文獻數(shù)據(jù)庫數(shù)據(jù)加工規(guī)范

出版時間:2009-11  出版社:知識產(chǎn)權(quán)出版社  作者:張建勇 編  頁數(shù):178  
Tag標簽:無  

前言

國家科技圖書文獻中心(以下簡稱NSTL)網(wǎng)絡(luò)服務(wù)系統(tǒng)面向全國用戶提供全面的科學(xué)技術(shù)文獻數(shù)據(jù)檢索和原文傳遞服務(wù)。NSTL的文獻數(shù)據(jù)庫建設(shè)主要包括期刊論文、會議論文、學(xué)位論文、科技報告、標準、專利等多種文獻類型。數(shù)據(jù)加工規(guī)模龐大,每年加工的題錄、文摘和引文數(shù)據(jù)量以千萬條計,并且還在以比較快的速度增長。NSTL文獻數(shù)據(jù)加工工作由9家成員館共同承擔(dān)。NSTL自成立以來,一直十分重視數(shù)據(jù)加工的標準化和規(guī)范化建設(shè),2001年正式發(fā)布了《國家科技圖書文獻中心——文獻數(shù)據(jù)加工細則》規(guī)范和約束數(shù)據(jù)加工的格式和內(nèi)容,以提高數(shù)據(jù)加工的標準化和規(guī)范化水平。2002~2006年NSTL組織協(xié)調(diào)的《我國數(shù)字圖書館標準規(guī)范建設(shè)項目》,先后完成并推出了與數(shù)字圖書館建設(shè)相關(guān)的一系列標準和研究報告,其中多項標準涉及NSTL現(xiàn)有建設(shè)的多種數(shù)據(jù)資源。2008年,為進一步提高數(shù)據(jù)庫建設(shè)的標準化和規(guī)范化水平,NSTL適時啟動了文獻數(shù)據(jù)加工細則的修訂工作,遵循數(shù)字圖書館標準規(guī)范項目的相關(guān)標準和其他研究成果,從數(shù)字圖書館資源組織和現(xiàn)代網(wǎng)絡(luò)信息服務(wù)的角度,重新修改和細化NSTL的數(shù)據(jù)加工規(guī)范。為此,NSTL專門成立了文獻數(shù)據(jù)加工規(guī)范修訂小組,修訂小組的成員由各成員單位具有豐富數(shù)據(jù)加工經(jīng)驗的管理人員、元數(shù)據(jù)研究人員、編目人員、信息技術(shù)人員等共同組成。修訂小組詳細調(diào)研了文獻數(shù)據(jù)加工領(lǐng)域的國內(nèi)外的研究進展,深入研究了Dc和相關(guān)元數(shù)據(jù)的研究成果,分析了國內(nèi)外同類文獻信息服務(wù)系統(tǒng),包括Pubmed、Web of Science、Inspec、NTIS、Science Direct等的數(shù)據(jù)格式和相關(guān)樣例。聽取了NSTL成員單位的數(shù)據(jù)加工人員、服務(wù)人員和系統(tǒng)開發(fā)人員對數(shù)據(jù)的要求,圍繞數(shù)據(jù)元素的必要性、全文服務(wù)的要求、系統(tǒng)發(fā)布的需求等各方面因素,對數(shù)據(jù)格式和數(shù)據(jù)元素進行了多次深入的討論。經(jīng)過充分的文獻調(diào)研和集體討論,確定以我國數(shù)字圖書館標準規(guī)范項目的相關(guān)數(shù)據(jù)標準為基礎(chǔ),適當(dāng)擴展服務(wù)中需要的數(shù)據(jù)元素,參考DC元數(shù)據(jù)的數(shù)據(jù)組織體系,組織和撰寫新的NSTL文獻數(shù)據(jù)庫數(shù)據(jù)加工規(guī)范。按照元數(shù)據(jù)框架和數(shù)字圖書館元數(shù)據(jù)標準的規(guī)定,突出了各類型文獻數(shù)據(jù)元素的特點并盡可能復(fù)用,建立了各類型文獻的元數(shù)據(jù)層次結(jié)構(gòu),讓使用者易于理解和執(zhí)行。比如,根據(jù)期刊文獻的特點將元數(shù)據(jù)結(jié)構(gòu)分為母體文獻層、館藏信息層、篇名數(shù)據(jù)層、參考文獻層,每一層次都確定一個數(shù)據(jù)元素集,每個數(shù)據(jù)元素都按照ISO11179標準,詳細著錄其標簽、名稱、定義、必備性、可重復(fù)性、注釋、示例等元素項。最后形成的數(shù)據(jù)加工規(guī)范文檔結(jié)構(gòu)為:按文獻類型分別組織,首先概述每一種文獻類型的內(nèi)涵和外延,其次說明該類型文獻的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)關(guān)系,再次分別定義該類型文獻每一層次數(shù)據(jù)元素集和數(shù)據(jù)元素列表。列舉完所有文獻類型后,最后將所有數(shù)據(jù)元素按字順排列詳細說明。文獻數(shù)據(jù)加工規(guī)范確定的數(shù)據(jù)交換格式為業(yè)界通用的xML格式,各類型文獻的xML Schema詳見本規(guī)范的正文部分。XML Schema主要用于NSTL業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)交換,以及NSTL與外部系統(tǒng)之間的數(shù)據(jù)交換。

內(nèi)容概要

本書是國內(nèi)第一部在文獻數(shù)據(jù)庫建設(shè)中基于元數(shù)據(jù)理論制訂的數(shù)據(jù)加工和管理的規(guī)范性文檔。該規(guī)范系統(tǒng)描述了各類文獻數(shù)據(jù)的元數(shù)據(jù)描述框架、元素集的構(gòu)成和元素集之間的關(guān)系。規(guī)范編制科學(xué)嚴謹、適用面廣,具有較強的實用價值。本書對文獻數(shù)據(jù)庫數(shù)據(jù)加工的管理,系統(tǒng)數(shù)據(jù)加工的規(guī)范化建設(shè)有一定的參考作用和借鑒價值。本書適合數(shù)據(jù)加工管理人員、數(shù)據(jù)庫設(shè)計人員和其他信息處理人員閱讀和使用。

書籍目錄

第1章 編制原則和方法 1.1 功能需求說明 1.2 規(guī)范制定原則  1.2.1 模塊化原則  1.2.2 可擴展原則  1.2.3 統(tǒng)一化原則  1.2.4 需求原則  1.2.5 互操作原則 1.3 資源描述框架  1.3.1 元數(shù)據(jù)結(jié)構(gòu)  1.3.2 元素定義方法  1.3.3 形式化描述一XMLSchema的應(yīng)用第2章 術(shù)語表第3章 期刊論文描述元數(shù)據(jù)規(guī)范 3.1 概述 3.2 期刊論文元數(shù)據(jù)描述集中各元素集關(guān)系 3.3 論文描述元素集 3.4 論文作者描述元素集 3.5 期刊描述元素集 3.6 期刊卷期描述元素集 3.7 期刊收藏單位描述元素集 3.8 論文參考文獻描述元素集 3.9 管理信息描述元素集第4章 會議論文描述元數(shù)據(jù)規(guī)范 4.1 概述 4.2 會議論文元數(shù)據(jù)描述集中各元素集關(guān)系 4.3 會議論文描述元素集 4.4 論文作者描述元素集 4.5 會議錄描述元素集 4.6 會議文獻收藏單位描述元素集 4.7 管理信息描述元素集第5章 學(xué)位論文描述元數(shù)據(jù)規(guī)范 5.1 概述 5.2 學(xué)位論文元數(shù)據(jù)描述集中各元素集關(guān)系 5.3 學(xué)位論文描述元素集 5.4 學(xué)位論文作者描述元素集 5.5 學(xué)位論文導(dǎo)師描述元素集 5.6 學(xué)位論文館藏描述元素集 5.7 管理信息描述元素集第6章 文集匯編描述元數(shù)據(jù)規(guī)范 6.1 概述 6.2 文集匯編元數(shù)據(jù)描述集中各元素集關(guān)系 6.3 論文描述元素集 6.4 論文作者描述元素集 6.5 文集匯編母體文獻描述元素集 6.6 文集匯編收藏單位描述元素集 6.7 管理信息描述元素集第7章 科技報告描述元數(shù)據(jù)規(guī)范 7.1 概述 7.2 科技報告元數(shù)據(jù)描述集中各元素集關(guān)系 7.3 科技報告描述元素集 7.4 科技報告作者描述元素集 7.5 科技報告館藏描述元素集 7.6 管理信息描述元素集第8章 元素定義 8.1 abstract 8.2 abstract_alternative 8.3 affiliation 8.4 affilation_ahernative 8.5 ahernative 8.6 author_name 8.7 author_name_alternative 8.8 author_sequence  8.9 catalog_code 8.10 checkin_time 8.11 citation_authorl 8.12 citation_author2 8.13 citation_author3 8.14 citation_editor in chief 8.15 citation_issue 8.16 citation_orig_info 8.17 citation_page 8.18 citation_publisher 8.19 citation_sourcetitle 8.20 citation_title 8.21 citation_type 8.22 citation_url 8.23 citation_volume 8.24 citation_year 8.25 classification 8.26 classification_scheme 8.27 cn 8.28 coden 8.29 conference_date 8.30 conference_name 8.31 conference_no 8.32 conference_place 8.33 conferencesponsor 8.34 create_time 8.35 degree 8.36 degree_offering_org 8.37 doi 8.38 eisbn 8.39 eissn 8.40 email 8.41 end_page 8.42 end_year 8.43 fulltext_flag 8.44 holding_number 8.45 host_classfication 8.46 host_editor 8.47 host_language 8.48 host_title 8.49 host_title_alternative 8.50 ISBN 8.51 ISSN 8.52 issue 8.53 keyword 8.54 keyword_alternative 8.55 language 8.56 library_code 8.57 local_doi 8.58 major 8.59 other_language 8.60 paper_id 8.61 paper_no 8.62 paper_type 8.63 processing_mode 8.64 processing_unit 8.65 publisher 8.66 publishing_place 8.67 qualification_date 8.68 record_level 8.69 reportno 8.70 research_subject 8.71 start_page 8.72 start_year 8.73 subjectheading 8.74 submit_date 8.75 subscription_number 8.76 supervisor 8.77 supervisor_affiliation 8.78 supervisor_affiliation_alternative 8.79 supervisor_email 8.80 supervisor_name_alternative 8.81 supervisor_sequence 8.82 thesaurus 8.83 title 8.84 total_page_number 8.85 total_referencenumber 8.86 type 8.87 university……第9章 數(shù)據(jù)形式化描述XML Schema和數(shù)據(jù)樣例第10章 附錄

章節(jié)摘錄

插圖:1.1 功能需求說明本規(guī)范主要用于指導(dǎo)NSTL館藏文獻資源的數(shù)據(jù)描述和管理,包括期刊論文、會議論文、學(xué)位論文、文集匯編和科技報告。期刊論文、會議論文及文集匯編都是結(jié)集出版的文獻,學(xué)位論文和科技報告則通常是單篇成冊出版。本規(guī)范從功能上可支持:文獻選擇,包括:①按類型選擇文獻,②根據(jù)文獻主題和內(nèi)容選擇文獻,③根據(jù)文獻引用頻次選擇文獻;文獻識別,包括:①根據(jù)文獻特征識別,②識別文獻作者及其所在機構(gòu),③通過全球通用的DOI識別文獻,④通過NSTL本地通用的Local DOI識別文獻,⑤識別所描述對象是否有紙本全文;文獻獲取,包括:①檢索文獻主題和文摘,②支持多語種的文獻檢索,③支持()pen URL鏈接服務(wù)器對檢索結(jié)果的調(diào)用,幫助實現(xiàn)原文獲取,④支持在NSTL成員館范圍內(nèi)的全文獲??;加工管理,包括:①實現(xiàn)按文獻品種分配加工任務(wù),避免重復(fù)加工,②按本/冊管理加工進度,③根據(jù)加工深度要求(加工題錄、文摘或是引文),安排加工任務(wù),④支持OAI協(xié)議對數(shù)據(jù)的收割。1.2 規(guī)范制定原則1.2.1 模塊化原則模塊化被視為現(xiàn)代元數(shù)據(jù)最重要的特征。模塊化的關(guān)鍵是根據(jù)實際使用的需要,將資源對象區(qū)分為若干個實體,對資源的描述,即是對多個不同實體的組合和描述。2007年DC年會上提出的“新加坡框架”以新的方式闡述了元數(shù)據(jù)模塊化設(shè)計思路。根據(jù)新加坡框架的定義,一個DC元數(shù)據(jù)應(yīng)用綱要至少要包括功能需求、領(lǐng)域模型和描述集合綱要這幾部分。功能需求定義了應(yīng)用綱要所需要支持完成的設(shè)計功能,以及其他一些功能需求;領(lǐng)域模型主要定義應(yīng)用綱要所描述的基本實體概念以及它們之間主要的相互關(guān)系。領(lǐng)域模型既可以用文本描述,也可以采用像UML這樣更為規(guī)范的描述方法;描述集合綱要是一個信息模型,定義了描述集合的結(jié)構(gòu)限定,描述集合綱要以計算機可讀的XML格式書寫,定義了一組元數(shù)據(jù)記錄,它是應(yīng)用綱要可遵循的實例。

編輯推薦

《文獻數(shù)據(jù)庫數(shù)據(jù)加工規(guī)范》是由知識產(chǎn)權(quán)出版社出版的。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    文獻數(shù)據(jù)庫數(shù)據(jù)加工規(guī)范 PDF格式下載


用戶評論 (總計1條)

 
 

  •   書寫的很好,內(nèi)容很贊
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7