出版時(shí)間:2009-12 出版社:東南大學(xué)出版社 作者:章成志,白振田 著 頁(yè)數(shù):198 字?jǐn)?shù):173000
Tag標(biāo)簽:無(wú)
前言
2001年7-8月《中圖法》編委會(huì)在京對(duì)《中國(guó)分類主題詞表》第2版初稿進(jìn)行綜合審定,南京農(nóng)業(yè)大學(xué)、中山大學(xué)、上??哲娬螌W(xué)院等信息管理系的老師帶領(lǐng)部分研究生參加了審定工作。薛春香就是這批學(xué)生中的佼佼者之一。她敏捷嚴(yán)謹(jǐn)?shù)乃季S、沉穩(wěn)扎實(shí)的作風(fēng)以及深究勤問(wèn)的性格給我留下深刻的印象。此后,她攻讀博士、做博士后,始終在信息組織這塊沃土上辛勤耕耘,由此也與《中圖法》、《中國(guó)分類主題詞表》結(jié)下了不解之緣,成為《中圖法》編委會(huì)的常客。八年后,薛春香的《網(wǎng)絡(luò)環(huán)境中知識(shí)組織系統(tǒng)構(gòu)建與應(yīng)用研究》問(wèn)世,這是她在博士論文的基礎(chǔ)上從更廣闊的情報(bào)語(yǔ)言領(lǐng)域進(jìn)行深入研究后完成的,論證的結(jié)構(gòu)更加完善、內(nèi)容也更加豐富。這本書(shū)對(duì)網(wǎng)絡(luò)環(huán)境中的知識(shí)組織系統(tǒng)及研究現(xiàn)狀、知識(shí)組織系統(tǒng)構(gòu)建與描述標(biāo)準(zhǔn)等作了全面的概述,深入對(duì)網(wǎng)絡(luò)環(huán)境中知識(shí)組織系統(tǒng)的設(shè)計(jì)、傳統(tǒng)知識(shí)組織系統(tǒng)自動(dòng)構(gòu)建以及知識(shí)組織系統(tǒng)的互操作與整合進(jìn)行了研究,并對(duì)網(wǎng)絡(luò)環(huán)境中知識(shí)組織系統(tǒng)的應(yīng)用做了分析,是目前國(guó)內(nèi)一本較全面地研究知識(shí)組織系統(tǒng)構(gòu)建與應(yīng)用的著作。
內(nèi)容概要
本書(shū)總結(jié)了作者近年來(lái)在文本自動(dòng)標(biāo)引和,自動(dòng)分類上所做的研究與實(shí)踐。全書(shū)由四部分構(gòu)成:第一部分為基礎(chǔ)部分,介紹研究背景和研究意義,并對(duì)相關(guān)研究進(jìn)展進(jìn)行綜述;第二部分介紹作者在自動(dòng)標(biāo)引方面的研究工作;第三部分介紹基于《中圖法》分類知識(shí)庫(kù)的文本自動(dòng)分類系統(tǒng):第四部分介紹基于統(tǒng)計(jì)與規(guī)則相結(jié)合的文本自動(dòng)分類系統(tǒng)?! ”緯?shū)是國(guó)內(nèi)第一本比較系統(tǒng)地介紹文本自動(dòng)標(biāo)引和自動(dòng)分類研究的專著,對(duì)從事信息檢索、文本挖掘、知識(shí)組織、數(shù)字圖書(shū)館等研究和應(yīng)用開(kāi)發(fā)的科技人員有較高參考價(jià)值,可作為圖書(shū)館學(xué)、情報(bào)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、信息管理和信息系統(tǒng)等專業(yè)的研究生、高年級(jí)本科生的教學(xué)參考書(shū)和技術(shù)資料。
作者簡(jiǎn)介
章成志,1997年生,1999年獲安徽工程科技學(xué)院學(xué)士學(xué)位,2002年獲南京農(nóng)業(yè)大學(xué)碩士學(xué)位,2007年獲南京大學(xué)博士學(xué)位。現(xiàn)為中國(guó)科學(xué)技術(shù)信息研究所在站博士后,南京理工大學(xué)信息管理系講師、碩士生導(dǎo)師。研究領(lǐng)域包括信息組織、信息檢索、文本挖掘等。曾獲國(guó)家自然科學(xué)基金
書(shū)籍目錄
第一部分 第1章 引言 1.1 研究背景 1.2 自動(dòng)標(biāo)引與自動(dòng)分類的作用 1.3 本書(shū)的內(nèi)容與章 節(jié)安排 第2章 文本自動(dòng)標(biāo)引與分類研究進(jìn)展 2.1 自動(dòng)標(biāo)引研究綜述 2.2 文本分類研究綜述 2.3 本章 小結(jié)第二部分 第3章 文本分詞技術(shù)及抽詞詞典構(gòu)造 3.1 文本分詞技術(shù)概述 3.2 分詞模式設(shè)計(jì)及其原理 3.3 原始抽詞詞典的構(gòu)造 3.4 詞典約簡(jiǎn)算法實(shí)驗(yàn) 第4章 基于多特征選擇及權(quán)值計(jì)算 4.1 特征選擇方法概述 4.2 算法設(shè)計(jì)原理 4.3 結(jié)果分析 第5章 自動(dòng)標(biāo)引中標(biāo)引源權(quán)重方案確定 5.1 標(biāo)引源權(quán)重研究綜述 5.2 標(biāo)引源權(quán)重方案的確定 5.3 本章 小結(jié)第三部分 第6章 分類知識(shí)庫(kù)的制作 6.1 概述 6.2 關(guān)鍵詞(串)一分類號(hào)關(guān)聯(lián)研究綜述 6.3 關(guān)鍵詞(串)一分類號(hào)關(guān)聯(lián)方法 6.4 分類知識(shí)庫(kù)的制作 6.5 分類知識(shí)庫(kù)的性能測(cè)評(píng) 6.6 篇名知識(shí)庫(kù)的制作 6.7 本章 小結(jié) 第7章 基于語(yǔ)義體系的詞語(yǔ)相似度計(jì)算 7.1 概述 7.2 詞語(yǔ)相似度研究綜述 7.3 基于語(yǔ)義體系的詞語(yǔ)相似度算法 7.4 基于語(yǔ)義相似度的同義詞挖掘 7.5 本章 小結(jié) 第8章 基于知識(shí)庫(kù)的文本自動(dòng)分類 8.1 文本自動(dòng)系統(tǒng)總體設(shè)計(jì) 8.2 文本自動(dòng)分類系統(tǒng)的測(cè)評(píng) 8.3 《全國(guó)報(bào)刊索引》自動(dòng)標(biāo)引與自動(dòng)分類系統(tǒng)介紹 8.4 本章 小結(jié)第四部分 第9章 統(tǒng)計(jì)與決策規(guī)則雙重分類算法 9.1 分類器概述 9.2 雙重分類原理 9.3 分類規(guī)則提取 9.4 雙重分類過(guò)程 9.5 實(shí)驗(yàn)結(jié)果及分析 第10章 層次分類算法實(shí)驗(yàn) 10.1 層次分類原理 10.2 層次分類算法設(shè)計(jì) 10.3 實(shí)驗(yàn)結(jié)果及分析 第11章 基于統(tǒng)計(jì)與規(guī)則相結(jié)合的文本分類系統(tǒng)的實(shí)現(xiàn) 11.1 系統(tǒng)實(shí)驗(yàn)用語(yǔ)料選擇及分析 11.2 系統(tǒng)總體框架與模塊介紹 11.3 系統(tǒng)測(cè)試分析 11.4 本章 小結(jié)名稱索引主題索引后記
章節(jié)摘錄
插圖:(3)術(shù)語(yǔ)表和字典/詞典術(shù)語(yǔ)表是術(shù)語(yǔ)及其定義的列表。術(shù)語(yǔ)可來(lái)源于特定領(lǐng)域或特定作品,這些術(shù)語(yǔ)在某一特定環(huán)境中被定義,而且很少有多種不同的含義。字典/詞典是以字順排列的字或詞以及它們的定義的列表,包括字或詞的各種不同含義。字典/詞典的范圍要比術(shù)語(yǔ)表寬泛和通用。字典/詞典還可以提供字或詞的起源信息,如拼寫(xiě)或詞法,以及跨學(xué)科的多種含義;有的字典或詞典還可能提供不同含義的同義詞、相關(guān)詞,但它沒(méi)有明確的等級(jí)層次體系,也沒(méi)有試圖通過(guò)概念來(lái)將字詞加以分組,如《現(xiàn)代漢語(yǔ)詞典》等。(4)規(guī)范文檔規(guī)范文檔亦稱權(quán)威檔,是用來(lái)控制同一實(shí)體(人或事物)不同的名稱,或者某個(gè)特定領(lǐng)域中專有名詞的詞匯表,例如國(guó)家名稱表、個(gè)人姓名表、組織結(jié)構(gòu)名稱列表。非規(guī)范的詞匯被鏈接指向規(guī)范詞匯。這種類型的知識(shí)組織系統(tǒng)并不揭示復(fù)雜的結(jié)構(gòu)和組織關(guān)系,一般只揭示等同關(guān)系。如臺(tái)灣“中央研究院”組織制作的人名權(quán)威檔、地名權(quán)威檔、時(shí)代權(quán)威檔等,在其人名權(quán)威檔中檢索“徐光啟”,在“徐光啟”這一條目下,以“徐光啟”作為規(guī)范名,并列有其字、號(hào),如“子先”、“徐玄扈”、“玄扈先生”、“徐文定公”等,通過(guò)這些詞匯的檢索能指向“徐光啟”這一條目。(5)同義詞環(huán)同義詞環(huán)是一組同義、近義甚至相關(guān)詞的集合,類似于入口詞表,但是它不會(huì)強(qiáng)行要求環(huán)中某一個(gè)詞作為“正式詞”,環(huán)中任何一個(gè)詞的士也位都是平等的,都可以是正式詞。同義詞環(huán)通常與搜索引擎一起使用,以幫助擴(kuò)充檢索式,用戶只要使用同義詞環(huán)中的任何一個(gè)詞,就可以找到這一類的資源。圖1-5是利用Googl。
后記
本書(shū)系《情報(bào)檢索語(yǔ)言與智能信息處理》叢書(shū)之一,是在筆者博士學(xué)位論文《農(nóng)史知識(shí)組織系統(tǒng)構(gòu)建與應(yīng)用研究》(2006年6月完成)的基礎(chǔ)上經(jīng)過(guò)擴(kuò)充改編而成。知識(shí)組織系統(tǒng)是對(duì)各種知識(shí)組織的語(yǔ)義工具的統(tǒng)稱。從廣義而言,其包含的各種具體類型的工具有數(shù)十種之多,本書(shū)在論述時(shí)盡量從整體上論述,以求全面。但限于筆者以往的研究以分類法和詞表建設(shè)與應(yīng)用為主,對(duì)本體、主題圖等缺乏實(shí)踐;同時(shí),分類法和受控詞表仍是本體、主題圖等新型知識(shí)組織系統(tǒng)構(gòu)建的基礎(chǔ),因此在本書(shū)實(shí)驗(yàn)研究中仍以網(wǎng)絡(luò)環(huán)境中的分類法和受控詞表為研究重點(diǎn)。但是從傳統(tǒng)分類法、敘詞表向本體轉(zhuǎn)換,基于概念圖和主題圖來(lái)組織和導(dǎo)航信息資源等,將是筆者今后研究中不可回避并將著重關(guān)注的課題。本書(shū)能夠得以出版,首先感謝我的導(dǎo)師侯漢清教授,沒(méi)有導(dǎo)師的親切教誨和悉心指導(dǎo),要完成本書(shū)是不可想象的。導(dǎo)師一貫嚴(yán)謹(jǐn)?shù)闹螌W(xué)作風(fēng)、孜孜不倦的探索精神給我留下深切的體會(huì),并鞭策我在今后的人生旅程中不斷學(xué)習(xí)與提高。
編輯推薦
《網(wǎng)絡(luò)環(huán)境中知識(shí)組織系統(tǒng)構(gòu)建與應(yīng)用研究》:情報(bào)檢索語(yǔ)言與智能信息處理叢書(shū)
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
情報(bào)檢索語(yǔ)言與智能信息處理叢書(shū)(全8冊(cè)) PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版