出版時(shí)間:2012-8 出版社:劉俊熙、 盛宇 電子工業(yè)出版社 (2012-08出版) 作者:劉俊熙,盛宇 著
內(nèi)容概要
信息檢索是指將信息按一定的方式組織起來,并根據(jù)用戶的需求找出有關(guān)信息的過程與技術(shù)。本書共分11章,內(nèi)容包括計(jì)算機(jī)信息檢索基礎(chǔ),信息檢索技術(shù)實(shí)現(xiàn),網(wǎng)絡(luò)信息資源概述,搜索引擎,綜合和專題數(shù)據(jù)庫,國際聯(lián)機(jī)檢索,多媒體信息檢索,學(xué)術(shù)論文撰寫、答辯及發(fā)表,國內(nèi)主要數(shù)據(jù)庫檢索方法匯集等。全書在上一版的基礎(chǔ)上,增加了有關(guān)搜索引擎、人文社會(huì)科學(xué)信息檢索與利用、中外文網(wǎng)絡(luò)數(shù)據(jù)庫的檢索與利用等內(nèi)容,內(nèi)容豐富、新穎,信息量大。
書籍目錄
第1章 計(jì)算機(jī)信息檢索基礎(chǔ) 1.1 學(xué)科基礎(chǔ)——信息學(xué) 1.1.1 信息概述 1.1.2 信息需要和檢索 1.2 技術(shù)基礎(chǔ)——信息技術(shù) 1.2.1 信息技術(shù)概述 1.2.2 信息檢索的關(guān)鍵技術(shù)——數(shù)據(jù)庫技術(shù) 1.2.3 網(wǎng)絡(luò)時(shí)代對(duì)信息存儲(chǔ)與檢索技術(shù)的挑戰(zhàn) 第2章 計(jì)算機(jī)信息檢索概述 2.1 計(jì)算機(jī)信息檢索基本概念 2.1.1 計(jì)算機(jī)信息檢索的發(fā)展、條件和類型 2.1.2 計(jì)算機(jī)信息檢索的原理 2.1.3 計(jì)算機(jī)信息檢索系統(tǒng) 2.2 計(jì)算機(jī)信息檢索語言 2.2.1 檢索語言基礎(chǔ)知識(shí) 2.2.2 檢索語言的類型 2.3 計(jì)算機(jī)信息檢索原理、步驟和檢索效果 2.3.1 計(jì)算機(jī)信息檢索的步驟 2.3.2 檢索效果的評(píng)價(jià)指標(biāo) 2.3.3 檢索策略 第3章 計(jì)算機(jī)信息檢索技術(shù)實(shí)現(xiàn) 3.1 初級(jí)和高級(jí)檢索技術(shù) 3.1.1 初級(jí)檢索技術(shù) 3.1.2 高級(jí)檢索技術(shù) 3.1.3 智能推拉技術(shù) 3.1.4.自然語言處理技術(shù) 3.2 信息檢索技術(shù)的延伸——數(shù)據(jù)挖掘 3.2.1 數(shù)據(jù)挖掘基本概況 3.2.2 數(shù)據(jù)挖掘常用的技術(shù) 3.2.3 信息檢索和數(shù)據(jù)挖掘的技術(shù)關(guān)聯(lián)分析 第4章 網(wǎng)絡(luò)信息資源概述 4.1 網(wǎng)絡(luò)資源的基本概念 4.1.1 Intemet概況 4.1.2 網(wǎng)絡(luò)信息資源的類型 4.2 網(wǎng)絡(luò)信息資源的組織 4.2.1 元數(shù)據(jù)概述 4.2.2 元數(shù)據(jù)的主要代表:DublinCore 第5章 網(wǎng)絡(luò)信息資源檢索——搜索引擎(1) 5.1 搜索引擎 5.1.1 搜索引擎概述 5.1.2 搜索引擎技術(shù)分析 5.1.3 搜索引擎評(píng)價(jià) 5.2 著名搜索引擎——Google(谷歌) 5.2.1 關(guān)于Google 5.2.2 eageRank算法解析 5.3 著名搜索引擎一Baidu(百度) 5.3.1 關(guān)于Baidu 5.3.2 Baidu的超鏈分析 5.3.3 Baidu和Google主要內(nèi)容比較分析 5.4 搜索引擎的搜索策略和技巧 5.4.1 利用搜索引擎學(xué)習(xí)網(wǎng)站 5.4.2 搜索引擎的搜索步驟 5.4.3 搜索引擎的搜索技巧 5.4.4 常見問題的搜索方法 5.4.5 搜索引擎的優(yōu)化(SEO) 第6章 網(wǎng)絡(luò)信息資源檢索——搜索引擎(2) 6.1 國外常用的搜索引擎介紹 6.2 元搜索引擎 6.2.1 元搜索引擎概述 6.2.2 元搜索引擎的優(yōu)勢(shì)、選擇和評(píng)價(jià) 6.2.3 常用元搜索引擎介紹 6.3 垂直搜索引擎 6.3.1 垂直搜索引擎概述 6.3.2 垂直搜索引擎的技術(shù)分析 6.3.3 垂直搜索引擎現(xiàn)狀分析 6.4 站內(nèi)搜索引擎 6.4.1 站內(nèi)搜索引擎概述 6.4.2 典型站內(nèi)搜索引擎介紹 6.4.3 垂直和通用搜索引擎的差別 6.5 知識(shí)搜索和人肉搜索 6.5.1 機(jī)器搜索的延伸——知識(shí)搜索 6.5.2 知識(shí)搜索的變異——“人肉搜索” 第7章 網(wǎng)絡(luò)信息資源檢索——綜合和專題數(shù)據(jù)庫 7.1 綜合數(shù)據(jù)庫檢索系統(tǒng) 7.1.1 中國期刊網(wǎng)概況 7.1.2 維普資訊數(shù)據(jù)庫 7.1.3 中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS) 7.1.4 萬方數(shù)據(jù)資源檢索系統(tǒng) 7.1.5 中文社科報(bào)刊篇名數(shù)據(jù)庫 7.1.6 SCIExpanded 7.1.7 聯(lián)機(jī)書目檢索系統(tǒng)(OPAC) 7.2 專題數(shù)據(jù)庫檢索系統(tǒng) 7.2.1 網(wǎng)上專利信息檢索 7.2.2 網(wǎng)上學(xué)位論文信息檢索 7.2.3 網(wǎng)上學(xué)術(shù)會(huì)議信息檢索 7.2.4 網(wǎng)上科技報(bào)告信息檢索 7.2.5 網(wǎng)上標(biāo)準(zhǔn)資料信息檢索 7.2.6 網(wǎng)上參考工具書信息檢索 7.2.7 GoogleEarth檢索 第8章 網(wǎng)絡(luò)信息資源檢索——國際聯(lián)機(jī)檢索 8.1 聯(lián)機(jī)檢索系統(tǒng) 8.1.1 聯(lián)機(jī)檢索系統(tǒng)概述 8.1.2 聯(lián)機(jī)檢索系統(tǒng)的選擇及數(shù)據(jù)庫選擇 8.2 國際聯(lián)機(jī)檢索:Dialog 8.2.1 Diflog概述 8.2.2 Diflog檢索技術(shù) 8.2.3 Diflog檢索步驟、結(jié)果處理及操作實(shí)例 8.3 國際聯(lián)機(jī)檢索:OCLC的FirstSealCh 8.3.1 FirstSearch概述 8.3.2 FirstSearch數(shù)據(jù)庫 8.3.3 FirstSearch檢索方法 第9章 多媒體信息檢索 9.1 多媒體信息檢索 9.1.1 多媒體信息檢索概述 9.1.2 多媒體信息檢索的關(guān)鍵技術(shù) 9.2 多媒體信息檢索——圖像檢索 9.2.1 圖像數(shù)據(jù)的檢索原理、方法與技術(shù) 9.2.2 基于圖像內(nèi)容的圖像檢索系統(tǒng) 9.3 多媒體信息檢索——視頻檢索 9.3.1 視頻檢索概述 9.3.2 視頻檢索關(guān)鍵技術(shù) 9.4 多媒體信息檢索——音頻檢索 9.4.1 音頻檢索概述 9.4.2 音頻檢索方法 第10章 學(xué)術(shù)論文撰寫、答辯及發(fā)表 10.1 學(xué)術(shù)論文 10.1.1 學(xué)術(shù)論文概述 10.1.2 學(xué)術(shù)論文的選題 10.2 學(xué)術(shù)論文的撰寫 10.2.1 學(xué)術(shù)論文撰寫的過程 10.2.2 學(xué)術(shù)論文的具體要求 10.3 學(xué)術(shù)論文的使用 10.3.1 學(xué)術(shù)論文的講解、答辯和發(fā)表 10.3.2 利用信息資源進(jìn)行論文寫作的示例 第11章 國內(nèi)主要數(shù)據(jù)庫檢索方法匯集 11.1 中國期刊網(wǎng)檢索方法 11.2 中文科技期刊數(shù)據(jù)庫檢索方法 11.3 萬方數(shù)據(jù)資源檢索系統(tǒng)檢索方法 11.4 其他數(shù)據(jù)庫檢索方法舉例 參考文獻(xiàn)
章節(jié)摘錄
版權(quán)頁: 插圖: 在搜索軟件系統(tǒng)里面,真正起指揮作用的是人工管理系統(tǒng)制定的規(guī)則和檢索索引數(shù)據(jù)庫。它可以決定什么樣的網(wǎng)站抓得勤一點(diǎn),或者干脆不抓。同時(shí)要判斷這個(gè)網(wǎng)頁幾項(xiàng)要素: ①這個(gè)網(wǎng)頁的核心內(nèi)容是什么,也就是這個(gè)網(wǎng)頁的“關(guān)鍵詞”是什么。 ②這個(gè)網(wǎng)頁的重要性權(quán)重如何,也就是說在同樣“關(guān)鍵詞”的網(wǎng)頁比較,誰更符合這個(gè)“關(guān)鍵詞”。 在第一個(gè)要素里面,需要通過對(duì)網(wǎng)頁上的內(nèi)容進(jìn)行分析,而這里的“關(guān)鍵詞”不是我們?nèi)粘@斫獾脑~語,它是由語義分析學(xué)習(xí)系統(tǒng)按照一定規(guī)律制定的“最小語境含義表達(dá)單位(語境根)”,它可以是一個(gè)字,一個(gè)詞,甚至一個(gè)短語,就是說它是表示某個(gè)含義的最小單位。通過根據(jù)“最小語境含義表達(dá)單位(語境根)”和網(wǎng)頁文字進(jìn)行比較,判斷出這個(gè)網(wǎng)頁的“關(guān)鍵詞”。 這里有兩點(diǎn)是很關(guān)鍵的,因?yàn)椤白钚≌Z境含義表達(dá)單位(語境根)”和網(wǎng)頁文字,是按照一定層次來進(jìn)行比較的,所以首先會(huì)比較網(wǎng)頁代碼頭部里面的關(guān)鍵詞,其次是網(wǎng)頁標(biāo)題,然后會(huì)比較明顯的標(biāo)記的文字。這也是為什么網(wǎng)站優(yōu)化(SEO)說標(biāo)題和某些“關(guān)鍵詞”突出顯示很重要的緣故。 還有一個(gè)是網(wǎng)頁文字相關(guān)性,其實(shí)也就是“相關(guān)詞”。舉例來說,一個(gè)“關(guān)鍵詞”是“計(jì)算機(jī)”的頁面上,同時(shí)出現(xiàn)內(nèi)存、硬盤等相關(guān)內(nèi)容的頁面,肯定比一個(gè)同時(shí)只出現(xiàn)“蘿卜”、“白菜”的頁面更符合這個(gè)“關(guān)鍵詞”。 (2)索引軟件 索引軟件主要是理解Robot所搜索的網(wǎng)頁信息,利用數(shù)據(jù)庫管理系統(tǒng)來組織所采集標(biāo)引的網(wǎng)頁信息,并從中抽取索引項(xiàng),形成索引數(shù)據(jù)庫。數(shù)據(jù)庫中的一條記錄基本上對(duì)應(yīng)于一個(gè)網(wǎng)頁,一般包括關(guān)鍵詞、網(wǎng)頁摘要、網(wǎng)頁URL等信息。由于各個(gè)搜索引擎的標(biāo)引原則和方式不同,所以它們的索引記錄內(nèi)容不一定相同,即使是同一網(wǎng)頁的記錄內(nèi)容也不盡完全相同。搜索引擎的有效性在很大程度上取決于索引的質(zhì)量,而索引的質(zhì)量由索引技術(shù)和索引策略來決定。 索引可以分為客觀索引項(xiàng)和內(nèi)容索引項(xiàng)兩種: ①客觀索引項(xiàng)與文檔的語意內(nèi)容無關(guān),如作者名、URL、更新時(shí)間、編碼、長度、鏈接流行度(LinkPopularity)等。內(nèi)容索引項(xiàng)是用來反映文檔內(nèi)容的,如關(guān)鍵詞及其權(quán)重、短語、單字等。
編輯推薦
《大學(xué)計(jì)算機(jī)規(guī)劃教材:計(jì)算機(jī)信息檢索(第3版)》可作為高等學(xué)校信息管理及相關(guān)專業(yè)學(xué)生的教材或教學(xué)參考書,也可作為各類專業(yè)人員、普通網(wǎng)民堂握計(jì)笪機(jī)網(wǎng)絡(luò)信息檢索知識(shí)與技能的參考書。
圖書封面
評(píng)論、評(píng)分、閱讀與下載