出版時(shí)間:2008-10 出版社:中國(guó)鐵道出版社 作者:于天恩 頁(yè)數(shù):629 字?jǐn)?shù):939000
Tag標(biāo)簽:無(wú)
內(nèi)容概要
這本書(shū)基于Lucene的當(dāng)前最新版本(2.1)精解了Lucene搜索引擎的相關(guān)知識(shí),從基礎(chǔ)知識(shí)到應(yīng)用開(kāi)發(fā),精練簡(jiǎn)潔,恰到好處 本書(shū)共包括16章,分為6部分。第1部分Lucene基礎(chǔ)。介紹了Lucene的基礎(chǔ)知識(shí),包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應(yīng)用,最后做了兩個(gè)應(yīng)用項(xiàng)目。第2部分:數(shù)據(jù)解析。介紹解析不同格式數(shù)據(jù)(如Word、PDF等)的方法,包括常用的數(shù)據(jù)解析組件、Lucene自身的數(shù)據(jù)解析機(jī)制和Lius類(lèi)庫(kù)。第3部分:索引的高級(jí)知識(shí)。介紹了 Lucene建立索引的過(guò)程,索引的查看和刪除,索引的同步,索引的合并和優(yōu)化等內(nèi)容。第4部分:搜索的高級(jí)知識(shí)。介紹使用不同的Query對(duì)象構(gòu)建搜索請(qǐng)求,使用QueryParser解析用戶的搜索請(qǐng)求,搜索結(jié)果的過(guò)濾和排序等內(nèi)容。第5部分:Lucene應(yīng)用實(shí)例。應(yīng)用本節(jié)介紹的所有知識(shí)構(gòu)建一個(gè)桌面搜索引擎和一個(gè)Web搜索引擎。這部分作為對(duì)前面所有內(nèi)容的總結(jié)。第6部分:Nutch搜索引擎框架。介紹了基于Lucene的完整搜索引擎Nutch。 本書(shū)適合從Lucene初學(xué)者到高級(jí)開(kāi)發(fā)人員之間的一切Lucene愛(ài)好者。
作者簡(jiǎn)介
于天恩,現(xiàn)任某大型軟件開(kāi)發(fā)公司技術(shù)總監(jiān),高級(jí)軟件工程師,精通主流軟件編程技術(shù)(100多種),具有大量軟件項(xiàng)目開(kāi)發(fā)經(jīng)驗(yàn)。主持開(kāi)發(fā)過(guò)大中型企業(yè)網(wǎng)站,短信服務(wù)系統(tǒng),辦公自動(dòng)化系統(tǒng)(OA),CRM系統(tǒng)等。
已經(jīng)出版的作品:《PHP精解案例教程》、《做自己的搜索引擎——搜
書(shū)籍目錄
第1部分 Lucene基礎(chǔ)(第1~5章) 第1章 Lucene簡(jiǎn)介 1.1 認(rèn)識(shí)Lucene 1.1.1 Lucene是什么 1.1.2 Lucene的作者 1.1.3 Lucene的歷史 1.l.4 Lucene的現(xiàn)在 1.2 Lucene體驗(yàn)實(shí)例 1.2.1 下載Lucene 1.2.2 編寫(xiě)輔助糞 1.2.3 最簡(jiǎn)單的搜索引擎 1.2.4 索引器的開(kāi)發(fā) 1.2.5 索引器的運(yùn)行 1.2.6 搜索器的開(kāi)發(fā) 1.2.7 搜索器的運(yùn)行 小結(jié) 第2章 創(chuàng)建索引 2.1 創(chuàng)建索引的基本方式 2.1.1 理解創(chuàng)建索引的過(guò)程 2.1.2 創(chuàng)建Field 2.1.3 創(chuàng)建Document 2.1.4 創(chuàng)建Index Writer 2.2 創(chuàng)建索引實(shí)例 2.2.1 簡(jiǎn)單索引 2.2.2 復(fù)雜一點(diǎn)的索引 2.2.3 為文件創(chuàng)建索引 2.2.4 為某一目錄下的所有文件創(chuàng)建索引 小結(jié) 第3章 執(zhí)行搜索 3.1 執(zhí)行搜索的基本方式 3.1.1 創(chuàng)建搜索器對(duì)象:IndexSearcher 3.1.2 封裝搜索條件:使用Term和Query對(duì)象 3.1.3 執(zhí)行搜索 3.1.4 提取搜索結(jié)果:了解Hits對(duì)象 3.1.5 提取搜索結(jié)果:了解Document對(duì)象 3.1.6 提取搜索結(jié)果了解Field對(duì)象 3.2 執(zhí)行搜索實(shí)例 3.2.1 簡(jiǎn)單搜索 3.2.2 分詞問(wèn)題 小結(jié) 第4章 中文分詞 4.1 說(shuō)說(shuō)分詞 4.1.1 分詞的方法 4.1.2 做分詞器 4.2 Lucene的分詞器 4.2.1 二分法分詞器 4.2.2 Lucene自帶的中文分詞器 4.2.3 NGram分詞器的原理和用法 4.2.4 JE分詞器的原理和用法 4.2.5 IK分詞器的原理和用法 4.2.6 其他分詞器 小結(jié) ……第2部分 數(shù)據(jù)解析(第6~8章)第3部分 索引的高級(jí)知識(shí)(第9~10章)第4部分 搜索的高級(jí)知識(shí)(第11~12章)第5部分 lucene應(yīng)用實(shí)例(第13~14章)第6部分 Nutch搜索引擎框架(第15~16章)
章節(jié)摘錄
第1部分 Lucene基礎(chǔ)(第1~5章) 作為本書(shū)的第一部分,筆者在這里使用五章的篇幅介紹了Lucene的基礎(chǔ)知識(shí)。包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應(yīng)用,最后做了兩個(gè)應(yīng)用項(xiàng)目,來(lái)說(shuō)明使用Lucene建立搜索引擎的詳細(xì)過(guò)程?! ∵@部分內(nèi)容是很淺的,只是基礎(chǔ)。學(xué)過(guò)了這部分之后,讀者就可以做一些實(shí)際的應(yīng)用項(xiàng)目了。比如:給自己的網(wǎng)站添加全文搜索引擎。
編輯推薦
《Lucene搜索引擎開(kāi)發(fā)權(quán)威經(jīng)典》基于Lucene的當(dāng)前最新版本(2.1)精解了Lucene搜索引擎的相關(guān)知識(shí),從基礎(chǔ)知識(shí)到應(yīng)用開(kāi)發(fā),精煉簡(jiǎn)潔,恰到好處。 《Lucene搜索引擎開(kāi)發(fā)權(quán)威經(jīng)典》包含了必要的理論,但以實(shí)踐為主。所講的理論都不是紙上談兵,都是可以立即付諸實(shí)踐進(jìn)行工程應(yīng)用,代碼可以直接拿來(lái)用?! ?shū),不見(jiàn)得要寫(xiě)得深透。書(shū)的好壞要由書(shū)面向的讀者群來(lái)評(píng)價(jià)?!禠ucene搜索引擎開(kāi)發(fā)權(quán)威經(jīng)典》適合從Lucene初學(xué)者到高級(jí)開(kāi)發(fā)人員之間的一切Lucene愛(ài)好者?! ?nèi)容精練實(shí)用,《Lucene搜索引擎開(kāi)發(fā)權(quán)威經(jīng)典》中所列代碼可以搭建一座中型搜索平臺(tái),完整實(shí)例再現(xiàn),讓讀者緊跟作者構(gòu)建思路,Lucene搜索引擎技術(shù)完美演繹。
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
Lucene搜索引擎開(kāi)發(fā)權(quán)威經(jīng)典 PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版