開(kāi)發(fā)自己的搜索引擎--Lucene 2.0+Heriterx

出版時(shí)間：2007-6 出版社：人民郵電出版社作者：邱哲,符滔滔頁(yè)數(shù)：521 字?jǐn)?shù)：662000
Tag標(biāo)簽：無(wú)

內(nèi)容概要

本書(shū)是一本針對(duì)搜索引擎開(kāi)發(fā)的書(shū)籍。通過(guò)學(xué)習(xí)本書(shū)，讀者可以獨(dú)立構(gòu)建出一個(gè)企業(yè)級(jí)的搜索引擎網(wǎng)站。本書(shū)詳細(xì)講解了搜索引擎與信息檢索基礎(chǔ)，Lucene入門實(shí)例，Lucene索引的建立，使用Lucene進(jìn)行搜索，排序，過(guò)濾和分頁(yè)，Lucene的分析器，對(duì)Word、Excel和PDF格式文檔的處理，Compass搜索引擎框架，Lucene分布式和Google Search API，爬蟲(chóng)Heritrix，HTMLParser，DWR等內(nèi)容。最后綜合使用所講述的技術(shù)，構(gòu)建了一個(gè)典型的垂直搜索系統(tǒng)，該系統(tǒng)具有很強(qiáng)的商業(yè)實(shí)用價(jià)值。　　本書(shū)是一本介紹如何使用Lucene 2.0和Heritrix來(lái)構(gòu)建搜索引擎的書(shū)。通過(guò)對(duì)相關(guān)API和源代碼的分析，力求使讀者在掌握應(yīng)用的基礎(chǔ)上能夠深入其核心，自行擴(kuò)展和開(kāi)發(fā)相應(yīng)組件，開(kāi)發(fā)出更有創(chuàng)意的搜索引擎產(chǎn)品?！　”緯?shū)適合從事計(jì)算機(jī)軟件開(kāi)發(fā)的人員閱讀，同時(shí)也可以作為搜索引擎愛(ài)好者的入門書(shū)籍。閱讀本書(shū)需要具備Java語(yǔ)言基礎(chǔ)。

作者簡(jiǎn)介

邱哲，北京理工大學(xué)碩士，現(xiàn)為某公司技術(shù)經(jīng)理，主要從事歐美軟件外包開(kāi)發(fā)。在J2EE方面有4年的開(kāi)發(fā)經(jīng)驗(yàn)，在搜索引擎與“爬蟲(chóng)”方面有3年的開(kāi)發(fā)經(jīng)驗(yàn)，著有《征服Ajax+Lucene構(gòu)建搜索引擎》一書(shū)。

書(shū)籍目錄

第一篇　搜索引擎入門  第1章　搜索引擎與信息檢索基礎(chǔ)　    1.1　搜索引擎的歷史　      1.1.1　萌芽：Archie、Gopher　      1.1.2　起步：Robot(網(wǎng)絡(luò)機(jī)器人)的出現(xiàn)與Spider(網(wǎng)絡(luò)爬蟲(chóng))　      1.1.3　發(fā)展：Excite、Galaxy、Yahoo等　      1.1.4　繁榮：Infoseek、AltaVista、Google和Baidu　    1.2　信息檢索系統(tǒng)的基本知識(shí)　      1.2.1　什么是信息檢索系統(tǒng)　      1.2.2　信息檢索的過(guò)程　      1.2.3　傳統(tǒng)查找的優(yōu)點(diǎn)和不足　      1.2.4　使用索引提高檢索速度　      1.2.5　倒排索引　      1.2.6　評(píng)價(jià)信息檢索系統(tǒng)的標(biāo)準(zhǔn)　    1.3　Lucene簡(jiǎn)介　    1.4　小結(jié)　第二篇　Lucene開(kāi)發(fā)詳解  第2章　Lucene入門實(shí)例　    2.1　實(shí)例介紹　      2.1.1　實(shí)例說(shuō)明　      2.1.2　開(kāi)發(fā)過(guò)程　    2.2　準(zhǔn)備工作　      2.2.1　將文檔的全角標(biāo)點(diǎn)轉(zhuǎn)換成半角標(biāo)點(diǎn)　      2.2.2　將大文檔切分成多個(gè)小文檔　      2.2.3　預(yù)處理源文件的統(tǒng)一接口　    2.3　創(chuàng)建Eclipse工程　      2.3.1　準(zhǔn)備工作　      2.3.2　創(chuàng)建工程并引入Lucene的JAR包　      2.3.3　運(yùn)行文檔預(yù)處理類　      2.3.4　創(chuàng)建處理文檔的索引類：IndexProcessor　      2.3.5　創(chuàng)建檢索索引的搜索類　    2.4　運(yùn)行效果　    2.5　小結(jié)　  第3章　Lucene索引的建立　    3.1　Document邏輯文件　      3.1.1　Lucene的Document　      3.1.2　為Document添加多種Field　      3.1.3　Document的內(nèi)部實(shí)現(xiàn)　    3.2　Field的內(nèi)部實(shí)現(xiàn)　      3.2.1　Field包含的類　      3.2.2　Field類的構(gòu)造方法　    3.3　Lucene的索引工具IndexWriter　      3.3.1　IndexWriter的初始化　      3.3.2　向索引添加文檔　      3.3.3　限制每個(gè)Field中的詞條的數(shù)量　    3.4　Lucene索引過(guò)程詳解　      3.4.1　Lucene索引建立過(guò)程概述　            3.4.2　使用addDocument方法向索引添加文檔　      3.4.3　DocumentWriter的addDocument方法　                              3.4.4　文檔的倒排　      3.4.5　對(duì)postingTable進(jìn)行排序　      3.4.6　將Posting信息寫入索引　    3.5　索引文件格式　      3.5.1　索引的segment　      3.5.2　.fnm格式　      3.5.3　.fdx與.fdt格式　      3.5.4　.tii與.tis格式　      3.5.5　deletable格式　                  3.5.6　復(fù)合索引格式.cfs　          3.6　索引過(guò)程的優(yōu)化　                  3.6.1　合并因子mergeFactor　            3.6.2　maxMergeDocs　                              3.6.3　minMergeDocs　          3.7　索引的合并與索引的優(yōu)化　      3.7.1　FSDirectory與RAMDirectory　      3.7.2　使用IndexWriter來(lái)合并索引　                                    3.7.3　索引的優(yōu)化　    3.8　從索引中刪除文檔　                                                     3.8.1　索引的讀取工具IndexReader　            3.8.2　使用文檔ID號(hào)來(lái)刪除特定文檔　      3.8.3　使用Field信息來(lái)刪除批量文檔　    3.9　Lucene的同步問(wèn)題　      3.9.1　為什么要進(jìn)行同步以及Lucene的同步法則　      3.9.2　commit.lock與write.lock　                3.10　Lucene 2.0的新類：IndexModifier類　    3.11　小結(jié)　  第4章　Lucene的搜索　    4.1　使用IndexSearcher進(jìn)行搜索　      4.1.1　初始化IndexSearcher　      4.1.2　IndexSearcher最簡(jiǎn)單的使用　      4.1.3　IndexSearcher的多種search方法　    4.2　Hits類詳解　      4.2.1　Hits類的公有接口　      4.2.2　效率分析　      4.2.3　Hits內(nèi)部的緩存　      4.2.4　Hits類的工作原理　    4.3　對(duì)搜索結(jié)果的評(píng)分　      4.3.1　文檔與詞條的向量空間　      4.3.2　Lucene的文檔得分算法　    4.4　構(gòu)建各種Lucene內(nèi)建的Query對(duì)象　      4.4.1　toString查看原子查詢　      4.4.2　查詢重寫與權(quán)重　      4.4.3　TermQuery詞條搜索　      4.4.4　BooleanQuery布爾搜索　      4.4.5　RangeQuery范圍搜索　      4.4.6　PrefixQuery前綴搜索　      4.4.7　PhraseQuery短語(yǔ)搜索　      4.4.8　MultiPhraseQuery多短語(yǔ)搜索　      4.4.9　FuzzyQuery模糊搜索　      4.4.10　WildcardQuery通配符搜索　      4.4.11　SpanQuery跨度搜索　          4.5　第三方提供的Query對(duì)象：RegexQuery　                      4.6　通過(guò)QueryParser轉(zhuǎn)換用戶關(guān)鍵字　                                        4.6.1　詞條的定義　      4.6.2　QueryParser初始化　      4.6.3　改變QueryParser默認(rèn)的布爾邏輯　                  4.6.4　短語(yǔ)和QueryParser　      4.6.5　FuzzyQuery和QueryParser　      4.6.6　通配符與QueryParser　                                    4.6.7　查找指定的Field　      4.6.8　RangeQuery與QueryParser　      4.6.9　QueryParser和SpanQuery　    4.7　多Field搜索與多索引搜索　      4.7.1　多域搜索MultiFieldQueryParser　            4.7.2　MultiSearcher在多個(gè)索引上搜索　            4.7.3　ParalellMultiSearcher：多線程搜索　            4.7.4　Searchable和RMI　          4.8　小結(jié)　  第5章　排序、過(guò)濾和分頁(yè)　    5.1　相關(guān)度排序　      5.1.1　使用Score進(jìn)行自然排序　      5.1.2　Searcher的explain方法　      5.1.3　通過(guò)改變boost值來(lái)改變文檔的得分　    5.2　使用Sort來(lái)排序　      5.2.1　Sort簡(jiǎn)介　      5.2.2　SortField　      5.2.3　按文檔得分進(jìn)行排序　      5.2.4　按文檔的內(nèi)部ID號(hào)來(lái)排序　      5.2.5　按一個(gè)或多個(gè)Field來(lái)排序　      5.2.6　改變SortField中的Locale信息　    5.3　搜索的過(guò)濾器　      5.3.1　過(guò)濾器的基本結(jié)構(gòu)　                                    5.3.2　一個(gè)簡(jiǎn)單的Filter：建立索引　      5.3.3　一個(gè)簡(jiǎn)單的Filter：打印索引文檔信息　                  5.3.4　一個(gè)簡(jiǎn)單的Filter：安全級(jí)別與過(guò)濾器代碼　      5.3.5　一個(gè)簡(jiǎn)單的Filter：在搜索時(shí)應(yīng)用過(guò)濾器　            5.3.6　一個(gè)簡(jiǎn)單的Filter：總結(jié)　      5.3.7　按范圍過(guò)濾RangeFilter　      5.3.8　在結(jié)果中查詢QueryFilter　      5.3.9　緩存結(jié)果：CachingWrapperFilter　    5.4　翻頁(yè)問(wèn)題　      5.4.1　依賴于session的翻頁(yè)　            5.4.2　多次查詢　      5.4.3　緩存+多次查詢　            5.4.4　緩存+多次查詢+數(shù)據(jù)庫(kù)　    5.5　小結(jié)　  第6章　Lucene的分析器　          6.1　分析　      6.1.1　分詞　            6.1.2　Lucene的分析器的結(jié)構(gòu)　      6.1.3　Lucene的分析器的實(shí)現(xiàn)　                6.2　Lucene與JavaCC　      6.2.1　JavaCC簡(jiǎn)介　                        6.2.2　JavaCC為L(zhǎng)ucene提供的分析器腳本　      6.2.3　Lucene的標(biāo)準(zhǔn)分析器　      6.2.4　標(biāo)準(zhǔn)過(guò)濾器：StandardFilter　      6.2.5　大小寫轉(zhuǎn)換器：LowerCaseFilter　            6.2.6　忽略詞過(guò)濾器：StopFilter　    6.3　分析器的進(jìn)階　      6.3.1　再看StandardAnalyzer中的管道過(guò)濾器結(jié)構(gòu)　      6.3.2　長(zhǎng)度過(guò)濾器：LengthFilter　      6.3.3　PerFieldAnalyzerWrapper　      6.3.4　其他　    6.4　對(duì)中文的分析　      6.4.1　現(xiàn)有的中文分詞方式簡(jiǎn)介　      6.4.2　中科院的分詞軟件和JE分詞　    6.5　小結(jié)　第三篇　Lucene相關(guān)話題  第7章　對(duì)Word、Excel 和PDF的處理　    7.1　使用PDFBox處理PDF文檔　      7.1.1　PDFBox的下載　      7.1.2　在Eclipse中配置　      7.1.3　使用PDFBox解析PDF內(nèi)容　      7.1.4　運(yùn)行效果　      7.1.5　與Lucene的集成　    7.2　使用xpdf來(lái)處理中文PDF文檔　      7.2.1　xpdf的下載　      7.2.2　配置　      7.2.3　提取中文　      7.2.4　運(yùn)行效果　    7.3　使用POI來(lái)處理Excel和Word文件格式　      7.3.1　對(duì)Excel的處理類　      7.3.2　ExcelReader的運(yùn)行效果　      7.3.3　POI中Excel文件Cell的類型　      7.3.4　對(duì)Word的處理類　    7.4　使用Jacob來(lái)處理Word文檔　      7.4.1　Jacob的下載　      7.4.2　在Eclipse中配置　          7.5　小結(jié)　  第8章　Compass：封裝了Lucene的框架　    8.1　Compass簡(jiǎn)介　      8.1.1　Compass的下載　      8.1.2　Compass的代碼片斷　    8.2　Compass的初始配置　      8.2.1　Compass的配置文件　      8.2.2　將索引存放于內(nèi)存中　      8.2.3　使用JDBC來(lái)存儲(chǔ)索引　            8.2.4　使用連接池來(lái)存儲(chǔ)索引　      8.2.5　加載compass.cfg.xml文件　    8.3　域模型的配置　      8.3.1　實(shí)體代碼　      8.3.2　實(shí)體關(guān)系　            8.3.3　實(shí)體Book的配置文件　      8.3.4　通用元數(shù)據(jù)定義文件(.cmd.xml)　      8.3.5　Author和Article的配置文件　    8.4　使用Compass來(lái)建立索引　            8.4.1　索引代碼　      8.4.2　對(duì)象關(guān)系圖和運(yùn)行結(jié)果　    8.5　使用Compass來(lái)搜索　      8.5.1　使用find()方法搜索　      8.5.2　CompassHits類型　                              8.5.3　CompassHit類型　      8.5.4　使用Lucene語(yǔ)法來(lái)查找　    8.6　配置Analyzer和Optimizer　    8.7　小結(jié)　  第9章　Lucene分布式和Google Search API　    9.1　Lucene與分布式　      9.1.1　什么是GFS　      9.1.2　為L(zhǎng)ucene提供分布式的幾點(diǎn)設(shè)想　    9.2　Google的Search API　      9.2.1　搭建環(huán)境　      9.2.2　構(gòu)建搜索類　      9.2.3　設(shè)置查詢時(shí)的參數(shù)和查詢語(yǔ)法　      9.2.4　運(yùn)行測(cè)試　    9.3　小結(jié)　第四篇　網(wǎng)絡(luò)爬蟲(chóng)Heritrix  第10章　無(wú)比強(qiáng)大的網(wǎng)絡(luò)爬蟲(chóng)Heritrix　    10.1　Heritrix使用入門　      10.1.1　下載和運(yùn)行Heritrix　      10.1.2　在Eclipse里配置Heritrix的開(kāi)發(fā)環(huán)境　      10.1.3　創(chuàng)建一個(gè)新的抓取任務(wù)　      10.1.4　設(shè)置抓取時(shí)的處理鏈　      10.1.5　設(shè)置運(yùn)行時(shí)的參數(shù)　            10.1.6　運(yùn)行抓取任務(wù)　      10.1.7　Heritrix的鏡像存儲(chǔ)結(jié)構(gòu)　      10.1.8　終止抓取或終止Heritrix的運(yùn)行　    10.2　Heritrix的架構(gòu)　      10.2.1　抓取任務(wù)CrawlOrder　      10.2.2　中央控制器CrawlController　      10.2.3　Frontier鏈接制造工廠　      10.2.4　用Berkeley DB實(shí)現(xiàn)的BdbFrontier　      10.2.5　Heritrix的多線程ToeThread和ToePool　      10.2.6　處理鏈和Processor　    10.3　擴(kuò)展和定制Heritrix　      10.3.1　向Heritrix中添加自己的Extractor　      10.3.2　定制Queue-assignment-policy的兩個(gè)問(wèn)題　      10.3.3　定制Queue-assignment-policy繼承QueueAssignmentPolicy類　      10.3.4　擴(kuò)展FrontierScheduler來(lái)抓取特定的內(nèi)容　      10.3.5　在Prefetcher中取消robots.txt的限制　    10.4　小結(jié)　第五篇　構(gòu)建垂直搜索引擎  第11章　搜索引擎綜合實(shí)例：準(zhǔn)備篇　    11.1　實(shí)例簡(jiǎn)介以及實(shí)現(xiàn)途徑　      11.1.1　選擇網(wǎng)站　      11.1.2　太平洋電腦網(wǎng)和網(wǎng)易手機(jī)頻道　      11.1.3　分析網(wǎng)站內(nèi)容并準(zhǔn)備抓取清單　      11.1.4　從下拉列表獲得手機(jī)品牌首頁(yè)　      11.1.5　解析手機(jī)品牌頁(yè)面　    11.2　在Heritrix中為pconline開(kāi)發(fā)抓取所需的定制類　      11.2.1　保存所有產(chǎn)品的頁(yè)面和圖片　      11.2.2　不保存其他無(wú)關(guān)頁(yè)面　      11.2.3　開(kāi)始抓取　    11.3　在Heritrix中為網(wǎng)易手機(jī)頻道開(kāi)發(fā)抓取所需的定制類　      11.3.1　分析網(wǎng)易手機(jī)頻道　      11.3.2　設(shè)計(jì)抓取代碼　    11.4　在Eclipse中創(chuàng)建工程結(jié)構(gòu)　      11.4.1　下載插件　      11.4.2　在Eclipse中配置插件　      11.4.3　創(chuàng)建工程　      11.4.4　設(shè)置工程的Context　      11.4.5　設(shè)定源代碼存放和輸出路徑　      11.4.6　添加Java代碼　      11.4.7　添加Jar包　      11.4.8　創(chuàng)建JSP文件　      11.4.9　工程整體結(jié)構(gòu)一覽　    11.5　設(shè)定配置文件及其相關(guān)類　      11.5.1　系統(tǒng)屬性配置文件　      11.5.2　封裝配置文件　    11.6　產(chǎn)品詳細(xì)信息文件格式　    11.7　解析網(wǎng)頁(yè)信息的基類Extractor　    11.8　太平洋電腦網(wǎng)手機(jī)產(chǎn)品頁(yè)面Extractor　    11.9　pconline產(chǎn)品信息運(yùn)行效果測(cè)試　      11.9.1　編寫測(cè)試函數(shù)　      11.9.2　執(zhí)行測(cè)試　    11.10　網(wǎng)易手機(jī)頻道的產(chǎn)品信息運(yùn)行效果　    11.11　構(gòu)建產(chǎn)品信息詞庫(kù)　    11.12　數(shù)據(jù)庫(kù)與索引結(jié)構(gòu)　      11.12.1　定義Product類　      11.12.2　確定數(shù)據(jù)庫(kù)與索引的結(jié)構(gòu)　    11.13　數(shù)據(jù)庫(kù)處理和索引處理　      11.13.1　對(duì)數(shù)據(jù)庫(kù)進(jìn)行操作　      11.13.2　對(duì)索引進(jìn)行操作　    11.14　調(diào)用數(shù)據(jù)庫(kù)處理類和索引處理類　    11.15　運(yùn)行　    11.16　小結(jié)　  第12章　使用正則表達(dá)式與HTMLParser提取網(wǎng)頁(yè)內(nèi)容　    12.1　HTML的基本知識(shí)　    12.2　JDK中的正則表達(dá)式提取網(wǎng)頁(yè)內(nèi)容　      12.2.1　java.util.regex包　      12.2.2　正則表達(dá)式提取網(wǎng)頁(yè)內(nèi)容實(shí)例　    12.3　HTMLParser提取網(wǎng)頁(yè)內(nèi)容　      12.3.1　HTMLParser的下載　      12.3.2　HTMLParser概述　      12.3.3　Lexer的功能及實(shí)現(xiàn)　      12.3.4　HTMLParser的功能及實(shí)現(xiàn)　      12.3.5　HTMLParser實(shí)例　    12.4　小結(jié)　  第13章　搜索引擎綜合實(shí)例：DWR　    13.1　DWR的下載　    13.2　DWR入門與實(shí)例演示　      13.2.1　創(chuàng)建工程結(jié)構(gòu)　      13.2.2　在web.xml中配置DWR　      13.2.3　配置dwr.xml　      13.2.4　頁(yè)面代碼　      13.2.5　運(yùn)行效果　      13.2.6　DWR與直接使用XMLHttpRequest對(duì)象的比較　      13.2.7　在DWR中操縱自定義的對(duì)象　      13.2.8　查看DWR的輸出日志　    13.3　dwr.xml的配置　      13.3.1　dwr.xml的標(biāo)準(zhǔn)結(jié)構(gòu)　      13.3.2　標(biāo)簽與DWR自帶的converter和creator　      13.3.3　標(biāo)簽　      13.3.4　標(biāo)簽　      13.3.5　另一個(gè)例子　    13.4　util.js　      13.4.1　調(diào)用util.js　      13.4.2　使用useLoadingMessage方法顯示提示圖標(biāo)　      13.4.3　DWRUtil.setValue和DWRUtil.getValue　      13.4.4　DWRUtil.getValues和DWRUtil.setValues　      13.4.5　DWRUtil.addOptions和DWRUtil.removeAllOptions　      13.4.6　DWRUtil.addRows和DWRUtil.removeAllRows　      13.4.7　DWRUtil.toDescriptiveString方法　    13.5　小結(jié)　  第14章　搜索引擎綜合實(shí)例：Web篇　    14.1　配置文件　      14.1.1　Spring配置文件　      14.1.2　DWR配置文件　      14.1.3　web.xml　                14.2　各種Bean類　            14.2.1　SearchResult　      14.2.2　SearchResults　      14.2.3　SearchRequest　    14.3　SearchService的實(shí)現(xiàn)　    14.4　SearchResultDao　    14.5　前臺(tái)部分　      14.5.1　搜索主頁(yè)面main.jsp　      14.5.2　圖片的顯示　      14.5.3　詳細(xì)信息頁(yè)面detail.jsp　    14.6　問(wèn)題　    14.7　小結(jié)

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載

還沒(méi)讀過(guò)(36)
勉強(qiáng)可看(260)
一般般(445)
內(nèi)容豐富(1845)
強(qiáng)力推薦(151)

開(kāi)發(fā)自己的搜索引擎--Lucene 2.0+Heriterx PDF格式下載

用戶評(píng)論 (總計(jì)80條)

以前總覺(jué)得搜索引擎很神秘，遙不可及，沒(méi)想到通過(guò)看完此書(shū)，初步學(xué)習(xí)JAVA界第一個(gè)開(kāi)源搜索引擎框架--Lucene后，才真正感覺(jué)其實(shí)搜索就在我們身邊，搜索引擎以及網(wǎng)絡(luò)爬蟲(chóng)的基本原理也已了解。而此書(shū)就是最好的入門書(shū)籍，講的很通俗易懂，實(shí)例也很到位，內(nèi)容比較豐富，對(duì)于想用JAVA開(kāi)發(fā)簡(jiǎn)單的搜索引擎的或是想在自己J2EE之路上錦上添花的讀者，都是值得一看的好書(shū)??！
現(xiàn)在網(wǎng)上關(guān)于搜索引擎的資料比較少,.net版本更是沒(méi)有。我是從Lucene的Java版獲取思路，完善Lucene.net的功能。偶爾可以看看，如果你想學(xué)習(xí)搜索引擎。
正在進(jìn)行著畢業(yè)設(shè)計(jì)的實(shí)現(xiàn)，我選擇的題目為基于lucene檢索系統(tǒng)的研究是開(kāi)發(fā)。為了使自己和別人有不同，所以，就選擇了這個(gè)題目?？戳舜蟾?個(gè)月的理論知識(shí)，開(kāi)始實(shí)踐的時(shí)候，發(fā)現(xiàn)根本無(wú)法入手，就開(kāi)始了網(wǎng)上選書(shū)的征程，感謝當(dāng)當(dāng)網(wǎng)的數(shù)據(jù)挖掘技術(shù)，將這本書(shū)進(jìn)入我的我眼里，報(bào)著忐忑的心里，買了這個(gè)書(shū)，到了，就開(kāi)始了瘋狂的學(xué)習(xí)過(guò)程。從開(kāi)始到最后，幾乎沒(méi)有什么廢話可言，認(rèn)真的講解，認(rèn)真的教授。一點(diǎn)一點(diǎn)的，我從懵懂到懂，經(jīng)歷了這個(gè)過(guò)程。謝謝作者。本來(lái)，這方面的書(shū)就不多。這個(gè)的確很好唯一不足的地方就是，最后的例子不能使用。原因是，網(wǎng)站改版了，與作者無(wú)關(guān)。嘿嘿～希望，作者還有好書(shū)出現(xiàn)。
這本書(shū)很不錯(cuò)，例子很詳細(xì)，唯一的遺憾是對(duì)于compass講解有點(diǎn)少了，只能從lucene入手，再掌握compass這樣的選擇其實(shí)也是蠻不錯(cuò)的。
http://www.smallmao.cn/Java學(xué)習(xí)視頻下載：http://java.smallmao.cn/不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)不錯(cuò)，lucene入門很好！！
對(duì)于想自己開(kāi)發(fā)垂直搜索引擎的朋友的話，那么這本書(shū)會(huì)是一本不錯(cuò)的入門書(shū)，而且找不到第二本替代的書(shū)。至少我沒(méi)發(fā)現(xiàn)呵呵！
開(kāi)發(fā)自己的搜索引擎這本書(shū)很不錯(cuò),但關(guān)于這一類的書(shū)太少了
從頭看到尾，所獲頗豐，已經(jīng)可以把Lucene用到實(shí)際工作中了。
學(xué)習(xí)lucene的好書(shū)。
這本書(shū)非常不錯(cuò)，對(duì)學(xué)習(xí)搜索引擎的初學(xué)者來(lái)說(shuō)幫助挺大的。當(dāng)當(dāng)?shù)乃拓浰俣纫埠芸欤?天左右就收到了，比較驚喜。
對(duì)于沒(méi)接觸過(guò)搜索引擎的可以看看，入門級(jí)的，推薦
還算可以啦~~書(shū)中雖然給出的代碼占了很大篇幅，對(duì)于有項(xiàng)目開(kāi)發(fā)基本的人來(lái)說(shuō)，卻是好事。因?yàn)橥ㄟ^(guò)閱讀代碼，再加上書(shū)中還算詳細(xì)的解說(shuō)，很快就能掌握啦。
最基本的全文檢索引擎
1、認(rèn)為此書(shū)講的很垃圾，書(shū)中書(shū)中所有的問(wèn)題，都是點(diǎn)到為止，沒(méi)有一點(diǎn)深入的地方在具體的項(xiàng)目中，基本用不上。2、書(shū)中有多次描述上的錯(cuò)誤。而且還沒(méi)有源碼與之對(duì)應(yīng)，我暈~~
這本書(shū)還挺不錯(cuò)的，做這講的比較有耐心
這本書(shū)不錯(cuò)大家可以買來(lái)看看就是價(jià)格有點(diǎn)貴！
一直不太相信國(guó)人寫的書(shū)，但是這本真的不錯(cuò)。一周就看完了，把東西都講清楚了，非常感謝！
書(shū)挺好適合初學(xué)者
比較適合我的需要
很好當(dāng)當(dāng)網(wǎng)上的書(shū)又便宜又好
好.不錯(cuò)合我的需要
不知道,還沒(méi)看
兩個(gè)字，經(jīng)典！看就是了
書(shū)籍還可以，只是也還好，而且有個(gè)比較實(shí)用案例講解了Lucene+Heritirx結(jié)合的構(gòu)建了一個(gè)搜索引擎。如果這個(gè)有興趣的朋友可以買來(lái)看看。。
看完一遍，感覺(jué)還不錯(cuò)，Lucene2.0講的比較細(xì)致，是學(xué)習(xí)Lucene2.0的一本好書(shū)！不過(guò)內(nèi)部大部分是關(guān)于Lucene2.0基礎(chǔ)接口使用的介紹，是入門的好書(shū)，如果能多講一些Lucene2.0的高級(jí)主題就好啦，比如如何創(chuàng)建高性能，分布式搜索引擎。
但Lucene版本有點(diǎn)過(guò)老。但對(duì)學(xué)習(xí)搜索引擎的原理是很有好處的。
詳細(xì)的介紹了lucene，但是對(duì)于heritrix而言，個(gè)人認(rèn)為介紹的還不夠詳細(xì)，只是介紹了使用上的一些方法和一個(gè)簡(jiǎn)單的擴(kuò)展?？傮w上講，還是一本值得一讀的。
對(duì)于初學(xué)者而言確實(shí)不錯(cuò)，對(duì)于研究英文版的Lucene2.0api而言，此書(shū)替我理清了不少思路。問(wèn)題是Lucene的很多輔助功能書(shū)中沒(méi)有介紹。還是需要讀者自己去研究api。開(kāi)心之余不免感到有點(diǎn)惋惜。看來(lái)還得去研究LuceneinAction。
這是一本入門的好書(shū)，有很多例子由淺入深，對(duì)于想提高的人幫助不大，但是對(duì)于想入門的朋友，確實(shí)不錯(cuò)~！本來(lái)書(shū)就不厚，還有大段大段的代碼占據(jù)了相當(dāng)?shù)目臻g，真正有價(jià)值的內(nèi)容不多。原價(jià)太貴了，打完折還是覺(jué)得貴，薄薄一本書(shū)性價(jià)比不高。這是一本很不錯(cuò)的搜索引擎開(kāi)發(fā)入門書(shū)，書(shū)中簡(jiǎn)要的介紹了搜索引擎的倆個(gè)開(kāi)源工具，對(duì)于初學(xué)者有很大的幫助，
這本書(shū)讀了一半左右了，感覺(jué)代碼偏多了一些。講的不夠深入，要是想了解深入的lucene的東西不太適合。個(gè)人感覺(jué)比較適合像我這種初學(xué)者：）
這本書(shū)很不錯(cuò)，自己的搜索引擎開(kāi)發(fā)指南，適用于有一定開(kāi)發(fā)經(jīng)驗(yàn)的人員。如果是初學(xué)者的話還是不要購(gòu)買了。
關(guān)于搜索引擎開(kāi)發(fā)的書(shū)比較少，這本書(shū)對(duì)于初學(xué)者很值得看
該書(shū)我覺(jué)得對(duì)搜索引擎入門來(lái)說(shuō)還可以，我已經(jīng)看了索引和檢索那部分了，感覺(jué)真的不錯(cuò)！或許是因?yàn)闀?shū)的作者跟我們一樣都很年輕吧，我也看了作者為書(shū)做的BLOG了，上面有很多內(nèi)容感覺(jué)還可以。
初學(xué)都不錯(cuò),可以初步了解lucene的架構(gòu)
這本書(shū)深入淺出的介紹了搜索引擎。簡(jiǎn)單的介紹了搜索引擎的歷史，包括yahoogoogle的故事等。對(duì)于瀏覽器有一個(gè)大體的介紹，也有一個(gè)很好的例子。不過(guò)對(duì)于我個(gè)人來(lái)說(shuō)工作上暫時(shí)用不上，所以沒(méi)有細(xì)讀，只是作為一種儲(chǔ)備存在書(shū)架上了。書(shū)到用時(shí)方恨少，呵呵。
這本書(shū)是我對(duì)比了好幾本關(guān)于搜索引擎的書(shū)后選擇買的，自己感覺(jué)還不錯(cuò)，反正對(duì)我想要了解的東西都有講到了，只是書(shū)的快遞慢的呀，從購(gòu)買后將近等了半個(gè)月呢，希望當(dāng)當(dāng)能夠改進(jìn)呢~~
一直以來(lái)，想找本搜索引擎方面的書(shū)籍看看，苦于書(shū)籍太少?？戳诉@本書(shū)后，我發(fā)覺(jué)我找到我想要的了。
我是初學(xué)者、對(duì)于初學(xué)者而言很有幫助，講的很細(xì)；其中案例比較多，而這對(duì)于初學(xué)者而言是錦上添花，看了大概基本可以建立屬于自己的搜索引擎了。。。感興趣的朋友可以看看。
是一本入門的好書(shū),不過(guò)要想學(xué)高升一點(diǎn)的.建議不要買這本!感覺(jué)有點(diǎn)像照著API在寫書(shū),只不過(guò)比API多了幾句中文的說(shuō)明.
盡管此書(shū)講的有些內(nèi)容不是太深入,但總體上還是可以的.書(shū)中包括了對(duì)少部分源代碼的分析,從而讓讀者對(duì)它有了更深入的了解.其中還提到相關(guān)的一些內(nèi)容,讓我們知道這方面的內(nèi)容應(yīng)該可以再去深究
想做搜索的朋友可以參考一下，質(zhì)量和內(nèi)容都堪稱上成
內(nèi)容沒(méi)有深入的講太多東西，只是簡(jiǎn)單介紹了一下基礎(chǔ)使用的東西！
還是值得學(xué)習(xí)一下的，搜索這個(gè)東西還是很復(fù)雜的。
書(shū)有點(diǎn)貴，但是物有所值，要有一定java基礎(chǔ)才能看懂
書(shū)還是挺不錯(cuò)的不過(guò)光盤就不是很好用啦要是光盤能有個(gè)實(shí)例就更好了
這書(shū)相對(duì)于入門者就有點(diǎn)無(wú)所適從,因?yàn)樯婕暗狡渌矫娴臇|西,所以建議初學(xué)者先看看關(guān)于Apache等環(huán)境軟件的搭建!!
作為入門的參考書(shū)還是比較不錯(cuò)。。。
都快變成源代碼導(dǎo)讀了，這書(shū)的厚度完全可以刪減二分之一。
有的內(nèi)容是有點(diǎn)老了。這次送貨很及時(shí)，希望繼續(xù)努力
入門真的還不錯(cuò)
送書(shū)速度很快，只用了4天。還有光盤啊。。
很詳細(xì)，細(xì)致，期待更多這樣的好書(shū)
是一本還算好的書(shū)，但還能做的更好。
一本很不錯(cuò)的書(shū)，值得參考！
例子還可以，適合出學(xué)者
速度和質(zhì)量還不錯(cuò)。
我覺(jué)得還不錯(cuò)，但是我還沒(méi)仔細(xì)看呢
貨真價(jià)實(shí)，物美價(jià)廉！
對(duì)于lucene的介紹還可以，compass部分講的就真的是相當(dāng)入門了，需要進(jìn)行項(xiàng)目開(kāi)發(fā)的話還需要自己去學(xué)習(xí)compass文檔和api。但是現(xiàn)在市場(chǎng)上根本就沒(méi)有compasssearch相關(guān)的書(shū)，所以從這個(gè)角度來(lái)說(shuō)還是不錯(cuò)的
如果沒(méi)有半點(diǎn)搜索引擎開(kāi)發(fā)經(jīng)驗(yàn)，這本書(shū)倒是蠻適合。
lucene有些地方還不完善，這本書(shū)講的也不是很深
看了這本書(shū)能對(duì)搜索引擎有一個(gè)初步的了解，是一本入門級(jí)的書(shū)
可以作為初學(xué)者入門使用
我買的時(shí)候是想做點(diǎn)東西出來(lái)?？墒前l(fā)現(xiàn)里邊的東西比較散，要組織起來(lái)需要很大的基礎(chǔ)
感覺(jué)一般，項(xiàng)目的實(shí)際應(yīng)用性太差，不知道你們感覺(jué)如何
紙質(zhì)特軟特差，比報(bào)紙的紙還要次！在當(dāng)當(dāng)買了幾本書(shū)都是如此，實(shí)在是令人不爽！如果能報(bào)銷的話，建議到書(shū)店去買啦，書(shū)店的折扣也至少是90％...
可惜編者水平有限,很多地方寫錯(cuò)了...
書(shū)還是挺不錯(cuò)的服務(wù)不怎么樣太慢也沒(méi)有光盤
買回來(lái)以后仔細(xì)的看了，沒(méi)有想象中的好，很多都說(shuō)的不夠細(xì)
要想深入，只能選擇其他的
如題：不夠深入
不是很好，很多都是解析源碼，沒(méi)有觀點(diǎn)
拿到手有電后悔，入門看比較好，業(yè)界人士就不必啦，luceneinaction好過(guò)。
大入門了，沒(méi)有什么特別好的內(nèi)容
說(shuō)實(shí)話，買了本書(shū)我很后悔
只是講如何調(diào)用控件，沒(méi)實(shí)質(zhì)性的東西
“配有一個(gè)完整的搜索引擎案例。這個(gè)案例有很強(qiáng)的實(shí)用價(jià)值，只需稍加修改，就能應(yīng)用于實(shí)際項(xiàng)目，市場(chǎng)價(jià)值在30000元以上！”。出版是沒(méi)有這個(gè)代碼。只是說(shuō)“沒(méi)有拿到授權(quán)，趕不上出版時(shí)間”就了事？這樣的縮水了的書(shū)，出了不丟人？賣“期書(shū)”，代碼光盤什么時(shí)候補(bǔ)給我們？
先說(shuō)說(shuō)內(nèi)容，如果你會(huì)用百度或者是google并且你聽(tīng)說(shuō)過(guò)lucene你這本書(shū)你也可以寫得出來(lái)，絕大部分的內(nèi)容就是直接從源代碼里把代碼復(fù)制出來(lái)，再在網(wǎng)上搜點(diǎn)評(píng)論貼上去，請(qǐng)問(wèn)這就是在你們創(chuàng)作的書(shū)嗎？？？字寫得很大500多頁(yè)的內(nèi)容字體小一個(gè)號(hào)也就成300頁(yè)了?。。。。?，再說(shuō)說(shuō)光盤只有30幾M的東西而且還不是什么有用的東西，兩個(gè)字不值?。。。?！希望不要有人再上當(dāng)了~！@#￥%……&*（）——+
就說(shuō)了幾句大實(shí)話，當(dāng)當(dāng)網(wǎng)還把我的評(píng)論給刪除了，太不厚道了。難道就只準(zhǔn)說(shuō)好話，不準(zhǔn)說(shuō)實(shí)話？？？？搞毛了，下次不在這里買書(shū)了。這本書(shū)確實(shí)是非常一般，不過(guò)是將API講了一遍。
都是將代碼的，而且很費(fèi)。。。

開(kāi)發(fā)自己的搜索引擎--Lucene 2.0+Heriterx

用戶評(píng)論 (總計(jì)80條)

推薦圖書(shū)

相關(guān)圖書(shū)