搜索引擎

出版時間:2005-4  出版社:科學出版社發(fā)行部  作者:李曉明  頁數(shù):247  
Tag標簽:無  

內(nèi)容概要

本書系統(tǒng)地介紹了互聯(lián)網(wǎng)搜索引擎的工作原理、實現(xiàn)技術(shù)及其系統(tǒng)構(gòu)建方案。全書分三篇共13章內(nèi)容,從基本工作原理概述,到一個小型簡單搜索引擎具體細節(jié)的實現(xiàn),進而詳細討論了大規(guī)模分布式搜索引擎系統(tǒng)的設(shè)計要點及其關(guān)鍵技術(shù);最后介紹了面向主題和個性化的web信息服務,闡述了中文網(wǎng)頁自動分類等技術(shù)及其應用。本書層次分明,由淺入深;既有深入的理論分析,也有大量的實驗數(shù)據(jù),具有學習和實用雙重意義。    本書可作為高等院校計算機科學與技術(shù)、信息管理與信息系統(tǒng)、電子商務等專業(yè)的研究生或高年級本科生的教學參考書和技術(shù)資料,對廣大從事網(wǎng)絡(luò)技術(shù)、Web站點的管理、數(shù)字圖書館、Web挖掘等研究和應用開發(fā)的科技人員也有很高的參考價值。

作者簡介

李曉明:天網(wǎng)搜索引擎領(lǐng)域負責人
閆宏飛 王繼民:天網(wǎng)搜索引擎項目負責人

書籍目錄

前言第一章 引論 第一節(jié) 搜索引擎的概念  第二節(jié) 搜索引擎的發(fā)展歷史  第三節(jié) 一些著名的搜索引擎上篇 Web搜索引擎基本原理和技術(shù) 第二章 Web搜索引擎工作原理和體系結(jié)構(gòu)   第一節(jié) 基本要求   第二節(jié) 網(wǎng)頁搜集   第三節(jié) 預處理   第四節(jié) 查詢服務   第五節(jié) 體系結(jié)構(gòu) 第三章 Web信息的搜集    第一節(jié)   引言     一、超文本傳輸協(xié)議     二、一個小型搜索引擎系統(tǒng)   第二節(jié) 網(wǎng)頁搜集     一、定義LJRL類和Page類     二、與服務器建立連接     三、發(fā)送請求和接收數(shù)據(jù)     四、網(wǎng)頁信息存儲的天網(wǎng)格式   第三節(jié) 多道搜集程序并行工作     一、多線程并發(fā)工作     二、控制對一個站點并發(fā)搜集線程的數(shù)目     第四節(jié) 如何避免網(wǎng)頁的重復搜集     一、記錄未訪問、已訪問IJRL和網(wǎng)頁內(nèi)容摘要信息     二、域名與IP的對應問題   第五節(jié) 如何首先搜集重要的網(wǎng)頁   第六節(jié) 搜集信息的類型   第七節(jié) 本章 小結(jié)     第四章 對搜集信息的預處理    第一節(jié) 信息預處理的系統(tǒng)結(jié)構(gòu)-    第二節(jié) 索引網(wǎng)頁庫    第三節(jié) 中文自動分詞    第四節(jié) 分析網(wǎng)頁和建立倒排文件    第五節(jié) 本章 小結(jié) 第五章 信息查詢服務   第一節(jié) 查詢服務的系統(tǒng)結(jié)構(gòu)   第二節(jié) 檢索的定義   第三節(jié) 查詢服務的實現(xiàn)     一、結(jié)果集合的形成     二、查詢結(jié)果顯示   第四節(jié) 本章 小結(jié)中篇 對質(zhì)量和性能的追求 第六章 可擴展搜集子系統(tǒng)   第一節(jié) 天網(wǎng)系統(tǒng)概述和集中式搜集系統(tǒng)結(jié)構(gòu)     一、天網(wǎng)系統(tǒng)結(jié)構(gòu)     二、集中式搜集系統(tǒng)   第二節(jié) 利用并行處理技術(shù)高效搜集網(wǎng)頁的一種方案     一、節(jié) 點間URL的劃分策略     二、關(guān)于性能的討論     三、性能測試和評價     四、系統(tǒng)的動態(tài)可配置性設(shè)計    第三節(jié) 本章 小結(jié) 第七章 網(wǎng)頁凈化與消重    第一節(jié) 網(wǎng)頁凈化與元數(shù)據(jù)提取     一、引言     二、D0cview模型     三、網(wǎng)頁的表示     四、提取Docview模型要素的方法     五、模型應用及實驗研究    第二節(jié) 網(wǎng)頁消重算法     一、消重算法…… 第八章 高性能檢索子系統(tǒng) 第九章 用戶行為的特征及緩存的應用 第十章 相關(guān)排序與系統(tǒng)質(zhì)量評估下篇 面向主題和個性化的Wed信息服務 第十一章 中文網(wǎng)頁自動分類技術(shù) 第十二章 搜索引擎?zhèn)€性化查詢服務 第十三章 面向主題的信息搜集與應用參考文獻附錄 術(shù)語后記

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    搜索引擎 PDF格式下載


用戶評論 (總計84條)

 
 

  •   理論聯(lián)系實際,對深入了解搜索引擎的工作原理非常有用,遺憾的是對技術(shù)細節(jié)討論不夠充分
  •   國內(nèi)搜索引擎的書本來就少,這本書算是國內(nèi)出版的最好的一本。書上內(nèi)容結(jié)合了北大天網(wǎng)的實例來講解說明,算是有理有據(jù)的,并非泛泛而談。要知道天網(wǎng)搜索引擎算是國內(nèi)的Numberone了。百度里面都是從天網(wǎng)招過去的,酷訊的老板干脆就是原來開發(fā)天網(wǎng)的。由此可知這本書的含金量是很高的。只是版本有點老,如果作者能重新出版,加入一些新的內(nèi)容就更好了。
  •   學習搜索引擎的原理和方法的好書,經(jīng)典好書,值得推薦,作者還有系列相關(guān)書籍!
  •   史上最經(jīng)典的搜索引擎基礎(chǔ)學習資料,詳實,對學習SEO有相當大的幫助!
  •   適合學習搜索引擎的同學閱讀,要是有java版本就更好了
  •   非常不錯的一本搜索引擎教程,很值得一看!
  •   這是一本非常好搜索引擎的入門書籍!
  •   技術(shù)原理類的書 朋友推薦的 值得一看,這種工具類的書,只能在辦公室書桌旁看,需要用心去思考和理解。
  •   對天網(wǎng)有深刻的探索,比較系統(tǒng),便于只是融合
  •   圖書館借了好幾次,最終決定買一本。很有收藏價值的書,相信以為一直會用到
  •   內(nèi)容一氣呵成,非常流暢,由淺入深,適合初學者
  •   感覺寫的不錯,才看到第六章。。。
  •   買了好幾本書,質(zhì)量都不錯,當當一如既往的好
  •   基礎(chǔ)知識,不錯的一本書,推薦一下。
  •   相當專業(yè),在網(wǎng)上看人家推薦的,還可以
  •   因為第二版有點貴,就選擇了第一版。做seo的話還是需要多熟悉一下基礎(chǔ)的內(nèi)容。
  •   封面不怎么喜歡,但是內(nèi)容還行
  •   真正的理解了搜索的內(nèi)容,比那些抄算法的強多了
  •   剛拿到手,匆匆翻閱了一下,感覺內(nèi)容很實在,應該是一本好書,真正閱讀的時候希望不要令人失望
  •   書好,我喜歡,希望大家購買!
  •   買來還沒有看,應該還可以
  •   在別人的博客中看見的,不錯
  •   講的非常好 我一看就明白了
  •   當當?shù)乃拓浰俣日娴暮芸?..
  •   不適合初學者啊 好難明啊
  •   第一次讀這類書,收獲不小,對我有一定深度!
  •   給先生買的,對工作有幫助,呵呵
  •   這本書系統(tǒng)地介紹了搜索引擎的實現(xiàn)方法及原理,是了解搜索引擎知識的一本好書
  •   學習seo首先要先系統(tǒng)的學習搜索引擎。知道了搜索引擎的工作原理才能讓seo工作展開的更順利,效果更明顯。這本書雖然老了點,但是還是值得我們借鑒,看看就知道了,我也是從seo三人行那里得知的這本書。
  •   對搜索引擎的研究綜述和基本框架談論的較為透徹,作為科研論文的參考文獻是不錯的。第6、7章在今日看來也不失指導價值,作者在圈內(nèi)算是有資歷的人了,寫出的東西當然有意義。搜索引擎領(lǐng)域的仁人志士理應買一本看看。美中不足的是出版年份較早,有些內(nèi)容過時了,希冀能有新版出現(xiàn)!
  •   國內(nèi)關(guān)于搜索引擎方面的書籍,本身就少,此書是非常好的搜索引擎方面的書籍,他不僅僅介紹理論,還有一個小的模型。關(guān)于中篇的介紹,要是在有實際的解決案例就好了
  •   聽seo三人行小涵推薦的,應該算是不錯的了。里面很多公司,主要想學下搜索引擎的原理,想理解多一點百度。相信會有比較深刻的搜索引擎原理認識
  •   剛開始學搜索引擎,這本書蠻不錯的,很適合初學者。
  •   這本書可以幫助讀者很快的了解整個搜索引擎的框架結(jié)構(gòu)
  •   適合入門看,可以對搜索引擎有個整體了解
  •   這個書,還是值得買的,如果你對搜索引擎不是很了解的話
  •   本書介紹的較為詳細,但不足的是沒有自己編寫的具體代碼,用的是別人的開源項目,對于做項目的人來書,可以作為參考書,但是不能作為一本可以作為模板的設(shè)計輔助教材
  •   對于入門來說是不錯的,雖然原理老了點,但是大體方向還是不變的。
  •   第一次用,很方便,價錢也說的過去!很好的互聯(lián)網(wǎng)產(chǎn)品!贊
  •   不錯,只是有些內(nèi)容希望寫的再詳細一些!
  •   比較專業(yè),正在研究中
  •   內(nèi)容不怎么生動,拿到這本書讓我想起大學的古板的教科書。
  •   這本書早幾個月就買好了,放在家里一直沒看,對書沒什么評價,不過送貨速度還蠻好的。
  •   相對于其它幾本來說,這本書還是不錯的。。。??梢砸豢?/li>
  •   但還是有點貴,這本書不是很厚啊,材料不足那么貴吧
  •   好,但是可能要有基礎(chǔ)的人才看得懂
  •   2天內(nèi)收到貨 速度快
  •   還沒看,爭取盡快看看
  •   老師給過了,就好
  •   頂!很難得的一本好書
  •   質(zhì)量、速度都還不錯。
  •   還不錯,很容易看懂,就是版本老了點。對于入門者還是值得一看的。。。。不說了,看書去。
  •   不錯書很好~~~·~
  •   從零開始教,還是蠻適合入門的
  •   不錯啊,還沒看完
  •   買了還沒什么時間去看.
  •   書的內(nèi)容老了些,但是很經(jīng)典
  •   相比其它幾款為了賺錢而推出的垃圾快餐書而言,這書算是不錯的了對搜索引擎的理論有一個詳細的介紹,適合入門但缺乏具體解決方案
  •   這本書里面很多測試對比數(shù)據(jù)
    因為這本書,我前幾天就上天網(wǎng)看看,感覺很多內(nèi)容搜不出來。
    這難道就是國內(nèi)最高水準的搜索引擎?
    今天去看,暫停服務了。
    網(wǎng)上好像有pdf版本的。
  •   泛泛的技術(shù)介紹,算是了解了行業(yè)知識,開闊視野。
  •   有一些參考價值,但是內(nèi)容比較老
  •   參考教材,需要慢慢體會
  •   挺專業(yè)的對我這樣的非專業(yè)的很難懂
  •   書還OK,多加學習
  •   寫得中規(guī)中矩,內(nèi)容不是很新穎,與其他書相近
  •   像大學教材,粗略的看了一下,內(nèi)容比較難,不適合初學者。
  •   深不深,淺不淺,湊合看看吧,
  •   只是外觀略顯陳舊,看上去像是二手書
  •   如果用來入門還算可以吧!
  •   深度是夠了,看書的人就費勁了。需要提前掌握很多知識再看吧。
  •   搞笑的是我買的一本居然還是裝訂錯誤的,搞的我還要去退掉。好象那5元郵費也沒退給我。
  •   入門的東西講了點吧。
  •   買了還沒什么時間去看
  •   買了一本,但是找不到源代碼。在網(wǎng)上下載的代碼不知道如何運行,書中也沒有講解,只是一味的講解原理,不將如何搭建。該搜索引擎案例TES似乎是很多人知道,但我并不覺得好在哪里。那個什么北大的搜索也不外如是,似乎沒什么人用。搜索出來的東西有些還沒有
  •   完全是大學教材一樣的照本宣科
  •   這一本更加差了,我不知道是盜版的還是因為出版社的原因
    反正影響到了閱讀了!
  •   收到的書都搞到不像了麻煩給本新的好嗎?
  •   書還可以就是快遞公司不太好書也被他們折出痕跡送貨時間也慢
  •   不錯 適合新手
  •   作為搜索引擎入門書非常好
  •   非?;A(chǔ)
  •   太基礎(chǔ)了 哈哈
  •   很不錯哦啊
  •   介紹搜索引擎技術(shù)的
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7