智能Web算法

出版時(shí)間:2011-11  出版社:電子工業(yè)出版社  作者:Haralambos Marmanis,Dmitry Babenko  頁數(shù):400  譯者:阿穩(wěn),陳鋼  
Tag標(biāo)簽:無  

內(nèi)容概要

  本書涵蓋了五類重要的智能算法:搜索、推薦、聚類、分類和分類器組合,并結(jié)合具體的案例討論了它們?cè)赪eb應(yīng)用中的角色及要注意的問題。除了第1章的概要性介紹以及第7章對(duì)所有技術(shù)的整合應(yīng)用外,第2~6章以代碼示例的形式分別對(duì)這五類算法進(jìn)行了介紹。

作者簡(jiǎn)介

Haralambos (Babis) Marmanis
博士是一位把機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于工業(yè)界的先行者,也是供應(yīng)管理的世界級(jí)專家。Dmitry
Babenko曾經(jīng)為銀行、保險(xiǎn)、供應(yīng)鏈管理與商務(wù)智能公司設(shè)計(jì)過應(yīng)用與基礎(chǔ)架構(gòu)。

書籍目錄

1 什么是智能Web?
 1.1 智能Web應(yīng)用實(shí)例
 1.2 智能應(yīng)用的基本要素
 1.3 什么應(yīng)用會(huì)受益于智能?
  1.3.1 社交網(wǎng)絡(luò)
  1.3.2 Mashup
  1.3.3 門戶網(wǎng)站
  1.3.4 維基
  1.3.5 文件分享網(wǎng)站
  1.3.6 網(wǎng)絡(luò)游戲
 1.4 如何構(gòu)建智能應(yīng)用?
  1.4.1 檢查功能和數(shù)據(jù)
  1.4.2 獲取更多的數(shù)據(jù)
 1.5 機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘及其他
 1.6 智能應(yīng)用中八個(gè)常見的誤區(qū)
  1.6.1 誤區(qū)1:數(shù)據(jù)是可靠的
  1.6.2 誤區(qū)2:計(jì)算能馬上完成
  1.6.3 誤區(qū)3:不用考慮數(shù)據(jù)規(guī)模
  1.6.4 誤區(qū)4:不考慮解決方案的可擴(kuò)展性
  1.6.5 誤區(qū)5:隨處使用同樣的方法
  1.6.6 誤區(qū)6:總是能知道計(jì)算時(shí)間
  1.6.7 誤區(qū)7:復(fù)雜的模型更好
  1.6.8 誤區(qū)8:存在無偏見的模型
 1.7 小結(jié)
 1.8 參考資料
2 搜索
 2.1 用Lucene實(shí)現(xiàn)搜索
  2.1.1 理解Lucene代碼
  2.1.2 搜索的基本步驟
 2.2 為什么搜索不僅僅是索引?
 2.3 用鏈接分析改進(jìn)搜索結(jié)果
  2.3.1 PageRank簡(jiǎn)介
  2.3.2 計(jì)算PageRank向量
  2.3.3 alpha:網(wǎng)頁間跳轉(zhuǎn)的影響
  2.3.4 理解冪方法
  2.3.5 結(jié)合索引分值和PageRank分值
 2.4 根據(jù)用戶點(diǎn)擊改進(jìn)搜索結(jié)果
  2.4.1 用戶點(diǎn)擊初探
  2.4.2 樸素貝葉斯分類器的使用
  2.4.3 整合Lucene索引、PageRank和用戶點(diǎn)擊
 2.5 Word、PDF等無鏈接文檔的排序
  2.5.1 DocRank算法簡(jiǎn)介
  2.5.2 DocRank的原理
 2.6 大規(guī)模實(shí)現(xiàn)的有關(guān)問題
 2.7 用戶得到了想要的結(jié)果嗎?精確度和查全率
 2.8 總結(jié)
 2.9 To Do
 2.10 參考資料
3 推薦系統(tǒng)
 3.1 一個(gè)在線音樂商店:基本概念
  3.1.1 距離與相似度的概念
  3.1.2 走近相似度的計(jì)算
  3.1.3 什么才是最好的相似度計(jì)算公式?
 3.2 推薦引擎是怎么工作的
  3.2.1 基于相似用戶的推薦
  3.2.2 基于相似條目的推薦
  3.2.3 基于內(nèi)容的推薦
 3.3 推薦朋友、文章與新聞報(bào)道
  3.3.1 MyDiggSpace.com簡(jiǎn)介
  3.3.2 發(fā)現(xiàn)朋友
  3.3.3 DiggDelphi的內(nèi)部工作機(jī)制
 3.4 像Netflix.com那樣推薦電影
  3.4.1 電影數(shù)據(jù)集的介紹及推薦器
  3.4.2 數(shù)據(jù)標(biāo)準(zhǔn)化與相關(guān)系數(shù)
 3.5 大規(guī)模的實(shí)現(xiàn)與評(píng)估
 3.6 總結(jié)
 3.7 To Do
 3.8 參考資料
4 聚類:事物的分組
 4.1 聚類的需求
  4.1.1 網(wǎng)站中的用戶組:案例研究
  4.1.2 用SQL order by子句分組
  4.1.3 用數(shù)組排序分組
 4.2 聚類算法概述
  4.2.1 基于分組結(jié)構(gòu)的聚類算法分類
  4.2.2 基于數(shù)據(jù)類型和結(jié)構(gòu)的聚類算法分類
  4.2.3 根據(jù)數(shù)據(jù)規(guī)模的聚類算法分類
 4.3 基于鏈接的算法
  4.3.1 樹狀圖:基本的聚類數(shù)據(jù)結(jié)構(gòu)
  4.3.2 基于鏈接的算法概況
  4.3.3 單鏈接算法
  4.3.4 平均鏈接算法
  4.3.5 最小生成樹算法
 4.4 k-means算法
  4.4.1 初識(shí)k-means算法
  4.4.2 k-means的內(nèi)部原理
 4.5 魯棒的鏈接型聚類(ROCK)
  4.5.1 ROCK簡(jiǎn)介
  4.5.2 為什么ROCK這么強(qiáng)大?
 4.6 DBSCAN
  4.6.1 基于密度的算法簡(jiǎn)介
  4.6.2 DBSCAN的原理
 4.7 超大規(guī)模數(shù)據(jù)聚類
  4.7.1 計(jì)算復(fù)雜性
  4.7.2 高維度
 4.8 總結(jié)
 4.9 To Do
 4.10 參考資料
5 分類:把事物放到它該在的地方
 5.1 對(duì)分類的需求
 5.2 分類器的概述
  5.2.1 結(jié)構(gòu)分類算法
  5.2.2 統(tǒng)計(jì)分類算法
  5.2.3 分類器的生命周期
 5.3 郵件的自動(dòng)歸類與垃圾郵件過濾
  5.3.1 樸素貝葉斯分類
  5.3.2 基于規(guī)則的分類
 5.4 用神經(jīng)網(wǎng)絡(luò)做欺詐檢測(cè)
  5.4.1 交易數(shù)據(jù)中關(guān)于欺詐檢測(cè)的一個(gè)用例
  5.4.2 神經(jīng)網(wǎng)絡(luò)概覽
  5.4.3 一個(gè)可用的神經(jīng)網(wǎng)絡(luò)欺詐檢測(cè)器
  5.4.4 神經(jīng)網(wǎng)絡(luò)欺詐檢測(cè)器剖析
  5.4.5 創(chuàng)建通用神經(jīng)網(wǎng)絡(luò)的基類
 5.5 你的結(jié)果可信嗎?
 5.6 大數(shù)據(jù)集的分類
 5.7 總結(jié)
 5.8 To Do
 5.9 參考資料
6 分類器組合
 6.1 信貸價(jià)值:分類器組合案例研究
  6.1.1 數(shù)據(jù)的簡(jiǎn)要說明
  6.1.2 為真實(shí)問題生成人工數(shù)據(jù)
 6.2 用單分類器做信用評(píng)估
  6.2.1 樸素貝葉斯的基準(zhǔn)線
  6.2.2 決策樹基準(zhǔn)線
  6.2.3 神經(jīng)網(wǎng)絡(luò)基線
 6.3 在同一個(gè)數(shù)據(jù)集中比較多個(gè)分類器
  6.3.1 McNemar檢驗(yàn)
  6.3.2 差額比例檢驗(yàn)
  6.3.3 Cochran Q檢驗(yàn)與F檢驗(yàn)
 6.4 Bagging: bootstrap聚合(bootstrap aggregating)
  6.4.1 bagging實(shí)例
  6.4.2 bagging分類器底層細(xì)節(jié)
  6.4.3 分類器集成
 6.5 Boosting:一種迭代提高的方法
  6.5.1 boosting分類器實(shí)例
  6.5.2 boosting分類器底層細(xì)節(jié)
 6.6 總結(jié)
 6.7 To Do
 6.8 參考資料
7 智能技術(shù)大匯集:一個(gè)智能新聞門戶
 7.1 功能概覽
 7.2 獲取并清洗內(nèi)容
  7.2.1 各就位、預(yù)備、開抓!
  7.2.2 搜索預(yù)備知識(shí)回顧
  7.2.3 一個(gè)抓取并處理好的新聞數(shù)據(jù)集
 7.3 搜索新聞
 7.4 分配新聞?lì)悇e
  7.4.1 順序問題
  7.4.2 使用NewsProcessor類進(jìn)行分類
  7.4.3 分類器
  7.4.4 分類策略:超越底層的分類
 7.5 用NewsProcessor類創(chuàng)建新聞分組
  7.5.1 聚類全部文章
  7.5.2 在一個(gè)新聞?lì)悇e中聚類文章
 7.6 基于用戶評(píng)分的動(dòng)態(tài)內(nèi)容展示
 7.7 總結(jié)
 7.8 To Do
 7.9 參考資料
附錄A BeanShell簡(jiǎn)介
 A.1 什么是BeanShell?
 A.2 為什么使用BeanShell?
 A.3 運(yùn)行BeanShell
 A.4 參考資料
附錄B 網(wǎng)絡(luò)采集
 B.1 爬蟲組件概況
  B.1.1 采集的步驟
  B.1.2 我們的簡(jiǎn)單爬蟲
  B.1.3 開源Web爬蟲
 B.2 參考資料
附錄C 數(shù)學(xué)知識(shí)回顧
 C.1 向量和矩陣
 C.2 距離的度量
 C.3 高級(jí)矩陣方法
 C.4 參考資料
附錄D 自然語言處理
 D.1 參考資料
附錄E 神經(jīng)網(wǎng)絡(luò)
 E.1 參考資料
索引

編輯推薦

算法是解決問題的一系列步驟。為實(shí)現(xiàn)有價(jià)值的Web應(yīng)用(如推薦引擎、智能化搜索、內(nèi)容組織系統(tǒng)等),本書提供了清晰的、精心組織過的算法模式。利用這些技術(shù),你可以捕獲用戶原始而重要的信息,并把它們應(yīng)用于實(shí)踐中以獲取相應(yīng)的收益。    用戶數(shù)據(jù)中包含大量有價(jià)值的關(guān)聯(lián)信息,它們往往無法通過人工觀察而直觀地獲取,對(duì)于希望從這些數(shù)據(jù)中挖掘信息的Web開發(fā)者來說,瑪若曼尼斯、巴賓寇編著的《智能Web算法》是一本很好的手冊(cè)。作者作為一名Web開發(fā)者,擁有豐富的實(shí)踐經(jīng)驗(yàn),加上多年來對(duì)機(jī)器學(xué)習(xí)領(lǐng)域技術(shù)的專研,使得本書對(duì)技術(shù)的解釋清晰明了,讀者可快速將其用于解決自己的問題。同時(shí),本書提供的Java程序展示了如何搭建一個(gè)智能的應(yīng)用,以及如何從用戶的行為中進(jìn)行學(xué)習(xí),這是一筆現(xiàn)成的財(cái)富。

圖書封面

圖書標(biāo)簽Tags

評(píng)論、評(píng)分、閱讀與下載


    智能Web算法 PDF格式下載


用戶評(píng)論 (總計(jì)95條)

 
 

  •   看看可以完全的顛覆傳統(tǒng)的對(duì)數(shù)據(jù)庫增刪改操作的過程。
    主要講了以下四點(diǎn)web智能應(yīng)用:搜索引擎,推薦系統(tǒng),事物分組,分類器
  •   主要的WEB應(yīng)用算法都涉及到了
  •   難得的一本web算法人們的好書
  •   呵呵。這本書介紹了很多方面的算法。值得一看。
  •   算法很重要,經(jīng)典
  •   需要有一定的算法基礎(chǔ)才能看哦
  •   算法很全。
  •   尚未看,感覺挺多算法知識(shí)的,同志任需努力
  •   智能技術(shù)的入門書,還有不少的網(wǎng)絡(luò)資源,喜歡。
  •   人工智能的書很少
  •   一句話,本書介紹的技術(shù)可操作性強(qiáng)。很適合對(duì)搜索引擎感興趣的朋友。
  •   書真的挺好的,適合網(wǎng)絡(luò)挖掘入門者學(xué)習(xí)與收藏。
  •   研究這方面內(nèi)容,看上去不錯(cuò),希望有所收獲~~
  •   這本書內(nèi)容上比較容易懂,不想一般的翻譯過來的書那樣晦澀和惡心,但是在閱讀本書之前建議先讀一下《Lucene in Action》或者其他有關(guān)Lucene的書籍。
  •   翻了下,感覺挺好的,只是自己還木有時(shí)間深入的看
  •   介紹的很清楚,值得看
  •   內(nèi)容豐富,淺顯易懂,文筆還行啊~
  •   我的專業(yè)需要這個(gè),希望能有用
  •   這本書寫得不錯(cuò),值得一看。
  •   這本書比較不錯(cuò),慢慢看,細(xì)細(xì)品。
  •   和我想的不太一樣,貌似是我想差了,不過內(nèi)容還不錯(cuò)。
  •   內(nèi)容新穎,翻譯還有待提高
  •   但是紙張也太對(duì)不起書的內(nèi)容了吧
  •   主要的WEB應(yīng)用算法都涉及到了,值得細(xì)讀
  •   不錯(cuò)的書,只是還沒有看
  •   給老公買的工具書,還不錯(cuò)
  •   剛收到書,大致翻了一下,應(yīng)該很對(duì)胃口
  •   很不錯(cuò),阿穩(wěn)翻譯的,看看!
  •   很不錯(cuò),可惜本人水平有限,看得不太懂。翻譯的質(zhì)量有待進(jìn)一步的提高。
  •   找了很久,終于找到了,很好
  •   高級(jí)程序員必要書籍
  •   很好,比較深入,細(xì)節(jié)也不錯(cuò)
  •   我只想說這是一本有用的書
  •   書真心是好書。但是封面刮破半厘米的口子。
  •   實(shí)用,有例子
  •   入門還是挺不錯(cuò)的
  •   書本質(zhì)量不鏎
  •   其它的不說了,難得一見的好書
  •   書剛到,還沒看,感覺還行??!
  •   對(duì)于智能web來說,算法的選擇很重要
  •   對(duì)于初學(xué)者來說,看完此書,會(huì)對(duì)搜索,智能推薦有明顯的認(rèn)識(shí)和提高。書中,還有核心算法的部分實(shí)現(xiàn)。對(duì)于想繼續(xù)鉆研此領(lǐng)域的人來說,是本好書
  •   書不錯(cuò),里邊主要是java實(shí)現(xiàn),智能算法講的也很不錯(cuò),比較推薦。
  •   這本書適合之前沒有過相關(guān)經(jīng)驗(yàn),然后需要用最快的速度完成一個(gè)智能系統(tǒng)的人。這各系統(tǒng)只是模型,離實(shí)際應(yīng)用還有相當(dāng)?shù)木嚯x。
  •   很有用,常用算法都有介紹,學(xué)習(xí)中。
  •   推薦算法部分的內(nèi)容太單薄,離我的要求太遠(yuǎn)。
  •   買本看看,web編程不再是增刪改。
  •   有了人工智能的基礎(chǔ)看這個(gè)可能比較輕松,沒有相關(guān)經(jīng)驗(yàn)可能看起來比較難。
  •   這本書還不錯(cuò),但是代碼占篇幅較多,可以作為一本不錯(cuò)的概述型書。
  •   紙張不錯(cuò),拿起來很輕。
    還只看了序言,譯者對(duì)學(xué)習(xí)方法很有心得
  •   我上午下的訂單,晚上就拿到書了,很棒的物流。
    書質(zhì)量也不錯(cuò),很好的初級(jí)啟蒙式讀本
  •   里面的內(nèi)容比較一般
  •   看起來挺高深的,內(nèi)容不太好理解。
  •   內(nèi)容很深?yuàn)W,需要慢慢研究。
  •   總體不錯(cuò),但是使用的Lucene版本比較老,需要對(duì)Lucene有比較深入的理解。
  •   書不錯(cuò),但是感覺文字部分偏多
  •   還未看,感覺一般
  •   講的很有啟發(fā)
  •   我還沒有時(shí)間照書練習(xí)
  •   翻譯的不錯(cuò),看了后很有啟發(fā)!
  •   目前還在看,有點(diǎn)難度
  •   書不錯(cuò) ,個(gè)人能力有限
  •   智能Web算法
  •   比較適合專業(yè)的算法研發(fā)人員
  •   書內(nèi)容不錯(cuò),不過涉及不夠深入;翻譯也還算可以,雖非業(yè)界權(quán)威,但也下了功夫??炊畱?yīng)該是沒為題的。
    總的來說,這是一本適合入門者學(xué)習(xí)的書。
  •   相對(duì)內(nèi)容來說,定價(jià)偏貴,博文視點(diǎn)的書沒幾本好的
  •   入門介紹性,幫助不大。
  •   書中的**,大家不要買
  •   感覺名實(shí)其副。。。。
  •   感覺還好, 不算很佳, 但也比較平平。
  •   跟大幫的事情,都是國外的牙慧
  •   書一般,比較適合科普;
    紙質(zhì)比較差,很輕。
  •   什么時(shí)候,給反券???
  •   速度還可以,但是書好像不是很新。
  •   盜版!
    鑒定完畢
  •   1:《SQL Server 2008商業(yè)智能完美解決方案》,對(duì)商業(yè)智能做了一個(gè)概括的介紹。個(gè)人看法比較適合于已經(jīng)熟悉微軟商業(yè)智能原理與實(shí)現(xiàn)的人閱讀,比如熟悉sql server 2005商業(yè)智能實(shí)現(xiàn)的人可以了解一下2008下的情況。不熟悉的人通過這本書可以了解商業(yè)智能的基礎(chǔ)理論。涉及到具體的操作,書中雖然有許多截圖,但是不夠詳細(xì),沒法用這本書來學(xué)習(xí)具體的操作。個(gè)人看法這本書要么再詳細(xì)一些,要么再簡(jiǎn)略一些,都會(huì)比現(xiàn)在要好。2:《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫肥菄獯髮W(xué)的教材,看譯者序許多國內(nèi)高線也用它作為教材。因此這本書講原理比較多。比較透徹,充滿了數(shù)學(xué)符號(hào)和公式。詳細(xì)講述了分類、關(guān)聯(lián)分析、聚類分析三種數(shù)據(jù)挖掘算法的原理。我發(fā)現(xiàn)有些數(shù)據(jù)挖掘的參數(shù)在微軟的幫助文檔中沒說明白,看這本書說的比較清楚。我想看的是能指導(dǎo)實(shí)際的數(shù)據(jù)挖掘操作的書,因此對(duì)書中的公式基本跳過。只看了看書中講到的算法解決的各種問題及其思路。3:《數(shù)據(jù)挖掘原理與應(yīng)用(第2版)》,講解Excel2007的數(shù)據(jù)挖掘插件做數(shù)據(jù)挖掘的部分不錯(cuò),后面講數(shù)據(jù)挖掘的各種算法,詳細(xì)列出了各種參數(shù)和DMX腳本,但是沒有透徹的講解,給我的感覺就像微軟的bookonline,適合作為工具書去查閱,但是不適合作為入門書去閱讀。書的最后部分給出了用.net實(shí)現(xiàn)數(shù)據(jù)挖掘編程的例子,應(yīng)該還可以實(shí)例代碼在實(shí)際項(xiàng)...目中做參考。4:《精通sql server 2008程序設(shè)計(jì)》,全書分了四個(gè)部分,第四部分講商業(yè)智能。限于篇幅問題在數(shù)據(jù)挖掘方面只講了一種算法(聚類分析)的實(shí)現(xiàn),如果想了解商業(yè)智能與數(shù)據(jù)挖掘,這本書也不夠?qū)嵱谩?:《智能Web算法》:所謂智能web,書中是指能根據(jù)用戶在網(wǎng)站的行為作出針對(duì)用戶的響應(yīng)的網(wǎng)站。常見的應(yīng)用就是推薦系統(tǒng)。另外作者認(rèn)為google的搜索也是智能web的例子。書中討論了Google搜索原理、推薦系統(tǒng)原理、聚類算法、分類算法。本書附有Java實(shí)現(xiàn)書中算法的源代碼,書中有不少篇幅是針對(duì)源代碼講算法。讀者也可以使用源代碼做測(cè)試。當(dāng)然作者聲明給出的代碼都是經(jīng)過刻意簡(jiǎn)化,目的是為了讓讀者快速明白算法的基本原理。感覺本書的翻譯還比較專業(yè),讀起來比較流暢。值得夸一夸的是本書的印刷用紙。不知道業(yè)內(nèi)名詞,但是書拿在手里明顯比同體積的書要輕,感覺很舒服。我在amazon.com上買過幾本美國出的書,也是感覺明顯比較輕。6:《深入淺出數(shù)據(jù)分析》:深入不夠,淺出做的不錯(cuò)。適合技術(shù)人員與業(yè)務(wù)人員作為統(tǒng)計(jì)學(xué)入門讀物來閱讀《深入淺出數(shù)據(jù)分析》是美國O’REILLY出版社的“深入淺出”系列之一。這個(gè)系列的特點(diǎn)是花了不少心思琢磨如何讓讀者更舒服地閱讀、記住書中更多內(nèi)容,書雖然都比較厚,但是插圖非常多。插圖與正文經(jīng)?;煸谝黄?,沒有明顯的界限。讀起來確實(shí)比較輕松,相對(duì)文字多圖少的書來說,也確實(shí)更容易記住書中的內(nèi)容。由于圖多字少,讀起來很快,也能讓人感覺比較有成就感。不過這個(gè)系列的書都比較貴。這本書的主要內(nèi)容我認(rèn)為是統(tǒng)計(jì)學(xué)入門。不懂技術(shù)但是用過excel的人就可以看。講了講統(tǒng)計(jì)學(xué)的基本概念和貝葉斯統(tǒng)計(jì)、直方圖、回歸、誤差等概念,使用了excel和一個(gè)專門的統(tǒng)計(jì)工具R做演示。作者比較推薦R。因?yàn)檫@個(gè)工具在統(tǒng)計(jì)學(xué)應(yīng)用方面比excel更靈活。是一個(gè)開源軟件,還有相關(guān)的社區(qū)在為這個(gè)軟件不停的增加功能。7:《可視化數(shù)據(jù)》專講Process這個(gè)軟件的使用,網(wǎng)絡(luò)書店對(duì)這本書的介紹都提及了這個(gè)問題。對(duì)這個(gè)軟件不感興趣的就不用買了。我買的時(shí)候沒注意到網(wǎng)頁上介紹,看的時(shí)候才發(fā)現(xiàn)。書中充斥著process的代碼。沒有學(xué)習(xí)和使用process的計(jì)劃,因此也就大概翻了翻,看看process解決的問題及其思路。8:《業(yè)務(wù)建模與數(shù)據(jù)挖掘》是05年出版的。與《數(shù)據(jù)模型資源手冊(cè)》卷一卷二同屬機(jī)械工業(yè)出版社的數(shù)據(jù)庫技術(shù)系列叢書。后者早就賣光了,這本書還有??磥磉€是比較冷僻。翻譯同樣的比較專業(yè)。同樣是偏學(xué)術(shù)性的。不過作為專業(yè)書來說,公式、圖表偏少。個(gè)人看法想研究具體的數(shù)據(jù)挖掘算法可以看《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫贰?:《數(shù)據(jù)之美》:概括描述了20個(gè)數(shù)據(jù)挖掘、數(shù)據(jù)可視化、云存儲(chǔ)及其他數(shù)據(jù)處理相關(guān)項(xiàng)目這本書相對(duì)來說還算比較新,是從英文版翻譯過來的。英文版2009年出版。中文版2010年10月出版。由20篇相互獨(dú)立的文章組成。每篇講一個(gè)數(shù)據(jù)處理相關(guān)的項(xiàng)目。不涉及具體的技術(shù)細(xì)節(jié),僅僅是概括說明原理、思路、過程、結(jié)果??傮w來說,閱讀起來有點(diǎn)晦澀。感覺作者基本都明白英文版的意思,不過有些地方中文表達(dá)上不夠通順。這在IT業(yè)的翻譯書中已經(jīng)算不錯(cuò)的組合了,強(qiáng)過中文過關(guān)但是不懂技術(shù)的情況。10:《超級(jí)數(shù)字天才》講數(shù)據(jù)挖掘給人類帶來的好處。比較詳細(xì),給出了具體的例子和實(shí)現(xiàn)的思路。書中列也在使用“數(shù)據(jù)分析”這個(gè)詞,基本也在指“數(shù)據(jù)挖掘”。書中列舉了數(shù)據(jù)挖掘在政府政策、教育、醫(yī)療等許多方面的實(shí)際應(yīng)用的例子,都比較有意思。想了解數(shù)據(jù)挖掘的具體應(yīng)用,可以看看這本書。書中給我印象比較深刻的是例子中政府與教育行業(yè)的數(shù)據(jù)挖掘應(yīng)用。一項(xiàng)政策的好壞,一個(gè)教育方法的好壞,美國人都試圖用數(shù)據(jù)說話。11:《數(shù)據(jù)分析競(jìng)爭(zhēng)法》是商務(wù)印書館的哈佛經(jīng)管系列之一,名頭比較大,先看它。不過有些失望。不是給技術(shù)人員看的。題目中的數(shù)據(jù)分析大約是說商業(yè)智能中的數(shù)據(jù)挖掘。作者把企業(yè)利用數(shù)據(jù)挖掘的程度分為由低到高的五級(jí)。全書反復(fù)論述每個(gè)級(jí)別的方法、工具、流程、對(duì)企業(yè)的好處,還舉了一些的例子。在我看來這些例子不夠詳細(xì),太籠統(tǒng)。所以我認(rèn)為這本書適合于不了解商業(yè)智能與數(shù)據(jù)挖掘的管理人員閱讀。 閱讀更多 ›
  •   本意是為了了解推薦引擎算法的。一讀才發(fā)現(xiàn)太簡(jiǎn)單。真的是普及性讀物。不如集體智慧編程那本書
  •   感覺內(nèi)容介紹的太淺顯了,尤其是分類那一章,5分鐘就翻完了,根本沒有什么實(shí)際的內(nèi)容,很失望
  •   完全陌生于這個(gè)數(shù)據(jù)挖掘領(lǐng)域,看這書收獲頗多。書本身就寫得不錯(cuò),沒什么數(shù)學(xué)公式,其次要贊的是譯者,翻譯的還是非常不錯(cuò)的,書籍很貼心的注明了英文原版書的相應(yīng)頁碼,剛好我電腦里面有英文的pdf,看起來就更爽了。推薦新手入門吧。已經(jīng)入門數(shù)據(jù)挖掘的有經(jīng)驗(yàn)的大牛完全可以忽略此書。
  •   書中每個(gè)章節(jié)所講的例子過于簡(jiǎn)單了,適合掃盲
  •   對(duì)相關(guān)領(lǐng)域人員來說太淺,只能作為非相關(guān)領(lǐng)域人員的掃盲讀物。
  •   屬于及其基礎(chǔ)讀物,沒什么太大價(jià)值。
  •   送貨速度,書的質(zhì)量都沒得說,麻煩把發(fā)票大清晰點(diǎn)吧 都看不清打的啥
  •   書好像被動(dòng)過,雖然沒有什么痕跡,但是肯定被動(dòng)過。不過肯定是正版的,從紙的質(zhì)感就知道。
  •   老外寫書的思路就是和國內(nèi)不太一樣,簡(jiǎn)單易懂,思路清晰,是很好的能讓人看懂的書。
  •   紙張稍厚了一點(diǎn),還沒看完呢
  •   寫的有點(diǎn)簡(jiǎn)略,適合了解。。
  •   目錄書,淺嘗輒止,內(nèi)容涵蓋的范圍大,但是都沒有深入,適合做目錄書。對(duì)于剛接觸的人來說可以起到指導(dǎo)作用。
  •   個(gè)人感覺作者不太適合寫書,全書1/3都是破碎的代碼片段,而且缺乏直觀的圖示。讀起來比較吃力,而且內(nèi)容的價(jià)值也不大。
  •   最初讀過《集體智慧編程》第一次感到老外寫的書就是好,卻是用心思在寫書,簡(jiǎn)單易懂,容易上手,不像國內(nèi)人們寫的書八股,讀完了,也知道點(diǎn)概念但是不知道如何使用,如何而在程序上去實(shí)現(xiàn)。后來發(fā)現(xiàn)《智能Web算法》立刻買了,大概讀了下,思路和《集體智慧編程》類似,但是有些其他的東西,這本書沒有細(xì)讀,但是應(yīng)該不失為一本不錯(cuò)的書,什么時(shí)候國人也能像老外們一樣做事?
  •   現(xiàn)在沒仔細(xì)研究,整本書講理論還是從工程上講,比較好容易讓人接受~~
  •   要不是內(nèi)容不錯(cuò),我就把書給退了,垃圾印刷,能值10塊錢就不錯(cuò)了,二手書買著都比這“正版書”強(qiáng),第一次打差評(píng),很郁悶!
  •   挺湊合的一本書
  •   算法是必不可少的
  •   專業(yè)書籍,單位同事推薦的。
  •   書不錯(cuò),好好學(xué)習(xí)天天向上
 

250萬本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7