數(shù)據(jù)挖掘

出版時(shí)間:2005-9  出版社:機(jī)械工業(yè)出版社  作者:威滕  頁(yè)數(shù):524  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

本書(shū)對(duì)1999年的初版做了重大的改動(dòng)。雖說(shuō)核心概念沒(méi)有變化,但本書(shū)進(jìn)行了更新使其能反映過(guò)去5年里的變化,參考文獻(xiàn)幾乎翻了一番。新版的重要部分包括:30個(gè)新的技術(shù)章節(jié);一個(gè)加強(qiáng)了的具有交互式界面的Weka機(jī)器學(xué)習(xí)工作平臺(tái);有關(guān)神經(jīng)網(wǎng)絡(luò)的完整信息,一個(gè)有關(guān)貝葉斯網(wǎng)絡(luò)的新節(jié);等等?! ”緯?shū)提供了機(jī)器學(xué)習(xí)概念的完整基礎(chǔ),此外還針對(duì)實(shí)際工作中應(yīng)用相關(guān)工具和技術(shù)提出了一些建議,在本書(shū)中你將發(fā)現(xiàn):   ●成功數(shù)據(jù)挖掘技術(shù)的核心算法,包括歷經(jīng)考驗(yàn)的真實(shí)技術(shù)及前沿的方法。   ●轉(zhuǎn)換輸入或輸出以改善性能的方法?!  窨上螺d的Weka軟件??一個(gè)用于數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法的集合,包括用于數(shù)據(jù)預(yù)處理、分類(lèi)、回歸、聚類(lèi)、關(guān)聯(lián)規(guī)則以及在新的交互式界面上可視化的工具。

作者簡(jiǎn)介

Lan H.Witten新西蘭懷卡托大學(xué)計(jì)算機(jī)科學(xué)系教授,ACM和新西蘭皇家學(xué)會(huì)成員。他曾榮獲2004年國(guó)際信息處理研究聯(lián)合會(huì)頒發(fā)的Namur獎(jiǎng)項(xiàng),這是一個(gè)兩年一度的榮譽(yù)獎(jiǎng)項(xiàng),用于獎(jiǎng)勵(lì)那些在信息和通信技術(shù)的社會(huì)應(yīng)用方面做出杰現(xiàn)貢獻(xiàn)及具有國(guó)際影響的人。他的著作包括《Managing Gi

書(shū)籍目錄

ForewordPrefacePart I Machine learning tools and techniques 1. What?s it all about?   1.1 Data mining and machine learning   1.2 Simple examples: the weather problem and others   1.3 Fielded applications   1.4 Machine learning and statistics   1.5 Generalization as search   1.6 Data mining and ethics   1.7 Further reading  2. Input: Concepts, instances, attributes   2.1 What?s a concept?   2.2 What?s in an example?  2.3 What?s in an attribute?   2.4 Preparing the input   2.5 Further reading  3. Output: Knowledge representation   3.1 Decision tables   3.2 Decision trees   3.3 Classification rules   3.4 Association rules   3.5 Rules with exceptions   3.6 Rules involving relations  3.7 Trees for numeric prediction   3.8 Instance-based representation   3.9 Clusters   3.10 Further reading  4. Algorithms: The basic methods   4.1 Inferring rudimentary rules   4.2 Statistical modeling   4.3 Divide-and-conquer: constructing decision trees   4.4 Covering algorithms: constructing rules   4.5 Mining association rules   4.6 Linear models   4.7 Instance-based learning   4.8 Clustering   4.9 Further reading  5. Credibility: Evaluating what?s been learned   5.1 Training and testing   5.2 Predicting performance   5.3 Cross-validation   5.4 Other estimates   5.5 Comparing data mining schemes   5.6 Predicting probabilities   5.7 Counting the cost   5.8 Evaluating numeric prediction   5.9 The minimum description length principle   5.10 Applying MDL to clustering   5.11 Further reading  6. Implementations: Real machine learning schemes   6.1 Decision trees   6.2 Classification rules   6.3 Extending linear models   6.4 Instance-based learning   6.5 Numeric prediction   6.6 Clustering   6.7 Bayesian networks  7. Transformations: Engineering the input and output   7.1 Attribute selection   7.2 Discretizing numeric attributes   7.3 Some useful transformations   7.4 Automatic data cleansing   7.5 Combining multiple models   7.6 Using unlabeled data   7.7 Further reading  8. Moving on: Extensions and applications   8.1 Learning from massive datasets   8.2 Incorporating domain knowledge   8.3 Text and Web mining   8.4 Adversarial situations   8.5 Ubiquitous data mining   8.6 Further reading Part II: The Weka machine learning workbench  9. Introduction to Weka   9.1 What?s in Weka?   9.2 How do you use it?   9.3 What else can you do?  9.4 How do you get it?  10. The Explorer   10.1 Getting started   10.2 Exploring the Explorer   10.3 Filtering algorithms   10.4 Learning algorithms   10.5 Meta-learning algorithms   10.6 Clustering algorithms   10.7 Association-rule learners   10.8 Attribute selection  11. The Knowledge Flow interface   11.1 Getting started   11.2 Knowledge Flow components   11.3 Configuring and connecting the components   11.4 Incremental learning  12. The Experimenter   12.1 Getting started   12.2 Simple setup   12.3 Advanced setup   12.4 The Analyze panel  12.5 Distributing processing over several machines  13. The command-line interface   13.1 Getting started   13.2 The structure of Weka   13.3 Command-line options  14. Embedded machine learning …… 15. Writing new learning schemes References Index

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    數(shù)據(jù)挖掘 PDF格式下載


用戶(hù)評(píng)論 (總計(jì)34條)

 
 

  •   是我們machinelearninganddatamining的教材之一,不過(guò)這本書(shū)是圍繞weka的,TomMitchell的MachineLearning是理論為主的。要做算法的implementation的時(shí)候,用這本書(shū)很好
  •   去年暑假開(kāi)始學(xué)習(xí)weka,是沖著weka部分買(mǎi)的,還不錯(cuò)~挺實(shí)用的一本書(shū),到現(xiàn)在還在有看!!
  •   好書(shū),翻譯版的書(shū)很多地方看不懂,有英文版的就好了
  •   很好的一本書(shū),不管入門(mén)和專(zhuān)家本書(shū)都有很大作用
  •   書(shū)不錯(cuò),價(jià)格也好,而且原版的竟然比翻譯的便宜,哈哈
  •   這是本經(jīng)典的DataMining書(shū)籍,值得一讀!
  •   首先,數(shù)的印制和紙質(zhì)不錯(cuò),影印版一樣很清晰;
    其次,內(nèi)容正在看,就目前所看來(lái)說(shuō),應(yīng)該是本不錯(cuò)的書(shū);
  •   首先是書(shū),質(zhì)量不錯(cuò),印刷的也很精良。與我的要求相符。然后是送貨,比預(yù)想中的要快,并且不要運(yùn)費(fèi),服務(wù)態(tài)度很好。
  •   送貨很快。正再看
  •   書(shū)上有講一款軟件,用于機(jī)器學(xué)習(xí)方面的。不過(guò)還沒(méi)試過(guò)。
  •   從事數(shù)據(jù)挖掘領(lǐng)域研究,買(mǎi)回來(lái)還沒(méi)怎么學(xué)習(xí)呢,不過(guò)是professor推薦的,應(yīng)該不錯(cuò)
  •   可以從入門(mén)學(xué)習(xí)。例子很多,很容易把握概念。You can study from the very basic concept with this book as it uses a lot of examples to explain every algorithm and principle. But the only thing that I didn't ***e is the book cover is a little bit dirty.
  •   英文原版的不錯(cuò)讀起來(lái)流暢不想一些翻譯的爛書(shū)不知所云
  •   上學(xué)的時(shí)候老師推薦的書(shū)。英文版的看起來(lái)有些吃力,但是比中文版要好一些??梢愿形陌鎸?duì)照著學(xué)習(xí)
  •   課本不錯(cuò),很新,,,大家要記得要發(fā)票啊。
  •   嗯,看了一小部分了,很不錯(cuò),算是實(shí)用。
  •   還不錯(cuò)的,我是和中文對(duì)照看的~
  •   剛看。沖著作者名氣買(mǎi)的,應(yīng)該還不錯(cuò)。
  •   買(mǎi)了一周了,看來(lái)前4章,有點(diǎn)失望。語(yǔ)言對(duì)讀者的重要性不言而喻,尤其是對(duì)以英語(yǔ)為第二語(yǔ)言的讀者。我對(duì)這本書(shū)的語(yǔ)言寫(xiě)作風(fēng)格很是不爽。作者做為一個(gè)新西蘭人使用的書(shū)面英語(yǔ)非?;逎?,經(jīng)常使用一些非主流的單詞。先忍一忍,趕快把后面的weka工具包那部分看完。
  •   一般,印刷質(zhì)量不行
  •     這本書(shū)確實(shí)如所知道的那樣,翻譯得很水。很多一些概念的東西就像把你隔在某種屏障外,然后其實(shí)說(shuō)的并不是那么枯燥的東西…………
      本書(shū)主要還是介紹機(jī)器學(xué)習(xí)的,用這本書(shū)的目的就是為了了解weka中算法實(shí)現(xiàn)的思想。從這點(diǎn)出發(fā)這本書(shū)還算是比較值當(dāng)?shù)牧?,比官方的文檔確實(shí)還是要精細(xì)更好一些……
  •     作者可以說(shuō)是享譽(yù)盛名,但是這本書(shū)寫(xiě)出來(lái),基本上章法全無(wú)。理論和例子基本上沒(méi)有幾個(gè)是適合入門(mén)者的,加上翻譯有些地方表意不清。初階入門(mén)者看了的話(huà),肯定一團(tuán)迷霧。
      評(píng)論太短了嘛?評(píng)論太短了嘛?評(píng)論太短了嘛?評(píng)論太短了嘛?評(píng)論太短了嘛?評(píng)論太短了嘛?評(píng)論太短了嘛?評(píng)論太短了嘛?
  •     -----------------------------------------
      
      外文教材, 外文參考書(shū) 請(qǐng)咨詢(xún)
      
      http://shop35575714.taobao.com
      
      
      ----------------------------------------
  •     我覺(jué)得,可以當(dāng)作weka的使用手冊(cè)來(lái)看,但是比weka自帶的指南寫(xiě)的好看。
      
      算法部分的介紹很詳細(xì)。
  •     這本書(shū)雖然標(biāo)題是Data Mining,但是核心內(nèi)容還是機(jī)器學(xué)習(xí)。我理解“數(shù)據(jù)挖掘”主要指的還是KDD,即基于數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn)。在這個(gè)領(lǐng)域,基本的方法是聚類(lèi)和關(guān)聯(lián)規(guī)則發(fā)現(xiàn);而在機(jī)器學(xué)習(xí)領(lǐng)域,主要研究的是分類(lèi)。
      
      這本書(shū)的內(nèi)容主要是分類(lèi),也有一部分聚類(lèi)的內(nèi)容,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)基本上沒(méi)有講。但它對(duì)分類(lèi)講的很詳細(xì),主要的思想都涉及到了,體系整理很好。它對(duì)相關(guān)的知識(shí),如分類(lèi)算法的性能估計(jì),如何在分類(lèi)中結(jié)合成本考慮等也做了詳細(xì)的介紹。因此,認(rèn)真讀讀這本書(shū)對(duì)于學(xué)好用好分類(lèi)是很有幫助的。
      
      它的第二部分介紹了Weka這個(gè)機(jī)器學(xué)習(xí)框架的使用。用好這個(gè)框架能夠幫助簡(jiǎn)化機(jī)器學(xué)習(xí)算法研究中的一些輔助工作,作用還是很大的。
      
      因此,推薦對(duì)機(jī)器學(xué)習(xí),特別是分類(lèi)有興趣的同志們看看這本書(shū)。
  •     這本書(shū)我覺(jué)得最值得閱讀的地方還是后面WEKA的部分,當(dāng)然了前面也有關(guān)于WEKA文件的表示說(shuō)明。至于其他的方面么,這本書(shū)只能說(shuō)是還湊合。當(dāng)然了如果你已經(jīng)有了本書(shū),又不想買(mǎi)其他的數(shù)據(jù)挖掘方面的教程,還是不錯(cuò)的。呵呵
  •     這種書(shū)的翻譯都是一個(gè)導(dǎo)師,找多個(gè)研究生每人分倆章節(jié),對(duì)這金山詞霸翻譯的,能好到哪里。所以要讀還是讀原版。
  •       翻譯的不大好,譬如:指針與引用的"引用(reference)",被翻譯成"參考";JavaBean被翻譯為Java豆;異常的"拋出"被翻譯為"丟棄"....
        不過(guò)對(duì)于想學(xué)習(xí)Weka,研究Weka源碼的朋友來(lái)說(shuō),該書(shū)的算法介紹和軟件使用還是很不錯(cuò)的.
  •     這本dm的書(shū)啃完了,覺(jué)得有點(diǎn)這個(gè)書(shū)有點(diǎn)“偏見(jiàn)”,怎么理解呢
      前面的東西不錯(cuò)哦,可是后半部分的Weka平臺(tái)我個(gè)人覺(jué)得翻翻就行了,要學(xué)還不如看看spss的書(shū)呢,前面關(guān)于機(jī)器模型的建立的數(shù)學(xué)基礎(chǔ)要求的不是很高,所以很適合一般沒(méi)有學(xué)過(guò)隨機(jī)過(guò)程的人看看,要是數(shù)學(xué)很牛的人,可以看看這個(gè)《模式分類(lèi)》,呵呵這本書(shū)也不錯(cuò),偶正在讀,不過(guò)這書(shū)很BT,我也是慢慢的啃,挺“費(fèi)牙”的,呵呵。
  •   呵呵,你轉(zhuǎn)行了?
  •   我都轉(zhuǎn)了一年了。。。。
  •   剛剛買(mǎi)了本.十一假期看.
  •   這個(gè)翻譯太搞了……
  •   這本書(shū)是英文版,何來(lái)的翻譯哦
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7