出版時(shí)間:2009-7 出版社:西南財(cái)經(jīng)大學(xué)出版社 作者:李保坤,張麗娟 頁(yè)數(shù):136
Tag標(biāo)簽:無
內(nèi)容概要
《數(shù)據(jù)挖掘教程》的文字內(nèi)容主要參考了美國(guó)麻省理工學(xué)院的數(shù)據(jù)挖掘開放講義、國(guó)外許多大學(xué)老師關(guān)于數(shù)據(jù)挖掘課程的教學(xué)資料以及網(wǎng)絡(luò)上對(duì)有關(guān)算法的介紹材料。書中使用的數(shù)據(jù)均來自統(tǒng)計(jì)學(xué)教材或數(shù)據(jù)挖掘教材中使用的標(biāo)準(zhǔn)數(shù)據(jù),數(shù)據(jù)分析結(jié)果和圖形展示由作者自己制作的西南財(cái)經(jīng)大學(xué)數(shù)據(jù)挖掘系統(tǒng)軟件生成。
作者簡(jiǎn)介
李保坤,美國(guó)新墨新墨西哥州立大學(xué)博士,西南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院副教授,應(yīng)用統(tǒng)計(jì)研究所副所長(zhǎng)。
書籍目錄
第一章 介紹1.1 這本書的讀者對(duì)象1.2 什么是數(shù)據(jù)挖掘1.3 數(shù)據(jù)挖掘的用途1.4 數(shù)據(jù)挖掘的起源1.5 術(shù)語(yǔ)和注釋1.6 數(shù)據(jù)集合的組織1.7 數(shù)據(jù)挖掘迅速發(fā)展的因素第二章 數(shù)據(jù)挖掘過程概覽2.1 數(shù)據(jù)挖掘的核心思想2.2 有約束學(xué)習(xí)和無約束學(xué)習(xí)2.3 數(shù)據(jù)挖掘的步驟2.4 SEMMA2.5 預(yù)備階段附錄:數(shù)據(jù)分塊方法2.6建立模型--線性回歸的一個(gè)例子第三章 有約束學(xué)習(xí)--分類和預(yù)測(cè)3.1 一個(gè)分兩類的分類法3.2 貝葉斯最小誤差法則3.3 采用分類誤差作為標(biāo)準(zhǔn)的分類方法評(píng)價(jià)3.4 不對(duì)稱錯(cuò)誤分類代價(jià)和貝葉斯風(fēng)險(xiǎn)3.5 分層采樣和不對(duì)稱代價(jià)3.6 推廣到多于兩類的情況3.7 提升圖3.8 波士頓住房(兩類)3.9 采用三分(Triage)策略的分類第四章 多元線性回歸4.1 多元線性回歸復(fù)習(xí)4.2 回歸過程舉例4.3 線性回歸的自變量選擇4.4 線性回歸分析的一般步驟第五章 Logistic回歸5.1 一個(gè)簡(jiǎn)單例子5.2 Logistic回歸模型5.3 機(jī)會(huì)比(Odds Ratio)5.4 概率5.5 模型擬合的又一個(gè)例子附錄A:回歸系數(shù)的極大似然估計(jì)和置信區(qū)間計(jì)算附錄B:使用西南財(cái)大數(shù)據(jù)挖掘系統(tǒng)對(duì)波士頓住宅區(qū)的數(shù)據(jù)處理第六章 神經(jīng)網(wǎng)絡(luò)6.1 神經(jīng)元(一個(gè)數(shù)學(xué)模型)6.2 神經(jīng)網(wǎng)絡(luò)6.3 費(fèi)歇爾(Fisher)的鳶尾花數(shù)據(jù)6.4 后向傳播算法--分類6.5 調(diào)整網(wǎng)絡(luò)用于預(yù)測(cè)6.6 多個(gè)區(qū)域最優(yōu)和遍數(shù)6.7 過分?jǐn)M合和訓(xùn)練遍數(shù)的選擇6.8 結(jié)構(gòu)的適應(yīng)性選擇6.9 成功應(yīng)用的例子附錄:使用西南財(cái)大數(shù)據(jù)挖掘系統(tǒng)的神經(jīng)網(wǎng)絡(luò)分類演示第七章 分類與回歸樹7.1 分類樹7.2 遞歸分區(qū)7.3 騎乘式割草機(jī)7.4 剪枝7.5 最小誤差樹7.6 最佳剪枝樹7.7 樹的分類規(guī)則7.8 回歸樹附錄:西南財(cái)大數(shù)據(jù)挖掘系統(tǒng)分類樹介紹第八章 判別分析8.1 騎乘式割草機(jī)8.2 Fisher的線性判別函數(shù)8.3 貝葉斯線性分類函數(shù)8.4 距離度量8.5 分類誤差8.6 鳶尾花的分類附錄A:馬氏距離附錄B:西南財(cái)大數(shù)據(jù)挖掘系統(tǒng)的判別分析第九章 其他有約束學(xué)習(xí)方法9.1 K-最近鄰點(diǎn)9.2 簡(jiǎn)單貝葉斯9.3 簡(jiǎn)單貝葉斯分類實(shí)例第十章 關(guān)聯(lián)分析--關(guān)聯(lián)法則10.1 發(fā)現(xiàn)交易數(shù)據(jù)庫(kù)里的關(guān)聯(lián)法則10.2 支持度和置信度10.3 增益和重要性10.4 相關(guān)系數(shù)和負(fù)關(guān)聯(lián)法則10.5 先驗(yàn)算法10.6 缺點(diǎn)第十一章 數(shù)據(jù)精簡(jiǎn)和探索11.1 降維--主成分分析11.2 成年長(zhǎng)子的頭部測(cè)量數(shù)值11.3 主成分11.4 葡萄酒的特征11.5 數(shù)據(jù)標(biāo)準(zhǔn)化11.6 主成分和正交最小二乘第十二章 聚類分析12.1 什么是聚類分析?12.2 電力公司數(shù)據(jù)12.3 層次聚類法12.4 k-均值算法12.5 相似測(cè)度12.6 其他的距離測(cè)度附錄:西南財(cái)大數(shù)據(jù)挖掘系統(tǒng)的聚類分析
章節(jié)摘錄
第一章 介紹 1.1 這本書的讀者對(duì)象 數(shù)據(jù)挖掘通常要涉及統(tǒng)計(jì)和機(jī)器學(xué)習(xí)(或者叫做人工智能)方面的算法。如果作者的目的只是讓讀者掌握數(shù)據(jù)挖掘的技術(shù)和工具的話,這類書籍因?yàn)槿狈υ敿?xì)的解釋,因此對(duì)讀者的指導(dǎo)作用就不會(huì)太強(qiáng)。另外也有許多關(guān)于數(shù)據(jù)挖掘算法比較專業(yè)的書籍,它們的對(duì)象是統(tǒng)計(jì)研究人員或者高年級(jí)的研究生,里面沒有具體的商業(yè)案例分析,因此一般的讀者會(huì)覺得太澀。有鑒于此,我們?cè)趯懽鞔藭鴷r(shí)內(nèi)容上主要突出了以下兩個(gè)特色: (1)介紹分類、預(yù)測(cè)、數(shù)據(jù)精簡(jiǎn)等數(shù)據(jù)挖掘核心技術(shù)的基礎(chǔ)理論和算法; ?。?)采用商業(yè)案例說明這些算法的使用?! ×硗猓@本書在形式上和普通的書籍有一個(gè)顯著的區(qū)別:它配備了一套演示各種算法的軟件——西南財(cái)經(jīng)大學(xué)數(shù)據(jù)挖掘系統(tǒng),供讀者理解數(shù)據(jù)挖掘思想、算法以及進(jìn)行數(shù)據(jù)挖掘練習(xí)。
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載