數(shù)據(jù)挖掘技術(shù)

出版時(shí)間:2009-1  出版社:水利水電出版社  作者:譚建豪 等編著  頁(yè)數(shù):285  
Tag標(biāo)簽:無(wú)  

前言

  數(shù)據(jù)挖掘是一門綜合性學(xué)科,借鑒了多門學(xué)科的概念、理論、方法和技術(shù)。這些學(xué)科包括數(shù)據(jù)庫(kù)系統(tǒng)、專家系統(tǒng)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、模式識(shí)別、信息檢索、人工神經(jīng)網(wǎng)絡(luò)(正文中簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò))、支持向量機(jī)、遺傳算法、模糊優(yōu)化、高性能計(jì)算和數(shù)據(jù)可視化等。數(shù)據(jù)挖掘旨在發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的知識(shí)模式,其基本問(wèn)題是可行性、實(shí)用性、有效性和可伸縮性問(wèn)題?! ?shù)據(jù)挖掘出現(xiàn)于20世紀(jì)80年代后期,隨著國(guó)內(nèi)外研究的深入,已經(jīng)取得了一批有價(jià)值的成果,并展現(xiàn)出良好的發(fā)展勢(shì)頭。本書較系統(tǒng)地闡述了該領(lǐng)域目前的研究狀況,介紹了幾種典型的數(shù)據(jù)挖掘技術(shù)和系統(tǒng),并討論了數(shù)據(jù)挖掘的應(yīng)用情況和研究方向?! ∨c數(shù)據(jù)挖掘有關(guān)的一些書籍主要是關(guān)于數(shù)據(jù)庫(kù)方面的。隨著大規(guī)模數(shù)據(jù)庫(kù)(或信息庫(kù))的廣泛應(yīng)用,人們已不滿足于僅對(duì)數(shù)據(jù)或信息進(jìn)行查詢和檢索,因?yàn)楹?jiǎn)單的查詢和檢索一般不能使用戶直接獲得帶有結(jié)論性的信息。因此僅僅依靠查詢和檢索的手段,數(shù)據(jù)庫(kù)蘊(yùn)藏的知識(shí)是得不到充分發(fā)掘和利用的?! ×硗?,人工智能、專家系統(tǒng)和機(jī)器學(xué)習(xí)方面的書籍對(duì)數(shù)據(jù)挖掘也有所論述。研究雖然取得了一定的進(jìn)展,但是知識(shí)獲取仍然是瓶頸問(wèn)題,知識(shí)工程師從專家那里獲取知識(shí)的方式仍然帶有很強(qiáng)的個(gè)體性和隨機(jī)性,沒(méi)有統(tǒng)一的方法?! ≈R(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘是一門新的技術(shù)學(xué)科,其理論框架與技術(shù)原理尚處于研究的初級(jí)階段,還沒(méi)有形成完整的理論體系。盡管如此,僅從已有的研究成果看,也足以展示其廣闊的研究領(lǐng)域和應(yīng)用前景。本書擬在闡述知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘原理的基礎(chǔ)上,探索將其用于復(fù)雜工業(yè)系統(tǒng)的原理、方法和技術(shù)?! ∧壳?,許多學(xué)校正在對(duì)傳統(tǒng)的教學(xué)內(nèi)容進(jìn)行改革,自動(dòng)化、電子信息、測(cè)控技術(shù)與儀表、電氣工程、系統(tǒng)工程、機(jī)電工程等專業(yè)迫切需要較多與信息相關(guān)的知識(shí)。由于這些專業(yè)的學(xué)生在本科階段已較為扎實(shí)地掌握了數(shù)據(jù)庫(kù)系統(tǒng)的知識(shí),在研究生階段便轉(zhuǎn)入人工智能理論與技術(shù)的學(xué)習(xí)。如何將數(shù)據(jù)挖掘技術(shù)及人工智能理論在一個(gè)大的框架內(nèi)以統(tǒng)一的視角用于解決工程實(shí)際問(wèn)題,是本書著力的方向?! ”窘滩氖菫殡娮有畔⒓跋嚓P(guān)專業(yè)編寫的。作為一門技術(shù)基礎(chǔ)課,它以“數(shù)據(jù)庫(kù)技術(shù)”及“人工智能”課程為先修課。既要學(xué)時(shí)少,又要讓學(xué)生對(duì)數(shù)據(jù)挖掘原理及其在復(fù)雜工業(yè)系統(tǒng)中的應(yīng)用建立較全面的印象,同時(shí)還應(yīng)該使學(xué)生學(xué)有所用,并為今后的發(fā)展打下基礎(chǔ),這是本書編寫的指導(dǎo)思想。編者力求避免本書與先修課程內(nèi)容重復(fù),對(duì)書中必不可少的相關(guān)知識(shí)只作簡(jiǎn)單介紹。

內(nèi)容概要

本書較為系統(tǒng)地介紹了數(shù)據(jù)挖掘的基本概念、基本方法和基本技術(shù)以及數(shù)據(jù)挖掘的最新進(jìn)展,并以較大篇幅敘述了數(shù)據(jù)挖掘在復(fù)雜工業(yè)系統(tǒng)中的應(yīng)用情況。    本書深入而系統(tǒng)地闡述了數(shù)據(jù)挖掘的研究歷史和現(xiàn)狀、數(shù)據(jù)挖掘與數(shù)理統(tǒng)計(jì)的關(guān)系、數(shù)據(jù)挖掘技術(shù)(包括語(yǔ)義網(wǎng)絡(luò)、智能體、分類、預(yù)測(cè)、復(fù)雜類型數(shù)據(jù)等基礎(chǔ)概念和技術(shù))、數(shù)據(jù)庫(kù)系統(tǒng)及專家系統(tǒng)中的數(shù)據(jù)挖掘方式、數(shù)據(jù)挖掘的應(yīng)用及一些具有挑戰(zhàn)性的研究課題,對(duì)每類問(wèn)題均提供了代表性算法和具體應(yīng)用法則。全書共分7章,主要內(nèi)容包括數(shù)據(jù)挖掘綜述、從數(shù)理統(tǒng)計(jì)到數(shù)據(jù)挖掘、語(yǔ)義網(wǎng)絡(luò)挖掘及其應(yīng)用、智能體挖掘及其應(yīng)用、分類挖掘及其應(yīng)用、預(yù)測(cè)挖掘及其應(yīng)用和復(fù)雜類型數(shù)據(jù)挖掘及其應(yīng)用。    本書可作為高等院校自動(dòng)化、電子信息、測(cè)控技術(shù)與儀表、電氣工程、系統(tǒng)工程、機(jī)電工程等專業(yè)的本科生和研究生教材,也可作為相關(guān)專業(yè)工程技術(shù)人員的自學(xué)參考書。

書籍目錄

前言第1章 數(shù)據(jù)挖掘綜述  1.1 數(shù)據(jù)挖掘的研究歷史和現(xiàn)狀  1.2 數(shù)據(jù)挖掘定義    1.2.1 技術(shù)角度的定義    1.2.2 商業(yè)角度的定義    1.2.3 數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別    1.2.4 數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)    1.2.5 數(shù)據(jù)挖掘和在線分析處理    1.2.6 數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)    1.2.7 軟硬件發(fā)展對(duì)數(shù)據(jù)挖掘的影響  1.3 數(shù)據(jù)挖掘研究?jī)?nèi)容    1.3.1 數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識(shí)    1.3.2 數(shù)據(jù)挖掘的功能    1.3.3 數(shù)據(jù)挖掘常用技術(shù)    1.3.4 數(shù)據(jù)挖掘中的數(shù)據(jù)倉(cāng)庫(kù)  1.4 數(shù)據(jù)挖掘系統(tǒng)工作原理    1.4.1 數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)    1.4.2 數(shù)據(jù)挖掘流程  1.5 小結(jié) 習(xí)題1第2章 從數(shù)理統(tǒng)計(jì)到數(shù)據(jù)挖掘  2.1 數(shù)理統(tǒng)計(jì)與數(shù)據(jù)挖掘的關(guān)系    2.1.1 數(shù)理統(tǒng)計(jì)的性質(zhì)    2.1.2 數(shù)據(jù)挖掘的性質(zhì)    2.1.3 從數(shù)理統(tǒng)計(jì)到數(shù)據(jù)挖掘  2.2 數(shù)理統(tǒng)計(jì)與數(shù)據(jù)庫(kù)技術(shù)的結(jié)合  2.3 回歸分析的基本概念  2.4 線性回歸方程  2.5 線性相關(guān)的顯著性檢驗(yàn)    2.5.1 線性回歸的方差分析    2.5.2 相關(guān)系數(shù)的顯著性檢驗(yàn)  2.6 非線性回歸分析    2.6.1 化非線性回歸為線性回歸  2.6.2 多項(xiàng)式回歸  2.7 多元線性回歸分析    2.7.1 多元線性回歸方程    2.7.2 多元線性回歸的方差分析  2.8 一般情況下的回歸分析    2.8.1 一般情況下的回歸方程    2.8.2 一般情況下的參數(shù)估計(jì)  2.9 逐步回歸分析的軟件設(shè)計(jì)  2.10 鍛模設(shè)計(jì)準(zhǔn)則的制定    2.10.1 研究的內(nèi)容    2.10.2 資料收集與數(shù)據(jù)處理    2.10.3 飛邊尺寸設(shè)計(jì)準(zhǔn)則的制定    2.10.4 飛邊金屬消耗設(shè)計(jì)準(zhǔn)則的制定  2.11 小結(jié)  習(xí)題2第3章 語(yǔ)義網(wǎng)絡(luò)挖掘及其應(yīng)用  3.1 語(yǔ)義網(wǎng)絡(luò)概念    3.1.1 概述    3.1.2 知識(shí)的表示    3.1.3 搜索原理    3.1.4 語(yǔ)義網(wǎng)絡(luò)及其特性    3.1.5 語(yǔ)義網(wǎng)絡(luò)的推理及其特點(diǎn)  3.2 語(yǔ)義網(wǎng)絡(luò)挖掘原理    3.2.1 概述    3.2.2 歸納學(xué)習(xí)中的實(shí)例學(xué)習(xí)    3.2.3 類比學(xué)習(xí)  3.3  基于AutoCAD的注塑模架設(shè)計(jì)專家系統(tǒng)    3.3.1  注塑模架設(shè)計(jì)專家系統(tǒng)總體方案設(shè)計(jì)    3.3.2 模架設(shè)計(jì)專家系統(tǒng)的組成    3.3.3 系統(tǒng)模架生成模塊的設(shè)計(jì)    3.3.4 系統(tǒng)數(shù)據(jù)庫(kù)模塊的設(shè)計(jì)    3.3.5 注塑模架CAD設(shè)計(jì)系統(tǒng)的實(shí)現(xiàn)  3.4 小結(jié)  習(xí)題3  第4章 智能體挖掘及其應(yīng)用  4.1 智能體概念    4.1.1 概述    4.1.2 分布式問(wèn)題求解    4.1.3 面向?qū)ο蟊硎痉ā ?章 分類挖掘及其應(yīng)用第6章 預(yù)測(cè)挖掘及其應(yīng)用第7章 復(fù)雜類型數(shù)據(jù)挖掘及其應(yīng)用參考文獻(xiàn)

章節(jié)摘錄

  第1章 數(shù)據(jù)挖掘綜述  1.1 數(shù)據(jù)挖掘的研究歷史和現(xiàn)狀  數(shù)據(jù)挖掘其實(shí)是一個(gè)逐漸演變的過(guò)程。電子數(shù)據(jù)處理的初期,人們就試圖通過(guò)某些方法來(lái)實(shí)現(xiàn)自動(dòng)決策支持,當(dāng)時(shí)機(jī)器學(xué)習(xí)成為人們關(guān)心的焦點(diǎn)。機(jī)器學(xué)習(xí)的過(guò)程就是將一些已知的并已被成功解決的問(wèn)題作為范例輸入計(jì)算機(jī),機(jī)器通過(guò)學(xué)習(xí)這些范例總結(jié)并生成相應(yīng)的規(guī)則,這些規(guī)則具有通用性,使用它們可以解決某一類的問(wèn)題。隨后,隨著人工神經(jīng)網(wǎng)絡(luò)(以下簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò))技術(shù)的形成和發(fā)展,人們的注意力轉(zhuǎn)向知識(shí)工程。知識(shí)工程不同于機(jī)器學(xué)習(xí),它是直接給計(jì)算機(jī)輸入已被代碼化的規(guī)則,而計(jì)算機(jī)是通過(guò)使用這些規(guī)則來(lái)解決某些問(wèn)題。專家系統(tǒng)就是用這種方法所得到的成果,但它有投資大、效果不甚理想等不足。20世紀(jì)80年代,人們又在新的神經(jīng)網(wǎng)絡(luò)理論的指導(dǎo)下,重新回到機(jī)器學(xué)習(xí)的方法上,并將其成果應(yīng)用于處理大型商業(yè)數(shù)據(jù)庫(kù)。  隨著數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫(kù)中抽取出來(lái),將為公司創(chuàng)造很多潛在的利潤(rùn),數(shù)據(jù)挖掘概念就是從這樣的商業(yè)角度開(kāi)發(fā)出來(lái)的?! ?shù)據(jù)倉(cāng)庫(kù)技術(shù)的發(fā)展與數(shù)據(jù)挖掘有著密切的關(guān)系。數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展是推動(dòng)數(shù)據(jù)挖掘技術(shù)發(fā)展的原因之一。但是,數(shù)據(jù)倉(cāng)庫(kù)并不是數(shù)據(jù)挖掘的先決條件,因?yàn)橛泻芏鄶?shù)據(jù)挖掘可直接從操作數(shù)據(jù)源中挖掘信息。  確切地說(shuō),數(shù)據(jù)挖掘(Data Mining),又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database—KDD),是指從大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中提取隱含的、未知的、非平凡的及有潛在應(yīng)用價(jià)值的信息或模式,它是數(shù)據(jù)庫(kù)研究中的一個(gè)很有應(yīng)用價(jià)值的新領(lǐng)域,融合了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域的理論和技術(shù)。

編輯推薦

  《數(shù)據(jù)挖掘技術(shù)》特色:  系統(tǒng)闡述數(shù)據(jù)挖掘基礎(chǔ)理論、基本方法和成熟技術(shù),著眼熱點(diǎn)、難點(diǎn)、疑點(diǎn)問(wèn)題,把握未來(lái)發(fā)展趨勢(shì);將數(shù)據(jù)挖掘技術(shù)與人工智能理論統(tǒng)一在一個(gè)大的框架內(nèi);知識(shí)點(diǎn)環(huán)環(huán)相扣,形成循序漸進(jìn)的知識(shí)鏈,精選相應(yīng)實(shí)例,供讀者加深理解;配有多種類型習(xí)題100多道,供讀者練習(xí)與自測(cè);提供教學(xué)相關(guān)資源(電子教案、教學(xué)網(wǎng)站等);既可作為高年級(jí)本科生、研究生教材,又可作為科研和工程技術(shù)人員參考資料。

圖書封面

圖書標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    數(shù)據(jù)挖掘技術(shù) PDF格式下載


用戶評(píng)論 (總計(jì)0條)

 
 

 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7