數(shù)據(jù)挖掘原理、算法及應(yīng)用

出版時(shí)間:2012-1  出版社:西安電子科技大學(xué)出版社  作者:李愛(ài)國(guó),厙向陽(yáng) 編著  頁(yè)數(shù):255  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

  《數(shù)據(jù)挖掘原理、算法及應(yīng)用》以各類數(shù)據(jù)挖掘算法為核心,以智能數(shù)據(jù)分析技術(shù)的發(fā)展為主線,結(jié)合作者自身的研究和應(yīng)用經(jīng)驗(yàn),闡述數(shù)據(jù)挖掘研究領(lǐng)域的主要理論和典型算法。全書共分8章:第1章為緒論;第2-5章分別介紹數(shù)據(jù)挖掘的主要技術(shù)、各類典型算法及其編程實(shí)現(xiàn),包括數(shù)據(jù)預(yù)處理技術(shù),關(guān)聯(lián)規(guī)則挖掘技術(shù)、分類技術(shù),聚類技術(shù)等幾大類技術(shù)和其中包含的典型算法;第6-8章分別簡(jiǎn)要介紹一些數(shù)據(jù)挖掘的應(yīng)用專題,包括時(shí)間序列數(shù)據(jù)挖掘、Weh挖掘、空間數(shù)據(jù)挖掘等。

書籍目錄

第1章 緒論
 1.1 數(shù)據(jù)挖掘的概念和定義
 1.2 數(shù)據(jù)挖掘的歷史及發(fā)展
 1.3 數(shù)據(jù)挖掘的研究?jī)?nèi)容及功能
 1.4 數(shù)據(jù)挖掘的常用技術(shù)及工具
 1.5 數(shù)據(jù)挖掘的應(yīng)用熱點(diǎn)
 1.6 小結(jié)
 習(xí)題
第2章 數(shù)據(jù)預(yù)處理
 2.1 數(shù)據(jù)預(yù)處理的目的
 2.2 數(shù)據(jù)清理
 2.3 數(shù)據(jù)集成和數(shù)據(jù)變換
 2.4 數(shù)據(jù)歸約
 2.5 數(shù)據(jù)離散化和概念分層
 2.6 特征選擇與提取
 2.7 小結(jié)
 習(xí)題
第3章 關(guān)聯(lián)規(guī)則挖掘
 3.1 基本概念
 3.2 關(guān)聯(lián)規(guī)則挖掘算法
 3.3 Apriori改進(jìn)算法
 3.4 不候選產(chǎn)生挖掘頻繁項(xiàng)集
 3.5 使用垂直數(shù)據(jù)格式挖掘頻繁項(xiàng)集
 3.6 挖掘閉頻繁項(xiàng)集
 3.7 挖掘各種類型的關(guān)聯(lián)規(guī)則
 3.8 相關(guān)分析
 3.9 肇于約束的關(guān)聯(lián)規(guī)則
 3.10 矢量空間數(shù)據(jù)庫(kù)中關(guān)聯(lián)規(guī)則的挖掘
 3.11 小結(jié)
 習(xí)題
第4章 分類和預(yù)測(cè)
 4.1 分類和預(yù)測(cè)的基本概念和步驟
 4.2 基于相似性的分類算法
 4.3 決策樹分類算法
 4.4 貝葉斯分類算法
 4.5 人工神經(jīng)網(wǎng)絡(luò)(ANN)
 4.6 支持向量機(jī)
 4.7 預(yù)測(cè)
 4.8 預(yù)測(cè)和分類中的準(zhǔn)確率
 4.9 評(píng)估分類器或預(yù)測(cè)器的準(zhǔn)確率
 4.10 小結(jié)
 習(xí)題
第5章 聚類方法
 5.1 概述
 5.2 劃分聚類方法
 5.3 層次聚方法
 5.4 密度聚類方法 聚類結(jié)構(gòu)
 5.5 基于網(wǎng)格聚類方法 變換聚類 聚類方法
 5.6 神經(jīng)網(wǎng)絡(luò)聚類方法:SOM
 5.7 異常檢測(cè)
 5.8 小結(jié)
 習(xí)題
第6章 時(shí)間序列數(shù)據(jù)挖掘
 6.1 概述
 6.2 時(shí)間序列數(shù)據(jù)建模
 6.3 時(shí)間序列預(yù)測(cè)
 6.4 時(shí)間序列數(shù)據(jù)庫(kù)相似搜索
 6.5 從時(shí)間序列數(shù)據(jù)中發(fā)現(xiàn)感興趣模式
 6.6 小結(jié)
 習(xí)題
第7章 Web挖掘
 7.1 挖掘的分類及基數(shù)據(jù)來(lái)源
 7.2 Web日志挖掘
 7.3 Web內(nèi)容挖掘
 7.4 小結(jié)
 習(xí)題
第8章 復(fù)雜類型數(shù)據(jù)挖掘
 8.1 空間數(shù)據(jù)挖掘 空間OLAP
 8.2 文本數(shù)據(jù)挖掘
 8.3 多媒體數(shù)據(jù)挖掘 遙感影像分類
 8.4小結(jié)
 習(xí)題
參考文獻(xiàn)

章節(jié)摘錄

版權(quán)頁(yè):第1章  緒    論1.1  數(shù)據(jù)挖掘的概念和定義數(shù)據(jù)挖掘(Date Mjjling)是近年來(lái)隨著人工智能和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展而出現(xiàn)的一門新興技術(shù)。它是從大量的數(shù)據(jù)中篩選出有效的、可信的以及隱含信息的高級(jí)處理過(guò)程。數(shù)據(jù)挖掘包含豐富的內(nèi)涵,是一個(gè)多學(xué)科交叉的研究領(lǐng)域。僅從從事研究和開發(fā)的人員來(lái)說(shuō),其涉及范圍之廣是其他領(lǐng)域所難以企及的,既有大學(xué)里的專門研究人員.也有商業(yè)公司的專家和技術(shù)人員。研究背景的不同會(huì)使他們從不同的角度來(lái)看待數(shù)據(jù)挖掘的概念。因此,理解數(shù)據(jù)挖掘的概念不是簡(jiǎn)單地下個(gè)定義就能解決的問(wèn)題。1.1.1  從商業(yè)角度看數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù)。數(shù)據(jù)挖掘技術(shù)把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的聯(lián)機(jī)查詢操作提高到?jīng)Q策支持、分析預(yù)測(cè)等更高級(jí)的應(yīng)用上。通過(guò)對(duì)特定數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計(jì)、分析、綜合和推理.發(fā)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性、未來(lái)趨勢(shì)以及一般性的概括知識(shí)等,這些知識(shí)性的信息可以用來(lái)指導(dǎo)高級(jí)商務(wù)活動(dòng),如顧客分析、定向營(yíng)銷、工作流管理、商店分布和欺詐監(jiān)測(cè)等。原始數(shù)據(jù)只是未被開采的礦山,需要挖掘和提煉才能獲得對(duì)商業(yè)目的有用的規(guī)律性知識(shí)。這正是數(shù)據(jù)挖掘這個(gè)名字的由來(lái)。因此,從商業(yè)角度看.?dāng)?shù)據(jù)挖掘就是按企業(yè)的業(yè)務(wù)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行深層次分析,以揭示隱藏的、未知的規(guī)律并將其模型化,從而支持商業(yè)決策活動(dòng)的技術(shù)。從商業(yè)應(yīng)用角度刻畫數(shù)據(jù)挖掘,可以使人們更全面地了解數(shù)據(jù)挖掘的真正含義。1.1.2數(shù)據(jù)挖掘的技術(shù)含義談到數(shù)據(jù)挖掘,必須提到另外一個(gè)名詞:數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)( Knowledge  Discovery  in  Databases,KDD).即將來(lái)加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個(gè)過(guò)程。KDD這個(gè)術(shù)語(yǔ)首次出現(xiàn)在1989年8月在美國(guó)底特律召開的第十一屆國(guó)際人工智能聯(lián)合會(huì)議的專題討論會(huì)上。隨后,在近十年的發(fā)展過(guò)程中.KDD專題討論會(huì)逐漸發(fā)展壯大。19999年在美國(guó)圣地亞哥舉行的第五屆KDD國(guó)際學(xué)術(shù)大會(huì),參加人數(shù)近千人,投稿280多篇,近年來(lái)的國(guó)際會(huì)議涉及的范圍更廣,如數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)(Data Mining and Knowledge  Discovery,DMKD)的基礎(chǔ)理論、新的發(fā)現(xiàn)算法、數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)及OLAP的結(jié)合、可視化技術(shù)、知識(shí)表示方法、Web中的數(shù)據(jù)挖掘等。此外,IEEE、ACM、IFIS、VLDB、SIGMOD等其他學(xué)會(huì)、學(xué)刊也紛紛把DMKD列為會(huì)議議題或出版???,成為當(dāng)前國(guó)際上的一個(gè)研究熱點(diǎn)。關(guān)于KDD和Data Mining的關(guān)系,有許多不同的看法。我們可以從這些不同的觀點(diǎn)中了解數(shù)據(jù)挖掘的技術(shù)含義。1)將KDD看成數(shù)據(jù)挖掘的例子之一這一馬點(diǎn)在數(shù)據(jù)挖掘發(fā)展的早期比較流行,并且可以在許多文獻(xiàn)中看到這種說(shuō)法,其主要觀點(diǎn)是數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)僅是數(shù)據(jù)挖掘的一個(gè)方面,因?yàn)閿?shù)據(jù)挖掘系統(tǒng)可以在關(guān)系數(shù)據(jù)庫(kù)存(Relational  Database)、事務(wù)數(shù)據(jù)庫(kù)(Transactional  Database)、數(shù)據(jù)倉(cāng)庫(kù)(DataWarehouses Warehouses)、空間數(shù)據(jù)庫(kù)(Spatial Databade)、文本數(shù)據(jù)(Text Data)以及諸如Web等多種數(shù)據(jù)組織形式中挖掘知識(shí)。從這個(gè)意義上來(lái)說(shuō).?dāng)?shù)據(jù)挖掘就是從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)以及其他數(shù)據(jù)存儲(chǔ)主式中挖掘有用知識(shí)的過(guò)程。2)數(shù)據(jù)挖掘是KDD不可缺少的一部分為了統(tǒng)一認(rèn)識(shí)Fayyd、Piatetsky-Shapiro和Smyth在1996年出版的權(quán)威論文集《知識(shí)發(fā)現(xiàn)與數(shù)據(jù)進(jìn)展》中給出了KDD和數(shù)據(jù)挖掘的最新定義:KDD是從數(shù)據(jù)中辨別有效的、新穎的、潛在有用的、最終可理解的模式的過(guò)程;數(shù)據(jù)挖掘是KDD中通過(guò)特定的算法在可接受的計(jì)算效率限制內(nèi)生成特定模式的一個(gè)步驟。這種觀點(diǎn)得到了大多數(shù)學(xué)者的認(rèn)同。它將KDD看做是一個(gè)廣義的范疇,包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、模式牛成及評(píng)估等一系列步驟,這樣,我們可以把KDD看做是由一些基本功能構(gòu)件組成的系統(tǒng)化協(xié)同工作系統(tǒng).而數(shù)據(jù)挖掘則是這個(gè)系統(tǒng)中的一個(gè)關(guān)鍵的部分。源數(shù)據(jù)經(jīng)過(guò)清理和轉(zhuǎn)換等步驟成為適合挖掘的數(shù)據(jù)集,數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識(shí)的提煉,最后以合適的知識(shí)模式用于進(jìn)一步的分析決策工作。將數(shù)據(jù)挖掘作為KDD的一個(gè)重要步驟看待,可以使我們更容易聚焦研究重點(diǎn),有效解決問(wèn)題。目前,人們對(duì)于數(shù)據(jù)挖掘算法的研究基本屬于這樣的范疇。3) KDD與Data Mining的含義相同有些人認(rèn)為.KDD與Data Mining只是對(duì)同-個(gè)概念的不同叫法。事實(shí)上,在現(xiàn)今的許多文獻(xiàn)(如技術(shù)綜述等)中,這兩個(gè)術(shù)語(yǔ)仍然不加區(qū)分地使用著。有人說(shuō).KDD在人工智能界更流行,而Data Mining在數(shù)據(jù)庫(kù)界使用更多,也有人說(shuō),一般在研究領(lǐng)域稱之為KDD,在工程領(lǐng)域則稱之為數(shù)據(jù)挖掘。實(shí)際上,數(shù)據(jù)挖掘的概念有廣義和狹義之分。廣義的定義址,數(shù)槲挖掘是從大型數(shù)據(jù)集(可能是不完全的、有噪聲的、不確定性的、各種存儲(chǔ)形式的)中,挖掘隱含在其中的、人們事先不知道的、對(duì)決策有用的知識(shí)的過(guò)程。狹義的定義址,數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過(guò)程。綜上所述,數(shù)據(jù)挖掘概念可以從不同的技術(shù)層面上來(lái)理解.但是其核心仍然是從數(shù)據(jù)中挖掘知識(shí)。所以,有人說(shuō)叫知識(shí)挖掘更合適。本書也在不同的章節(jié)使用數(shù)掘挖掘的廣義或狹義概念,讀者要注意根據(jù)上下文加以區(qū)分。當(dāng)然,在可能混淆的地方.我們將明確說(shuō)明。1.2數(shù)據(jù)挖掘的歷史及發(fā)展數(shù)據(jù)挖掘可以看做是信息技術(shù)悄然演化的結(jié)果。像其他新技術(shù)的發(fā)展歷程一樣,數(shù)據(jù)挖掘也必須經(jīng)過(guò)概念提出、概念接受、廣泛研究和探索、逐步應(yīng)用和大量應(yīng)用等階段。從目前的現(xiàn)狀看,大部分學(xué)者認(rèn)為數(shù)據(jù)挖掘的研究仍然處于廣泛研究和探索階段。

編輯推薦

《數(shù)據(jù)挖掘原理、算法及應(yīng)用》由西安電子科技大學(xué)出版社出版。

圖書封面

圖書標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    數(shù)據(jù)挖掘原理、算法及應(yīng)用 PDF格式下載


用戶評(píng)論 (總計(jì)10條)

 
 

  •   數(shù)據(jù)挖掘原理、算法及應(yīng)用對(duì)外行來(lái)說(shuō)比較深,看起來(lái)壓力很大;大話數(shù)據(jù)挖掘講的更通透,更淺顯易懂。
  •   數(shù)據(jù)挖掘方面的比較全面的一本書
  •   還是有點(diǎn)幫助的,她看了兩天現(xiàn)在都能跟我白活在知識(shí)管理等領(lǐng)域的應(yīng)用了。過(guò)兩天我也準(zhǔn)備看看。
  •   很好幫別人買的
  •   他說(shuō),大概瀏覽了一下,講得很不錯(cuò)
  •   有算法有示例,適合初學(xué)者。
  •   學(xué)校的教材,正在使用中
  •   一般般,新手可以看看
  •   就差不多湊合吧
  •   老師要求購(gòu)買的教材書,自己看覺(jué)得不錯(cuò),但老師說(shuō)內(nèi)容過(guò)于簡(jiǎn)單
 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7