數(shù)據(jù)挖掘原理、算法及應用

出版時間:2012-1  出版社:西安電子科技大學出版社  作者:李愛國,厙向陽 編著  頁數(shù):255  
Tag標簽:無  

內(nèi)容概要

  《數(shù)據(jù)挖掘原理、算法及應用》以各類數(shù)據(jù)挖掘算法為核心,以智能數(shù)據(jù)分析技術的發(fā)展為主線,結(jié)合作者自身的研究和應用經(jīng)驗,闡述數(shù)據(jù)挖掘研究領域的主要理論和典型算法。全書共分8章:第1章為緒論;第2-5章分別介紹數(shù)據(jù)挖掘的主要技術、各類典型算法及其編程實現(xiàn),包括數(shù)據(jù)預處理技術,關聯(lián)規(guī)則挖掘技術、分類技術,聚類技術等幾大類技術和其中包含的典型算法;第6-8章分別簡要介紹一些數(shù)據(jù)挖掘的應用專題,包括時間序列數(shù)據(jù)挖掘、Weh挖掘、空間數(shù)據(jù)挖掘等。

書籍目錄

第1章 緒論
 1.1 數(shù)據(jù)挖掘的概念和定義
 1.2 數(shù)據(jù)挖掘的歷史及發(fā)展
 1.3 數(shù)據(jù)挖掘的研究內(nèi)容及功能
 1.4 數(shù)據(jù)挖掘的常用技術及工具
 1.5 數(shù)據(jù)挖掘的應用熱點
 1.6 小結(jié)
 習題
第2章 數(shù)據(jù)預處理
 2.1 數(shù)據(jù)預處理的目的
 2.2 數(shù)據(jù)清理
 2.3 數(shù)據(jù)集成和數(shù)據(jù)變換
 2.4 數(shù)據(jù)歸約
 2.5 數(shù)據(jù)離散化和概念分層
 2.6 特征選擇與提取
 2.7 小結(jié)
 習題
第3章 關聯(lián)規(guī)則挖掘
 3.1 基本概念
 3.2 關聯(lián)規(guī)則挖掘算法
 3.3 Apriori改進算法
 3.4 不候選產(chǎn)生挖掘頻繁項集
 3.5 使用垂直數(shù)據(jù)格式挖掘頻繁項集
 3.6 挖掘閉頻繁項集
 3.7 挖掘各種類型的關聯(lián)規(guī)則
 3.8 相關分析
 3.9 肇于約束的關聯(lián)規(guī)則
 3.10 矢量空間數(shù)據(jù)庫中關聯(lián)規(guī)則的挖掘
 3.11 小結(jié)
 習題
第4章 分類和預測
 4.1 分類和預測的基本概念和步驟
 4.2 基于相似性的分類算法
 4.3 決策樹分類算法
 4.4 貝葉斯分類算法
 4.5 人工神經(jīng)網(wǎng)絡(ANN)
 4.6 支持向量機
 4.7 預測
 4.8 預測和分類中的準確率
 4.9 評估分類器或預測器的準確率
 4.10 小結(jié)
 習題
第5章 聚類方法
 5.1 概述
 5.2 劃分聚類方法
 5.3 層次聚方法
 5.4 密度聚類方法 聚類結(jié)構(gòu)
 5.5 基于網(wǎng)格聚類方法 變換聚類 聚類方法
 5.6 神經(jīng)網(wǎng)絡聚類方法:SOM
 5.7 異常檢測
 5.8 小結(jié)
 習題
第6章 時間序列數(shù)據(jù)挖掘
 6.1 概述
 6.2 時間序列數(shù)據(jù)建模
 6.3 時間序列預測
 6.4 時間序列數(shù)據(jù)庫相似搜索
 6.5 從時間序列數(shù)據(jù)中發(fā)現(xiàn)感興趣模式
 6.6 小結(jié)
 習題
第7章 Web挖掘
 7.1 挖掘的分類及基數(shù)據(jù)來源
 7.2 Web日志挖掘
 7.3 Web內(nèi)容挖掘
 7.4 小結(jié)
 習題
第8章 復雜類型數(shù)據(jù)挖掘
 8.1 空間數(shù)據(jù)挖掘 空間OLAP
 8.2 文本數(shù)據(jù)挖掘
 8.3 多媒體數(shù)據(jù)挖掘 遙感影像分類
 8.4小結(jié)
 習題
參考文獻

章節(jié)摘錄

版權頁:第1章  緒    論1.1  數(shù)據(jù)挖掘的概念和定義數(shù)據(jù)挖掘(Date Mjjling)是近年來隨著人工智能和數(shù)據(jù)庫技術的發(fā)展而出現(xiàn)的一門新興技術。它是從大量的數(shù)據(jù)中篩選出有效的、可信的以及隱含信息的高級處理過程。數(shù)據(jù)挖掘包含豐富的內(nèi)涵,是一個多學科交叉的研究領域。僅從從事研究和開發(fā)的人員來說,其涉及范圍之廣是其他領域所難以企及的,既有大學里的專門研究人員.也有商業(yè)公司的專家和技術人員。研究背景的不同會使他們從不同的角度來看待數(shù)據(jù)挖掘的概念。因此,理解數(shù)據(jù)挖掘的概念不是簡單地下個定義就能解決的問題。1.1.1  從商業(yè)角度看數(shù)據(jù)挖掘技術數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術。數(shù)據(jù)挖掘技術把人們對數(shù)據(jù)的應用從低層次的聯(lián)機查詢操作提高到?jīng)Q策支持、分析預測等更高級的應用上。通過對特定數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理.發(fā)現(xiàn)數(shù)據(jù)間的關聯(lián)性、未來趨勢以及一般性的概括知識等,這些知識性的信息可以用來指導高級商務活動,如顧客分析、定向營銷、工作流管理、商店分布和欺詐監(jiān)測等。原始數(shù)據(jù)只是未被開采的礦山,需要挖掘和提煉才能獲得對商業(yè)目的有用的規(guī)律性知識。這正是數(shù)據(jù)挖掘這個名字的由來。因此,從商業(yè)角度看.數(shù)據(jù)挖掘就是按企業(yè)的業(yè)務目標,對大量的企業(yè)數(shù)據(jù)進行深層次分析,以揭示隱藏的、未知的規(guī)律并將其模型化,從而支持商業(yè)決策活動的技術。從商業(yè)應用角度刻畫數(shù)據(jù)挖掘,可以使人們更全面地了解數(shù)據(jù)挖掘的真正含義。1.1.2數(shù)據(jù)挖掘的技術含義談到數(shù)據(jù)挖掘,必須提到另外一個名詞:數(shù)據(jù)庫中的知識發(fā)現(xiàn)( Knowledge  Discovery  in  Databases,KDD).即將來加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個過程。KDD這個術語首次出現(xiàn)在1989年8月在美國底特律召開的第十一屆國際人工智能聯(lián)合會議的專題討論會上。隨后,在近十年的發(fā)展過程中.KDD專題討論會逐漸發(fā)展壯大。19999年在美國圣地亞哥舉行的第五屆KDD國際學術大會,參加人數(shù)近千人,投稿280多篇,近年來的國際會議涉及的范圍更廣,如數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(Data Mining and Knowledge  Discovery,DMKD)的基礎理論、新的發(fā)現(xiàn)算法、數(shù)據(jù)挖掘與數(shù)據(jù)倉庫及OLAP的結(jié)合、可視化技術、知識表示方法、Web中的數(shù)據(jù)挖掘等。此外,IEEE、ACM、IFIS、VLDB、SIGMOD等其他學會、學刊也紛紛把DMKD列為會議議題或出版??蔀楫斍皣H上的一個研究熱點。關于KDD和Data Mining的關系,有許多不同的看法。我們可以從這些不同的觀點中了解數(shù)據(jù)挖掘的技術含義。1)將KDD看成數(shù)據(jù)挖掘的例子之一這一馬點在數(shù)據(jù)挖掘發(fā)展的早期比較流行,并且可以在許多文獻中看到這種說法,其主要觀點是數(shù)據(jù)庫中的知識發(fā)現(xiàn)僅是數(shù)據(jù)挖掘的一個方面,因為數(shù)據(jù)挖掘系統(tǒng)可以在關系數(shù)據(jù)庫存(Relational  Database)、事務數(shù)據(jù)庫(Transactional  Database)、數(shù)據(jù)倉庫(DataWarehouses Warehouses)、空間數(shù)據(jù)庫(Spatial Databade)、文本數(shù)據(jù)(Text Data)以及諸如Web等多種數(shù)據(jù)組織形式中挖掘知識。從這個意義上來說.數(shù)據(jù)挖掘就是從數(shù)據(jù)庫、數(shù)據(jù)倉庫以及其他數(shù)據(jù)存儲主式中挖掘有用知識的過程。2)數(shù)據(jù)挖掘是KDD不可缺少的一部分為了統(tǒng)一認識Fayyd、Piatetsky-Shapiro和Smyth在1996年出版的權威論文集《知識發(fā)現(xiàn)與數(shù)據(jù)進展》中給出了KDD和數(shù)據(jù)挖掘的最新定義:KDD是從數(shù)據(jù)中辨別有效的、新穎的、潛在有用的、最終可理解的模式的過程;數(shù)據(jù)挖掘是KDD中通過特定的算法在可接受的計算效率限制內(nèi)生成特定模式的一個步驟。這種觀點得到了大多數(shù)學者的認同。它將KDD看做是一個廣義的范疇,包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、模式牛成及評估等一系列步驟,這樣,我們可以把KDD看做是由一些基本功能構(gòu)件組成的系統(tǒng)化協(xié)同工作系統(tǒng).而數(shù)據(jù)挖掘則是這個系統(tǒng)中的一個關鍵的部分。源數(shù)據(jù)經(jīng)過清理和轉(zhuǎn)換等步驟成為適合挖掘的數(shù)據(jù)集,數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識的提煉,最后以合適的知識模式用于進一步的分析決策工作。將數(shù)據(jù)挖掘作為KDD的一個重要步驟看待,可以使我們更容易聚焦研究重點,有效解決問題。目前,人們對于數(shù)據(jù)挖掘算法的研究基本屬于這樣的范疇。3) KDD與Data Mining的含義相同有些人認為.KDD與Data Mining只是對同-個概念的不同叫法。事實上,在現(xiàn)今的許多文獻(如技術綜述等)中,這兩個術語仍然不加區(qū)分地使用著。有人說.KDD在人工智能界更流行,而Data Mining在數(shù)據(jù)庫界使用更多,也有人說,一般在研究領域稱之為KDD,在工程領域則稱之為數(shù)據(jù)挖掘。實際上,數(shù)據(jù)挖掘的概念有廣義和狹義之分。廣義的定義址,數(shù)槲挖掘是從大型數(shù)據(jù)集(可能是不完全的、有噪聲的、不確定性的、各種存儲形式的)中,挖掘隱含在其中的、人們事先不知道的、對決策有用的知識的過程。狹義的定義址,數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識的過程。綜上所述,數(shù)據(jù)挖掘概念可以從不同的技術層面上來理解.但是其核心仍然是從數(shù)據(jù)中挖掘知識。所以,有人說叫知識挖掘更合適。本書也在不同的章節(jié)使用數(shù)掘挖掘的廣義或狹義概念,讀者要注意根據(jù)上下文加以區(qū)分。當然,在可能混淆的地方.我們將明確說明。1.2數(shù)據(jù)挖掘的歷史及發(fā)展數(shù)據(jù)挖掘可以看做是信息技術悄然演化的結(jié)果。像其他新技術的發(fā)展歷程一樣,數(shù)據(jù)挖掘也必須經(jīng)過概念提出、概念接受、廣泛研究和探索、逐步應用和大量應用等階段。從目前的現(xiàn)狀看,大部分學者認為數(shù)據(jù)挖掘的研究仍然處于廣泛研究和探索階段。

編輯推薦

《數(shù)據(jù)挖掘原理、算法及應用》由西安電子科技大學出版社出版。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘原理、算法及應用 PDF格式下載


用戶評論 (總計10條)

 
 

  •   數(shù)據(jù)挖掘原理、算法及應用對外行來說比較深,看起來壓力很大;大話數(shù)據(jù)挖掘講的更通透,更淺顯易懂。
  •   數(shù)據(jù)挖掘方面的比較全面的一本書
  •   還是有點幫助的,她看了兩天現(xiàn)在都能跟我白活在知識管理等領域的應用了。過兩天我也準備看看。
  •   很好幫別人買的
  •   他說,大概瀏覽了一下,講得很不錯
  •   有算法有示例,適合初學者。
  •   學校的教材,正在使用中
  •   一般般,新手可以看看
  •   就差不多湊合吧
  •   老師要求購買的教材書,自己看覺得不錯,但老師說內(nèi)容過于簡單
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7