數(shù)據(jù)挖掘

出版時間:2008-11  出版社:中國科學技術(shù)大學出版社  作者:朱明  頁數(shù):491  
Tag標簽:無  

前言

2008年是中國科學技術(shù)大學建校五十周年。為了反映五十年來辦學理念和特色,集中展示教材建設(shè)的成果,學校決定組織編寫出版代表中國科學技術(shù)大學教學水平的精品教材系列。在各方的共同努力下,共組織選題281種,經(jīng)過多輪、嚴格的評審,最后確定50種入選精品教材系列。1958年學校成立之時,教員大部分都來自中國科學院的各個研究所。作為各個研究所的科研人員,他們到學校后保持了教學的同時又作研究的傳統(tǒng)。同時,根據(jù)“全院辦校,所系結(jié)合”的原則,科學院各個研究所在科研第一線工作的杰出科學家也參與學校的教學,為本科生授課,將最新的科研成果融入到教學中。五十年來,外界環(huán)境和內(nèi)在條件都發(fā)生了很大變化,但學校以教學為主、教學與科研相結(jié)合的方針沒有變。正因為堅持了科學與技術(shù)相結(jié)合、理論與實踐相結(jié)合、教學與科研相結(jié)合的方針,并形成了優(yōu)良的傳統(tǒng),才培養(yǎng)出了一批又一批高質(zhì)量的人才。學校非常重視基礎(chǔ)課和專業(yè)基礎(chǔ)課教學的傳統(tǒng),也是她特別成功的原因之一。當今社會,科技發(fā)展突飛猛進、科技成果日新月異,沒有扎實的基礎(chǔ)知識,很難在科學技術(shù)研究中作出重大貢獻。建校之初,華羅庚、吳有訓、嚴濟慈等老一輩科學家、教育家就身體力行,親自為本科生講授基礎(chǔ)課。他們以淵博的學識、精湛的講課藝術(shù)、高尚的師德,帶出一批又一批杰出的年輕教員,培養(yǎng)了一屆又一屆優(yōu)秀學生。這次入選校慶精品教材的絕大部分是本科生基礎(chǔ)課或?qū)I(yè)基礎(chǔ)課的教材,其作者大多直接或間接受到過這些老一輩科學家、教育家的教誨和影響,因此在教材中也貫穿著這些先輩的教育教學理念與科學探索精神。

內(nèi)容概要

數(shù)據(jù)挖掘技術(shù),又稱為數(shù)據(jù)庫知識發(fā)現(xiàn),是20世紀90年代在信息技術(shù)領(lǐng)域開始迅速發(fā)展起來的計算機技術(shù)。作者結(jié)合自己近20年從事人工智能、機器學習、數(shù)據(jù)挖掘等方面的科研工作積累與教學經(jīng)驗,編著此書。    本書較全面系統(tǒng)地介紹了數(shù)據(jù)挖掘中常用和常見的數(shù)據(jù)挖掘方法,以及文本與視頻數(shù)據(jù)挖掘方法。    本書的主要內(nèi)容包括:數(shù)據(jù)挖掘基本知識、數(shù)據(jù)挖掘預(yù)處理方法、決策樹分類及其他分類方法、關(guān)聯(lián)知識挖掘方法、各種聚類分析方法,以及文本挖掘所涉及表示、分類和聚類等方法,還包括視頻挖掘所涉及的視頻鏡頭檢測、字幕提取、視頻摘要和視頻檢索等主要分析方法。    本書作為學習、掌握和應(yīng)用數(shù)據(jù)挖掘方法和技術(shù)的綜合指導書,是從事數(shù)據(jù)挖掘研究與應(yīng)用人員,以及希望了解數(shù)據(jù)挖掘主要方法和技術(shù)的IT技術(shù)人員的良師益友;同時也是一本可用于大學高年級或研究生相關(guān)課程的教材和參考文獻。

書籍目錄

總序前言第1章 數(shù)據(jù)挖掘?qū)д? 1.1 數(shù)據(jù)挖掘的發(fā)展背景  1.2 數(shù)據(jù)挖掘定義  1.3 數(shù)據(jù)挖掘過程  1.4 數(shù)據(jù)挖掘功能  1.5 數(shù)據(jù)挖掘應(yīng)用  1.6 數(shù)據(jù)挖掘發(fā)展  1.7 本章小結(jié)第2章 數(shù)據(jù)預(yù)處理  2.1 數(shù)據(jù)描述    2.1.1 數(shù)據(jù)集類型    2.1.2 數(shù)據(jù)質(zhì)量  2.2 數(shù)據(jù)清理    2.2.1 缺失值處理    2.2.2 噪聲數(shù)據(jù)處理    2.2.3 數(shù)據(jù)清理過程  2.3 數(shù)據(jù)集成和變換    2.3.1 數(shù)據(jù)集成    2.3.2 數(shù)據(jù)變換    2.3.3 維度歸約  2.4 數(shù)據(jù)歸約    2.4.1 數(shù)據(jù)立方體聚集    2.4.2 屬性子集選擇  2.5 本章小結(jié)第3章 分類挖掘:決策樹  3.1 決策樹方法  3.2 決策樹深入    3.2.1 信息熵基礎(chǔ)    3.2.2 C4.5方法    3.2.3 CART方法    3.2.4 SLIQ方法    3.2.5 SPRINT方法    3.2.6 其他決策樹方法  3.3 決策樹的簡化  3.4 決策樹的改進    3.4.1 屬性選擇    3.4.2 連續(xù)屬性離散化  3.5 決策樹的討論    3.5.1 決策樹優(yōu)化問題    3.5.2 決策樹優(yōu)化方法  3.6 分類模型的評估  3.7 本章小結(jié)第4章 分類挖掘  4.1 貝葉斯方法    4.1.1 貝葉斯方法概述    4.1.2 樸素貝葉斯分類  4.2 k-近鄰方法  4.3 人工神經(jīng)網(wǎng)絡(luò)方法  4.4 遺傳進化方法  4.5 支持向量機方法    4.5.1 SVM分類方法  4.6 粗糙集方法  4.7 集成學習方法  ……第5章 關(guān)聯(lián)挖掘第6章 聚類挖掘第7章 異類挖掘第8章 文本挖掘第9章 視頻挖掘第10章 視頻分析

章節(jié)摘錄

第1章 數(shù)據(jù)挖掘?qū)д摂?shù)據(jù)挖掘是20世紀80年代末開始逐步發(fā)展起來的一個新的研究領(lǐng)域,它是多個學科和技術(shù)相結(jié)合的產(chǎn)物。本章將簡要介紹數(shù)據(jù)挖掘的發(fā)展背景、概念定義、主要方法及應(yīng)用案例等內(nèi)容。1.1 數(shù)據(jù)挖掘的發(fā)展背景隨著數(shù)據(jù)庫技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無數(shù)個數(shù)據(jù)庫被用于商業(yè)管理、政府辦公、科學研究和工程開發(fā)等領(lǐng)域,超級市場中的交易數(shù)據(jù)、加油站里的汽油銷售數(shù)據(jù)、旅行社的旅游信息等等,均構(gòu)成了數(shù)據(jù)庫系統(tǒng)的信息來源。近年來,數(shù)據(jù)庫所管理的數(shù)據(jù)量急劇增大,人們積累的數(shù)據(jù)越來越多。例如:美國NASA的地球觀測系統(tǒng)(EoS)每小時向地面發(fā)回約50 GB的圖像數(shù)據(jù);美國沃爾瑪零售系統(tǒng)每天會產(chǎn)生約2億條交易數(shù)據(jù)。人們希望能夠?qū)ζ溥M行更高層次的分析,以便更好地利用這些數(shù)據(jù)。激增的數(shù)據(jù)背后隱藏著許多重要的信息,目前的數(shù)據(jù)庫系統(tǒng)可以高效地實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段,導致了“數(shù)據(jù)富有但知識貧乏”的現(xiàn)象。于是,一個新的挑戰(zhàn)被提了出來:在這被稱之為信息爆炸的時代,信息過量幾乎成為人人需要面對的問題。如何才能不被信息的汪洋大海所淹沒,從中及時發(fā)現(xiàn)有用的知識,提高信息利用率呢?要想使數(shù)據(jù)真正成為一個企業(yè)的資源,只有充分利用它為企業(yè)自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。

編輯推薦

《數(shù)據(jù)挖掘(第2版)》作為學習、掌握和應(yīng)用數(shù)據(jù)挖掘方法和技術(shù)的綜合指導書,是從事數(shù)據(jù)挖掘研究與應(yīng)用人員,以及希望了解數(shù)據(jù)挖掘主要方法和技術(shù)的IT技術(shù)人員的良師益友;同時也是一本可用于大學高年級或研究生相關(guān)課程的教材和參考文獻。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘 PDF格式下載


用戶評論 (總計5條)

 
 

  •   這本書主要是簡單的關(guān)于數(shù)據(jù)挖掘方面的知識,對于初學者來說還不錯
  •   講的很概括,能讓你有個對數(shù)據(jù)挖掘有個全距把握
  •   講的不夠清楚,每種算法都只是一種概述,類似于文獻綜述的書
  •   書寫的很好,紙張也很好。
  •     這本書,對數(shù)據(jù)挖掘相關(guān)的技術(shù)以及所涉及的各個領(lǐng)域,都進行了比較詳細的介紹。但整體而言,對于數(shù)據(jù)挖掘入門者而言,不是很適合。個人覺得,這本書對數(shù)學以及神經(jīng)網(wǎng)絡(luò)、小波變換等相關(guān)的知識要求的還是比較深。所以,想從事數(shù)據(jù)挖掘領(lǐng)域研究的同學,倒是比較好的一本書。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7