數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

出版時(shí)間:2004-8  出版社:浙江大學(xué)出版社  作者:周根貴 編  頁數(shù):327  字?jǐn)?shù):374000  
Tag標(biāo)簽:無  

內(nèi)容概要

  本書側(cè)重于信息管理中信息組織與處理的技術(shù),全面而系統(tǒng)地介紹了數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的基本概念、基本方法和基本技術(shù),以及數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域與最新進(jìn)展。全書共分10章,包括概論,數(shù)據(jù)倉庫的技術(shù)與開發(fā),數(shù)據(jù)倉庫的管理,聯(lián)機(jī)分析處理,SQL
Server數(shù)據(jù)倉庫的應(yīng)用與開發(fā),數(shù)據(jù)挖掘與知識發(fā)現(xiàn),統(tǒng)計(jì)類數(shù)據(jù)挖掘技術(shù),知識類數(shù)據(jù)挖掘技術(shù),21世紀(jì)的數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的綜合應(yīng)用等內(nèi)容。為了便于學(xué)習(xí),每一章都有提要和小結(jié),并配有一定數(shù)量的習(xí)題,以幫助讀者對基本內(nèi)容的理解和掌握。本書深入淺出,闡述清晰、理論與實(shí)際并重,可作為高等院校信息管理與信息系統(tǒng)等專業(yè)本科生、研究生的教材。

書籍目錄

第1章 概論
 1.1 決策支持技術(shù)與數(shù)據(jù)庫的發(fā)展
  1.1.1 決策支持技術(shù)的發(fā)展
  1.1.2 數(shù)據(jù)庫技術(shù)的發(fā)展
 1.2 數(shù)據(jù)倉庫概述
  1.2.1 數(shù)據(jù)倉庫概念的提出
  1.2.2 數(shù)據(jù)倉庫的定義
  1.2.3 數(shù)據(jù)倉庫的特征
  1.2.4 數(shù)據(jù)倉庫的應(yīng)用和發(fā)展
 1.3 數(shù)據(jù)挖掘概述
  1.3.1 數(shù)據(jù)挖掘的定義
  1.3.2 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的關(guān)系
  1.3.3 數(shù)據(jù)挖掘的應(yīng)用和發(fā)展
 本章小結(jié)
 習(xí)題
第2章 數(shù)據(jù)倉庫的技術(shù)與開發(fā)
 2.1 數(shù)據(jù)倉庫的體系結(jié)構(gòu)
  2.1.1 用戶眼中的數(shù)據(jù)倉庫結(jié)構(gòu)
  2.1.2 數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)
  2.1.3 數(shù)據(jù)集市
 2.2 元數(shù)據(jù)
  2.2.1 元數(shù)據(jù)的定義
  2.2.2 元數(shù)據(jù)的主要作用
  2.2.3 元數(shù)據(jù)分類
 2.3 數(shù)據(jù)倉庫的數(shù)據(jù)模型
  2.3.1 概念模型
  2.3.2 邏輯模型
  2.3.3 物理模型
 2.4 粒度和分割
  2.4.1 粒度的確定
  2.4.2 粒度劃分實(shí)例
  2.4.3 數(shù)據(jù)分割
 2.5 數(shù)據(jù)倉庫和開發(fā)流程
 2.6 總線型結(jié)構(gòu)的數(shù)據(jù)倉庫
  2.6.1 統(tǒng)一的維
  2.6.2 統(tǒng)一的事實(shí)
  2.6.3 數(shù)據(jù)倉庫總線
 本章小結(jié)
 習(xí)題
第3章 數(shù)據(jù)倉庫管理技術(shù)
 3.1 數(shù)據(jù)倉庫管理的基本內(nèi)容
 3.2 休眠數(shù)據(jù)管理
  3.2.1 休眠數(shù)據(jù)的定義與理解
  3.2.2 休眠數(shù)據(jù)的處理
 3.3 元數(shù)據(jù)的管理
  3.3.1 傳統(tǒng)的元數(shù)據(jù)管理方法
  3.3.2 企業(yè)級中心知識庫的管理方法
 3.4 數(shù)據(jù)清理
  3.4.1 臟數(shù)據(jù)的來源和清理
  3.4.2 過期數(shù)據(jù)的清理
 本章小結(jié)
 習(xí)題
第4章 聯(lián)機(jī)分析處理
 4.1 概述
  4.1.1 OLAP的定義
  4.1.2 OLAP的基本概念
  4.1.3 OLAP的基本分析操作
  4.1.4 OLAP和OLTP的比較
 4.2 多維OLAP和關(guān)系OLAP
  4.2.1 數(shù)據(jù)存儲
  4.2.2 MOLAP和ROLAP的特征
  4.2.3 星型模式
 4.3 OLAP的新發(fā)展——OLAM
 ……
第5章 SQL Server數(shù)據(jù)倉庫的應(yīng)用與開發(fā)
第6章 數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
第7章 統(tǒng)計(jì)類數(shù)據(jù)挖掘技術(shù)
第8章 知識類數(shù)據(jù)挖掘技術(shù)
第9章 非結(jié)構(gòu)化數(shù)據(jù)挖掘技術(shù)
第10章 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的綜合應(yīng)用
第11章 數(shù)據(jù)挖掘的語言與工具
第12章 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的綜合應(yīng)用
參考文獻(xiàn)

章節(jié)摘錄

版權(quán)頁:插圖:7.5.2統(tǒng)計(jì)分析工具應(yīng)用在統(tǒng)計(jì)類數(shù)據(jù)挖掘技術(shù)的應(yīng)用中,需要商業(yè)分析人員給予必要的輔助指導(dǎo),因此統(tǒng)計(jì)類數(shù)據(jù)挖掘技術(shù)的應(yīng)用的成敗往往取決于商業(yè)分析人員的專業(yè)水平。7.5.2.1統(tǒng)計(jì)分析類工具應(yīng)用中的問題在現(xiàn)實(shí)世界中的數(shù)據(jù)倉庫極易受噪聲、空缺數(shù)據(jù)和不一致性數(shù)據(jù)的影響。因?yàn)閿?shù)據(jù)倉庫太大,存在不完整的、含噪聲的和不一致的數(shù)據(jù)是大型的、現(xiàn)實(shí)數(shù)據(jù)庫或數(shù)據(jù)倉庫的共同特點(diǎn)。不完整數(shù)據(jù)的出現(xiàn)可能有多種原因。有些感興趣的屬性,并非總是可用的。數(shù)據(jù)含噪聲(具有不正確的屬性值)可能有多種原因:如收集數(shù)據(jù)的設(shè)備可能出故障,人為的或計(jì)算機(jī)的錯(cuò)誤可能在數(shù)據(jù)輸入時(shí)出現(xiàn),數(shù)據(jù)傳輸中的錯(cuò)誤也可能出現(xiàn)。這些或許是由于技術(shù)的限制(如用于數(shù)據(jù)傳輸同步的緩沖區(qū)大小的限制),不正確的數(shù)據(jù)可能由命名或所用的數(shù)據(jù)代碼不一致而造成的。重復(fù)元組也會造成數(shù)據(jù)噪聲,對此也需要清理。數(shù)據(jù)清理例程通過填寫空缺的值、平滑噪聲數(shù)據(jù),識別、刪除孤立點(diǎn),并且解決不一致來“清理”數(shù)據(jù)。臟數(shù)據(jù)能使挖掘過程陷入混亂,導(dǎo)致不可靠的輸出。盡管大部分挖掘例程都有一些過程,處理不完整或噪聲數(shù)據(jù),但它們并非總是強(qiáng)壯的。相反,它們更致力于避免數(shù)據(jù)過分適合所建的模型。這樣,需要一個(gè)預(yù)處理步驟清理數(shù)據(jù)中的各種問題。(1)空缺值處理如果一個(gè)數(shù)據(jù)庫中許多元組的一些屬性值沒有記錄值,可以采用以下的方法為該屬性添上空缺的值。忽略元組:如果挖掘任務(wù)涉及分類或描述,但是缺少類標(biāo)號時(shí)可以忽略元組。該方法應(yīng)用時(shí),要求元組有多個(gè)屬性缺少值,否則該方法不是很有效。當(dāng)每個(gè)屬性缺少值的百分比變化很大時(shí),它的性能就非常差。

編輯推薦

《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(第2版)》為普通高等教育“十一五”國家級規(guī)劃教材,信息管理與信息系統(tǒng)專業(yè)核心課程精品教材系列之一。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 PDF格式下載


用戶評論 (總計(jì)5條)

 
 

  •   數(shù)據(jù)庫不錯(cuò)的,會是挺有用的技能。。
  •   挺好的,很不錯(cuò),物流也很快耶~~
  •   薄薄一本書,作者想說很多內(nèi)容,結(jié)果每一部分的內(nèi)容都講的很泛泛,不深入,很像是維基百科上的名詞解釋和周邊介紹一樣。如果想科普的,看看不錯(cuò)。如果想深入學(xué)習(xí)的,就不建議買這本書了。
  •   這樣的書不能再然他們出版了,純粹是浪費(fèi)閱讀人的時(shí)間和心情!
  •   對我很有幫助,我要好好研讀
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7