出版時(shí)間:2012-8 出版社:經(jīng)濟(jì)科學(xué)出版社 作者:李於洪 編 頁(yè)數(shù):264 字?jǐn)?shù):310000
內(nèi)容概要
李於洪主編的《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)д摗窞閿?shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基礎(chǔ)教程,是作者多年來(lái)從事數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程教學(xué)經(jīng)驗(yàn)的梳理和總結(jié)。為了增強(qiáng)內(nèi)容的直觀性和可理解度,全書(shū)以大量圖、表、實(shí)例融入其中。全書(shū)共分為四篇14章。第一篇為導(dǎo)引,共分2章:用實(shí)例和實(shí)例分析引導(dǎo)學(xué)生理解數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的概念內(nèi)涵及其產(chǎn)生背景。第二篇為數(shù)據(jù)倉(cāng)庫(kù),共分5章:詳細(xì)介紹了數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)及其組成部分的功能;從商業(yè)需求的角度介紹了數(shù)據(jù)倉(cāng)庫(kù)維度建模方法和聯(lián)機(jī)分析處理操作;介紹了元數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)建設(shè)中的重要性、分類(lèi)方法與作用。第三篇為數(shù)據(jù)挖掘,共分4章:通過(guò)淺顯易懂的語(yǔ)言及實(shí)例,深入淺出地介紹了關(guān)聯(lián)分析方法、神經(jīng)網(wǎng)絡(luò)算法、決策樹(shù)算法和聚類(lèi)分析方法。第四篇為實(shí)驗(yàn)與工具,共分3章:提供了數(shù)據(jù)倉(cāng)庫(kù)實(shí)驗(yàn)、神經(jīng)網(wǎng)絡(luò)建模實(shí)驗(yàn)、決策樹(shù)與關(guān)聯(lián)分析實(shí)驗(yàn),強(qiáng)化培養(yǎng)學(xué)生的應(yīng)用能力。
《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)д摗房勺鳛槠胀ǜ叩仍盒S?jì)算機(jī)專(zhuān)業(yè)、軟件工程專(zhuān)業(yè)、信管專(zhuān)業(yè)等其他相關(guān)專(zhuān)業(yè)的教材,也可作為數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘方面的培訓(xùn)教材,對(duì)于希望了解或?qū)W習(xí)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘知識(shí)的自學(xué)人士,本書(shū)具有較強(qiáng)的可讀性。
書(shū)籍目錄
第一篇 導(dǎo)引
第1章 數(shù)據(jù)倉(cāng)庫(kù)概念與內(nèi)涵
1.1 數(shù)據(jù)倉(cāng)庫(kù)概念
1.1.1 數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生
1.1.2 數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用實(shí)例:理解數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用目標(biāo)與作用
1.2 數(shù)據(jù)倉(cāng)庫(kù)的四個(gè)基本特征
1.2.1 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是面向主題的
1.2.2 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是集成的
1.2.3 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是不可更新的
1.2.4 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是隨時(shí)間不斷變化的
1.3 數(shù)據(jù)集市——部門(mén)級(jí)數(shù)據(jù)倉(cāng)庫(kù)
1.3.1 自上而下構(gòu)建數(shù)據(jù)集市
1.3.2 自下而上構(gòu)建數(shù)據(jù)集市
1.3.3 自上而下與自下而上結(jié)合構(gòu)建數(shù)據(jù)集市
習(xí)題
討論題
第2章 數(shù)據(jù)挖掘概念與內(nèi)涵
2.1 數(shù)據(jù)挖掘概念
2.1.1 數(shù)據(jù)挖掘的產(chǎn)生
2.1.2 數(shù)據(jù)挖掘應(yīng)用實(shí)例:理解數(shù)據(jù)挖掘的應(yīng)用目標(biāo)與作用
2.1.3 數(shù)據(jù)挖掘的定義
2.2 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
討論題
第二篇 數(shù)據(jù)倉(cāng)庫(kù)
第3章 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)及其組成部分
3.1 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
3.2 數(shù)據(jù)倉(cāng)庫(kù)的組成部分及其功能
3.2.1 源數(shù)據(jù)部分
3.2.2 數(shù)據(jù)準(zhǔn)備部分
3.2.3 數(shù)據(jù)存儲(chǔ)部分
3.2.4 信息傳遞部分
思考題
習(xí)題
討論題
第4章 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的商業(yè)需求分析
4.1 收集商業(yè)需求數(shù)據(jù)碰到的問(wèn)題
4.2 商業(yè)數(shù)據(jù)維度化分析
4.3 商業(yè)維度實(shí)例分析
思考題
習(xí)題
第5章 數(shù)據(jù)倉(cāng)庫(kù)的維度建模
5.1 維度建模基礎(chǔ)
5.2 星型模式及其查詢(xún)的鉆取
5.2.1 星型模式維度表內(nèi)容的特征
5.2.2 星型模式事實(shí)表內(nèi)容的特征
5.2.3 星型模式的優(yōu)勢(shì)
5.3 雪花型模式:對(duì)維度表的再處理
5.4 聚集事實(shí)表:對(duì)關(guān)鍵指標(biāo)的再處理
5.4.1 理解事實(shí)表的數(shù)據(jù)量
5.4.2 理解聚集事實(shí)表的作用
5.4.3 對(duì)事實(shí)表進(jìn)行聚集的三種方法
5.4.4 聚集過(guò)程中相關(guān)問(wèn)題討論
思考題
習(xí)題
第6章 數(shù)據(jù)倉(cāng)庫(kù)中的聯(lián)機(jī)分析處理——OLAP
6.1 OLAP的含義、規(guī)則與特征
6.1.1 OLAP的含義
6.1.2 OLAP的規(guī)則
6.1.3 OLAP的特征
6.2 OLAP的基本操作
6.2.1 切片
6.2.2 切塊
6.2.3 上鉆與下鉆
6.2.4 旋轉(zhuǎn)
6.3 OLAP模型結(jié)構(gòu)
6.3.1 關(guān)系聯(lián)機(jī)分析處理(ROLAP)結(jié)構(gòu)
6.3.2 多維聯(lián)機(jī)分析處理(MOLAP)結(jié)構(gòu)
6.3.3 混合聯(lián)機(jī)分析處理(HOLAP)結(jié)構(gòu)
6.3.4 桌面聯(lián)機(jī)分析處理(DOLAP)結(jié)構(gòu)
6.3.5 客戶(hù)聯(lián)機(jī)分析處理(COLAP)結(jié)構(gòu)
6.4 典型OLAP模型的數(shù)據(jù)組織與應(yīng)用
6.4.1 ROLAP的數(shù)據(jù)組織與應(yīng)用
6.4.2 MOIAP的數(shù)據(jù)組織與應(yīng)用
6.4.3 ROLAP與MOLAP的數(shù)據(jù)組織與應(yīng)用比較
思考題
習(xí)題
討論題
第7章 元數(shù)據(jù)
7.1 數(shù)據(jù)倉(cāng)庫(kù)中元數(shù)據(jù)的重要性
7.1.1 數(shù)據(jù)倉(cāng)庫(kù)的用戶(hù)需要元數(shù)據(jù)
7.1.2 數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)者需要元數(shù)據(jù)
7.1.3 數(shù)據(jù)倉(cāng)庫(kù)的管理員需要元數(shù)據(jù)
7.2 關(guān)于數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)的概念界定
7.3 元數(shù)據(jù)的幾種分類(lèi)方法
7.3.1 按用途對(duì)元數(shù)據(jù)進(jìn)行分類(lèi)
7.3.2 按數(shù)據(jù)倉(cāng)庫(kù)功能區(qū)域劃分的元數(shù)據(jù)分類(lèi)
7.3.3 按元數(shù)據(jù)的活動(dòng)方式進(jìn)行分類(lèi)
7.4 元數(shù)據(jù)的作用
7.5 元數(shù)據(jù)管理的體系結(jié)構(gòu)
7.5.1 集中的方法
7.5.2 分散的方法
7.5.3 分布的方法
思考題
習(xí)題
討論題
第三篇 數(shù)據(jù)挖掘
第8章 關(guān)聯(lián)分析
8.1 關(guān)聯(lián)規(guī)則概念
8.1.1 關(guān)聯(lián)規(guī)則的支持度和置信度
8.1.2 關(guān)聯(lián)規(guī)則分類(lèi)
8.2 關(guān)聯(lián)規(guī)則挖掘算法
8.2.1 Apriori算法
8.2.2 強(qiáng)關(guān)聯(lián)規(guī)則的有效性和可行性問(wèn)題
習(xí)題
討論題
第9章 神經(jīng)網(wǎng)絡(luò)算法
9.1 神經(jīng)網(wǎng)絡(luò)概念
9.1.1 神經(jīng)網(wǎng)絡(luò)原理
9.1.2 人工神經(jīng)網(wǎng)絡(luò)
9.2 人工神經(jīng)網(wǎng)絡(luò)模型
9.2.1 感知器
9.2.2 帶隱層的人工神經(jīng)網(wǎng)絡(luò)
9.3 前饋神經(jīng)網(wǎng)絡(luò)
9.3.1 訓(xùn)練神經(jīng)網(wǎng)絡(luò)
9.3.2 后向傳播如何工作
9.3.3 后向傳播算法
9.4 有關(guān)神經(jīng)網(wǎng)絡(luò)研究中應(yīng)該關(guān)注的幾個(gè)問(wèn)題
9.4.1 關(guān)于對(duì)神經(jīng)網(wǎng)絡(luò)的理解問(wèn)題
9.4.2 關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)用中數(shù)據(jù)準(zhǔn)備的問(wèn)題
9.4.3 影響神經(jīng)網(wǎng)絡(luò)模型性能的部分因素
9.4.4 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),需要強(qiáng)調(diào)以下幾個(gè)問(wèn)題
習(xí)題
討論題
第10章 決策樹(shù)算法
10.1 決策樹(shù)分類(lèi)概述
10.1.1 決策樹(shù)分類(lèi)步驟
10.1.2 決策樹(shù)分類(lèi)舉例
10.2 ID3算法
10.2.1 信息論基本原理
10.2.2 ID3算法的基本思想與實(shí)例
10.2.3 ID3算法應(yīng)用中應(yīng)該關(guān)注的幾個(gè)問(wèn)題
習(xí)題
討論題
第11章 聚類(lèi)分析
11.1 聚類(lèi)分析概述
11.1.1 聚類(lèi)分析中的數(shù)據(jù)類(lèi)型
11.1.2 聚類(lèi)分析中相異度(相似性、差異度)測(cè)度方法
11.2 聚類(lèi)分析方法
11.2.1 劃分聚類(lèi)方法
11.2.2 基于密度的聚類(lèi)方法
11.2.3 聚類(lèi)分析在數(shù)據(jù)挖掘應(yīng)用中有待進(jìn)一步研究的問(wèn)題
習(xí)題
討論題
第四篇 實(shí)驗(yàn)與工具
第12章 數(shù)據(jù)倉(cāng)庫(kù)實(shí)驗(yàn)與工具應(yīng)用
第13章 神經(jīng)網(wǎng)絡(luò)建模實(shí)驗(yàn)與工具應(yīng)用
第14章 決策樹(shù)與關(guān)聯(lián)分析實(shí)驗(yàn)與工具應(yīng)用
參考文獻(xiàn)
章節(jié)摘錄
在成功連接到該服務(wù)器之后將返回AnalysisManager,此時(shí)在AnalysisMan-ager出現(xiàn)了剛剛注冊(cè)的服務(wù)器,如果該服務(wù)器在安裝AnalysisServices時(shí)選擇了創(chuàng)建示例數(shù)據(jù)庫(kù)的話(huà),此時(shí)可以看到“FoodMart2000”示例數(shù)據(jù)庫(kù)。 在每個(gè)分析服務(wù)器上可以創(chuàng)建一個(gè)或多個(gè)數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)多維數(shù)據(jù)集、數(shù)據(jù)挖掘模型和相關(guān)對(duì)象。應(yīng)該為每組相關(guān)的計(jì)劃創(chuàng)建一個(gè)數(shù)據(jù)庫(kù),每個(gè)數(shù)據(jù)庫(kù)存儲(chǔ)自己的對(duì)象,這些對(duì)象包括以下內(nèi)容: (1)數(shù)據(jù)源。數(shù)據(jù)源包含訪(fǎng)問(wèn)對(duì)象(如多維數(shù)據(jù)集)的源數(shù)據(jù)所必需的信息。一個(gè)數(shù)據(jù)庫(kù)可以包含多個(gè)數(shù)據(jù)源,數(shù)據(jù)庫(kù)中的多維數(shù)據(jù)集、分區(qū)和維度共享這些數(shù)據(jù)源?! 。?)多維數(shù)據(jù)集。多維數(shù)據(jù)集即數(shù)據(jù)立方體。一個(gè)多維數(shù)據(jù)集只能有一個(gè)數(shù)據(jù)源,創(chuàng)建多維數(shù)據(jù)集時(shí),可以從數(shù)據(jù)庫(kù)的數(shù)據(jù)源中選擇數(shù)據(jù)源,也可以創(chuàng)建新的數(shù)據(jù)源?! 。?)共享維度。共享維度是可用于多個(gè)多維數(shù)據(jù)集的維度。MicrosoftSQLServer2000AnalysisServices包括幾種維度,最常見(jiàn)的劃分是常規(guī)維度、虛擬維度、父子維度和數(shù)據(jù)挖掘維度,其中任何一種維度都可以創(chuàng)建共享維度。共享同一數(shù)據(jù)源的共享維度可以包括在數(shù)據(jù)庫(kù)中的任何多維數(shù)據(jù)集中。通過(guò)創(chuàng)建共享維度并在多個(gè)多維數(shù)據(jù)集中使用,可以節(jié)省大量時(shí)間,否則,就要在每個(gè)多維數(shù)據(jù)集內(nèi)創(chuàng)建重復(fù)的專(zhuān)用維度?! 。?)數(shù)據(jù)挖掘模型。數(shù)據(jù)挖掘模型是數(shù)據(jù)挖掘的中央對(duì)象,是一個(gè)虛擬結(jié)構(gòu),它表示關(guān)系或多維數(shù)據(jù)的分組和預(yù)測(cè)分析。MicrosoftSQLServer2000A-nalysisServices支持兩種數(shù)據(jù)挖掘模型,基于多維數(shù)據(jù)集(數(shù)據(jù)立方體)的挖掘模型和基于關(guān)系數(shù)據(jù)庫(kù)的挖掘模型,在AnalysisManager樹(shù)形目錄中分別用不同的圖標(biāo)表示?! 。?)數(shù)據(jù)庫(kù)角色。數(shù)據(jù)庫(kù)角色包括WindowsNT4.0或Windows2000用戶(hù)賬戶(hù)和組。通常,數(shù)據(jù)庫(kù)角色創(chuàng)建后指派給多維數(shù)據(jù)集或數(shù)據(jù)挖掘模型,授予該角色對(duì)多維數(shù)據(jù)集或挖掘模型的訪(fǎng)問(wèn)權(quán),同時(shí)創(chuàng)建一個(gè)與數(shù)據(jù)庫(kù)角色同名的多維數(shù)據(jù)集或挖掘模型角色用以保存該角色的信息。在數(shù)據(jù)庫(kù)角色中,可以控制對(duì)數(shù)據(jù)庫(kù)中維度的訪(fǎng)問(wèn),可以指定角色能夠查看維度的哪些級(jí)別和成員。數(shù)據(jù)庫(kù)角色是直接從屬于數(shù)據(jù)庫(kù)的,一個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)庫(kù)角色僅適用于該數(shù)據(jù)庫(kù)和其中的對(duì)象。數(shù)據(jù)庫(kù)角色可以通過(guò)數(shù)據(jù)庫(kù)角色管理器和“數(shù)據(jù)庫(kù)角色”對(duì)話(huà)框創(chuàng)建和維護(hù)。在AnalysisManager中,右擊“數(shù)據(jù)庫(kù)角色”,從彈出菜單中選擇“管理角色”選項(xiàng),就會(huì)彈出數(shù)據(jù)庫(kù)角色管理器。角色的每個(gè)屬性都可以通過(guò)右鍵菜單進(jìn)行編輯?! ?/pre>圖書(shū)封面
評(píng)論、評(píng)分、閱讀與下載
- 還沒(méi)讀過(guò)(98)
- 勉強(qiáng)可看(716)
- 一般般(122)
- 內(nèi)容豐富(5065)
- 強(qiáng)力推薦(415)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)д?PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版