出版時(shí)間:2012-7 出版社:清華大學(xué)出版社 作者:亞當(dāng)森 頁數(shù):390 字?jǐn)?shù):662000
Tag標(biāo)簽:無
內(nèi)容概要
學(xué)習(xí)維度設(shè)計(jì)的最佳實(shí)踐?!禨tar
Schema完全參考手冊(cè):數(shù)據(jù)倉(cāng)庫維度設(shè)計(jì)權(quán)威指南》全面、深入地介紹了設(shè)計(jì)原理及其理論基礎(chǔ)。全書圍繞設(shè)計(jì)概念組織并輔以詳實(shí)的示例,可作為初學(xué)者逐步深入學(xué)習(xí)星型模式的參考資料,同時(shí)也為專家提供了內(nèi)容豐富的參考資源。
《Star
Schema完全參考手冊(cè):數(shù)據(jù)倉(cāng)庫維度設(shè)計(jì)權(quán)威指南》首先介紹維度設(shè)計(jì)的基礎(chǔ)知識(shí),向讀者展示如何將這些基礎(chǔ)應(yīng)用于不同的數(shù)據(jù)倉(cāng)庫體系結(jié)構(gòu),包括w.h.inmon和ralph
kimball倡導(dǎo)的體系結(jié)構(gòu)。本書通過介紹一系列高級(jí)技術(shù)來幫助讀者解決現(xiàn)實(shí)世界中存在的復(fù)雜性,獲得最佳性能并適應(yīng)商業(yè)智能和etl軟件產(chǎn)品的需求。讀者可以將書中的設(shè)計(jì)任務(wù)和設(shè)計(jì)產(chǎn)品運(yùn)用于所有項(xiàng)目中,而無論項(xiàng)目采用什么方法和架構(gòu)。
作者簡(jiǎn)介
作者:(美國(guó))亞當(dāng)森(Christopher Adamson) 譯者:王紅濱 王念濱 初妍 Christopher Adamson是星型模式設(shè)計(jì)專家,并且是經(jīng)驗(yàn)豐富的數(shù)據(jù)倉(cāng)庫實(shí)踐者。他在世界各地演講和授課,撰寫數(shù)據(jù)倉(cāng)庫相關(guān)內(nèi)容,并通過Oakton軟件有限責(zé)任公司提供數(shù)據(jù)倉(cāng)庫咨詢服務(wù)。 作為一名咨詢專家,Christopher與各個(gè)行業(yè)的客戶一起工作,一開發(fā)數(shù)據(jù)倉(cāng)庫戰(zhàn)略,識(shí)別并確定項(xiàng)目?jī)?yōu)先順序,設(shè)計(jì)并修改解決方案,以及管理實(shí)現(xiàn)。他服務(wù)的客戶包括財(cái)富500強(qiáng)的公司、政府機(jī)關(guān)和數(shù)據(jù)倉(cāng)庫軟件提供商。 Christopher在世界范圍內(nèi)為成千上萬學(xué)生講授多維設(shè)計(jì)。他是The Data Warehousing Institute(TDWI)的教員,為重要會(huì)議提供現(xiàn)場(chǎng)講座,并且提供網(wǎng)絡(luò)教學(xué)。 Christopher撰寫了許多有關(guān)數(shù)據(jù)倉(cāng)庫的文章和書籍。他是Mastering Data Warehouse Aggregates(Wiley,2006)一書的作者,并與人合著了Data Warehouse Design Solutions(Wilev,1998)一書。他撰寫有關(guān)數(shù)據(jù)倉(cāng)庫的文章并為讀者解答問題的博客網(wǎng)址為www.StarSchemaCentral.com.
書籍目錄
第1部分 基礎(chǔ)
第1章 分析型數(shù)據(jù)庫與維度設(shè)計(jì)
1.1 維度設(shè)計(jì)
1.2 星型模式
1.3 星型模式的應(yīng)用
1.4 指導(dǎo)原則
1.5 本章小結(jié)
1.6 補(bǔ)充閱讀
第2章 數(shù)據(jù)倉(cāng)庫體系結(jié)構(gòu)
2.1 inmon的企業(yè)信息化工廠
2.2 kimball的維度數(shù)據(jù)倉(cāng)庫
2.3 獨(dú)立型數(shù)據(jù)集市
2.4 體系結(jié)構(gòu)和維度設(shè)計(jì)
2.5 本章小結(jié)
2.6 補(bǔ)充閱讀
第3章 星型模式與多維數(shù)據(jù)集
3.1 維度表特性
3.2 事實(shí)表特性
3.3 緩慢變化維
3.4 多維數(shù)據(jù)集
3.5 本章小結(jié)
3.6 補(bǔ)充閱讀
第2部分 多種星型模式
第4章 過程處理中的事實(shí)表
4.1 事實(shí)表與業(yè)務(wù)過程
4.2 具有不同時(shí)間的事實(shí)
4.3 具有不同粒度的事實(shí)
4.4 從多個(gè)事實(shí)表中分析事實(shí)
4.5 本章小結(jié)
4.6 補(bǔ)充閱讀
第5章 維度一致性問題
5.1 星型模式之間的協(xié)同
5.2 維度與橫向鉆取
5.3 一致性維度
5.4 結(jié)構(gòu)與一致性
5.5 本章小結(jié)
5.6 補(bǔ)充閱讀
第3部分 維度設(shè)計(jì)
第6章 深入學(xué)習(xí)維度表
6.1 將維度分組到表中
6.2 分解大型維度
6.3 角色維度和別名使用
6.4 避免空值
6.5 行為維度
6.6 本章小結(jié)
6.7 補(bǔ)充閱讀
第7章 層次結(jié)構(gòu)與雪花模式
7.1 鉆取
7.2 屬性層次和鉆取
7.3 雪花模式
7.4 支架表
7.5 本章小結(jié)
7.6 補(bǔ)充閱讀
第8章 深入學(xué)習(xí)緩慢變化技術(shù)
8.1 時(shí)間戳維度
8.2 類型3變化
8.3 混合緩慢變化
8.4 本章小結(jié)
8.5 補(bǔ)充閱讀
第9章 多值維度與橋接表
9.1 標(biāo)準(zhǔn)的一對(duì)多關(guān)系
9.2 多值維度
9.3 多值屬性
9.4 本章小結(jié)
9.5 補(bǔ)充閱讀
第10章 遞歸層次與橋接表
10.1 遞歸層次
10.2 遞歸層次的扁平化
10.3 層次橋接表
10.4 變化與層次橋接表
10.5 關(guān)于層次橋接表的相關(guān)討論
10.6 本章小結(jié)
10.7 補(bǔ)充閱讀
第4部分 事實(shí)表設(shè)計(jì)
第11章 事務(wù)、快照和累積快照
11.1 事務(wù)事實(shí)表
11.2 事實(shí)表快照
11.3 累積快照事實(shí)表
11.4 本章小結(jié)
11.5 補(bǔ)充閱讀
第12章 無事實(shí)的事實(shí)表
12.1 無事實(shí)的事件
12.2 條件、范圍或資格
12.3 本章小結(jié)
12.4 補(bǔ)充閱讀
第13章 特殊類型的星型模式
13.1 特殊類型屬性
13.2 核心和自定義星型模式
13.3 使用通用屬性
13.4 本章小結(jié)
13.5 補(bǔ)充閱讀
第5部分 性能
第14章 導(dǎo)出模式
14.1 重構(gòu)維度數(shù)據(jù)
14.2 融合事實(shí)表
14.3 旋轉(zhuǎn)事實(shí)表
14.4 切片事實(shí)表
14.5 集合操作事實(shí)表
14.6 本章小結(jié)
14.7 補(bǔ)充閱讀
第15章 聚集
15.1 聚集的基礎(chǔ)知識(shí)
15.2 使聚集不可見
15.3 可選的匯總設(shè)計(jì)方法
15.4 本章小結(jié)
15.5 補(bǔ)充閱讀
第6部分 工具及文檔
第16章 設(shè)計(jì)與商業(yè)智能
16.1 商業(yè)智能與sql生成
16.2 適用于語義層的指導(dǎo)原則
16.3 使用商業(yè)智能工具的sql生成器
16.4 使用基于多維數(shù)據(jù)集的商業(yè)智能
16.5 本章小結(jié)
16.6 補(bǔ)充閱讀
第17章 設(shè)計(jì)與etl
17.1 etl過程
17.2 加載星型模式
17.3 優(yōu)化加載
17.4 清理數(shù)據(jù)
17.5 內(nèi)部處理列
17.6 本章小結(jié)
17.7 補(bǔ)充閱讀
第18章 如何設(shè)計(jì)并文檔化維度模型
18.1 維度設(shè)計(jì)與數(shù)據(jù)倉(cāng)庫生命周期
18.2 設(shè)計(jì)活動(dòng)
18.3 文檔化維度模型
18.4 本章小結(jié)
18.5 補(bǔ)充閱讀
章節(jié)摘錄
版權(quán)頁: 插圖: 由于非可加的事實(shí)并未存儲(chǔ)在事實(shí)表中,需要注意不要丟失這些事實(shí)。在許多業(yè)務(wù)過程中,比率是非常重要的度量,沒有它們,系統(tǒng)會(huì)存在許多缺陷。作為模式設(shè)計(jì)的一部分,非可加事實(shí)應(yīng)該被文檔化,在第18章“如何設(shè)計(jì)并文檔化維度模型”中將詳細(xì)討論。 注意: 關(guān)于非可加性的討論還沒有結(jié)束。除了非可加及可加的事實(shí)之外,還存在半可加的事實(shí)。關(guān)于半可加事實(shí)將在第11章“事務(wù)、快照和累積快照”中討論。 3.2.3 粒度 事實(shí)表行所表達(dá)的細(xì)節(jié)層次被稱為粒度。清楚地聲明事實(shí)表的粒度是模式設(shè)計(jì)過程中的一個(gè)重要工作。明確的粒度能夠確保對(duì)事實(shí)表中行的意思的理解不會(huì)產(chǎn)生混淆,保證所有的事實(shí)按照同樣的細(xì)節(jié)層次記錄。 可以采用多種方式描述粒度。許多模式設(shè)計(jì)者采用簡(jiǎn)單地枚舉相關(guān)維度的方式來描述粒度。例如,圖3—1所示的訂單事實(shí)表(ORDER FACTS)的粒度可以描述為“按照每天、銷售人員、產(chǎn)品、客戶排序”。 以上方式聽起來好像說清楚了,它揭示了星型模式的重要信息。在此方式下,粒度的聲明包含以下隱含意思:對(duì)給定的某天,如果一個(gè)客戶在同一銷售商處,就同一產(chǎn)品提交了多個(gè)訂單,那么這些訂單將被組合到同一行中。這樣的聚合可能拋棄了有用的信息。 多數(shù)情況下,模式設(shè)計(jì)者會(huì)避免在將數(shù)據(jù)加載到事實(shí)表之前聚合數(shù)據(jù)。盡可能地保持最細(xì)粒度的數(shù)據(jù),星型模式就能解決范圍更加寬泛的分析型需求。初期的業(yè)務(wù)需求可能不需要詳細(xì)數(shù)據(jù),但分析型的需求往往具有變化的趨勢(shì),一旦構(gòu)建了聚集模式,對(duì)詳細(xì)信息的需求將就此展開。 無論采用何種數(shù)據(jù)倉(cāng)庫結(jié)構(gòu),這一指導(dǎo)原則都普遍適用。對(duì)多維數(shù)據(jù)倉(cāng)庫來說,事實(shí)表包含粒度數(shù)據(jù)至關(guān)重要,因?yàn)槎嗑S數(shù)據(jù)倉(cāng)庫是細(xì)節(jié)數(shù)據(jù)的集中存儲(chǔ)倉(cāng)庫。如果性能成為關(guān)注的焦點(diǎn),可以在細(xì)粒度事實(shí)表中附帶聚合信息,第15章中將會(huì)討論該問題。針對(duì)企業(yè)信息化工廠體系結(jié)構(gòu)來說,這一指導(dǎo)原則可以寬松一些,因?yàn)椴煌膫}(cāng)庫均包含粒度數(shù)據(jù)。在此環(huán)境下,數(shù)據(jù)集市的事實(shí)表可以聚集數(shù)據(jù),而不用擔(dān)心丟失信息的問題。不過,對(duì)研究粒度數(shù)據(jù)的新需求可能會(huì)導(dǎo)致重新開發(fā)數(shù)據(jù)集市。 技巧: 盡可能將事實(shí)表的粒度設(shè)置為最詳細(xì)的數(shù)據(jù)粒度級(jí)別。這一原則有助于確保分析型應(yīng)用具有最大的靈活性。假如能夠有不同的倉(cāng)庫保存不同粒度的數(shù)據(jù),則可以降低要求,但這種方式可能會(huì)對(duì)未來的應(yīng)用帶來限制。
編輯推薦
《Star Schema完全參考手冊(cè):數(shù)據(jù)倉(cāng)庫維度設(shè)計(jì)權(quán)威指南》由清華大學(xué)出版社出版。
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載