出版時間:2010-5 出版社:機械工業(yè)出版社 作者:加西亞-莫利納(Hector Garcia-Molina),Jeffrey D.Ullman,Jennifer Widom 頁數(shù):385 譯者:楊冬青,吳愈青,包小源
Tag標簽:無
前言
隨著計算機硬件、軟件技術(shù)的飛速發(fā)展和計算機系統(tǒng)在各行各業(yè)的廣泛應(yīng)用,數(shù)據(jù)已經(jīng)成為各種機構(gòu)的寶貴資源,數(shù)據(jù)庫系統(tǒng)對于當今科研部門、政府機關(guān)、企事業(yè)單位等來說都是至關(guān)重要的。而數(shù)據(jù)庫系統(tǒng)中的核心軟件是數(shù)據(jù)庫管理系統(tǒng)(DBMS)。DBMS用于高效地創(chuàng)建和存儲大量的數(shù)據(jù),并對數(shù)據(jù)進行有效的管理、處理和維護,是數(shù)據(jù)庫專家和技術(shù)人員數(shù)十年研究開發(fā)的結(jié)果,是當前最復(fù)雜的系統(tǒng)軟件之一。要深入掌握數(shù)據(jù)庫系統(tǒng)的原理和技術(shù),進而從事數(shù)據(jù)庫管理軟件和工具的開發(fā),必須學習和研究數(shù)據(jù)庫管理系統(tǒng)實現(xiàn)技術(shù)。要深入了解數(shù)據(jù)庫系統(tǒng)的內(nèi)部結(jié)構(gòu),以開發(fā)出高效的數(shù)據(jù)庫應(yīng)用系統(tǒng),也需要學習和研究數(shù)據(jù)庫管理系統(tǒng)實現(xiàn)技術(shù)。 Hector GarciaMolina、Jeffrey DUllman和Jennifer Widom是斯坦福大學著名的計算機科學家,多年來他們在數(shù)據(jù)庫系統(tǒng)領(lǐng)域中做了大量的開創(chuàng)性工作,由他們撰寫的《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》一書是關(guān)于數(shù)據(jù)庫系統(tǒng)實現(xiàn)方面內(nèi)容最為全面的著述之一。我們于2000年將《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》的第1版譯成中文,國內(nèi)許多大學采用它作為研究生數(shù)據(jù)庫課程的教材或主要教學參考書,收到了良好的效果。 現(xiàn)在我們又翻譯了《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》第2版。第2版保持了第1版的總體風格,首先對數(shù)據(jù)庫系統(tǒng)實現(xiàn)原理進行了深入闡述,并具體討論了數(shù)據(jù)庫管理系統(tǒng)的三個主要成分——存儲管理器、查詢處理器和事務(wù)管理器的實現(xiàn)技術(shù)。與第1版相比,第2版對于數(shù)據(jù)存儲和索引結(jié)構(gòu)的闡述進行了適當?shù)膲嚎s,分別將原來的兩章合并為一章;另外,增加了一章“并行與分布式數(shù)據(jù)庫”(第9章),其中包括了第1版中分散在查詢處理和事務(wù)管理的相關(guān)章節(jié)中的內(nèi)容,并增加了有關(guān)分布式查詢執(zhí)行的一些新內(nèi)容,例如,map reduce并行架構(gòu)、P2P數(shù)據(jù)庫以及分布式散列的實現(xiàn)等。同時,第2版充分反映了數(shù)據(jù)管理技術(shù)的新進展,對內(nèi)容進行了擴充,除了在第1版中原有的“信息集成”一章(第10章)中加入了新的內(nèi)容外,還增加了兩個全新的章:“數(shù)據(jù)挖掘”(第11章)和“數(shù)據(jù)庫系統(tǒng)與互聯(lián)網(wǎng)”(第12章)。“數(shù)據(jù)挖掘”一章中包含了關(guān)聯(lián)規(guī)則與頻繁項集挖掘技術(shù),從一個非常大的數(shù)據(jù)庫或Web頁面集合中發(fā)現(xiàn)“相似”的項的“最小散列”和“局部敏感散列”等關(guān)鍵技術(shù),以及高維空間中大規(guī)模數(shù)據(jù)的聚簇問題等?!皵?shù)據(jù)庫系統(tǒng)與互聯(lián)網(wǎng)”一章中重點闡述了與互聯(lián)網(wǎng)相關(guān)的兩個方面的數(shù)據(jù)庫技術(shù):Web搜索引擎及其PageRank算法,流數(shù)據(jù)模型以及管理數(shù)據(jù)流形式的大量數(shù)據(jù)所需的技術(shù)。 我們認為這本書既適合作為高等院校計算機專業(yè)研究生的教材或本科生的教學參考書,又適合作為從事相關(guān)研究或開發(fā)工作的專業(yè)技術(shù)人員的高級參考資料。 楊冬青全面組織了本書的翻譯,吳愈青、包小源、唐世渭在本書的翻譯和審校中做了大量的工作。除此之外,參加翻譯的還有閆秋玲、鄭麗麗、蔡慧慧、馬煜、張棋、陳巍、郭思祺、夏海峰、翁學天、郭少松、李樹節(jié)。 限于譯者水平,譯文中難免有疏漏和錯誤,歡迎批評指正。
內(nèi)容概要
本書是斯坦福大學計算機科學專業(yè)數(shù)據(jù)庫系列課程第二門課的教科書。書中對數(shù)據(jù)庫系統(tǒng)實現(xiàn)原理進行了深入闡述,并具體討論了數(shù)據(jù)庫管理系統(tǒng)的三個主要成分——存儲管理器、查詢處理器和事務(wù)管理器的實現(xiàn)技術(shù)。此外,第2版充分反映了數(shù)據(jù)管理技術(shù)的新進展,對內(nèi)容進行了擴充,除了在第1版中原有的“信息集成”一章(第10章)中加入了新的內(nèi)容外,還增加了兩個全新的章:“數(shù)據(jù)挖掘”(第11章)和“數(shù)據(jù)庫系統(tǒng)與互聯(lián)網(wǎng)”(第12章)。 本書適合作為高等院校計算機專業(yè)研究生的教材或本科生的教學參考書,也適合作為從事相關(guān)研究或開發(fā)工作的專業(yè)技術(shù)人員的高級參考資料。
作者簡介
Hector Garcia-Molina,斯坦福大學計算機科學與電子工程系的Leona rd BoSack和SandraLerner教授。他在數(shù)據(jù)庫系統(tǒng)、分布式系統(tǒng)和數(shù)字圖書館領(lǐng)域中發(fā)表了大量論文,研究興趣包括分布式計算系統(tǒng)、數(shù)據(jù)庫系統(tǒng)和數(shù)字圖書館。他是ACM會士、美國藝術(shù)與科學院會士和美國國家工程院成
書籍目錄
出版者的話譯者序譯者簡介出版前言第1章 DBMS系統(tǒng)概述 1.1 數(shù)據(jù)庫系統(tǒng)的發(fā)展 1.2 數(shù)據(jù)庫管理系統(tǒng)概述 1.3 本書概述 1.4 數(shù)據(jù)庫模型和語言回顧 1.5 參考文獻第一部分 數(shù)據(jù)庫系統(tǒng)實現(xiàn) 第2章 輔助存儲管理 2.1 存儲器層次 2.2 磁盤 2.3 加速對輔助存儲器的訪問 2.4 磁盤故障 2.5 組織磁盤上的數(shù)據(jù) 2.6 塊和記錄地址的表示 2.7 變長數(shù)據(jù)和記錄 2.8 記錄的修改 2.9 小結(jié) 2.10 參考文獻 第3章 索引結(jié)構(gòu) 3.1 索引結(jié)構(gòu)基礎(chǔ) 3.2 B-樹 3.3 散列表 3.4 多維索引 3.5 多維數(shù)據(jù)的散列結(jié)構(gòu) 3.6 多維數(shù)據(jù)的樹結(jié)構(gòu) 3.7 位圖索引 3.8 小結(jié) 3.9 參考文獻 第4章 查詢執(zhí)行 4.1 物理查詢計劃操作符介紹 4.2 一趟算法 4.3 嵌套循環(huán)連接 4.4 基于排序的兩趟算法 4.5 基于散列的兩趟算法 4.6 基于索引的算法 4.7 緩沖區(qū)管理 4.8 使用超過兩趟的算法 4.9 小結(jié) 4.10 參考文獻 第5章 查詢編譯器 5.1 語法分析和預(yù)處理 5.2 用于改進查詢計劃的代數(shù)定律 5.3 從語法分析樹到邏輯查詢計劃 5.4 運算代價的估計 5.5 基于代價的計劃選擇介紹 5.6 連接順序的選擇 5.7 物理查詢計劃選擇的完成 5.8 小結(jié) 5.9 參考文獻 第6章 系統(tǒng)故障對策 6.1 可恢復(fù)操作的問題和模型 6.2 undo日志 6.3 redo日志 6.4 undo/redo日志 6.5 針對介質(zhì)故障的防護 6.6 小結(jié) 6.7 參考文獻 第7章 并發(fā)控制 7.1 串行調(diào)度和可串行化調(diào)度 7.2 沖突可串行化 7.3 使用鎖的可串行化實現(xiàn) 7.4 有多種鎖模式的封鎖系統(tǒng) 7.5 封鎖調(diào)度器的一種體系結(jié)構(gòu) 7.6 數(shù)據(jù)庫元素的層次 7.7 樹協(xié)議 …… 第8章 再論事務(wù)管理 第9章 并行與分布式數(shù)據(jù)庫 第二部分 現(xiàn)代數(shù)據(jù)庫系統(tǒng)專題 第10章 信息集成 第11章 數(shù)據(jù)挖掘 第12章 數(shù)據(jù)庫系統(tǒng)與互聯(lián)網(wǎng)
章節(jié)摘錄
插圖:1.2.3 主存和緩沖區(qū)管理器數(shù)據(jù)庫中的數(shù)據(jù)通常駐留在輔助存儲器中,在當今的計算機系統(tǒng)中,“輔助存儲器”通常就是磁盤。然而,數(shù)據(jù)必須在主存儲器中,才能對其進行有用的操作。存儲管理器的任務(wù)是控制數(shù)據(jù)在磁盤上的放置和在磁盤與主存之間的移動。在一個簡單的數(shù)據(jù)庫系統(tǒng)中,存儲管理器和底層操作系統(tǒng)的文件系統(tǒng)沒有什么不同。但是。為了提高效率,DBMS通常直接控制在磁盤上的存儲,至少在一些情況下是這樣的。存儲管理器跟蹤文件在磁盤上所處的位置,獲得緩沖區(qū)管理器所要求的文件的磁盤塊號。緩沖區(qū)管理器負責將可利用的主存空間分割成緩沖區(qū),緩沖區(qū)是與頁面同等大小的區(qū)域,磁盤塊的內(nèi)容可以傳送到緩沖區(qū)中。這樣,所有需要從磁盤得到信息的DBMS成分都或直接或通過執(zhí)行引擎與緩沖區(qū)和緩沖區(qū)管理器交互。不同的DBMS成分所需要的信息的類型包括:1.數(shù)據(jù):數(shù)據(jù)庫自身的內(nèi)容。2.元數(shù)據(jù):描述數(shù)據(jù)庫的結(jié)構(gòu)及其約束的數(shù)據(jù)庫模式。3.日志記錄:關(guān)于最近對數(shù)據(jù)庫所做改變的信息,這些信息支持數(shù)據(jù)庫的持久性。4.統(tǒng)計信息:DBMS收集和存儲的關(guān)于數(shù)據(jù)庫中的各個關(guān)系或其他成分的大小、取值等信息。5.索引:支持對數(shù)據(jù)進行高效存取的數(shù)據(jù)結(jié)構(gòu)。1.2.4 事務(wù)處理正如前面所講,通常將一個或多個數(shù)據(jù)庫操作組成一組,稱作事務(wù),事務(wù)是必須被作為一個原子,外觀上獨立于其他事務(wù)執(zhí)行的單位。而且,DBMS保證持久性,即已完成事務(wù)所做的工作決不會丟失。事務(wù)管理器從應(yīng)用系統(tǒng)接收事務(wù)命令,從而得知什么時候事務(wù)開始,什么時候事務(wù)結(jié)束,以及應(yīng)用系統(tǒng)的期望(例如,某些應(yīng)用可能不希望具有原子性)。事務(wù)處理器執(zhí)行下列任務(wù):1.日志記錄:為了保證持久性,對于數(shù)據(jù)庫的每一個變化都在磁盤上記錄日志。日志管理器遵循幾種策略中的某一種進行工作,這些策略保證不管在什么時候系統(tǒng)發(fā)生故障或“崩潰”,恢復(fù)管理器都能查看關(guān)于數(shù)據(jù)庫變化的日志,并將數(shù)據(jù)庫恢復(fù)到某個一致的狀態(tài)。開始時,日志管理器將日志寫到緩沖區(qū)中,然后它與緩沖區(qū)管理器協(xié)調(diào),保證在適當?shù)臅r候?qū)⒕彌_區(qū)寫到磁盤中(磁盤中的數(shù)據(jù)不受系統(tǒng)崩潰的影響)。2.并發(fā)控制:事務(wù)的執(zhí)行從表面上看必須是孤立的。但是在大多數(shù)系統(tǒng)中,實際上有許多事務(wù)在同時執(zhí)行。因此,調(diào)度器(并發(fā)控制管理器)必須保證多個事務(wù)的一個個動作以一種適當?shù)捻樞驁?zhí)行,從而使得最終的結(jié)果與這些事務(wù)事實上一個執(zhí)行完了再執(zhí)行下一個的結(jié)果相同。典型的調(diào)度器通過在數(shù)據(jù)庫的某些部分上維護若干個鎖來進行它的工作。這些鎖防止兩個事務(wù)以造成不良后果的方式存取數(shù)據(jù)的相同部分。如圖1.1 所示,鎖通常存儲在主存儲器中的封鎖表中。調(diào)度器禁止執(zhí)行引擎訪問數(shù)據(jù)庫中被封鎖的部分,從而對查詢和其他數(shù)據(jù)庫操作的執(zhí)行發(fā)生影響。
編輯推薦
《數(shù)據(jù)庫系統(tǒng)實現(xiàn)(第2版)》內(nèi)容深入且全面,技術(shù)實用且先進,敘述深入淺出,是一本難得的高層次的教材,適合作為高等院校計算機專業(yè)研究生的教材或本科生的教學參考書,也適合作為從事相關(guān)研究或開發(fā)工作的專業(yè)技術(shù)人員的高級參考資料。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載
數(shù)據(jù)庫系統(tǒng)實現(xiàn) PDF格式下載