出版時(shí)間:2012-10 出版社:清華大學(xué)出版社 作者:鮑亮,陳榮 編著 頁數(shù):437 字?jǐn)?shù):723000
Tag標(biāo)簽:無
內(nèi)容概要
《深入淺出云計(jì)算》作者以多年實(shí)際研發(fā)項(xiàng)目為背景,通過項(xiàng)目實(shí)戰(zhàn)與代碼分析,深入淺出地講述云計(jì)算的基本概念,云計(jì)算的核心技術(shù)細(xì)節(jié)以及使用云計(jì)算平臺解決實(shí)際問題的思路與方法。
全書共分4篇。第1篇循序漸進(jìn)地介紹云計(jì)算的基本概念,學(xué)習(xí)云計(jì)算需要掌握的基本知識和云計(jì)算環(huán)境搭建方法;第2篇基于hadoop開源云計(jì)算平臺,講解如何構(gòu)建一個(gè)基于云計(jì)算的應(yīng)用系統(tǒng),了解云計(jì)算應(yīng)用系統(tǒng)的設(shè)計(jì)方法:第3篇以開源的hadoop云計(jì)算平臺為分析對象,在源代碼層次上對分布式文件系統(tǒng)、mapreduce計(jì)算模型、nosql數(shù)據(jù)庫和集群管理算法與技術(shù)等云計(jì)算核心技術(shù)進(jìn)行深度剖析;第4篇為云計(jì)算應(yīng)用篇,介紹了基于hadoop云計(jì)算平臺的4個(gè)高級應(yīng)用框架,讀者可以結(jié)合自己的應(yīng)用需求與場景,使用這些框架解決實(shí)際問題。
《深入淺出云計(jì)算》理論聯(lián)系實(shí)踐,既有理論深度又有實(shí)用價(jià)值,可作為高校教材使用,也可作為云計(jì)算研發(fā)人員以及愛好者的學(xué)習(xí)和參考手冊。
書籍目錄
第1篇 初始云計(jì)算
第1章云計(jì)算介紹
1.1云計(jì)算相關(guān)概念
1.2云計(jì)算的歷史
1.3云計(jì)算的現(xiàn)狀
1.4本章小結(jié)
第2章云計(jì)算技術(shù)基礎(chǔ)
2.1hdfs相關(guān)技術(shù)
2.2mapreduce相關(guān)技術(shù)
2.3hbase相關(guān)技術(shù)
2.4zookeeper相關(guān)技術(shù)
2.5本章小結(jié)
第3章云計(jì)算開發(fā)環(huán)境搭建
3.1集群環(huán)境介紹
3.2 hadoop環(huán)境搭建
3.3 hadoop集群配置
3.4hbase環(huán)境搭建
3.5zookeeper環(huán)境搭建
3.6本章小結(jié)
第2篇 淺出云計(jì)算
第4章應(yīng)用實(shí)例:圖像百科系統(tǒng)
4.1應(yīng)用背景
4.2需求分析
4.3核心業(yè)務(wù)處理流程
4.4總體設(shè)計(jì)
4.5本章小結(jié)
第5章使用hdfs存儲海量圖像數(shù)據(jù)
5.1hdfs介紹
5.2 hdfs接口介紹
5.3圖像百科系統(tǒng)中的圖像存儲
5.4系統(tǒng)實(shí)現(xiàn)
5.5本章小結(jié)
第6章使用mapreduce處理圖像
6.1分布式數(shù)據(jù)處理mapreduce
6.2使用mapreduce編程模犁
6.3更新圖像百科條目的mapreduce設(shè)計(jì)
6.4 mapreduce對更新條目的實(shí)現(xiàn)
6.5本章小結(jié)
第7章使用hbase存儲百科數(shù)據(jù)
7.1 hbase的基本特征
7.2使用hbase編程
7.3fotospedia系統(tǒng)的數(shù)據(jù)庫設(shè)計(jì)
7.4 fotospedia系統(tǒng)的數(shù)據(jù)庫實(shí)現(xiàn)
7.5本章小結(jié)
第8章使用zookeeper管理集群
8.1zookeeper詳細(xì)介紹
8.2 zookeeper的使用方法及api介紹
8.3圖像百科系統(tǒng)集群管理詳細(xì)設(shè)計(jì)
8.4圖像百科系統(tǒng)集群管理實(shí)現(xiàn)
8.5本章小結(jié)
第3篇 深入云計(jì)算
第9章深入分析hdfs
9.1hdfs核心設(shè)計(jì)機(jī)制
9.2 hdfs源碼總體介紹
9.3核心代碼分析
9.4 hadoop支持的其他文件系統(tǒng)
9.5本章小結(jié)
第10章深入分析mapreduce
10.1mapreduce框架結(jié)構(gòu)
10.2代碼靜態(tài)分析
10.3代碼詳細(xì)分析
10.4本章小結(jié)
第11章深入分析hbase
11.1hbase體系與原理
11.2hbase總體結(jié)構(gòu)
11.3hbase關(guān)鍵剖析
11.4本章小結(jié)
第12章深入分析zookeeper
12.1概述
12.2代碼靜態(tài)分析
12.3代碼情景分析
12.4本章小結(jié)
第13章應(yīng)用pig實(shí)現(xiàn)并行數(shù)據(jù)處理
13.1apachepig簡介
13.2 pig的安裝與配置
13.3深入分析pig
13.4 pig實(shí)例分析
13.5 pig與sql比較
13.6本章小結(jié)
第14章應(yīng)用hive構(gòu)建數(shù)據(jù)處理平臺
14.1hive簡介
14.2hive安裝配置
14.3 hive使用與操作
14.4實(shí)例介紹
14.5本章小結(jié)
第15章應(yīng)用mahout實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法
15.1mahout概述
15.2mahout安裝配置
15.3mahout使用簡介
15.4本章小結(jié)
第16章應(yīng)用hama實(shí)現(xiàn)分布式計(jì)算
16.1hama簡介
16.2hamabsp介紹
16.3hama安裝配置
16.4實(shí)例介紹
16.5本章小結(jié)
附錄
章節(jié)摘錄
版權(quán)頁: 插圖: 原子性:整個(gè)事務(wù)中的所有操作,要么全部完成,要么全部不完成,不可能停滯在中間某個(gè)環(huán)節(jié)。事務(wù)在執(zhí)行過程中發(fā)生錯(cuò)誤,會被回滾(Rollback)到事務(wù)開始前的狀態(tài),就像這個(gè)事務(wù)從來沒有執(zhí)行過一樣。 一致性:在事務(wù)開始之前和事務(wù)結(jié)束以后,數(shù)據(jù)庫的完整性約束沒有被破壞。隔離性:兩個(gè)事務(wù)的執(zhí)行是互不干擾的,一個(gè)事務(wù)不可能看到其他事務(wù)運(yùn)行時(shí)中間某一時(shí)刻的數(shù)據(jù)。兩個(gè)事務(wù)不會發(fā)生交互。 持久性:在事務(wù)完成以后,該事務(wù)對數(shù)據(jù)庫所做的更改被持久地保存在數(shù)據(jù)庫之中,并不會被回滾。 某一數(shù)據(jù)在集群中不同節(jié)點(diǎn)中的內(nèi)容一致。 可用性(Availability):每一個(gè)操作無論是請求失敗或成功,總是能夠在確定的時(shí)間內(nèi)得到響應(yīng)。 分區(qū)容忍性(Partition Tolerance):在出現(xiàn)網(wǎng)絡(luò)分區(qū)(如斷網(wǎng))等情況時(shí),系統(tǒng)中任意信息的丟失不會影響系統(tǒng)的繼續(xù)運(yùn)行(除非整個(gè)網(wǎng)絡(luò)都故障)。 這個(gè)定理使得數(shù)據(jù)庫架構(gòu)師在設(shè)計(jì)數(shù)據(jù)庫系統(tǒng)時(shí),無須再去費(fèi)盡心機(jī)地嘗試使系統(tǒng)同時(shí)滿足一致性、可用性和分區(qū)容忍性這三種需求,而可以集中精力按照系統(tǒng)的需求,設(shè)計(jì)合適的系統(tǒng)架構(gòu)來滿足這三者中的兩個(gè)。 一般而言,傳統(tǒng)的關(guān)系數(shù)據(jù)庫大都是滿足CA的,放棄了分區(qū)容忍性來滿足強(qiáng)一致性和高可用性的需求。而對于分布式系統(tǒng)而言,系統(tǒng)數(shù)據(jù)分布在不同的網(wǎng)絡(luò)節(jié)點(diǎn)中,因此大多數(shù)情況下需要滿足分區(qū)容忍性來降低單點(diǎn)失效等問題的風(fēng)險(xiǎn),因此一般只有CP和AP兩種選擇。 AP模式:確保系統(tǒng)可用性和分區(qū)容忍性,弱化了數(shù)據(jù)一致性要求,一般以“最終一致性(Eventual Consistency)”來實(shí)現(xiàn)一致性需求。典型的系統(tǒng)如Dynamo、Tokyo Cabinet、Cassandra、CouchDB、SimpleDB等。 CP模式:確保分布在網(wǎng)絡(luò)不同節(jié)點(diǎn)上數(shù)據(jù)的一致性,因此降低了對可用性的要求。 這種系統(tǒng)如BigTable、HBase、MongoDB、Redis、MemcacheDB、BerkeleyDB等。 2.3.4一致性模型 在CAP理論中,提出了分布式系統(tǒng)設(shè)計(jì)中對一致性的取舍。事實(shí)上,設(shè)計(jì)分布式系統(tǒng)時(shí)降低一致性要求,并不是說完全不考慮…致性,而是相對于強(qiáng)一致性而言,采取一定的折中方式,系統(tǒng)一般還是需要滿足最終一致性的。常用的一致性模型如下。 (1)強(qiáng)一致性(Strict Consistency):系統(tǒng)中某個(gè)數(shù)據(jù)被成功更新(事務(wù)成功返回)后,后續(xù)任何對該數(shù)據(jù)的讀取操作得到的都是更新后的值。 (2)弱一致性(Weak Consistency):系統(tǒng)中的某個(gè)數(shù)據(jù)被更新后,后續(xù)對該數(shù)據(jù)的讀取操作得到的不一定是更新后的值,這種情況下通常有個(gè)“不一致性時(shí)間窗口(InconsistencyWindow)”存在,當(dāng)更新操作完成并經(jīng)過這個(gè)不一致性時(shí)間窗口后,后續(xù)讀取操作得到的就是更新后的值。
編輯推薦
《深入淺出云計(jì)算》理論聯(lián)系實(shí)踐,既有理論深度又有實(shí)用價(jià)值,可作為高校教材使用,也可作為云計(jì)算研發(fā)人員以及愛好者的學(xué)習(xí)和參考手冊。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載