實(shí)戰(zhàn)Hadoop

出版時(shí)間:2011-8  出版社:電子工業(yè)出版社  作者:劉鵬  頁(yè)數(shù):456  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

作為谷歌云計(jì)算基礎(chǔ)架構(gòu)的模仿實(shí)現(xiàn),Hadoop堪稱業(yè)界最經(jīng)典的開(kāi)源云計(jì)算平臺(tái)軟件。《實(shí)戰(zhàn)Hadoop--開(kāi)啟通向云計(jì)算的捷徑》(作者劉鵬)是原著的Hadoop編程技術(shù)書籍,是云計(jì)算專家劉鵬教授繼《云計(jì)算》教材取得成功后,再次組織團(tuán)隊(duì)精心編寫的又一力作,其作者均來(lái)自擁有豐富實(shí)踐經(jīng)驗(yàn)的云計(jì)算技術(shù)研發(fā)和教學(xué)團(tuán)隊(duì)。
《實(shí)戰(zhàn)Hadoop--開(kāi)啟通向云計(jì)算的捷徑》強(qiáng)調(diào)動(dòng)手、強(qiáng)調(diào)實(shí)戰(zhàn),以風(fēng)趣幽默的語(yǔ)言和一系列生動(dòng)的實(shí)戰(zhàn)應(yīng)用案例,系統(tǒng)地講授了Hadoop的核心技術(shù)和擴(kuò)展技術(shù),包括:
HDFS、MapReduce、HBase、Hive、Pig、Cassandra、
Chukwa和ZooKeeper等,并給出了3個(gè)完整的Hadoop云計(jì)算綜合應(yīng)用實(shí)例,最后介紹了保障Hadoop平臺(tái)可靠性的方法。
本書讀者對(duì)象為各類云計(jì)算相關(guān)企業(yè)、高校和科研機(jī)構(gòu)的研發(fā)人員,亦適合作為高校研究生和本科生教材。

作者簡(jiǎn)介

劉鵬,清華大學(xué)博士,解放軍理工大學(xué)教授、學(xué)科帶頭人,中國(guó)云計(jì)算專家委員會(huì)委員。主要研究方向?yàn)樾畔⒕W(wǎng)格和云計(jì)算,完成科研課題18項(xiàng),發(fā)表論文70余篇,獲部級(jí)科技進(jìn)步獎(jiǎng)6項(xiàng)。曾奪得國(guó)際計(jì)算機(jī)排序比賽冠軍,并兩次奪得全國(guó)高??萍急荣愖罡擢?jiǎng),獲“全軍十大學(xué)習(xí)成才標(biāo)兵”、“南京十大杰出青年”和“清華大學(xué)學(xué)術(shù)新秀”等稱號(hào)。2002年首倡的“網(wǎng)格計(jì)算池”和2003年研發(fā)的“反垃圾郵件網(wǎng)格”分別為云計(jì)算和云安全的前身。創(chuàng)辦了知名的中國(guó)網(wǎng)格(chinagrid.net)和中國(guó)云計(jì)算(chinacloud.cn)網(wǎng)站。

書籍目錄

第1章 神奇的大象——Hadoop
 1.1 初識(shí)神象
  1.2 Hadoop初體驗(yàn)
  1.2.1 了解Hadoop的構(gòu)架
  1.2.2 查看Hadoop活動(dòng)
 1.3 Hadoop族群
 1.4 Hadoop安裝
  1.4.1 在Linux系統(tǒng)中安裝Hadoop
  1.4.2 在Windows系統(tǒng)中安裝Hadoop
  1.4.3 站在象背上說(shuō)“hello”
  1.4.4 Eclipse下的Hadoop應(yīng)用開(kāi)發(fā)
 參考文獻(xiàn)
第2章 HDFS——不怕故障的海量存儲(chǔ)
第3章 分久必合——MapReduce
第4章 一張無(wú)限大的表——HBase
第5章 更上一層樓——MapReduce進(jìn)階
第6章 Hive——飛進(jìn)數(shù)據(jù)倉(cāng)庫(kù)的小蜜蜂
第7章 Pig——一頭什么都能吃的豬
第8章 Facebook的女神——Cassandra
第9章 Chukwa——收集數(shù)據(jù)的大烏龜
第10章 一統(tǒng)天下——ZooKeeper
第11章 綜合實(shí)戰(zhàn)1——打造一個(gè)搜索引擎
第12章 綜合實(shí)戰(zhàn)2——生物信息學(xué)應(yīng)用
第13章 綜合實(shí)戰(zhàn)3——移動(dòng)通信信令監(jiān)測(cè)與查詢
第14章 高枕無(wú)憂——Hadoop容錯(cuò)

章節(jié)摘錄

版權(quán)頁(yè):插圖:在對(duì)源文件進(jìn)行功能性處理之前,有必要對(duì)11.2.2節(jié)生成的源文件進(jìn)行一次預(yù)分析和過(guò)濾。主要原因有以下幾個(gè)。(1)在遇到故障并恢復(fù)爬行后,爬蟲會(huì)從日志文件的最近一頁(yè)(一頁(yè)包含20個(gè)帖子)重新繼續(xù)爬取工作。從最近一頁(yè)爬取保證了帖子不被遺漏,但是會(huì)導(dǎo)致有些帖子被重復(fù)爬?。ㄒ话悴粫?huì)超過(guò)2次)。為保證索引時(shí)指定文件的唯一性,有必要過(guò)濾相同帖子的記錄,保證帖子的唯一性。(2)爬取過(guò)程中,從遇到的帖子中抽取出的信息可能并不符合我們的要求,比如,源文件中可能會(huì)有之類的記錄。這樣的空信息記錄也必須過(guò)濾掉。對(duì)源文件進(jìn)行一次預(yù)分析和過(guò)濾以確保數(shù)據(jù)的完整性和正確性,可以避免后續(xù)步驟中由于數(shù)據(jù)不正確而引發(fā)的一些問(wèn)題。對(duì)元數(shù)據(jù)進(jìn)行預(yù)分析是海量數(shù)據(jù)處理過(guò)程中很必要也是很自然的一步。

媒體關(guān)注與評(píng)論

隨著計(jì)算模式從個(gè)人計(jì)算向云計(jì)算的發(fā)展,開(kāi)源軟件的比重和作用越來(lái)越大,現(xiàn)在多數(shù)云服務(wù)都基于開(kāi)源平臺(tái)Hadoop是國(guó)際著名的云計(jì)算開(kāi)源平臺(tái),本書通過(guò)許多實(shí)例,深入系統(tǒng)地分析了Hadoop的技術(shù)、源碼以及構(gòu)建實(shí)用系統(tǒng)的方法。為國(guó)內(nèi)產(chǎn)學(xué)研各界開(kāi)啟了一條通向云計(jì)算的捷徑。  ——中國(guó)工程院院士、中國(guó)電子學(xué)會(huì)計(jì)算專家委員會(huì)副主任 倪光南作為云計(jì)算基礎(chǔ)架構(gòu)的開(kāi)源軟件,Hadoop堪稱業(yè)界最成熟和經(jīng)典的案例該書是云計(jì)算業(yè)界專家劉鵬教授帶領(lǐng)科研團(tuán)隊(duì),基于多年研究心得,做了大量技術(shù)開(kāi)發(fā)和測(cè)試,以嚴(yán)謹(jǐn)?shù)膽B(tài)度和詼諧幽默的語(yǔ)言編寫的Hadoop實(shí)戰(zhàn)寶典。相信對(duì)推動(dòng)中國(guó)云計(jì)算技術(shù)的發(fā)展和應(yīng)用具有重要價(jià)值?!  信d通訊首席構(gòu)師、中國(guó)電子學(xué)會(huì)云計(jì)算專家委員會(huì)委員 羅圣美熱烈祝賀劉鵬教授主編的  實(shí)戰(zhàn)Hadoop——開(kāi)啟通向云計(jì)算的捷徑。一書出版發(fā)行,它將大力推動(dòng)我國(guó)云計(jì)算的應(yīng)用?!  迦A大學(xué)教授、中國(guó)電子學(xué)會(huì)云計(jì)算專家委員會(huì)委員 鄭緯民

編輯推薦

《實(shí)戰(zhàn)Hadoop:開(kāi)啟通向云計(jì)算的捷徑》:云計(jì)算核心研發(fā)團(tuán)隊(duì)剖析Hadoop:怎么裝?怎么編程?怎么解決實(shí)際問(wèn)題?

圖書封面

圖書標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    實(shí)戰(zhàn)Hadoop PDF格式下載


用戶評(píng)論 (總計(jì)86條)

 
 

  •   實(shí)戰(zhàn)Hadoop——開(kāi)啟通向云計(jì)算的捷徑 看看
  •   Hadoop的入門教材,學(xué)習(xí)云計(jì)算的開(kāi)始。
  •   深入淺出、生動(dòng)而詳細(xì)地講述Hadoop的基本原理,并配以實(shí)際應(yīng)用案例,相信本書會(huì)對(duì)推動(dòng)Hadoop在國(guó)內(nèi)的應(yīng)用和研究起到極大的作用
  •   云計(jì)算涉及到的相關(guān)軟件的情況介紹的很多,對(duì)于對(duì)云計(jì)算所知不多的人很有幫助
  •   簡(jiǎn)明易懂,由淺入深,很適合hadoop學(xué)習(xí)。
  •   了解hadoop必讀書籍,寫得很不錯(cuò),推薦
  •   這是購(gòu)買的第一本hadoop方面的書,真的很不錯(cuò)。
  •   內(nèi)容很標(biāo)準(zhǔn),hadoop入門的話再好不過(guò)了,不會(huì)像網(wǎng)上的教程那樣總是出錯(cuò)。
  •   知道如何開(kāi)發(fā)云技術(shù)平臺(tái),值得一看的書
  •   剛買,還沒(méi)時(shí)間看,但是作者給的網(wǎng)址: ***.chinacloud***盡然沒(méi)法登陸
  •   學(xué)習(xí)一下新技術(shù)??纯戳私饬私?。
  •   書寫的不錯(cuò),歷史,發(fā)展,案例
  •   入門可以,但這些上網(wǎng)找也是可以的。。。。不過(guò)可以幫著理一下思路。書很厚,說(shuō)的點(diǎn)也多。。。但都不整個(gè)深入,介紹性的講了下。。。
  •   適合已經(jīng)入門的讀者。
  •   大數(shù)據(jù)時(shí)代入門書籍
  •   昨晚一口氣讀了大半,寫了很好,很適合初學(xué)者
  •   這書值得一看,不錯(cuò)的書!
  •   書不錯(cuò),是可以直接上手的書
  •   書的內(nèi)容正好符合我所想要的
  •   書的質(zhì)量不錯(cuò),內(nèi)容還沒(méi)有看呢,很有手感
  •   這書實(shí)踐性好像挺強(qiáng)的.
  •   書剛到,還沒(méi)來(lái)的及看。
  •   從基礎(chǔ)入手,講的比較全面。
  •   純粹學(xué)習(xí)之用。
  •   精品,非常不錯(cuò),是一本入門級(jí)的好書,如果正在接觸海量數(shù)據(jù)的操作,可以嘗試學(xué)習(xí)。
  •   這本書配合權(quán)威指南看還行
  •   感覺(jué)這本書是初學(xué)者的最初的選擇
  •   實(shí)用性很強(qiáng),就是里面有些錯(cuò)誤有待修改。
  •   雖然有一些錯(cuò)別字,但是還是覺(jué)得比其他的讀物要好點(diǎn)
  •   看了幾章 愛(ài)不釋手
  •   內(nèi)容詳實(shí),很新,有用。
  •   正在看,看了下目錄不錯(cuò)
  •   才看了一點(diǎn),覺(jué)得理論講的不錯(cuò)!
  •   看了目錄和第一頁(yè),內(nèi)容質(zhì)量不錯(cuò),希望有收獲。
  •   《實(shí)戰(zhàn)Hadoop》是中國(guó)電子學(xué)會(huì)云計(jì)算專家委員會(huì)劉鵬教授主編的國(guó)內(nèi)第一本原著的Hadoop編程技術(shù)書籍。國(guó)內(nèi)原創(chuàng),但是講的比較淺顯,失之深入,快速瀏覽下也還不錯(cuò)。
  •   作為Hadoop使用級(jí)別挺好的,之前劉博寫過(guò)一本云計(jì)算,不過(guò)理論偏多。后來(lái)寫了這本實(shí)戰(zhàn),感覺(jué)可以。如果能夠配合hadoop原理自己實(shí)現(xiàn)一套山寨或者精簡(jiǎn)版的云計(jì)算平臺(tái)就更好了?!林馗写笥诟袆?dòng)……
  •   劉鵬教授的云計(jì)算看過(guò),很不錯(cuò),相信他推薦的書也很不錯(cuò),希望有所收獲
  •   書一看就是正版,但是感覺(jué)每頁(yè)的含量都不是很足,很多都是來(lái)自論文上面的,有點(diǎn)拼湊的感覺(jué)!在如今Hadoop資料比較缺乏的時(shí)代,用來(lái)作入門還是可以的。
  •   雖然從hadoop權(quán)威指南中抄了不少,但還是以中國(guó)人的方式呈現(xiàn)了hadoop。案例不錯(cuò)。
  •   花一個(gè)小時(shí)通篇粗讀了一遍。對(duì)我們這種用不上想了解偶爾又想實(shí)戰(zhàn)研究一把的人,是本好書。
  •   這本書范圍挺廣,但是案例不錯(cuò)經(jīng)典,缺相關(guān)關(guān)聯(lián)。不過(guò)可以提高自己的知識(shí)面。
  •   適合入門,深入的話,只能再買更詳細(xì)的書來(lái)看
  •   不錯(cuò)的一本書,正好老師上課也是推薦這本書作為教材!
  •   總體內(nèi)容不錯(cuò),不夠詳細(xì),不夠深入,初學(xué)者的入門好書。
  •   送貨的速度很快,書的內(nèi)容還沒(méi)有具體看,希望很好。
  •   還不錯(cuò),包裝不好,書略有破損
  •   總的說(shuō)來(lái),感覺(jué)內(nèi)容太少,雖然書挺厚的,但明顯內(nèi)容不多,一頁(yè)紙浪費(fèi)不少。字號(hào)特別大,行間距也不小,一頁(yè)沒(méi)寫多少字,就用完了,如今這年頭,出版的書基本上都這個(gè)樣。無(wú)語(yǔ)!
  •   感覺(jué)還行,正在學(xué)習(xí)
  •   正在努力地學(xué)習(xí)中……
  •   挺實(shí)用的一本書,入門還是挺好的
  •   還不錯(cuò),入門參考
  •   這個(gè)需要慢慢看!
  •   還可以,深度不夠,不過(guò)還是比較全面
  •   給別人買的,聽(tīng)說(shuō)還好
  •   項(xiàng)目需要,研讀中...
  •   權(quán)威,目前階段算很好的了
  •   適合初學(xué)者學(xué)習(xí)hadoop框架,一步一步寫的比較仔細(xì),不錯(cuò)。
  •   該書編者是我老師,以及同學(xué)。 只能說(shuō),不推薦這本書。 這更像一本手冊(cè)。 推薦Hadoop權(quán)威指南這本書。
  •   只是工具書,對(duì)hadoop沒(méi)有一個(gè)直觀的認(rèn)識(shí),只是拿來(lái)玩玩還行。
  •   可能是個(gè)人水平有限,書中涉及到很多的JAVA語(yǔ)言內(nèi)容,本來(lái)想著增加運(yùn)維能力的,感覺(jué)這本書應(yīng)該適合開(kāi)發(fā)看!
  •   書本的內(nèi)容比較適合初學(xué)者,但是要深入研究的話光靠這本書是不行的。
  •   書中介紹不詳細(xì)!每頁(yè)書的內(nèi)容很少!介紹不是很到位!
  •   正在讀,寫的比較樸實(shí),比較適合初學(xué)者
  •   看了之后還是覺(jué)得應(yīng)該買國(guó)外版的。
  •   以后再也不在當(dāng)當(dāng)買書了 運(yùn)輸不好 書都損壞的不成樣子了 真夠鬧心
  •   還算可以,但不是我想想中的完美!
  •   體現(xiàn)了國(guó)產(chǎn)書的特色,東拼西湊,多個(gè)作者,一人一章,沒(méi)有統(tǒng)一的寫作思想,書的很多內(nèi)容就是官方文檔翻譯過(guò)來(lái)的,買虧了,不如去看官方文檔。
    求國(guó)人什么時(shí)候別太想著坑讀書人的錢!
  •   這本書一般般,講述的不夠細(xì)致。
  •   內(nèi)涵不夠!適合初級(jí)學(xué)習(xí)!?。。。。。。?!
  •   那有什么實(shí)戰(zhàn),簡(jiǎn)直就是狗屁!看完這本書后就知道hadoop包括哪些模塊以及哪些實(shí)現(xiàn)技術(shù),沒(méi)有一點(diǎn)實(shí)戰(zhàn)性。這本書就是介紹hadoop的組成模塊以及子模塊的功能。
  •   內(nèi)容嚴(yán)重錯(cuò)誤,字大,行間距大,擺明了坑爹啊。

    書內(nèi)的源碼肯定是亂寫上去的,各別類的方法在實(shí)際中跟本不存在,方法的輸入?yún)?shù)類型胡拼亂湊,全是異常,編譯都通不過(guò)。真是坑人啊。~~~~~~~~~~~~~

    后幾單的實(shí)戰(zhàn),根本就是海吹,沒(méi)有實(shí)戰(zhàn)的可行性。這些作者真是太無(wú)恥了。。。。。。大家警惕啊,買了就后悔。。。。。。
  •   看了這本書終于明白什么叫做天下文章一大抄
  •   這本書還算不錯(cuò)的。比如Pig一章,介紹了如何運(yùn)行腳本,都簡(jiǎn)明扼要,切中要害??戳似渌臅紱](méi)有很好闡述這個(gè)問(wèn)題。抄的話,肯定是有的,畢竟這些東西都是外國(guó)人提出的。另外,這本書的推薦者實(shí)在太多了,比如張亞勤都推薦,覺(jué)得有點(diǎn)太中國(guó)特色了。
  •   這本書講述了很多新技術(shù),不過(guò)只是皮毛,不夠深入
  •   很出名的一本書,適合初學(xué)者,但是有的地方講的確實(shí)不到位,按照上面的說(shuō)法安裝hadoop是絕對(duì)安裝不上的,有何必講,直接略過(guò)好了,或者給個(gè)指引,推薦個(gè)好的資源讓我們?nèi)タ?/li>
  •   預(yù)期的差不多,雖然最終沒(méi)有采用這個(gè)技術(shù)做項(xiàng)目,但確實(shí)了解了一些技術(shù)要領(lǐng)與細(xì)節(jié),值得購(gòu)買。
  •   紙質(zhì)什么的都行,挺滿意的……
  •   雜糅,不具體,死摳概念,完全不想看,還不如網(wǎng)絡(luò)資料來(lái)的具體。
  •   很好,很不錯(cuò)。書寫的很好,送貨速度很快
  •   書質(zhì)量很好,很喜歡,正在學(xué)習(xí)中
  •   1,質(zhì)量 非常好2,內(nèi)容 偏于實(shí)踐,如果初學(xué),買本原理的會(huì)比較好
  •   太專業(yè),有點(diǎn)看不太懂。卓越的送貨還是不錯(cuò)的。
  •   剛拿到書,隨后進(jìn)一步評(píng)論
  •   實(shí)戰(zhàn)Hadoop
  •   實(shí)戰(zhàn)Hadoop:開(kāi)啟通向云計(jì)算的捷徑
  •   好書,希望解決大數(shù)據(jù)問(wèn)題
 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7