出版時間:2012-10 出版社:人民郵電出版社 作者:[美] Nathan Yau 頁數(shù):281 字?jǐn)?shù):437000 譯者:向怡寧
Tag標(biāo)簽:無
前言
引 言數(shù)據(jù)不是什么新鮮玩意。早在幾個世紀(jì)之前,人們就開始對數(shù)據(jù)進(jìn)行量化分析并為之繪制表格了。然而在為FlowingData(我創(chuàng)建的一個有關(guān)設(shè)計、可視化和統(tǒng)計的網(wǎng)站)寫作時,我發(fā)覺這一領(lǐng)域在過去數(shù)年間出現(xiàn)了爆炸式的發(fā)展,而且未來還會更加蓬勃??萍嫉倪M(jìn)步使得收集和存儲數(shù)據(jù)變得輕而易舉,而互聯(lián)網(wǎng)則讓我們擺脫了時間和空間的束縛。如果運(yùn)用得當(dāng),這種數(shù)據(jù)的“財富”能夠提供豐富的信息,幫助人們更明智地制定決策、更清楚地傳達(dá)理念,而且能讓我們以更為客觀的角度去審視自己對世界和自身的看法。隨著2009年年中Data.gov網(wǎng)站的上線,美國政府?dāng)?shù)據(jù)公開化進(jìn)程發(fā)生了一次重大轉(zhuǎn)變。這是一套綜合的數(shù)據(jù)目錄系統(tǒng),由各級聯(lián)邦政府機(jī)構(gòu)提供,表現(xiàn)出各組織及官方的透明度和責(zé)任感。比如說,國民有權(quán)利了解政府把稅收收入都花在了哪里,而在此之前美國政府給人的感覺就像一個黑箱。Data.gov上的很多數(shù)據(jù)其實(shí)在許多網(wǎng)站中都能找到,但現(xiàn)在它們都被會聚在一起,而且有著統(tǒng)一的格式,更加便于人們進(jìn)行分析和可視化。除了Data.gov之外,聯(lián)合國也有類似的網(wǎng)站UNdata,英國很快也發(fā)布了Data.gov.uk,而像紐約、舊金山和倫敦等全球許多城市也都參與到了數(shù)據(jù)公開這一潮流中來。如今的網(wǎng)站也變得越來越開放,有數(shù)千個API(應(yīng)用編程接口)在鼓勵和“慫恿”著開發(fā)人員去調(diào)用網(wǎng)站已有的數(shù)據(jù)做各種事情。比如Twitter和Flickr就提供了覆蓋面極廣的API,開發(fā)人員可以自由定制與網(wǎng)站本身完全不同、五花八門的用戶界面。API編目網(wǎng)站ProgrammableWeb目前已收錄超過2000個API 。諸如Infochimps和Factual這樣的應(yīng)用最近也大量涌現(xiàn)出來,它們存在的目的就是向人們提供結(jié)構(gòu)化的數(shù)據(jù)。在個人層面,我們可以在Facebook上結(jié)交朋友,在Foursquare上分享所在的位置,或者在Twitter上發(fā)布自己的最新動態(tài),這所有的一切都只需要點(diǎn)擊幾次鼠標(biāo)或者敲擊幾下鍵盤就能實(shí)現(xiàn)。一些針對性更強(qiáng)的應(yīng)用則方便我們記錄品嘗過什么美食、體重幾何、情緒高低等林林總總的事情。幾乎可以這樣說,只要你想對自己的某個方面進(jìn)行追蹤,就會有這樣一款應(yīng)用來幫助你實(shí)現(xiàn)愿望。數(shù)據(jù)就靜靜地待在我們生活的每一個角落。園子里已經(jīng)果實(shí)累累,正等待著我們?nèi)ゲ烧Υ蠖鄶?shù)人來說,真正有意思的并不是數(shù)據(jù)本身,而是數(shù)據(jù)背后蘊(yùn)涵的信息。人們都希望知道他們的數(shù)據(jù)有何意義,而如果你能幫助他們,那么你就會大受歡迎。難怪Google首席經(jīng)濟(jì)學(xué)家Hal Varian會說統(tǒng)計學(xué)家將是未來十年內(nèi)最迷人的職業(yè),而這絕不僅僅是因?yàn)榻y(tǒng)計學(xué)家長得好看(盡管以極客們的別樣眼光來看,我們確實(shí)長得讓人賞心悅目)。可視化要想探索和理解那些大型的數(shù)據(jù)集,可視化是最有效的途徑之一。把數(shù)字置于視覺空間中,我們的大腦或者讀者的大腦就會更容易發(fā)現(xiàn)其中潛藏的模式。人類對圖形的理解能力確實(shí)很強(qiáng),往往能夠從中發(fā)現(xiàn)一些通過常規(guī)統(tǒng)計方法很難挖掘到的信息。John Tukey是我最喜愛的統(tǒng)計學(xué)家,也是探索性數(shù)據(jù)分析理論(Exploratory Data Analysis)的締造者。他精通各種統(tǒng)計方法和工具,而且深信圖形技術(shù)在其中亦占有一席之地。他堅信,圖形的呈現(xiàn)方式會讓人們得到許多出乎意料的結(jié)果。只需對數(shù)據(jù)進(jìn)行可視化,我們就能從中發(fā)現(xiàn)大量信息,而且很多情況下這也是我們制定明智決策或描述復(fù)雜事件所需要的唯一手段。比如說,在2009年美國的失業(yè)率遭遇了一次大幅增長。2007年的全美平均失業(yè)率是4.6%,2008年上漲到了5.8%。而到了2009年9月,突然就攀升至9.8%。但是這些全國平均數(shù)字只揭示了事件的一部分,它們只是概括了整個國家的總體狀況。有哪些地區(qū)的失業(yè)率高于其他地區(qū)?又有哪些地區(qū)并未受到很大波及?我們無法從中獲得答案。圖0-1用一系列美國地圖更為完整地說明了情況,而且我們只需略掃一眼就能回答上面的問題。顏色較深的縣失業(yè)率相對較高,而顏色較淺的縣失業(yè)率較低。在2009年的地圖上(圖0-2),我們可以看到美國西部和東部大多數(shù)地區(qū)的失業(yè)率都超過了10%,而中西部地區(qū)則未受到太大影響。圖0-1 2004—2009年美國失業(yè)率分布圖如果手上只有單純的電子表格,要想找到其中蘊(yùn)涵的地區(qū)性或周期性的模式就會很花時間,而只靠前面那些全國平均數(shù)字則完全不可能。而用地圖呈現(xiàn)之后,雖然增加了許多縣的數(shù)據(jù),但讀者的理解程度反而提高了。這些地圖有可能幫助當(dāng)局決定往哪些地區(qū)劃撥救濟(jì)金或提供其他形式的援助。圖0-2 2009年失業(yè)率分布圖這個例子的絕妙之處在于,用于產(chǎn)生地圖的數(shù)據(jù)都是免費(fèi)的,由美國勞工統(tǒng)計局直接面向公眾開放。盡管找到這些數(shù)據(jù)并不是那么輕而易舉,但它們確實(shí)就在某個地方聽候我們的差遣,而且還有更多格式化的數(shù)據(jù)正等待著我們作更好的視覺處理。比如說,《美國統(tǒng)計摘要》(The Statistical Abstract of the United States) 就含有數(shù)百個數(shù)據(jù)表格(見圖0-3),但沒有任何圖表。這簡直是天賜的良機(jī),我們可以在此基礎(chǔ)上進(jìn)行加工,展現(xiàn)整個國家的概貌。這個過程將會非常有趣。不久前我用圖形描繪了其中的部分表格(見圖0-4),很快就得到了美國近年來結(jié)婚率及離婚率、郵政資費(fèi)、用電量等信息的直觀變化情況。單純的表格形式很難閱讀,讀者只能得到一些零散的數(shù)值,而在圖表化視圖中,人們能夠輕易地發(fā)現(xiàn)變化的趨勢和模式,而且一眼就能作出比較。圖0-3 美國統(tǒng)計摘要網(wǎng)站中的表格圖0-4 美國統(tǒng)計摘要網(wǎng)站數(shù)據(jù)的圖表化視圖類似《紐約時報》、《華盛頓郵報》這樣的新聞機(jī)構(gòu)很擅長讓數(shù)據(jù)變得栩栩如生、易于理解。它們對已有數(shù)據(jù)的利用也許是最充分的,因?yàn)榻?jīng)常會有相關(guān)主題的新聞故事見諸報端。有時故事中還會插入數(shù)據(jù)圖表以強(qiáng)調(diào)不同的觀點(diǎn),而有時只需要圖表就能講述整個故事。在傳統(tǒng)媒體向網(wǎng)絡(luò)媒體轉(zhuǎn)型的過程中,圖形的應(yīng)用變得更加普及。如今的新聞機(jī)構(gòu)中都已設(shè)立了專門處理交互、圖表或地圖數(shù)據(jù)的各種部門,比如《紐約時報》就專門為“計算機(jī)輔助報道”成立了一個新聞編輯部,旗下的記者都專注于用數(shù)據(jù)來報道新聞。而《紐約時報》的圖形編輯部處理起大量數(shù)據(jù)來也同樣得心應(yīng)手。即使是在流行文化領(lǐng)域,可視化也占據(jù)了自己的一席之地。Stamen Design是一家以在線交互聞名的可視化公司,他們在過去數(shù)年中一直都在對每年的MTV音樂錄影帶大獎頒獎時期的Twitter狀態(tài)進(jìn)行追蹤。Stamen Design每一次的設(shè)計都與之前有所不同,但其核心一直保持不變:實(shí)時展現(xiàn)人們在Twitter上的熱門話題。2009年Kanye West在Taylor Swift發(fā)表獲獎感言時突然暴走 ,我們通過Stamen Design的追蹤可以很容易地了解人們對他這種行徑的看法?,F(xiàn)在看來,我們發(fā)現(xiàn)這個領(lǐng)域中也有偏重情緒而非分析的一面,對可視化的定義開始變得模糊起來。在很長一段時間內(nèi)人們都認(rèn)為,可視化就是關(guān)于量化后的事實(shí):我們把它們作為工具來識別事物發(fā)展的模式,轉(zhuǎn)而為分析研究提供幫助。但可視化并不僅僅與冰冷的事實(shí)有關(guān)。就如同Stamen Design的追蹤設(shè)計一樣,它有著很強(qiáng)的娛樂因素,為觀眾提供了另一種方式去關(guān)注頒獎典禮,并在過程中與其他粉絲進(jìn)行互動。Jonathan Harris的設(shè)計也是一個很好的例子。在他的We Feel Fine(我們感覺良好) 和Whale Hunt(捕鯨) 等作品中,Harris并不是出于分析角度,而是圍繞著故事本身來進(jìn)行設(shè)計,而且這些故事以人類情感為中心,超越了單純的數(shù)字和分析行為。圖表和圖形逐漸也超出了工具的范疇,發(fā)展為傳達(dá)理念的載體。GraphJam和Indexed之類的網(wǎng)站 就喜歡運(yùn)用文氏圖 、餅圖等形式來戲謔流行歌曲及文化,用紅白黑等顏色組合來譏諷政客,或者譴責(zé)虐待動物的行為。我自己也在這個方向上作了一些嘗試,在FlowingData上發(fā)表了系列漫畫Data Underload(數(shù)據(jù)低負(fù)荷)。在圖0-5中,我用圖形表現(xiàn)了美國電影協(xié)會評選出的一些經(jīng)典電影臺詞——非常無厘頭,但很有趣(至少對我來說如此)。圖0-5 圖表形式的電影臺詞那么,到底什么是可視化呢?每個人都有自己的答案。有些人認(rèn)為只有嚴(yán)格意義上的傳統(tǒng)圖形圖表才是可視化。而另一些人的觀點(diǎn)則更加開放,他們認(rèn)為只要是在表現(xiàn)數(shù)據(jù),不管是數(shù)據(jù)藝術(shù)品還是微軟Excel表格,都可以算是可視化。我個人較為傾向于后者,但有時也發(fā)現(xiàn)自己站在前一陣營。畢竟,這一問題上孰是孰非并不是那么重要,只要能達(dá)成我們的目的就行了。不管可視化是什么,我們繪制演示用的圖例也好、進(jìn)行數(shù)據(jù)分析也好、用數(shù)據(jù)來報道新聞也罷,最終其實(shí)都是在尋求真相。在某些時候,統(tǒng)計也會產(chǎn)生錯誤的假象,但造成錯覺的并不是數(shù)字本身,而是運(yùn)用數(shù)字的人。有時候這是有意為之,但更多情況下是疏忽大意所致。如果我們不知道如何創(chuàng)建合適的圖形,或者不知道如何客觀地看待數(shù)據(jù),那么就會產(chǎn)生謬誤。但只要我們掌握了適當(dāng)?shù)目梢暬记珊吞幚矸绞?,就能更加自信地陳述觀點(diǎn),并且對自己的發(fā)現(xiàn)感覺良好。學(xué)習(xí)數(shù)據(jù)我在大學(xué)一年級時開始接觸統(tǒng)計學(xué),當(dāng)時它是一門必修的基礎(chǔ)課,但與我的專業(yè)電氣工程并沒有太大關(guān)系。講課的教授熱情極高,而且對這一領(lǐng)域樂此不疲。他上課時喜歡在教室的臺階上來回走動,身體語言極為豐富,而且不時鼓勵身邊的學(xué)生參與討論。我從未遇到過如此興奮的老師,而且毫無疑問,正是這種精神吸引我進(jìn)入了數(shù)據(jù)領(lǐng)域,最終在四年后考上了統(tǒng)計學(xué)的研究生。在本科四年中,統(tǒng)計學(xué)就是數(shù)據(jù)分析、頻率分布和假設(shè)檢驗(yàn),而我一直樂在其中。我覺得觀察數(shù)據(jù)集,探索其中的趨勢、模式和關(guān)聯(lián)性很有意思。但開始研究生學(xué)業(yè)之后,我的觀點(diǎn)發(fā)生了改變,事情變得更加有趣了。統(tǒng)計學(xué)不再是假設(shè)檢驗(yàn)(結(jié)果表明,在許多情況下它并無太大作用)以及尋找模式了。哦,不,我收回這句話。統(tǒng)計學(xué)仍然與這些有關(guān),但我對它產(chǎn)生了不一樣的感受。統(tǒng)計學(xué)其實(shí)是在用數(shù)據(jù)講故事。我們手頭的大堆數(shù)據(jù)反映了真實(shí)的世界,然后我們對它們進(jìn)行分析,得到的不只是數(shù)據(jù)的關(guān)聯(lián)性,我們還能了解到身邊正在發(fā)生什么。這些故事反過來可以幫助我們解決真實(shí)世界中存在的問題,例如降低犯罪率、提高衛(wèi)生意識、改善高速上的交通狀況,或者只是增長我們的見識。很多人都未能找到數(shù)據(jù)與真實(shí)生活之間的聯(lián)系。我想這也是為什么當(dāng)我告訴人們我讀研是為了學(xué)統(tǒng)計學(xué)時,大多數(shù)人都說那是他們“上學(xué)時最痛恨的一門課”。我相信讀者們不會犯同樣的錯誤,否則你就不會選擇讀這本書了,不是嗎?運(yùn)用數(shù)據(jù)需要一些技能,如何才能掌握呢?你可以像我一樣去學(xué)校選擇正規(guī)的課程訓(xùn)練,但你也可以通過大量的實(shí)踐經(jīng)驗(yàn),自學(xué)成才。其實(shí)大多數(shù)研究生課程和自學(xué)也沒有多大區(qū)別。在可視化和信息圖(infographics)方面也是如此。并不是只有專業(yè)圖形設(shè)計師才能創(chuàng)建優(yōu)秀的圖表,同樣,你也不需要拿到統(tǒng)計學(xué)的博士學(xué)位。你所需要的只是保持對學(xué)習(xí)的渴望,而且和生活中的所有事情一樣,你需要不斷練習(xí)才能變得更在行。我制作的第一張數(shù)據(jù)圖大概是在小學(xué)四年級,那是為了應(yīng)付一次課外科學(xué)研究。我和搭檔一直很想知道蝸牛在什么樣的平面上會爬得更快,于是把它們放在各種粗糙或光滑的物體表面上,并計時觀察它們爬過一段特定距離各需要多久。最后我拿到了蝸牛在不同表面上爬行的時間數(shù)據(jù),并據(jù)此制作了一張柱形圖。至于當(dāng)時是否知道應(yīng)該將它們按長短進(jìn)行排序,我已經(jīng)記不太清了,但是和Excel軟件的辛苦糾纏倒是一直刻骨銘心。不過第二年當(dāng)我們研究赤擬谷盜 最喜歡吃哪種谷制品時,作圖就是小菜一碟了。當(dāng)你理順某款軟件的基本功能和操作方式之后,剩下的幾乎都輕而易舉。這個例子完美地說明了什么叫做從經(jīng)驗(yàn)中學(xué)習(xí)。噢,順便提一句,如果你還在琢磨前面的問題,答案是蝸牛在玻璃上爬得最快,而赤擬谷盜最喜歡吃葡萄果仁麥片(Grape Nut)。從本質(zhì)上來說,學(xué)習(xí)任何軟件或編程語言的過程幾乎都是一樣的。如果你一行代碼都沒寫過,那么R(許多統(tǒng)計學(xué)家都采用的一種計算環(huán)境)必然會讓你望而生畏,而一旦你跟著完成了幾個范例之后,就會很快找到竅門。這本書能夠幫助你做到這些。之所以這樣說,是因?yàn)槲冶救司褪沁@樣學(xué)習(xí)的。我還記得自己第一次深入接觸可視化的設(shè)計層面時的情形。那還是我讀研究生的第二年,好消息從天而降,我得知自己獲得了《紐約時報》圖形編輯的實(shí)習(xí)機(jī)會。在那一刻之前,圖表對我而言只是一種分析工具而已(比如小學(xué)課外活動時作的柱形圖),就算其中含有一些美學(xué)和設(shè)計因素,比重也少得可憐。而將數(shù)據(jù)用于新聞報道,這對我來說更是無從入手。所以為了作準(zhǔn)備,我閱讀了手邊能找到的所有設(shè)計書籍,以及一本Adobe Illustrator的使用指南,因?yàn)槲抑馈都~約時報》圖形編輯部用的就是這款軟件。不過還沒等我真正上手就已經(jīng)開始繪制工作了。當(dāng)你被迫邊學(xué)邊干的時候,就不得不盡快掌握那些必需的知識,而當(dāng)你開始處理更多數(shù)據(jù)、設(shè)計更多圖表時,你的技能也會隨之突飛猛進(jìn)。如何閱讀本書本書以實(shí)例講解為主,目的是讓大家熟悉制圖所需的每一個步驟,掌握每一項(xiàng)技能。你可以從頭開始完整地讀一遍,不過如果你已經(jīng)有想法在醞釀了,也可以只挑選最感興趣的幾章來讀。所有的章節(jié)都經(jīng)過了精心的組織,案例是相互獨(dú)立的。如果讀者對數(shù)據(jù)領(lǐng)域還比較陌生,那么閱讀最開始的幾章應(yīng)該會很有幫助。它們介紹了處理數(shù)據(jù)的方法、需要關(guān)注的重點(diǎn)以及各種可用的工具,便于讀者了解如何獲得數(shù)據(jù),如何規(guī)范格式并為可視化作準(zhǔn)備。之后的幾章會根據(jù)不同的數(shù)據(jù)類型和側(cè)重面分別介紹各種可視化技巧。請記住,永遠(yuǎn)都要讓數(shù)據(jù)說話。不管你選擇何種閱讀方式,我都強(qiáng)烈建議你在閱讀時打開電腦,和我一起逐步完成每一個范例,并且瀏覽在注釋和參考中提到的各種資源。你也可以在網(wǎng)站上下載到所有的代碼、數(shù)據(jù)文件和可交互演示。為了表述得更清楚一些,圖0-6給出了一張流程圖,便于讀者找到需要的章節(jié)。祝大家閱讀開心!
內(nèi)容概要
在生活中,數(shù)據(jù)幾乎無處不在,任我們?nèi)∮谩H欢?,同樣的?shù)據(jù)給人的感覺可能會千差萬別:或冰冷枯燥,讓人望而生畏、百思不解其意;或生動有趣,讓人一目了然、豁然開朗。為了達(dá)到后一種效果,我們需要采用一種特別的方式來展示數(shù)據(jù),來解釋、分析和應(yīng)用它。這就是數(shù)據(jù)可視化技術(shù)。
Nathan
Yau是這一創(chuàng)新領(lǐng)域的先鋒。在《鮮活的數(shù)據(jù):數(shù)據(jù)可視化指南》中,他根據(jù)數(shù)據(jù)可視化的工作流程,先后介紹了如何獲取數(shù)據(jù),將數(shù)據(jù)格式化,用可視化工具(如R)生成圖表,以及在圖形編輯軟件(如Illustrator)中修改以使圖表達(dá)到最佳效果。本書介紹了數(shù)十種方法(如柱形圖、餅圖、折線圖和散點(diǎn)圖等),以創(chuàng)造性的視覺方式生動講述了有關(guān)數(shù)據(jù)的故事。翻開本書,思維之門會豁然大開,你會發(fā)現(xiàn)有那么多樣的手段去賦予數(shù)據(jù)全新的意義!
《鮮活的數(shù)據(jù):數(shù)據(jù)可視化指南》主要內(nèi)容包括:
學(xué)習(xí)如何用視覺化表示方式來呈現(xiàn)數(shù)據(jù),讓讀者看到不一樣的信息;
發(fā)現(xiàn)數(shù)據(jù)背后的故事;
探索不同的數(shù)據(jù)來源,確定有效的展示格式;
試驗(yàn)并對比不同的可視化工具;
尋找數(shù)據(jù)中的趨勢和模式,并以適當(dāng)?shù)膱D表來展現(xiàn)它們;
設(shè)定明確的目標(biāo),并用其指引你的可視化過程。
作者簡介
Nathan
Yau,加州大學(xué)洛杉磯分校統(tǒng)計學(xué)專業(yè)在讀博士、超級數(shù)據(jù)迷,專注于數(shù)據(jù)可視化與個人數(shù)據(jù)收集。他曾在《紐約時報》、CNN、Mozilla和SyFy工作過,認(rèn)為數(shù)據(jù)和信息圖不僅適用于分析,用來講述與數(shù)據(jù)有關(guān)的故事也非常合適。Yau的目標(biāo)是讓非專業(yè)人士讀懂并用好數(shù)據(jù)。你可以從中欣賞到他最新的數(shù)據(jù)可視化實(shí)驗(yàn)作品。
向怡寧,交互和視覺設(shè)計師、搖滾樂手,同時還熱衷于翻譯和寫作。著有《Flash組件、游戲、SWF加解密》及《就這么簡單:Web開發(fā)中的可用性和用戶體驗(yàn)》,譯有《奇思妙想:15位計算機(jī)天才及其重大發(fā)現(xiàn)》、《瞬間之美:Web界面設(shè)計如何讓用戶心動》、《網(wǎng)站設(shè)計解構(gòu):有效的交互設(shè)計框架和模式》、《網(wǎng)站搜索設(shè)計:兼顧SEO及可用性的網(wǎng)站設(shè)計心得》等書。他認(rèn)為“一個不會彈吉他的設(shè)計師不是個好譯者”。
書籍目錄
第1章 用數(shù)據(jù)講故事
1.1 不只是數(shù)字
1.1.1 新聞報道
1.1.2 藝術(shù)
1.1.3 娛樂
1.1.4 引人注目
1.2 我們要尋求什么
1.2.1 模式
1.2.2 相互關(guān)系
1.2.3 有問題的數(shù)據(jù)
1.3 設(shè)計
1.3.1 解釋編碼
1.3.2 標(biāo)注坐標(biāo)軸
1.3.3 確保幾何上的正確性
1.3.4 提供數(shù)據(jù)來源
1.3.5 考慮你的受眾
1.4 小結(jié)
第2章 處理數(shù)據(jù)
2.1 收集數(shù)據(jù)
2.1.1 由他人提供
2.1.2 尋找數(shù)據(jù)源
2.1.3 自動搜集數(shù)據(jù)
2.2 設(shè)置數(shù)據(jù)的格式
2.2.1 數(shù)據(jù)格式
2.2.2 格式化工具
2.2.3 用代碼來格式化
2.3 小結(jié)
第3章 選擇可視化工具
3.1 開箱即用的可視化工具
3.1.1 可選項(xiàng)
3.1.2 取舍
3.2 編程工具
3.2.1 可選項(xiàng)
3.2.2 取舍
3.3 繪圖軟件
3.3.1 可選項(xiàng)
3.3.2 取舍
3.4 地圖繪制工具
3.4.1 可選項(xiàng)
3.4.2 取舍
3.5 衡量各種可選項(xiàng)
3.6 小結(jié)
第4章 有關(guān)時間趨勢的可視化
4.1 在時間中尋求什么
4.2 時間中的離散點(diǎn)
4.2.1 柱形
4.2.2 柱形的堆疊
4.2.3 圓點(diǎn)
4.3 延續(xù)性數(shù)據(jù)
4.3.1 點(diǎn)與點(diǎn)相連
4.3.2 一步一個臺階
4.3.3 平滑和估算
4.4 小結(jié)
第5章 有關(guān)比例的可視化
5.1 在比例中尋求什么
5.2 整體中的各個部分
5.2.1 餅圖
5.2.2 面包圈圖
5.2.3 比例中的堆疊
5.2.4 層級和矩形
5.3 帶時間屬性的比例
5.3.1 堆疊的延續(xù)
5.3.2 逐點(diǎn)詳述
5.4 小結(jié)
第6章 有關(guān)關(guān)系的可視化
6.1 在關(guān)系中尋求什么
6.2 關(guān)聯(lián)性
6.2.1 更多的圓點(diǎn)
6.2.2 探索更多的變量
6.2.3 氣泡
6.3 分布
6.3.1 老式的分布圖表
6.3.2 有關(guān)分布的柱形
6.3.3 延續(xù)性的密度
6.4 對照和比較
6.5 小結(jié)
第7章 發(fā)現(xiàn)差異
7.1 在差異中尋求什么
7.2 在多個變量間比較
7.2.1 熱身
7.2.2 相面術(shù)
7.2.3 星光燦爛
7.2.4 平行前進(jìn)
7.3 減少維度
7.4 尋找異常值
7.5 小結(jié)
第8章 有關(guān)空間關(guān)系的可視化
8.1 在空間中尋求什么
8.2 具體位置
8.2.1 找到緯度和經(jīng)度
8.2.2 單純的點(diǎn)
8.2.3 有大有小的點(diǎn)
8.3 地區(qū)
8.4 跨越空間和時間
8.4.1 系列組圖
8.4.2 抓住差額
8.4.3 動畫
8.5 小結(jié)
第9章 有目的地設(shè)計
9.1 讓自己作好準(zhǔn)備
9.2 讓讀者作好準(zhǔn)備
9.3 視覺提示
9.4 好的可視化
9.5 小結(jié)
章節(jié)摘錄
版權(quán)頁: 插圖: 1.帶分隔符的文本 很多人都很熟悉帶分隔符的文本。我們在前面一節(jié)的例子中就創(chuàng)建過以逗號分隔的文本文件。如果把數(shù)據(jù)集看成是按行和列來分布,那么分隔符文本就是用分隔符來分開每一列。分隔符一般用的是英文逗號(半角字符),也可以是制表符tab,或者是空格、英文分號、冒號、斜杠等任何你喜歡的字符。不過逗號和tab是最常見的。 分隔符文本應(yīng)用廣泛,可以被大多數(shù)電子表格程序閱讀,例如Excel或者Google Documents。我們也可以把電子表格輸出成分隔符文本。如果你要使用多個工作表格,通常就會有多個分隔符文件,除非特殊指定。 這種格式也便于與其他人共享,因?yàn)樗鼰o需依賴于任何特定程序。 2.JavaScript對象表示法(JSON) 很多網(wǎng)頁API都適用于這種格式。它既能夠讓計算機(jī)理解,又便于人類閱讀。不過如果你眼前的數(shù)據(jù)過多,盯太久可能會頭暈?zāi)垦!T摳袷交贘avaScript表示法,但并不依賴于這種語言。JSON中有許多規(guī)格說明,但只用掌握一些基礎(chǔ)就能滿足大部分需要。 JSON利用關(guān)鍵字和值,并且把數(shù)據(jù)條目作為對象來處理。如果我們把JSON數(shù)據(jù)轉(zhuǎn)化成逗號分隔數(shù)據(jù)(Comma-Separated Value,CSV),那么每個對象都會占一行。 大家將會在后文中看到,有很多應(yīng)用、語言和函數(shù)庫都支持JSON輸入。如果你打算設(shè)計便于互聯(lián)網(wǎng)傳播的數(shù)據(jù)圖形,就得了解一下這種格式。 訪問http:∕∕json.org閱讀JSON的完整說明。你不必了解這一格式的所有細(xì)節(jié),但當(dāng)你需要使用某個JSON數(shù)據(jù)源時,它還是很管用的。 3.XML XML(可擴(kuò)展標(biāo)記語言)是另一種互聯(lián)網(wǎng)上的流行格式,常被用于在API間傳遞數(shù)據(jù)。XML分為很多類型,規(guī)格說明也不少,但從最基本的層面來看,它就是一個文本文件,其中的值都封閉在各種標(biāo)簽之內(nèi)。
媒體關(guān)注與評論
本書就像是一封寫給Python、R、地圖和數(shù)據(jù)的情書。——FlowingData讀者評論我是Nathan Yau的博客FlowingDate的忠實(shí)粉絲,本書還沒出來我就預(yù)定了。果然,它完全符合我的預(yù)期:各種各樣的分析、數(shù)據(jù)資源和絕對精美的圖表?!獊嗰R遜讀者評論本書寫的很好,思路清晰,實(shí)例豐富,如果你經(jīng)常與數(shù)據(jù)打交道,選擇本書錯不了?!獊嗰R遜讀者評論
編輯推薦
數(shù)據(jù)可視化經(jīng)典著作 講解清晰、示例豐富、實(shí)用性強(qiáng) 創(chuàng)作信息圖的最佳參考指南
名人推薦
“本書就像是一封寫給Python、R、地圖和數(shù)據(jù)的情書。” --FlowingData讀者評論 “我是Nathan Yan的博客FlowingData的忠實(shí)粉絲,本書還沒出來我就預(yù)訂了。果然,它完全符合我的預(yù)期:各種各樣的分析、數(shù)據(jù)資源和絕對精美的圖表。” --亞馬遜讀者評論 “本書寫得很好,思路清晰,實(shí)例豐富,如果你經(jīng)常與數(shù)據(jù)打交道,選擇本書錯不了?!?--亞馬遜讀者評論
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載