日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

学习数据可视化,读哪本书比较好?

發(fā)布時(shí)間:2023/12/14 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 学习数据可视化,读哪本书比较好? 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

入門(mén)數(shù)據(jù)可視化的小伙伴往往都會(huì)問(wèn)這樣一個(gè)問(wèn)題:我應(yīng)該從哪里開(kāi)始學(xué)起,有什么書(shū)推薦嗎?

這個(gè)問(wèn)題之所以普遍,是因?yàn)閿?shù)據(jù)可視化是一個(gè)相當(dāng)交叉的學(xué)科,既涉及數(shù)據(jù)分析,也涉及設(shè)計(jì)和編程。而這三大方向之中,每一個(gè)又可以延伸出許多子領(lǐng)域(例如設(shè)計(jì)里面又可以分出靜態(tài)圖表設(shè)計(jì)、交互圖表設(shè)計(jì)、圖表動(dòng)畫(huà)設(shè)計(jì))。這樣一來(lái),可能的學(xué)習(xí)路徑就非常多樣。然而,目前市面上的可視化書(shū)籍各有側(cè)重、缺乏歸類(lèi),導(dǎo)致讀者很難高效挑選到最吻合自己學(xué)習(xí)目標(biāo)的讀物。再者,在中文世界里,高質(zhì)量的數(shù)據(jù)可視化讀物還不多,因此,如果想要深入了解這門(mén)學(xué)科,就繞不開(kāi)要閱讀一些英文著作。

基于以上這些原因,倭瓜在回答“我該讀什么書(shū)”的時(shí)候,總覺(jué)得十分棘手。不過(guò)幸運(yùn)的是,最近讀到了一篇文獻(xiàn)綜述,對(duì)可視化領(lǐng)域的圖書(shū)做了一次系統(tǒng)性梳理。這篇綜述由英國(guó)Swansea University的兩位研究人員撰寫(xiě),在選書(shū)這個(gè)問(wèn)題上給出了很好的指導(dǎo)。我們會(huì)首先介紹原版的英文圖書(shū),之后給出相應(yīng)的中文譯本。

可視化領(lǐng)域有多少書(shū)?

兩位研究者總共搜集到了86本與數(shù)據(jù)可視化強(qiáng)相關(guān)的書(shū)籍。這86本書(shū),涵蓋了可視化基礎(chǔ)理論、信息設(shè)計(jì)原理、可視分析、工具教程等多個(gè)方面。

其中,最早的可視化書(shū)籍發(fā)布于1967年,是來(lái)自Jacques Bertin的《圖形符號(hào)學(xué)》(Semiology of Graphics)。此后十幾年,都未有新的可視化書(shū)籍發(fā)表。

1983年,Edward Tufte發(fā)表了他的代表作The visual display of quantitative information,這也是可視化領(lǐng)域一本劃時(shí)代的奠基之作。

此后,90年代,又陸續(xù)有幾本新書(shū)出現(xiàn)。直到2000年,尤其是2010年以后,可視化相關(guān)書(shū)籍才迎來(lái)井噴。

這86本書(shū)的詳細(xì)列表可在項(xiàng)目網(wǎng)站查看:http://visbooks.swansea.ac.uk/

如何給這些書(shū)歸類(lèi)?

從寫(xiě)作定位來(lái)看,這些書(shū)可以被歸為6大類(lèi):

1.經(jīng)典理論

2.通俗讀物

3.學(xué)術(shù)教材

4.業(yè)界經(jīng)驗(yàn)

5.專(zhuān)項(xiàng)知識(shí)

6.工具教程

下面我們來(lái)自己看看每一類(lèi)具體都包含哪些書(shū)!

經(jīng)典理論

經(jīng)典理論一般是20年以上的奠基性作品,共6本:

1.Jacques Bertin的《圖形符號(hào)學(xué)》(Semiology of Graphics)。

Bertin是一名來(lái)自法國(guó)的制圖師,也是第一個(gè)系統(tǒng)地總結(jié)如何設(shè)計(jì)可視化的人。

比如,在這張圖里,Bertin總結(jié)了各種各樣的視覺(jué)符號(hào),包括:尺寸、飽和度、紋理、顏色、方向、形狀。同時(shí),他指出了數(shù)據(jù)本身有不同類(lèi)型,包括關(guān)系類(lèi)數(shù)據(jù)、順序類(lèi)數(shù)據(jù)等等。通過(guò)將視覺(jué)符號(hào)與數(shù)據(jù)類(lèi)型匹配,Bertin總結(jié)出了一系列可能的設(shè)計(jì)方案。

例如,下圖展示了16種地圖的畫(huà)法,是不是比現(xiàn)在的很多地圖都好看呢:


2.Edward Tufte的3本書(shū):The Visual Display of Quantitative Information,Envisioning Information,Visual Explanation。

Tufte在可視化領(lǐng)域的影響力毋庸置疑。他最為人稱(chēng)道的著作就是第一本:The Visual Display of Quantitative Information。

這本書(shū)提出的一系列理念,可以說(shuō)奠定了可視化領(lǐng)域的設(shè)計(jì)準(zhǔn)則。從“派系”而言,Tufte的觀點(diǎn)偏實(shí)用主義和極簡(jiǎn)主義,他強(qiáng)調(diào)用理性、客觀的方法,判斷一張圖表是否能夠最高效地傳達(dá)數(shù)據(jù)信息。比如,他提出了數(shù)據(jù)墨水(Data-Ink Ratio)和圖表垃圾(Chartjunk)的概念,強(qiáng)調(diào)應(yīng)該減少與數(shù)據(jù)無(wú)關(guān)的墨水。

同一幅折線圖,左邊裝飾主義,右邊極簡(jiǎn)主義

3.William Cleveland的2本書(shū):Visualizing Data,The Elements of Graphing Data。

第一本書(shū)比較偏向用可視化進(jìn)行數(shù)據(jù)分析,即如何用圖表繪制復(fù)雜的數(shù)據(jù)類(lèi)型,包括單變量,雙變量,三變量等等。作者提出的這些圖表畫(huà)法,在今天的很多統(tǒng)計(jì)軟件里已經(jīng)能常常見(jiàn)到:

用矩陣查看正態(tài)分布

Cleveland的第二本書(shū)則主要關(guān)注圖表元素的正確使用,比如圖例、數(shù)據(jù)標(biāo)簽、坐標(biāo)軸等是否清晰。

遺憾的是,這六本書(shū)目前都還沒(méi)有中文譯本。這里推薦一些中文文章供閱讀:Jacques Bertin與圖形符號(hào)系統(tǒng),數(shù)據(jù)可視化有統(tǒng)一規(guī)范嗎。

通俗讀物

通俗讀物一般是向大眾引介可視化概念、用法,并提供一些圖表案例供翻閱。由于是寫(xiě)給大眾看的入門(mén)類(lèi)書(shū)籍,因此不要求讀者有任何專(zhuān)業(yè)背景。

一些例子

影響比較大的有資深圖表設(shè)計(jì)師、數(shù)據(jù)新聞?dòng)浾逜lberto Cairo的三本書(shū):

其中兩本已經(jīng)被翻譯為中文。通過(guò)閱讀這些書(shū)籍,你可以了解到可視化是如何在真實(shí)數(shù)據(jù)上應(yīng)用的,以及在設(shè)計(jì)可視化時(shí),應(yīng)該避免哪些誤區(qū)或?yàn)E用。

還有一個(gè)更加“古早”的項(xiàng)目,Visual Complexity。這個(gè)項(xiàng)目從2005年起就開(kāi)始搜集各種各樣的可視化設(shè)計(jì),十幾年中已經(jīng)搜集了上千個(gè)作品,并出版了一部書(shū)籍,中文叫“視覺(jué)繁美”。

不過(guò),倭瓜最近一次登陸這個(gè)網(wǎng)站的時(shí)候,項(xiàng)目似乎已經(jīng)缺乏維護(hù)??粗畮啄昵暗脑O(shè)計(jì),不禁感嘆技術(shù)在進(jìn)步,而美還是一如往常。

與此同時(shí),市面上還有許多“圖冊(cè)”類(lèi)的書(shū)籍,主要以印刷可視化作品為主。這類(lèi)書(shū)的好處在于文字很少,因此看英文原版也不會(huì)有太大負(fù)擔(dān)。同時(shí),豐富的精選案例,也可以幫助你打開(kāi)設(shè)計(jì)思路、激發(fā)可視化的想象力。

兩本可愛(ài)的可視化畫(huà)冊(cè)

學(xué)術(shù)教材

第三類(lèi)書(shū)是學(xué)術(shù)教材。這類(lèi)書(shū)一般會(huì)系統(tǒng)性、分章節(jié)的講解領(lǐng)域知識(shí),受眾為學(xué)習(xí)該專(zhuān)業(yè)的學(xué)生。

一些例子

比如,下面這本書(shū)從 What, Why, How三個(gè)層面講解了什么是可視化、為什么需要可視化、以及如何可視化。

書(shū)中總結(jié)的視覺(jué)通道,比早期Bertin的總結(jié)要更全面一些,還包括斜度、彎曲度、體積、動(dòng)畫(huà)等等。這些通道都可以用來(lái)映射數(shù)據(jù):

書(shū)中也對(duì)可視化設(shè)計(jì)的合理性進(jìn)行了討論。例如,人眼對(duì)哪些視覺(jué)通道的感知更加準(zhǔn)確:

研究顯示,位置類(lèi)(Position)的視覺(jué)通道在感知上是最準(zhǔn)確的,面積類(lèi)(Area)則最不準(zhǔn)確

如果你還想更加深入地了解可視化背后的心理學(xué)原理,那么下面這本教材是一個(gè)不錯(cuò)的選擇。這本書(shū)基本上逐一介紹了人類(lèi)對(duì)各種視覺(jué)元素的感知機(jī)制,包括亮度、色彩、空間感等等。

中文教材方面,目前有浙大陳為老師等編寫(xiě)的《數(shù)據(jù)可視化》。這本書(shū)梳理了可視化領(lǐng)域的學(xué)科分類(lèi)和研究?jī)?nèi)容,對(duì)于想要學(xué)習(xí)可視化專(zhuān)業(yè)的同學(xué)來(lái)說(shuō)是一本必讀入門(mén)教材。

還有一些書(shū)筆者稱(chēng)之為“應(yīng)用型教材”,主要關(guān)注如何實(shí)現(xiàn)可視化。例如Nathan Yau的兩本書(shū),中文分別譯為“鮮活的數(shù)據(jù)”和“數(shù)據(jù)之美”。這兩本書(shū)偏系統(tǒng)性的實(shí)操教材,包括如何處理數(shù)據(jù)、分析數(shù)據(jù)、如何使用工具畫(huà)圖等。

業(yè)界經(jīng)驗(yàn)

這一類(lèi)的書(shū)籍一般是業(yè)界人士的現(xiàn)身說(shuō)法,結(jié)合業(yè)務(wù)和實(shí)操經(jīng)驗(yàn)進(jìn)行分享。它的目標(biāo)讀者一般是特定行業(yè)的從業(yè)者或?qū)I(yè)人士。

一些例子

例如,《用數(shù)據(jù)講故事》。這本書(shū)由谷歌的前人力分析團(tuán)隊(duì)經(jīng)理撰寫(xiě),主要講解在了公司業(yè)務(wù)場(chǎng)景里應(yīng)該怎樣繪制數(shù)據(jù)圖表,下圖右邊是它的中文版。

左:英文版;右:中文版

整本書(shū)不涉及任何復(fù)雜理論和技術(shù),但是許多小知識(shí)、小技巧能切實(shí)提高畫(huà)圖的水準(zhǔn)。比如,作者總結(jié)了一些商務(wù)匯報(bào)中常用的可視化類(lèi)型:

抑或是提出一些改進(jìn)辦法,使得原本簡(jiǎn)陋的excel圖表更加美觀得體。下面這張圖其實(shí)無(wú)形之中實(shí)踐了Tufte的數(shù)據(jù)墨水理論,減少了許多不必要的元素,使圖表整體更清晰、美觀。

左:改良前;右:改良后

總體而言,倭瓜認(rèn)為這本書(shū)很適合有日常作圖需求的辦公室人群,幾乎不需要專(zhuān)業(yè)知識(shí)背景,會(huì)比學(xué)術(shù)教材更加通俗易懂。當(dāng)然,有的時(shí)候,所謂的“業(yè)界”、“學(xué)界”并不是那么涇渭分明的。學(xué)術(shù)研究,往往也需要吸納很多業(yè)界的需求,而學(xué)術(shù)產(chǎn)生的成果也常常會(huì)應(yīng)用于實(shí)踐中。

以下面這本書(shū)為例,這本書(shū)的主題也是“用數(shù)據(jù)講故事”,但作者們都是資深的可視化研究人員。不過(guò),盡管仍保留著學(xué)術(shù)的嚴(yán)謹(jǐn)性,書(shū)籍的整體風(fēng)格并不晦澀,里面的文章也都不是嚴(yán)格意義上的論文,而是夾雜了許多觀點(diǎn)、評(píng)論和案例。筆者認(rèn)為這是一個(gè)跨越固有邊界、促進(jìn)思維碰撞的有益嘗試。

這本書(shū)暫時(shí)只有英文版

還有不少書(shū)專(zhuān)門(mén)講解商業(yè)儀表盤(pán)的制作經(jīng)驗(yàn):

或者是定位于設(shè)計(jì)師的經(jīng)驗(yàn)分享:

因此,在選書(shū)時(shí),最好認(rèn)準(zhǔn)自己本行業(yè)專(zhuān)家撰寫(xiě)的圖書(shū)。

專(zhuān)項(xiàng)知識(shí)

專(zhuān)項(xiàng)知識(shí)類(lèi)圖書(shū)一般解決一個(gè)具體的領(lǐng)域問(wèn)題,一般是偏技術(shù)類(lèi)的問(wèn)題,例如如何針對(duì)安全類(lèi)數(shù)據(jù)進(jìn)行可視化、如何對(duì)多維度數(shù)據(jù)進(jìn)行降維展示、如何對(duì)城市規(guī)劃數(shù)據(jù)進(jìn)行可視分析等等。

這些書(shū)往往是眾多學(xué)術(shù)研究成果的集成品,因而相對(duì)專(zhuān)業(yè)艱深,適合領(lǐng)域?qū)<已凶x。目前這一類(lèi)的圖書(shū)的中文譯本還很少,因此不做過(guò)多介紹了。

一些例子

工具教程

這一類(lèi)圖書(shū)主要講解某個(gè)工具的具體用法和操作步驟。而工具的種類(lèi)也非常繁多,且以編程語(yǔ)言和軟件為主(如Python, D3.js, Processing)。這類(lèi)圖書(shū)中文譯本不少,且中國(guó)本土也有很多人撰寫(xiě)此類(lèi)書(shū)籍。

然而,這類(lèi)書(shū)也存在一些潛在問(wèn)題,比如,教學(xué)的質(zhì)量不高、光是看書(shū)難以學(xué)會(huì)實(shí)操,以及工具本身更新?lián)Q代速度快等等。尤其是中文的技術(shù)類(lèi)圖書(shū),灌水的比例更大。因此筆者認(rèn)為,在學(xué)技術(shù)時(shí),讀書(shū)可能會(huì)幫助理解技術(shù)的構(gòu)建方式和底層邏輯。但要熟練掌握這門(mén)技術(shù),還是要依靠不斷的上手練習(xí)和項(xiàng)目實(shí)戰(zhàn)。

否則就會(huì)這樣

最后打個(gè)總結(jié)。如下圖所示,總體而言,早期的書(shū)籍以經(jīng)典理論(藍(lán)色)為主,而近年來(lái)則出現(xiàn)了越來(lái)越多工具教程(紫色)以及面向大眾用戶(hù)的通俗讀物(綠色)。同時(shí),也出現(xiàn)了一些內(nèi)容更綜合的書(shū)籍,例如在分享案例的同時(shí),提供工具教程(藍(lán)黑色)。當(dāng)然,當(dāng)我們書(shū)架上的選擇越來(lái)越豐富的時(shí)候,辨別好書(shū)也就越來(lái)也重要。

可視化書(shū)籍?dāng)?shù)量,按時(shí)間排序

哪些書(shū)最值得讀?

下面這張圖顯示了所有可視化書(shū)籍的學(xué)術(shù)引用量(展現(xiàn)其學(xué)術(shù)影響力,y軸表示)和亞馬遜銷(xiāo)量(展現(xiàn)其普遍的熱門(mén)程度,x軸表示)分布。

可視化書(shū)籍的引用量(y軸-越上越高)和亞馬遜銷(xiāo)量(x軸-越左越高)

首先來(lái)看高引的書(shū)籍,也就是圖上的這幾本:

引用量最高的是Tufte的The Visual Display of Quantitative Information,截止倭瓜發(fā)文時(shí)已經(jīng)被引超過(guò)13000次,引用量相比其他書(shū)可以說(shuō)是一騎絕塵。Tufte的另外兩本書(shū),Envisioning Information和Visual Explanation,分別位于被引的第2名、第7名。上文介紹的心理學(xué)教材Information Visualization: Perception for Design位列第3名。Bertin和Cleveland的經(jīng)典理論著作位列第4、第5。位列第6的是Illuminating the Path,這本書(shū)由美國(guó)國(guó)土安全部資助,致力于將數(shù)據(jù)的可視分析應(yīng)用于國(guó)家安全維護(hù)和反恐。位列第8的是另一本可視化教材Information Visualization: An Introduction。

再來(lái)看銷(xiāo)量。下圖紅框中是銷(xiāo)量最高的幾本書(shū):

所有書(shū)中銷(xiāo)量最好的是業(yè)界實(shí)戰(zhàn)書(shū)《用數(shù)據(jù)講故事》。Edward Tufte和Bertin的經(jīng)典著作分別位于銷(xiāo)量的第2、第3、第4、第7位。同樣高銷(xiāo)量還有通俗讀物如The Functional Art(《不只是美》),以及業(yè)界經(jīng)驗(yàn)書(shū)如Information Dashboard Design。

可以發(fā)現(xiàn),在國(guó)外,經(jīng)典理論著作無(wú)論是在引用量上,還是銷(xiāo)量上,都處于優(yōu)勢(shì)地位。而在銷(xiāo)量上同樣表現(xiàn)突出的,則主要是業(yè)界經(jīng)驗(yàn)和通俗讀物。

出于好奇,筆者也去查了查京東上賣(mài)得最火的可視化圖書(shū)。結(jié)果顯示,在中國(guó)最為暢銷(xiāo)的基本上都是技術(shù)類(lèi)教程,著重于工程實(shí)操。相反,基礎(chǔ)理論和行業(yè)經(jīng)驗(yàn)類(lèi)的書(shū)籍則數(shù)量較少,且大多譯自英文,鮮有來(lái)自本土的作者。可見(jiàn),國(guó)內(nèi)的可視化理念普及還需時(shí)日,同時(shí),我們也希望看到更多優(yōu)質(zhì)的本土作品出現(xiàn)。

以“數(shù)據(jù)可視化“為關(guān)鍵詞搜到的圖書(shū),按銷(xiāo)量排名

當(dāng)然,引用量和銷(xiāo)量并不是評(píng)價(jià)一本書(shū)的唯一標(biāo)準(zhǔn)。一方面,一本書(shū)是否被大多數(shù)人熟知存在一定的偶然性,并不是所有的好書(shū)都是熱門(mén)的;另一方面,讀書(shū)是人和書(shū)交互的過(guò)程,能夠解答你疑惑、啟發(fā)你思路的書(shū)往往才是最“對(duì)胃口”的書(shū)。

書(shū)山有路勤為徑。挑一本書(shū),開(kāi)啟你的可視化之旅吧!

————————————————

參考文獻(xiàn):

Rees, D., & Laramee, R. S. (2019, February). A survey of information visualization books. In?Computer Graphics Forum?(Vol. 38, No. 1, pp. 610-646).

https://www.youtube.com/watch?v=8EMW7io4rSI

https://medium.com/starlinking/%E7%94%A8%E6%95%B8%E6%93%9A%E8%AC%9B%E6%95%85%E4%BA%8B-d21cb7fc1540.

https://medium.com/vis-it-%E6%9C%89%E8%A6%96%E6%B2%92%E4%BA%8B/%E5%8F%AF%E8%A6%96%E5%8C%96%E5%9F%BA%E7%A4%8E-jacques-bertin-%E8%88%87%E5%9C%96%E5%BD%A2%E7%AC%A6%E8%99%9F%E7%B3%BB%E7%B5%B1-63c99484da5f.

https://medium.com/@mslima/visualcomplexity-com-ad9a12fa2c1a

https://www.jonasoesch.ch/reading/munzner-14-visualization-analysis-and-design

https://slidetodoc.com/visualization-analysis-design-tamara-munzner-department-of-computer/

- the end -

推薦閱讀

一個(gè)案例入門(mén)tableau——NBA球隊(duì)數(shù)據(jù)可視化實(shí)戰(zhàn)解析

「超哥的雜貨鋪」原創(chuàng)文章導(dǎo)航

中國(guó)行政單位樹(shù)形圖的可視化實(shí)戰(zhàn)!

七步搞定一個(gè)綜合案例,掌握pandas進(jìn)階用法!

實(shí)例講解利用python進(jìn)行數(shù)據(jù)獲取與數(shù)據(jù)預(yù)處理

Pandas tricks 之 transform的用法

總結(jié)

以上是生活随笔為你收集整理的学习数据可视化,读哪本书比较好?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。