一本书学会可视化设计 pdf_「读书」数据之美-一本书学会可视化设计
【導(dǎo)讀】本文約2200字,閱讀時(shí)間約為15分鐘。
每周,零一與您分享一本書,共同探索數(shù)據(jù)世界的浩瀚。若您喜歡,可轉(zhuǎn)發(fā)與更多的人交流,共同成長(zhǎng)。
一、數(shù)據(jù)
大多數(shù)人對(duì)于數(shù)據(jù),仍然停留到較為表面的含義上,即數(shù)字,沒有了解到它本質(zhì)的含義。
簡(jiǎn)單來說,數(shù)據(jù)可以理解為是對(duì)現(xiàn)實(shí)世界的抽象表達(dá),依存于它所代表的背景知識(shí)。
正如維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時(shí)代》提到了世界的本質(zhì)是數(shù)據(jù)。
我們進(jìn)一步來理解。
【以照片為例-第一步】
一張照片代表一個(gè)數(shù)據(jù)點(diǎn),也可以理解為一個(gè)數(shù)值,而一組則相當(dāng)于一個(gè)數(shù)據(jù)集。
當(dāng)我們剛拿到某一張照片的時(shí)候,未有任何的說明,我們就只能了解到眼睛所看到的。
但是,若有人跟你解釋,那你就能知道照片背后的“5W”。而一組照片所形成的數(shù)據(jù)集則能進(jìn)一步說明數(shù)據(jù)所代表的背景。
5W=何時(shí)(When)、何地(Where)、何人(Who)、何事(What)、何因(Why)。
不過,數(shù)據(jù)也不是固定不變的,它具有可變性和不確定性.
二、可視化
可視化其實(shí)就相當(dāng)于是讓數(shù)據(jù)“說話”,即連接數(shù)據(jù)和現(xiàn)象世界的媒介。
它以數(shù)據(jù)作為自己的內(nèi)容,以圖形、顏色等作為形式,根據(jù)目的來排列組合。
【以照片為例-第二步】
當(dāng)一組照片根據(jù)它們出現(xiàn)的時(shí)間而繪制成相應(yīng)的圖表的時(shí)候,更多有價(jià)值的信息就出現(xiàn)了,譬如你可以從圖中一眼就看出什么時(shí)候是婚宴的高潮,如下圖。
一般的可視化組件主要由以下4部分組成:
1.視覺暗示:將數(shù)據(jù)映射成彩色圖性,如圖中的柱狀,它一般包括長(zhǎng)度、角度、方向、形狀、面積與體積和顏色。
2.坐標(biāo)系:指定可視化的維度,如圖中的線條,主要分為直角坐標(biāo)系、極坐標(biāo)系和地理坐標(biāo)系。
3.標(biāo)尺: 指定了在每一個(gè)維度中數(shù)據(jù)映射的位置,如圖中的1月、2月等,包括數(shù)字標(biāo)尺、分類標(biāo)尺和時(shí)間標(biāo)尺。
4.背景信息:幫助更好地理解數(shù)據(jù)相關(guān)的5W信息,使得數(shù)據(jù)更清晰,并且能正確引導(dǎo)讀者。
我們需要知道的是為什么要進(jìn)行數(shù)據(jù)的可視化?
答案當(dāng)然是為了讀者,為了理解數(shù)據(jù)。
我們?cè)O(shè)計(jì)的可視化圖形可以是為某一位讀者設(shè)計(jì),也可以是為更廣泛的讀者。
需要注意的是讀者對(duì)數(shù)據(jù)的認(rèn)知以及數(shù)據(jù)背景的熟悉程度,并不是每個(gè)人都能讀懂可視化圖形。
因此,針對(duì)一些“初級(jí)”的讀者設(shè)計(jì)最簡(jiǎn)單餅圖、柱狀圖遠(yuǎn)比樹狀圖來得直觀易懂。
不過,這里數(shù)據(jù)工作者需要注意以下4 個(gè)誤區(qū):
1.為了新穎而新的圖表
2.認(rèn)為一切皆能可視化
3.純粹好看的圖表
4.固守可視化的規(guī)則
我們要把握住數(shù)據(jù)的背景知識(shí),根據(jù)實(shí)際需要來設(shè)計(jì)可視化圖表,使得目標(biāo)受眾能夠理解,并在必要時(shí)候輔之以相關(guān)數(shù)據(jù)予以說明。
三、數(shù)據(jù)的可視化
這個(gè)過程主要分為以下四個(gè)步驟:
1.明確擁有的數(shù)據(jù)
2.明確數(shù)據(jù)分析的維度
3.明確需要使用的工具
4.明確完成后的圖表所具有的意義
不同的數(shù)據(jù)有不同的過程,這主要分為三種:
一是分類數(shù)據(jù)的可視化,即將整體劃分為部分,形成分類,而這之中又可以細(xì)化成子分類。通過圖表的展示,可以看到最大值和最小值,從而了解到數(shù)據(jù)集的范圍。
二是時(shí)序數(shù)據(jù)的可視化,以時(shí)間作為劃分的依據(jù),尋找數(shù)據(jù)變化的模式,如呈現(xiàn)周期性或循環(huán),從而對(duì)現(xiàn)實(shí)問題提供指導(dǎo)。如下圖,我們可以從中很清晰地看出,美國的失業(yè)率呈現(xiàn)出周期性的變化,每隔一段時(shí)間就會(huì)出現(xiàn)峰值或谷值。
三是空間數(shù)據(jù)的可視化,以地理位置來劃分。我們根據(jù)某一個(gè)區(qū)域所呈現(xiàn)的峰值和谷值,來了解該區(qū)域背后所代表的模式。如下圖,看著廣東高居第一位,真是不愧是“什么都能吃的廣東人”。
此外,根據(jù)少數(shù)變量或許多變量的需求,我們可以用多個(gè)簡(jiǎn)單的圖表來尋找數(shù)據(jù)之間的關(guān)系,即明確峰值、谷值、數(shù)據(jù)范圍和數(shù)據(jù)的分布情況。
讓可視化設(shè)計(jì)更為清晰,我們需要做以下幾件事:
1.建立視覺層次
我們制作圖表,不會(huì)將多個(gè)變量用同一種形式或者是同一種顏色來表現(xiàn),而是會(huì)根據(jù)自身需要將重點(diǎn)予以突出。這樣的話,就能幫助讀者快速關(guān)注到數(shù)據(jù)圖形的重要部分,并且把周圍的東西當(dāng)作背景信息。
2. 增強(qiáng)圖表的可讀性
首先是允許數(shù)據(jù)點(diǎn)之間進(jìn)行比較,分析一個(gè)數(shù)值和其他數(shù)值的關(guān)聯(lián)大小乃至所有數(shù)據(jù)點(diǎn)之間是如何彼此相關(guān)的。
其次是描述背景信息,這能為讀者提供直觀的印象,如2012年美國總統(tǒng)大選結(jié)果(如下圖),兩黨各有其代表色,人們已經(jīng)習(xí)以為常,若是調(diào)換,反而成了多此一舉。
最后是留白,這會(huì)使得圖表容易閱讀,不至于混亂。
3.高亮顯示重點(diǎn)內(nèi)容
這其實(shí)可以理解為第一點(diǎn)的進(jìn)階版,我們劃分視覺層次,是為了突出重點(diǎn),而高亮就是這樣的存在。但是亮度的提升并不能隨心所欲,我們要確保新的視覺暗示和已有的視覺暗示不會(huì)相沖突。
而以上這幾點(diǎn)對(duì)于不熟悉數(shù)據(jù)的讀者來說,存在一定的難度。
因此,這時(shí)圖注就發(fā)揮了作用。它可以從解釋數(shù)據(jù)(包括標(biāo)題、子標(biāo)題、二級(jí)子標(biāo)題和說明性文字),統(tǒng)計(jì)學(xué)概念的解釋和排版的嘗試這幾方面來幫助讀者更好地理解。
我們一般借助的工具有熟悉的Microsoft Excel,也有相對(duì)來說比較陌生的Many Eyes。
針對(duì)特定數(shù)據(jù),也有相應(yīng)的工具,如樹圖、Gephi。
我們也可以借助編程工具來設(shè)計(jì)出更符合自身數(shù)據(jù)特性的程序,我們也可以使用插圖工具使圖表更加清晰明了。
不過,當(dāng)數(shù)據(jù)實(shí)在過于龐大時(shí),我們就只能運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)對(duì)數(shù)據(jù)進(jìn)行歸納匯總。
因?yàn)?#xff0c;別忘了,我們做的這一切都是為了讀者,為了理解數(shù)據(jù)。
資料來源:[美]邱南森 《數(shù)據(jù)之美》
圖片來源:《數(shù)據(jù)之美》、網(wǎng)絡(luò)
總結(jié)
以上是生活随笔為你收集整理的一本书学会可视化设计 pdf_「读书」数据之美-一本书学会可视化设计的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: wps打包exe文件_如何使用PTEma
- 下一篇: 怎么测内阻 恒压源_测电压表内阻的六种方