数据是美丽的:11个可视化案例分享
Reddit 是美國的一個(gè)綜合性論壇網(wǎng)站,網(wǎng)友戲稱“美國貼吧”。我最近發(fā)現(xiàn),這真是個(gè)寶藏網(wǎng)站。
它上面有很多話題節(jié)點(diǎn),很多話題下都有豐富的內(nèi)容。比如 learnprogramming 節(jié)點(diǎn)下,有很多人分享學(xué)習(xí)編程的資源和經(jīng)驗(yàn)討論。我之前發(fā)過兩篇文章《Crossin:我是如何在自學(xué)編程9個(gè)月后找到工作的》、《Crossin:如何保持學(xué)習(xí)編程的動(dòng)力》都是翻譯自此節(jié)點(diǎn)的文章。盡管國情不同,但在學(xué)編程這件事都是相通的。
除了這個(gè)節(jié)點(diǎn),最近我又沉迷另一個(gè) dataisbeautiful 的節(jié)點(diǎn),上面有大量數(shù)據(jù)可視化的作品。不過,由于網(wǎng)站是全英文,加上訪問有些不穩(wěn)定,估計(jì)大家看起來不大方便。所以我今天挑選最近看到的幾個(gè)不錯(cuò)的可視化案例分享一下,都附了具體的鏈接供進(jìn)一步了解。
這些案例大多兼具直觀和設(shè)計(jì)感,值得欣賞,同時(shí)也可以給想做數(shù)據(jù)可視化的同學(xué)一些啟發(fā),學(xué)習(xí)別人的展示方式。除此之外,每個(gè)案例我都去找了相關(guān)的制作工具,如果你對(duì)其中某種效果感興趣,可以用其工具自行模仿練習(xí)。
1
Franchise Earnings Comparison Over 20 Years20年系列電影票房收入
這是一個(gè)動(dòng)態(tài)展示,可以點(diǎn)擊視頻觀看。漫威宇宙的增長勢(shì)頭一覽無余。
數(shù)據(jù):http://the-numbers.com、CPI計(jì)算器
工具:python: matplotlib
項(xiàng)目:https://github.com/itaidagan/FranchiseRevenueComparison
原文:https://www.reddit.com/r/dataisbeautiful/comments/bgf3ye/oc_franchise_earnings_comparison_over_20_years/
2
The average color of each frame of Game of Thrones season 8 episode 3《權(quán)力的游戲》第8季第3集每幀平均顏色
權(quán)游最后一季廣為吐槽,其中關(guān)鍵的第3集更是暗到看不清。于是有人做了這么一個(gè)統(tǒng)計(jì),告訴你這一集到底有多“黑”。
工具:ffmpeg, python: PIL
項(xiàng)目:https://github.com/lint/avg-color-bar
原文:https://www.reddit.com/r/dataisbeautiful/comments/bjw7ct/the_average_color_of_each_frame_of_game_of/
3
How my salary of $11k per month is used in Seattle, WA, USA在西雅圖我每月1萬1的工資是如何花銷的
這種圖叫做桑基圖(Sankey diagram),常用來表示流程或流量分布。最近 Reddit 上很流行用此圖來可視化世界各地人民的工資消費(fèi)情況。
工具:SankeyMATIC
原文:https://www.reddit.com/r/dataisbeautiful/comments/bpk5d7/how_my_salary_of_11k_per_month_is_used_in_seattle/
4
The Most Valuable Team最有“價(jià)值”球隊(duì)
在體育運(yùn)動(dòng)中經(jīng)常會(huì)評(píng)選最有價(jià)值球員,但這里的最有“價(jià)值”球隊(duì)指的是資產(chǎn)最高的球隊(duì)。Top5這幾年都是這五支,其中美國職業(yè)橄欖球大聯(lián)盟的達(dá)拉斯牛仔隊(duì)已經(jīng)連續(xù)三年第一。
數(shù)據(jù):福布斯球隊(duì)價(jià)值排行
工具:Tableau
原文:https://www.reddit.com/r/dataisbeautiful/comments/btkihh/the_most_valuable_teams_oc/
5
Rafael Nadal’s French Open dominance納達(dá)爾在法網(wǎng)中的優(yōu)勢(shì)
對(duì)比有限幾項(xiàng)數(shù)值的不同常會(huì)用雷達(dá)圖。這里展示了納達(dá)爾費(fèi)德勒、德約科維奇在澳網(wǎng)、美網(wǎng)、法網(wǎng)、溫網(wǎng)中的相互戰(zhàn)績(jī)。
數(shù)據(jù):維基百科
工具:D3.js
原文:https://www.reddit.com/r/dataisbeautiful/comments/bthez5/rafael_nadals_french_open_dominance_he_won_11_out/
6
30 Years of the Music Industry, Visualised音樂產(chǎn)業(yè)30年
以堆疊區(qū)域圖的形式展現(xiàn)唱片產(chǎn)業(yè)中不同媒介形式的興衰。從圖上可以看到CD曾經(jīng)的輝煌和衰落。另外有意思的是黑膠唱片在近幾年有復(fù)興的趨勢(shì)。
數(shù)據(jù):美國唱片業(yè)協(xié)會(huì)
工具:RAWGraphs、Excel
原文:https://www.reddit.com/r/dataisbeautiful/comments/ble5y7/30_years_of_the_music_industry_visualised_oc/
7
4 years of texts between me and my long distance girlfriend throughout college4年大學(xué)期間和異地女友的短信數(shù)據(jù)分析
一位異地戀的小哥,因?yàn)椴徽J(rèn)同女朋友說他總是發(fā)短信太少,居然做了一套短信分析系統(tǒng),詳細(xì)分析了他們四年間互發(fā)短信的數(shù)量、時(shí)間、表情和用詞習(xí)慣等,并開放接口給大家使用。(前提是有個(gè)跟你互發(fā)消息的女朋友!)
工具:React(chart.js), Node/Express, Python
項(xiàng)目:https://leftonread.me
原文:https://www.reddit.com/r/dataisbeautiful/comments/biou3e/4_years_of_texts_between_me_and_my_long_distance/
8
Gaussian distribution高斯分布
高斯分布就是我們常說的“正態(tài)分布”。不過這里的高斯分布,是作者把高斯的畫像中的像素顏色分布進(jìn)行了動(dòng)態(tài)可視化,類似PS等軟件中的顏色直方圖。
工具:http://anvaka.github.io/pixchart
項(xiàng)目:https://github.com/anvaka/gauss-distribution
原文:https://www.reddit.com/r/dataisbeautiful/comments/7ol3gy/gaussian_distribution_oc/
9
The City is Alive: The Population of Manhattan, Hour-by-Hour城市是活的:紐約曼哈頓人口分時(shí)圖
這是一個(gè)三維可視化,把人口數(shù)、時(shí)間和地點(diǎn)三個(gè)維度的數(shù)據(jù),綜合在一起展現(xiàn)了曼哈頓地區(qū)一周七天的人流變化。
數(shù)據(jù):美國人口普查網(wǎng)站+地鐵站人流數(shù)據(jù)
工具:Python + QGIS,網(wǎng)頁版 Mapbox GL JS + D3.js
項(xiàng)目:https://github.com/citrusvanilla/manhattanpopulationexplorer
原文:https://www.reddit.com/r/dataisbeautiful/comments/8hys9k/the_city_is_alive_the_population_of_manhattan/
10
Cause of Death - Reality vs. Google vs. Media死亡原因統(tǒng)計(jì) - 現(xiàn)實(shí) vs. 谷歌 vs. 媒體
這個(gè)圖表分三個(gè)部分,把對(duì)于同一個(gè)問題,不同渠道的關(guān)注點(diǎn)不同進(jìn)行了關(guān)聯(lián)對(duì)比。現(xiàn)實(shí)中,大多數(shù)死因是心臟疾病和癌癥,而谷歌上的數(shù)據(jù),癌癥獨(dú)高,媒體上報(bào)道最多的則是兇殺和恐怖襲擊。
數(shù)據(jù):美國疾病控制與預(yù)防中心、谷歌、衛(wèi)報(bào)和紐約時(shí)報(bào)
工具:Python 3.6, numpy, pandas, matplotlib, imageio
項(xiàng)目:https://github.com/aaronpenne/data_visualization/tree/master/cause_of_death
原文:https://www.reddit.com/r/dataisbeautiful/comments/8cwcbu/cause_of_death_reality_vs_google_vs_media_oc/
11
Heatmap of numbers found at the end of Reddit usernamesReddit用戶名結(jié)尾數(shù)字熱力圖
這是對(duì)Reddit上的用戶名進(jìn)行了統(tǒng)計(jì),看看什么樣的數(shù)字結(jié)尾被用的最多。一眼直觀就能看出:123、666、999,以及198~2017等數(shù)字都比較高。比較奇怪的是69、420也出奇的高,搜了下我才知道這和Reddit自身的黑話有關(guān)(具體就不便說了)。
數(shù)據(jù):Kaggle: reddit-usernames
工具:python: matplotlib + seaborn
項(xiàng)目:https://github.com/colinmorris/reddit-username-suffixes
原文:https://www.reddit.com/r/dataisbeautiful/comments/7sewjx/heatmap_of_numbers_found_at_the_end_of_reddit/
以上僅僅是此節(jié)點(diǎn)上數(shù)據(jù)可視化案例的冰山一角,有興趣的同學(xué)也可以自己去挖掘。如果大家喜歡這些內(nèi)容,下次我再抽空搜羅些更有意思的過來。
更多關(guān)于編程和數(shù)據(jù)的有趣且實(shí)用的內(nèi)容,歡迎搜索關(guān)注:Crossin的編程教室
總結(jié)
以上是生活随笔為你收集整理的数据是美丽的:11个可视化案例分享的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 程序员考公指南1-59
- 下一篇: SSM项目-我爱我家(二)