如何用 Python 让你的 PPT 数据动起来?
點(diǎn)擊上方“編程派”,選擇設(shè)為“設(shè)為星標(biāo)”
優(yōu)質(zhì)文章,第一時(shí)間送達(dá)!
作者:Costas Andreou
機(jī)器之心編譯
參與:Jamin、張倩
在讀技術(shù)博客的過(guò)程中,我們會(huì)發(fā)現(xiàn)那些能夠把知識(shí)、成果講透的博主很多都會(huì)做動(dòng)態(tài)圖表。他們的圖是怎么做的?難度大嗎?這篇文章就介紹了 Python 中一種簡(jiǎn)單的動(dòng)態(tài)圖表制作方法。
數(shù)據(jù)暴增的年代,數(shù)據(jù)科學(xué)家、分析師在被要求對(duì)數(shù)據(jù)有更深的理解與分析的同時(shí),還需要將結(jié)果有效地傳遞給他人。如何讓目標(biāo)聽(tīng)眾更直觀地理解?當(dāng)然是將數(shù)據(jù)可視化啊,而且最好是動(dòng)態(tài)可視化。
本文將以線型圖、條形圖和餅圖為例,系統(tǒng)地講解如何讓你的數(shù)據(jù)圖表動(dòng)起來(lái)。
這些動(dòng)態(tài)圖表是用什么做的?
接觸過(guò)數(shù)據(jù)可視化的同學(xué)應(yīng)該對(duì) Python 里的 Matplotlib 庫(kù)并不陌生。它是一個(gè)基于 Python 的開(kāi)源數(shù)據(jù)繪圖包,僅需幾行代碼就可以幫助開(kāi)發(fā)者生成直方圖、功率譜、條形圖、散點(diǎn)圖等。這個(gè)庫(kù)里有個(gè)非常實(shí)用的擴(kuò)展包——FuncAnimation,可以讓我們的靜態(tài)圖表動(dòng)起來(lái)。
FuncAnimation 是 Matplotlib 庫(kù)中 Animation 類的一部分,后續(xù)會(huì)展示多個(gè)示例。如果是首次接觸,你可以將這個(gè)函數(shù)簡(jiǎn)單地理解為一個(gè) While 循環(huán),不停地在 “畫(huà)布” 上重新繪制目標(biāo)數(shù)據(jù)圖。
如何使用 FuncAnimation?
這個(gè)過(guò)程始于以下兩行代碼:
import?matplotlib.animation?as?anianimator?=?ani.FuncAnimation(fig,?chartfunc,?interval?=?100)從中我們可以看到 FuncAnimation 的幾個(gè)輸入:
fig 是用來(lái) 「繪制圖表」的 figure 對(duì)象;
chartfunc 是一個(gè)以數(shù)字為輸入的函數(shù),其含義為時(shí)間序列上的時(shí)間;
interval 這個(gè)更好理解,是幀之間的間隔延遲,以毫秒為單位,默認(rèn)值為 200。
這是三個(gè)關(guān)鍵輸入,當(dāng)然還有更多可選輸入,感興趣的讀者可查看原文檔,這里不再贅述。
下一步要做的就是將數(shù)據(jù)圖表參數(shù)化,從而轉(zhuǎn)換為一個(gè)函數(shù),然后將該函數(shù)時(shí)間序列中的點(diǎn)作為輸入,設(shè)置完成后就可以正式開(kāi)始了。
在開(kāi)始之前依舊需要確認(rèn)你是否對(duì)基本的數(shù)據(jù)可視化有所了解。也就是說(shuō),我們先要將數(shù)據(jù)進(jìn)行可視化處理,再進(jìn)行動(dòng)態(tài)處理。
按照以下代碼進(jìn)行基本調(diào)用。另外,這里將采用大型流行病的傳播數(shù)據(jù)作為案例數(shù)據(jù)(包括每天的死亡人數(shù))。
import?matplotlib.animation?as?ani import?matplotlib.pyplot?as?plt import?numpy?as?np import?pandas?as?pdurl?=?'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv' df?=?pd.read_csv(url,?delimiter=',',?header='infer')df_interest?=?df.loc[df['Country/Region'].isin(['United?Kingdom',?'US',?'Italy',?'Germany'])&?df['Province/State'].isna()]df_interest.rename(index=lambda?x:?df_interest.at[x,?'Country/Region'],?inplace=True) df1?=?df_interest.transpose()df1?=?df1.drop(['Province/State',?'Country/Region',?'Lat',?'Long']) df1?=?df1.loc[(df1?!=?0).any(1)] df1.index?=?pd.to_datetime(df1.index)繪制三種常見(jiàn)動(dòng)態(tài)圖表
繪制動(dòng)態(tài)線型圖
如下所示,首先需要做的第一件事是定義圖的各項(xiàng),這些基礎(chǔ)項(xiàng)設(shè)定之后就會(huì)保持不變。它們包括:創(chuàng)建 figure 對(duì)象,x 標(biāo)和 y 標(biāo),設(shè)置線條顏色和 figure 邊距等:
import?numpy?as?np import?matplotlib.pyplot?as?pltcolor?=?['red',?'green',?'blue',?'orange'] fig?=?plt.figure() plt.xticks(rotation=45,?ha="right",?rotation_mode="anchor")?#rotate?the?x-axis?values plt.subplots_adjust(bottom?=?0.2,?top?=?0.9)?#ensuring?the?dates?(on?the?x-axis)?fit?in?the?screen plt.ylabel('No?of?Deaths') plt.xlabel('Dates')接下來(lái)設(shè)置 curve 函數(shù),進(jìn)而使用 .FuncAnimation 讓它動(dòng)起來(lái):
def?buildmebarchart(i=int):plt.legend(df1.columns)p?=?plt.plot(df1[:i].index,?df1[:i].values)?#note?it?only?returns?the?dataset,?up?to?the?point?ifor?i?in?range(0,4):p[i].set_color(color[i])?#set?the?colour?of?each?curveimport?matplotlib.animation?as?ani animator?=?ani.FuncAnimation(fig,?buildmebarchart,?interval?=?100) plt.show()動(dòng)態(tài)餅狀圖
可以觀察到,其代碼結(jié)構(gòu)看起來(lái)與線型圖并無(wú)太大差異,但依舊有細(xì)小的差別。
import?numpy?as?np import?matplotlib.pyplot?as?pltfig,ax?=?plt.subplots() explode=[0.01,0.01,0.01,0.01]?#pop?out?each?slice?from?the?piedef?getmepie(i):def?absolute_value(val):?#turn?%?back?to?a?numbera??=?np.round(val/100.*df1.head(i).max().sum(),?0)return?int(a)ax.clear()plot?=?df1.head(i).max().plot.pie(y=df1.columns,autopct=absolute_value,?label='',explode?=?explode,?shadow?=?True)plot.set_title('Total?Number?of?Deaths\n'?+?str(df1.index[min(?i,?len(df1.index)-1?)].strftime('%y-%m-%d')),?fontsize=12)import?matplotlib.animation?as?ani animator?=?ani.FuncAnimation(fig,?getmepie,?interval?=?200) plt.show()主要區(qū)別在于,動(dòng)態(tài)餅狀圖的代碼每次循環(huán)都會(huì)返回一組數(shù)值,但在線型圖中返回的是我們所在點(diǎn)之前的整個(gè)時(shí)間序列。返回時(shí)間序列通過(guò) df1.head(i) 來(lái)實(shí)現(xiàn),而. max()則保證了我們僅獲得最新的數(shù)據(jù),因?yàn)榱餍胁?dǎo)致死亡的總數(shù)只有兩種變化:維持現(xiàn)有數(shù)量或持續(xù)上升。
df1.head(i).max()動(dòng)態(tài)條形圖
創(chuàng)建動(dòng)態(tài)條形圖的難度與上述兩個(gè)案例并無(wú)太大差別。在這個(gè)案例中,作者定義了水平和垂直兩種條形圖,讀者可以根據(jù)自己的實(shí)際需求來(lái)選擇圖表類型并定義變量欄。
fig?=?plt.figure() bar?=?''def?buildmebarchart(i=int):iv?=?min(i,?len(df1.index)-1)?#the?loop?iterates?an?extra?one?time,?which?causes?the?dataframes?to?go?out?of?bounds.?This?was?the?easiest?(most?lazy)?way?to?solve?this?:)objects?=?df1.max().indexy_pos?=?np.arange(len(objects))performance?=?df1.iloc[[iv]].values.tolist()[0]if?bar?==?'vertical':plt.bar(y_pos,?performance,?align='center',?color=['red',?'green',?'blue',?'orange'])plt.xticks(y_pos,?objects)plt.ylabel('Deaths')plt.xlabel('Countries')plt.title('Deaths?per?Country?\n'?+?str(df1.index[iv].strftime('%y-%m-%d')))else:plt.barh(y_pos,?performance,?align='center',?color=['red',?'green',?'blue',?'orange'])plt.yticks(y_pos,?objects)plt.xlabel('Deaths')plt.ylabel('Countries')animator?=?ani.FuncAnimation(fig,?buildmebarchart,?interval=100)plt.show()在制作完成后,存儲(chǔ)這些動(dòng)態(tài)圖就非常簡(jiǎn)單了,可直接使用以下代碼:
animator.save(r'C:\temp\myfirstAnimation.gif')感興趣的讀者如想獲得詳細(xì)信息可參考:https://matplotlib.org/3.1.1/api/animation_api.html。
原文鏈接:https://towardsdatascience.com/learn-how-to-create-animated-graphs-in-python-fce780421afe
回復(fù)下方「關(guān)鍵詞」,獲取優(yōu)質(zhì)資源回復(fù)關(guān)鍵詞「?pybook03」,立即獲取主頁(yè)君與小伙伴一起翻譯的《Think Python 2e》電子版 回復(fù)關(guān)鍵詞「入門資料」,立即獲取主頁(yè)君整理的?10 本 Python 入門書(shū)的電子版 回復(fù)關(guān)鍵詞「m」,立即獲取Python精選優(yōu)質(zhì)文章合集 回復(fù)關(guān)鍵詞「book 數(shù)字」,將數(shù)字替換成 0 及以上數(shù)字,有驚喜好禮哦~ 題圖:pexels,CC0 授權(quán)。好文章,我在看??
總結(jié)
以上是生活随笔為你收集整理的如何用 Python 让你的 PPT 数据动起来?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: [转]文本相似性算法:simhash/m
- 下一篇: python arp断网攻击_局域网ar