数据可视化|实验三 分析特征内部数据分布于分散状况
繪制 2000 年與 2016 年產(chǎn)業(yè)結(jié)構(gòu)餅圖
import matplotlib.pyplot as plt import numpy as np data=np.load('./國民經(jīng)濟(jì)核算季度數(shù)據(jù).npz',allow_pickle=True) name=data['columns'] values=data['values'] plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = False pic = plt.figure(dpi = 100, figsize = (8, 4)) plt.rcParams['font.sans-serif'] = 'SimHei' a_labs = [i[: 4] for i in name[3: 6]] b_labs = [i[: 2] for i in name[6:]]explode = [0.01, 0.01, 0.01]pic.add_subplot(1, 2, 1) plt.pie(np.sum(values[:4,3:6],axis=0),autopct='%1.1f%%',labels=a_labs, explode=explode) plt.title('2000 年產(chǎn)業(yè)結(jié)構(gòu) ')pic.add_subplot(1, 2, 2)plt.pie(np.sum(values[-2: -6: -1, 3: 6], axis = 0), autopct = '%1.1f%%',labels = a_labs, explode = explode)plt.title('2016 年產(chǎn)業(yè)結(jié)構(gòu) ') plt.savefig('./tmp/2000 到 2016 產(chǎn)業(yè)結(jié)構(gòu)變化餅圖 .png')plt.show()通過圖中“ 2000 年產(chǎn)業(yè)結(jié)構(gòu)”餅圖可以看出第二產(chǎn)業(yè)占比最大,而“ 2016 年產(chǎn)業(yè)結(jié)構(gòu)”餅圖可以看出第三產(chǎn)業(yè)占比大幅增加,遠(yuǎn)超其他產(chǎn)業(yè)。第一產(chǎn)業(yè)占比減少接近 2000 年占比的 50% 。我國產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化初見成效,三大產(chǎn)業(yè)發(fā)展逐漸協(xié)調(diào)。
使用生成服從標(biāo)準(zhǔn)正態(tài)分布的數(shù)據(jù)繪制直方圖
為了較好的展示效果,使用生成服從標(biāo)準(zhǔn)正態(tài)分布的數(shù)據(jù)繪制直方圖:
import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize = (8, 6), dpi = 100) mu = 0 sigma = 1 x = np.random.normal(mu, sigma, 10000) plt.hist(x, bins = 20, density = True, rwidth = 0.96) plt.title(' 標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)直方圖 ') plt.savefig('./tmp/ 標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)直方圖 .png') plt.show()通過直方圖可以明顯地看出數(shù)據(jù)的分布情況
使用 bar 函數(shù)繪制 2017 年第一季度各產(chǎn)業(yè)國民生產(chǎn)總值條形圖
data = np.load('./國民經(jīng)濟(jì)核算季度數(shù)據(jù).npz',allow_pickle=True) values = data['values'] plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = Falsex = range(3)my_height = np.sum(values[-2: -6: -1, 3: 6], axis = 0)plt.figure(figsize = (8, 8), dpi = 100)plt.bar(x, my_height, width=0.8)for i in range(len(my_height)):plt.text(i, my_height[i], '{} 億元 '.format(my_height[i]), va = 'bottom', ha = 'center') plt.xticks(x, [' 第一產(chǎn)業(yè) ', ' 第二產(chǎn)業(yè) ', ' 第三產(chǎn)業(yè) '])plt.ylim([0, 500000])plt.title('2016 年各產(chǎn)業(yè)國民生產(chǎn)總值條形圖 ')plt.savefig('./tmp/2016 年各產(chǎn)業(yè)國民生產(chǎn)總值條形圖 .png')plt.show()通過圖可以看出, 2016 年第一產(chǎn)業(yè)生產(chǎn)總值大致為第二產(chǎn)業(yè)的五分之一,基本與第三產(chǎn)業(yè)的六分之一持平。第二產(chǎn)業(yè)生產(chǎn)總值和第三產(chǎn)業(yè)生產(chǎn)總值相差大約三分之一。
繪制國民生產(chǎn)總值分散情況箱線圖
觀察 2000 年至 2017 年不同的產(chǎn)業(yè)和行業(yè)在國民生產(chǎn)總值中的分散情況,可以 發(fā)現(xiàn)整體分散情況,從而判斷整體增速是否加快:
plt.rcParams['font.sans-serif'] = 'SimHei'plt.rcParams['axes.unicode_minus'] = Falsepic = plt.figure(dpi = 200, figsize = (8, 8))plt.rcParams['font.sans-serif'] = 'SimHei'a_labs = [i[: 4] for i in name[3: 6]]b_labs = [i[: 2] for i in name[6: ]]pic.add_subplot(2, 1, 1)plt.boxplot([list(values[: , 3]), list(values[: , 4]),list(values[: , 5])], notch = True, meanline = True)plt.xticks(range(1, 4), a_labs) plt.title('2000-2017 年各產(chǎn)業(yè)國民生產(chǎn)總值箱線圖 ')pic.add_subplot(2, 1, 2)tem = []for i in range(6, len(values[0])):tem.append(list(values[: , i]))plt.boxplot(tem, notch = True, meanline = True)plt.xticks(range(1, len(b_labs) + 1), b_labs)plt.title('2000-2017 年各行業(yè)國民生產(chǎn)總值箱線圖 ')plt.savefig('./tmp/ 生產(chǎn)總值箱線圖 .png')plt.show()通過圖可以看出, 在 2000-2017 年第一產(chǎn)業(yè)在某一年有一個(gè)異常值。第三 產(chǎn)業(yè)整體增速變大,導(dǎo)致了第三產(chǎn)業(yè)數(shù)據(jù)前半部分相對(duì)密集而后半部分相對(duì)分散。而第二產(chǎn)業(yè)增長較平緩。行業(yè)中的工業(yè)與住宿的增長比較平緩,其他行業(yè),批發(fā)行業(yè),建筑行業(yè),金融行業(yè)和房地產(chǎn)行業(yè)增速均有所加快。
總結(jié)
以上是生活随笔為你收集整理的数据可视化|实验三 分析特征内部数据分布于分散状况的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据可视化|实验二 分析特征间关系
- 下一篇: 数据可视化|实验四 分析1996-201