数据可视化|实验三 分析特征内部数据分布于分散状况
生活随笔
收集整理的這篇文章主要介紹了
数据可视化|实验三 分析特征内部数据分布于分散状况
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
繪制 2000 年與 2016 年產業結構餅圖
import matplotlib.pyplot as plt import numpy as np data=np.load('./國民經濟核算季度數據.npz',allow_pickle=True) name=data['columns'] values=data['values'] plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = False pic = plt.figure(dpi = 100, figsize = (8, 4)) plt.rcParams['font.sans-serif'] = 'SimHei' a_labs = [i[: 4] for i in name[3: 6]] b_labs = [i[: 2] for i in name[6:]]explode = [0.01, 0.01, 0.01]pic.add_subplot(1, 2, 1) plt.pie(np.sum(values[:4,3:6],axis=0),autopct='%1.1f%%',labels=a_labs, explode=explode) plt.title('2000 年產業結構 ')pic.add_subplot(1, 2, 2)plt.pie(np.sum(values[-2: -6: -1, 3: 6], axis = 0), autopct = '%1.1f%%',labels = a_labs, explode = explode)plt.title('2016 年產業結構 ') plt.savefig('./tmp/2000 到 2016 產業結構變化餅圖 .png')plt.show()通過圖中“ 2000 年產業結構”餅圖可以看出第二產業占比最大,而“ 2016 年產業結構”餅圖可以看出第三產業占比大幅增加,遠超其他產業。第一產業占比減少接近 2000 年占比的 50% 。我國產業結構優化初見成效,三大產業發展逐漸協調。
使用生成服從標準正態分布的數據繪制直方圖
為了較好的展示效果,使用生成服從標準正態分布的數據繪制直方圖:
import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize = (8, 6), dpi = 100) mu = 0 sigma = 1 x = np.random.normal(mu, sigma, 10000) plt.hist(x, bins = 20, density = True, rwidth = 0.96) plt.title(' 標準正態分布數據直方圖 ') plt.savefig('./tmp/ 標準正態分布數據直方圖 .png') plt.show()通過直方圖可以明顯地看出數據的分布情況
使用 bar 函數繪制 2017 年第一季度各產業國民生產總值條形圖
data = np.load('./國民經濟核算季度數據.npz',allow_pickle=True) values = data['values'] plt.rcParams['font.sans-serif'] = 'SimHei' plt.rcParams['axes.unicode_minus'] = Falsex = range(3)my_height = np.sum(values[-2: -6: -1, 3: 6], axis = 0)plt.figure(figsize = (8, 8), dpi = 100)plt.bar(x, my_height, width=0.8)for i in range(len(my_height)):plt.text(i, my_height[i], '{} 億元 '.format(my_height[i]), va = 'bottom', ha = 'center') plt.xticks(x, [' 第一產業 ', ' 第二產業 ', ' 第三產業 '])plt.ylim([0, 500000])plt.title('2016 年各產業國民生產總值條形圖 ')plt.savefig('./tmp/2016 年各產業國民生產總值條形圖 .png')plt.show()通過圖可以看出, 2016 年第一產業生產總值大致為第二產業的五分之一,基本與第三產業的六分之一持平。第二產業生產總值和第三產業生產總值相差大約三分之一。
繪制國民生產總值分散情況箱線圖
觀察 2000 年至 2017 年不同的產業和行業在國民生產總值中的分散情況,可以 發現整體分散情況,從而判斷整體增速是否加快:
plt.rcParams['font.sans-serif'] = 'SimHei'plt.rcParams['axes.unicode_minus'] = Falsepic = plt.figure(dpi = 200, figsize = (8, 8))plt.rcParams['font.sans-serif'] = 'SimHei'a_labs = [i[: 4] for i in name[3: 6]]b_labs = [i[: 2] for i in name[6: ]]pic.add_subplot(2, 1, 1)plt.boxplot([list(values[: , 3]), list(values[: , 4]),list(values[: , 5])], notch = True, meanline = True)plt.xticks(range(1, 4), a_labs) plt.title('2000-2017 年各產業國民生產總值箱線圖 ')pic.add_subplot(2, 1, 2)tem = []for i in range(6, len(values[0])):tem.append(list(values[: , i]))plt.boxplot(tem, notch = True, meanline = True)plt.xticks(range(1, len(b_labs) + 1), b_labs)plt.title('2000-2017 年各行業國民生產總值箱線圖 ')plt.savefig('./tmp/ 生產總值箱線圖 .png')plt.show()通過圖可以看出, 在 2000-2017 年第一產業在某一年有一個異常值。第三 產業整體增速變大,導致了第三產業數據前半部分相對密集而后半部分相對分散。而第二產業增長較平緩。行業中的工業與住宿的增長比較平緩,其他行業,批發行業,建筑行業,金融行業和房地產行業增速均有所加快。
總結
以上是生活随笔為你收集整理的数据可视化|实验三 分析特征内部数据分布于分散状况的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据可视化|实验二 分析特征间关系
- 下一篇: 数据可视化|实验四 分析1996-201