日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

动手学数据分析(四)- 数据可视化

發布時間:2023/12/20 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 动手学数据分析(四)- 数据可视化 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 初心

本系列筆記用于記錄自己第一次參加Datawhale的組隊學習。自己馬上開啟研究生學習生涯,因此熟練掌握數據分析這一重要技能對未來的學習能夠提供很大的幫助,Datawhale團隊在項目初衷里說數據分析是一個要從一堆數字中看到真相的過程。學會操作數據只是數據分析的一半功力,剩下的另一半要用我們的大腦,多多思考,多多總結,更要多動手,實打實的的敲代碼。所以也希望在學習這門課時,多去推理,多去問問為什么;多多練習,確保理論實踐結合起來,在課程結束的時候一定會有大收獲。

因此希望自己再接下來的11天里面能夠實事求是、腳踏實地完成各項任務,提高自己的硬實力。

特別喜歡一句話:也許不負光陰就是最好的努力,而努力就是最好的自己。

學習內容: 回顧學習完第一章,我們對泰坦尼克號數據有了基本的了解,也學到了一些基本的統計方法,第二章中我們學習了數據的清理和重構,使得數據更加的易于理解;今天我們要學習的是第二章第三節:數據可視化,主要給大家介紹一下Python數據可視化庫Matplotlib,在本章學習中,你也許會覺得數據很有趣。在打比賽的過程中,數據可視化可以讓我們更好的看到每一個關鍵步驟的結果如何,可以用來優化方案,是一個很有用的技巧。

2 數據可視化

開始之前導入numpy、pandas包和數據

%matplotlib inline import numpy as np import pandas as pd import matplotlib.pyplot as plt

導入result.csv這個文件

text = pd.read_csv(r'result.csv') text.head()

可視化展示泰坦尼克號數據集中男女中生存人數分布情況(用柱狀圖試試)。

sex = text.groupby('Sex')['Survived'].sum() sex.plot.bar() plt.title('survived_count') plt.show()


可視化展示泰坦尼克號數據集中男女中生存人與死亡人數的比例圖(用柱狀圖試試)

text.groupby(['Sex','Survived'])['Survived'].count().unstack().plot(kind='bar',stacked='True') plt.title('survived_count') plt.ylabel('count')


可視化展示泰坦尼克號數據集中不同票價的人生存和死亡人數分布情況。(用折線圖試試)(橫軸是不同票價,縱軸是存活人數)

fare_sur = text.groupby(['Fare'])['Survived'].value_counts().sort_values(ascending=False) fare_sur


排序后繪折線圖

fig = plt.figure(figsize=(20, 18)) fare_sur.plot(grid=True) plt.legend() plt.show()


排序前繪折線圖

fare_sur1 = text.groupby(['Fare'])['Survived'].value_counts() fare_sur1

fig = plt.figure(figsize=(20, 18)) fare_sur1.plot(grid=True) plt.legend() plt.show()


可視化展示泰坦尼克號數據集中不同倉位等級的人生存和死亡人員的分布情況。(用柱狀圖試試)

pclass_sur = text.groupby(['Pclass'])['Survived'].value_counts() pclass_sur

import seaborn as sns sns.countplot(x="Pclass", hue="Survived", data=text)


可視化展示泰坦尼克號數據集中不同年齡的人生存與死亡人數分布情況。(不限表達方式)

facet = sns.FacetGrid(text, hue="Survived",aspect=3) facet.map(sns.kdeplot,'Age',shade= True) facet.set(xlim=(0, text['Age'].max())) facet.add_legend()


可視化展示泰坦尼克號數據集中不同倉位等級的人年齡分布情況。(用折線圖試試)

text.Age[text.Pclass == 1].plot(kind='kde') text.Age[text.Pclass == 2].plot(kind='kde') text.Age[text.Pclass == 3].plot(kind='kde') plt.xlabel("age") plt.legend((1,2,3),loc="best")

總結

以上是生活随笔為你收集整理的动手学数据分析(四)- 数据可视化的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。