大学计算机基础python第二次作业_python第二次作业-titanic数据集练习
一、讀入titanic.xlsx文件,按照教材示例步驟,完成數(shù)據(jù)清洗。
titanic數(shù)據(jù)集包含11個特征,分別是:
Survived:0代表死亡,1代表存活
Pclass:乘客所持票類,有三種值(1,2,3)
Name:乘客姓名
Sex:乘客性別
Age:乘客年齡(有缺失)
SibSp:乘客兄弟姐妹/配偶的個數(shù)(整數(shù)值)
Parch:乘客父母/孩子的個數(shù)(整數(shù)值)
Ticket:票號(字符串)
Fare:乘客所持票的價格(浮點數(shù),0-500不等)
Cabin:乘客所在船艙(有缺失)
Embark:乘客登船港口:S、C、Q(有缺失)
importpandas as pd
titanic= pd.read_excel('G:\ppp/titanic.xlsx')
titanic.head()
二、對titanic數(shù)據(jù)集完成以下統(tǒng)計操作
1.統(tǒng)計乘客死亡和存活人數(shù)
survived = titanic['survived'].value_counts()print("乘客存活人數(shù):{}\n乘客死亡人數(shù):{}".format(survived[1],survived[0])
2.統(tǒng)計乘客中男女性別人數(shù)
sex = titanic['sex'].value_counts()print("乘客中男性性別人數(shù):{}\n乘客中女性性別人數(shù):{}".format(sex[0],sex[1]))
3.統(tǒng)計男女獲救的人數(shù)
titanic['pclass'].value_counts()
4.統(tǒng)計乘客所在的船艙等級的人數(shù)
pclass = titanic['pclass'].value_counts()print("乘客所在的船艙等級是1的人數(shù)為:{}\n乘客所在的船艙等級是2的人數(shù)為:{}\n乘客所在的船艙等級是3的人數(shù)為:{}".format(pclass[1],pclass[2],pclass[3]))
5.使用corr()函數(shù),判斷兩個屬性是否具有相關(guān)性,分析艙位的高低和存活率的關(guān)系
print("艙位的高低和存活率的相關(guān)性為",titanic[u'survived'].corr(titanic[u'pclass']))
6.畫出乘客票價與艙位等級的箱體圖Boxplot,從圖中能夠得到哪些結(jié)論?
titanic.boxplot(['fare'],['pclass'])
總結(jié)
以上是生活随笔為你收集整理的大学计算机基础python第二次作业_python第二次作业-titanic数据集练习的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux 中的负载高低和 CPU 开销
- 下一篇: opencv利用矩形框选中某一区域_【从