pandas 分组统计的三个函数 pivot table crosstab groupby
生活随笔
收集整理的這篇文章主要介紹了
pandas 分组统计的三个函数 pivot table crosstab groupby
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
最近在做數據,記錄一下遇到的問題,解決的方式,
有一個數據,如圖
我想統計每年的idx_reply, idx_sat, idx_default的頻數 交叉統計。
探索了一下午,做法是這樣的。
data_testdata_test.groupby(data_test['year'])['idx_reply'].value_counts().unstack()使用groupby 默認會把分組的作為索引 ,如果不用 unstack, 就會是這樣
用了unstack ,就整齊一點
同樣的效果,也可以使用crosstab 達到。
pd.crosstab(index=data_test['year'], columns=data_test['idx_reply'])使用pivot_table,沒有辦法弄出上面的效果。
感覺就是crosstab命令做直接。還可以計算百分比
這里crosstab的margins 選項是
normalize : bool, {'all', 'index', 'columns'}, or {0,1}, default FalseNormalize by dividing all values by the sum of values.- If passed 'all' or `True`, will normalize over all values.- If passed 'index' will normalize over each row.- If passed 'columns' will normalize over each column.- If margins is `True`, will also normalize margin values.后續還會繼續學習。
總結
以上是生活随笔為你收集整理的pandas 分组统计的三个函数 pivot table crosstab groupby的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 21款现代ix35在方向盘怎么设置百公里
- 下一篇: pandas把索引变成列