pandas(七) -- 数据分组
生活随笔
收集整理的這篇文章主要介紹了
pandas(七) -- 数据分组
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據分組官方文檔
分組統計 - groupby功能
- 根據某些條件將數據拆分成組
- 對每個組單獨使用函數
- 將結果合并到一個數據結構中
根據單列或多列分組 .groupby()
分組后的對象執行數值計算函數 .sum(),.mean()…
分組后對象同時使用多個函數 --agg()。
參數:
- by 標簽(label)或標簽列表
- axis 默認值為0
- level MultiIndex時有效
- as_index 布爾型值 默認是True – 使用grouped的標簽作為index.若為False – grouped的標簽仍為標簽,會新生成0~n-1的index.
- sort 是否對grouped的標簽排序
返回的是GroupBy 對象。通過list(),查看具體內容
df
經過group方法后,得到的是groupby對象,是一個中間數據,沒有進行計算
- 使用list()將groupby對象變成列表對象,可查看具體內容
列表是兩個元組對象。每個元組包含‘A’的標簽名和相應的DataFrame或Series。
[('bar', A B C D1 bar one 0.953897 0.263753 bar three 0.190113 1.011155 bar two 0.941511 -0.51730), ('foo', A B C D0 foo one 1.119704 -0.7421482 foo two 0.643483 -1.1474054 foo two -0.952974 -0.4342416 foo one -0.421435 0.9337917 foo three -0.042118 0.641683)]- get_group()
df.groupby(['A']).get_group('bar')與list(df.groupby('A'))[0][1]相同
- .groups:將分組后的groups轉為dict
- 分組計算函數方法
- 多函數計算:agg()
函數寫法可以用str,或者np.方法
求均值和求和
可以通過list,dict傳入,當用dict時,key名為columns → 更新pandas后會出現警告
總結
以上是生活随笔為你收集整理的pandas(七) -- 数据分组的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pandas(六) -- 合并、连接、去
- 下一篇: pandas 读csv 报错 Unic