python新闻聚合_使用python对数据进行高效处理,包你玩转分组聚合
本文主要介紹python的第三方數據分析庫pandas,闡述其在數據分析領域應該如何高效地進行分組聚合,共分享5個最佳實踐。
groupby概念
groupby語句在數據分析中是用來做分組計算的,將數據劃分為不同的部分,常用的統計指標有:計數,求和,求最大最小值,平均值等等……
agg函數基本操作:傳入字典和列表的區別
直接上案例
直接用列表的形式就是 將每一列分別聚合求平均數,和,標準差,如下所示
傳入字典則是根據不同的列分別聚合不同的函數,如下所示
groupby稍微高端一點的操作:按照自定義分類進行聚合操作
有時候,我們對于完全沒有關系的列,要進行聚合操作,這時候我們可以選擇如下方法進行自定義分組條件(傳入字典的形式)
構造案例,如下
如果說希望將a,b,e劃分為同一種類別,c/d為同一類別,f自己為一類,求每個人實際擁有的數量,那么就可以如下圖方法處理
按照不同標準將同類數據聚合到一行
啥意思,就比如說,一個數據集合中有性別一列,現在需要將性別為男女的分開,將所有男性的某些特征匯總到一行,用逗號分隔,女性同樣如此
舉例如下所示
乍一看也是分組,但是涉及到不同的語法,解決方案如下所示
將分組后的數據列保持原列名
其實這個說簡單也簡單,不過當時我不知道這個方法的時候,走了很多的彎路,所以還是拿出來分享下
as_index=False 這個參數的作用,是不將聚合后的名稱更改為索引,我個人覺得很有用,尤其是需要進行數據集拼接聚合之后,可能還要關聯表
總結
以上是生活随笔為你收集整理的python新闻聚合_使用python对数据进行高效处理,包你玩转分组聚合的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 空调选定频还是变频(如何选择空调)
- 下一篇: python打卡摄像头黑屏_500行Py