當前位置：首頁 >

Pandas转pivot, groupby等结果为dataFrame--彻底解决多表头问题

發布時間：2025/4/16 47 豆豆

生活随笔收集整理的這篇文章主要介紹了 Pandas转pivot, groupby等结果为dataFrame--彻底解决多表头问题小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Pandas轉pivot, groupby等結果為dataFrame

問題背景：

在用Pandas進行數據分析和處理的時候，常會用到如goupby(),pivot()等方法，這些方法極大簡化了我們的操作復雜度。但另一方面，這些操作之后返回的類型往往卻并不是一個標準的DataFrame。具體的現象就是常會出現多出來的一級表頭，而當我們想要再進行繼續處理時，它的索引方式就發生變化了，不便于我們進一步操作。因此我們希望能夠有一種方法將這些返回類型再次變為我們需要的DataFrame類型同時保持原有的表頭。本文就這一問題進行簡單描述。

給定數據（借用一下這位朋友的數據）：

import pandas as pd df= pd.DataFrame({'name': ['張三','李四','王五','張三','王五','張三','趙六','張三','趙六'],'sex': ['男','女','男','男','男','男','女','女','女'],'expense': [2.9,9.0,8.5,5.6,5.6,5.2,1.2,4.5,3.2],'income': [5.2,2.5,6.3,5.6,4.5,5.6,1.2,8.5,1.2]})

df的值

dfname sex expense income 0 張三男 2.9 5.2 1 李四女 9.0 2.5 2 王五男 8.5 6.3 3 張三男 5.6 5.6 4 王五男 5.6 4.5 5 張三男 5.2 5.6 6 趙六女 1.2 1.2 7 張三女 4.5 8.5 8 趙六女 3.2 1.2

現在按性別統計他們的開銷：

df_expense = df.groupby(['sex','name'])['expense'].agg(np.mean)

結果：

df_expensesex name 女張三 4.500000李四 9.000000趙六 2.200000 男張三 4.566667王五 7.050000 Name: expense, dtype: float64

注意，此時的df_expense變成了series，因為這里我們只聚合了一列。而此時的前2列，實際上已經變成了df_expense的index

df_expense.indexMultiIndex([('女', '張三'),('女', '李四'),('女', '趙六'),('男', '張三'),('男', '王五')],names=['sex', 'name'])

那么如果直接使用to_frame()方法則不能得到我們想要的結果(即sex,name,mean_expense各為一列)：

pd.DataFrame(df_expense)expense sex name 女張三 4.500000李四 9.000000趙六 2.200000 男張三 4.566667王五 7.050000

因為此時它的index仍然是剛才那個Series類型的index。

還好Pandas實際上提供了一種機制，即重置索引。其基本原理是將每一列只要是表頭的項全部放在一起，作為一個完整的表頭名，從而實現將多級表頭合并為同一個表頭的效果：

df_new = pd.DataFrame(df_expense).reset_index()df_newsex name expense 0 女張三 4.500000 1 女李四 9.000000 2 女趙六 2.200000 3 男張三 4.566667 4 男王五 7.050000

再檢查一下它的表頭現在是哪些：

df_new.columnsIndex(['sex', 'name', 'expense'], dtype='object')

這樣一來，df_new就又變回了我們想要的DataFrame類型，就方便我們操作了。

《新程序員》：云原生和全面數字化實踐50位技術專家共同創作，文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的Pandas转pivot, groupby等结果为dataFrame--彻底解决多表头问题的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Python轻量级IDE推荐 -- Ju
下一篇： Pandas简明教程：一、Pandas简

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

Pandas转pivot, groupby等结果为dataFrame--彻底解决多表头问题

Pandas轉pivot, groupby等結果為dataFrame

總結