當(dāng)前位置：首頁(yè) >

【Python基础】在pandas中使用数据透视表

發(fā)布時(shí)間：2025/3/8 26 豆豆

生活随笔收集整理的這篇文章主要介紹了【Python基础】在pandas中使用数据透视表小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章來源于Python大數(shù)據(jù)分析，作者朱衛(wèi)軍

什么是透視表？

經(jīng)常做報(bào)表的小伙伴對(duì)數(shù)據(jù)透視表應(yīng)該不陌生，在excel中利用透視表可以快速地進(jìn)行分類匯總，自由組合字段聚合計(jì)算，而這些只需要拖拉拽就能實(shí)現(xiàn)。

維基百科對(duì)透視表（pivot table）解釋是：

A 「pivot table」?is a table ?of statistics that summarizes the data of a more extensive table.?

透視表是一種匯總了更廣泛表數(shù)據(jù)的統(tǒng)計(jì)信息表。

典型的數(shù)據(jù)格式是扁平的，只包含行和列，不方便總結(jié)信息：

而數(shù)據(jù)透視表可以快速抽取有用的信息：

pandas也有透視表？

pandas作為編程領(lǐng)域最強(qiáng)大的數(shù)據(jù)分析工具之一，自然也有透視表的功能。

在pandas中，透視表操作由pivot_table()函數(shù)實(shí)現(xiàn)，不要小看只是一個(gè)函數(shù)，但卻可以玩轉(zhuǎn)數(shù)據(jù)表，解決大麻煩。

pivot_table使用方法：

pandas.pivot_table(*data*,?*values=None*,?*index=None*,?*columns=None*,?*aggfunc='mean'*,?*fill_value=None*,?*margins=False*,?*dropna=True*,?*margins_name='All'*,?*observed=False*)?

參數(shù)解釋：

data：dataframe格式數(shù)據(jù)
values：需要匯總計(jì)算的列，可多選
index：行分組鍵，一般是用于分組的列名或其他分組鍵，作為結(jié)果DataFrame的行索引
columns：列分組鍵，一般是用于分組的列名或其他分組鍵，作為結(jié)果DataFrame的列索引
aggfunc：聚合函數(shù)或函數(shù)列表，默認(rèn)為平均值
fill_value：設(shè)定缺失替換值
margins：是否添加行列的總計(jì)
dropna：默認(rèn)為True，如果列的所有值都是NaN，將不作為計(jì)算列，False時(shí)，被保留
margins_name：匯總行列的名稱，默認(rèn)為All
observed：是否顯示觀測(cè)值

注意，在所有參數(shù)中，values、index、columns最為關(guān)鍵，它們分別對(duì)應(yīng)excel透視表中的值、行、列：

參數(shù)aggfunc對(duì)應(yīng)excel透視表中的值匯總方式，但比excel的聚合方式更豐富：

如何使用pivot_table?

下面拿數(shù)據(jù)練一練，示例數(shù)據(jù)表如下：

該表為用戶訂單數(shù)據(jù)，有訂單日期、商品類別、價(jià)格、利潤(rùn)等維度。

首先導(dǎo)入數(shù)據(jù)：

data?=?pd.read_excel("E:\\訂單數(shù)據(jù).xlsx") data.head()

接下來使用透視表做分析：

計(jì)算每個(gè)州銷售總額和利潤(rùn)總額

result1?=?pd.pivot_table(data,index='洲'?,?values?=?['銷售額','利潤(rùn)']?,?aggfunc?=?np.sum) result1.head()

計(jì)算每個(gè)洲每個(gè)城市每單平均銷售量

result2?=?pd.pivot_table(data,index=['洲','城市'],aggfunc=np.mean,values=['數(shù)量']) result2.head(20)

計(jì)算每個(gè)洲的總銷量和每單平均銷量

result3?=?pd.pivot_table(data,index=['洲'],aggfunc=[np.sum,np.mean],values=['數(shù)量']) result3.head()

看每個(gè)城市（行）每類商品（列）的總銷售量，并匯總計(jì)算

result4?=?pd.pivot_table(data,index=['城市'],columns=['商品類別'],aggfunc=[np.sum],values=['數(shù)量'],margins=True) result4.head()

總結(jié)

本文介紹了pandas pivot_table函數(shù)的使用，其透視表功能基本和excel類似，但pandas的聚合方式更加靈活和多元，處理大數(shù)據(jù)也更快速，大家有興趣可探索更高級(jí)的用法。

備注：本站的微信群尚有幾十個(gè)名額，可以直接掃碼進(jìn)入。

若掃碼顯示滿員請(qǐng)掃下面的二維碼：

總結(jié)

以上是生活随笔為你收集整理的【Python基础】在pandas中使用数据透视表的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：【深度学习】神经网络知识专题总结
下一篇：基于Python的特征自动化选择：两行代

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

【Python基础】在pandas中使用数据透视表

什么是透視表？

pandas也有透視表？

如何使用pivot_table?

總結(jié)

總結(jié)