當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

Python之分组级运算——【transform()方法、apply()方法】

發(fā)布時(shí)間：2023/12/13 python 25 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python之分组级运算——【transform()方法、apply()方法】小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

數(shù)據(jù)轉(zhuǎn)換——transform()方法
數(shù)據(jù)應(yīng)用——apply()方法

數(shù)據(jù)轉(zhuǎn)換——transform()方法

使用aggregate()方法進(jìn)行聚合運(yùn)算已經(jīng)在上一篇博客中詳細(xì)闡述，我們知道aggregate()方法返回的數(shù)據(jù)集的形狀（shape）與被分組的數(shù)據(jù)集的形狀是不同的，如果希望保持與原數(shù)據(jù)數(shù)據(jù)集形狀相同，則可以通過transfrom()方法實(shí)現(xiàn)。

transform(self, func, *args, **kwargs)

上述方法中只有一個(gè)func參數(shù)，表示操作Pandas對(duì)象的函數(shù)，該函數(shù)可以是內(nèi)置方法也可以是自定義函數(shù)。

transform()方法返回的結(jié)果有兩種：

一種是可以廣播的標(biāo)量值（np.mean）
一種可以是與分組大小相同的結(jié)果數(shù)組

通過transfrom()方法操作分組時(shí)，該方法回將func()函數(shù)應(yīng)用到各個(gè)分組中，并且將結(jié)果放在適當(dāng)?shù)奈恢蒙稀?/p>

下面通過實(shí)例來進(jìn)一步了解該方法的具體功能。

創(chuàng)建測(cè)試對(duì)象：

import pandas as pd import numpy as npdf = pd.DataFrame(np.arange(25).reshape(5, 5),index=list([0, 1, 2, 3, 4]),columns=list('abcde')) df['key'] = pd.Series(data=list('AABBB'), name='key') print(df)

輸出結(jié)果：

a b c d e key 0 0 1 2 3 4 A 1 5 6 7 8 9 A 2 10 11 12 13 14 B 3 15 16 17 18 19 B 4 20 21 22 23 24 B

以key列進(jìn)行分組，可以將df對(duì)象拆分成A、B兩組，將mean()方法應(yīng)用到每個(gè)分組中，計(jì)算每個(gè)分組中每列的平均值。

代碼如下：

df_group = df.groupby('key').transform('mean') print(df_group)

輸出結(jié)果：

a b c d e 0 2.5 3.5 4.5 5.5 6.5 1 2.5 3.5 4.5 5.5 6.5 2 15.0 16.0 17.0 18.0 19.0 3 15.0 16.0 17.0 18.0 19.0 4 15.0 16.0 17.0 18.0 19.0

從輸出結(jié)果可以看出，每列的數(shù)據(jù)是各分組求得的平均數(shù)。操作過程是通過mean()方法算出均值（一個(gè)標(biāo)準(zhǔn)量）后將其廣播。

不難發(fā)現(xiàn)上述示例中，原始數(shù)據(jù)的列數(shù)與最終結(jié)果的列數(shù)是不一樣的。

如果希望原始數(shù)據(jù)的列數(shù)與最終結(jié)果的列數(shù)是一樣的。那么需要?jiǎng)?chuàng)建一個(gè)Series對(duì)象作為分組鍵，而不是將原始數(shù)據(jù)中的列作為分組鍵。

創(chuàng)建測(cè)試對(duì)象：

df1 = DataFrame(np.arange(20).reshape(5, 4)) print(df1)

輸出結(jié)果：

0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 3 12 13 14 15 4 16 17 18 19

然后創(chuàng)建一個(gè)列表key，key的長(zhǎng)度需要與df1對(duì)象的行數(shù)是一樣的，我們將key當(dāng)作分組鍵，然后對(duì)每個(gè)分組執(zhí)行求平均值的操作。

代碼如下：

key = ['one', 'one', 'two', 'two', 'two'] df1_group = df1.groupby(by=key).transform('mean') print(df1_group)

輸出結(jié)果：

0 1 2 3 0 2 3 4 5 1 2 3 4 5 2 12 13 14 15 3 12 13 14 15 4 12 13 14 15

數(shù)據(jù)應(yīng)用——apply()方法

apply()方法的使用十分靈活，它可以作用于DataFrame中的每一列、每一行元素，還可以在許多標(biāo)準(zhǔn)用例中代替聚合和轉(zhuǎn)換。

測(cè)試對(duì)象：

a b c d e key 0 0 1 2 3 4 A 1 5 6 7 8 9 A 2 10 11 12 13 14 B 3 15 16 17 18 19 B 4 20 21 22 23 24 B

運(yùn)用apply()方法的代碼如下：

df_by_group = df.groupby('key')def plus_ten(data_frame):return data_frame.iloc[:, :5] + 10df_by_group_apply = df_by_group.apply(func=plus_ten) print(df_by_group_apply)

輸出結(jié)果：

a b c d e 0 10 11 12 13 14 1 15 16 17 18 19 2 20 21 22 23 24 3 25 26 27 28 29 4 30 31 32 33 34

也可以用內(nèi)置方法進(jìn)行數(shù)據(jù)應(yīng)用：

df1_by_group_apply1 = df.iloc[:, :5].apply(func='mean') print("df1_apply:\n", df1_by_group_apply1)

輸出結(jié)果：

df1_apply:a 10.0 b 11.0 c 12.0 d 13.0 e 14.0 dtype: float64

總結(jié)

以上是生活随笔為你收集整理的Python之分组级运算——【transform()方法、apply()方法】的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： git/github使用完整教程（1）基
下一篇： Python数据预处理之异常值的处理——