日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python dataframe删除重复行_详解pandas使用drop_duplicates去除DataFrame重复项参数

發布時間:2023/12/10 python 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python dataframe删除重复行_详解pandas使用drop_duplicates去除DataFrame重复项参数 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Pandas之drop_duplicates:去除重復項

方法

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

參數

這個drop_duplicate方法是對DataFrame格式的數據,去除特定列下面的重復行。返回DataFrame格式的數據。

subset : column label or sequence of labels, optional 用來指定特定的列,默認所有列

keep : {‘first', ‘last', False}, default ‘first' 刪除重復項并保留第一次出現的項

inplace : boolean, default False 是直接在原來數據上修改還是保留一個副本

DataFrame中存在重復的行或者幾行中某幾列的值重復,這時候需要去掉重復行,示例如下:

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)

代碼中subset對應的值是列名,表示只考慮這兩列,將這兩列對應值相同的行進行去重。默認值為subset=None表示考慮所有列。

keep='first'表示保留第一次出現的重復行,是默認值。keep另外兩個取值為"last"和False,分別表示保留最后一次出現的重復行和去除所有重復行。

inplace=True表示直接在原來的DataFrame上刪除重復項,而默認值False表示生成一個副本。

將副本賦值給dataframe:

data=data.drop_duplicates(subset=None,keep='first',inplace=False)

這一行代碼與文章開頭提到的那行代碼效果等效,但是如果在該DataFrame上新增一列:

data['extra']=test_data['item_price_level']

就會報如下錯誤:

SettingWithCopyWarning: ?A value is trying to be set on a copy of a slice from a DataFrame.

所以如果想對DataFrame去重,最好采用開頭提到的那行代碼。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

總結

以上是生活随笔為你收集整理的python dataframe删除重复行_详解pandas使用drop_duplicates去除DataFrame重复项参数的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。