日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【Python】Pandas数据排序实现

發布時間:2025/3/12 python 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【Python】Pandas数据排序实现 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

公眾號:尤而小屋
作者:Peter
編輯:Peter

在以前的一篇文章? ?圖解Pandas的排序機制sort_values? ?詳細介紹了如何使用pandas的內置函數sort_values來實現數據的排序。本文講解的是如何使用自定義方式來實現排序:

  • 映射關系實現

  • CategoricalDtype類型實現

模擬數據

先模擬一份簡單的數據:

import?pandas?as?pd import?numpy?as?npdf?=?pd.DataFrame({"nick":["aaa","bbb","aba","abc","cac","ccc"],??#?昵稱"math":[100,120,130,111,100,128],??#?數學"english":[140,80,120,90,125,116],??#?英語"size":["S","M","L","XS","XL","L"]???#?衣服大小})df

sort_values

DataFrame.sort_values(by,?axis=0,?ascending=True,?inplace=False,?kind='quicksort',?na_position='last',?# last,first;默認是lastignore_index=False,?key=None)

參數的具體解釋為:

  • by:表示根據什么字段或者索引進行排序,可以是一個或多個

  • axis:排序是在橫軸還是縱軸,默認是縱軸axis=0

  • ascending:排序結果是升序還是降序,默認是升序

  • inplace:表示排序的結果是直接在原數據上的就地修改還是生成新的DatFrame

  • kind:表示使用排序的算法,快排quicksort,,歸并mergesort, 堆排序heapsort,穩定排序stable ,默認是 :快排quicksort

  • na_position:缺失值的位置處理,默認是最后,另一個選擇是首位

  • ignore_index:新生成的數據幀的索引是否重排,默認False(采用原數據的索引)

  • key:排序之前使用的函數

下面通過幾個簡單的例子來復習下sort_values的使用:

單個字段排序

通過nick字段排序,字符串是根據字母的ASCII碼;默認是從小到大的升序。第一個字母相同,則比較第二個,類推:

根據數值的大小來升序排列:

可以將排序方式改為降序:

多個字段排序

多個字段的同時排序,默認也是升序。當第一個字段的取值相同,再根據第二個字段來升序排列

給不同的字段指定不同的排序方式:

再完整地對比下兩種不同的方式:

上面的就是sort_values方法的常見排序方式。

自定義排序

使用sort_values方法排序的時候都是內置的字母或者數值型數據的大小直接來排序,當遇到下面的情況,該如何操作?

當我們根據衣服的大小size來排序,得到的結果是:

明顯這樣的排序方式不是我們理想中的樣子,在我們的認知中:

  • XS:很小

  • S:小

  • M:中等

  • L:大

  • XL:超大

該如何解決這個問題?提供兩種方式:

方法1:通過映射

1、先找到每個size的順序對應的數值大小

2、生成新的字段order

3、我們對order進行排序

方法2:使用CategoricalDtype

CategoricalDtype是具有類別和順序的分類數據的類型,能夠創建我們自定義的排序數據類型。官網地址:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.CategoricalDtype.html

1、指定一個分類的數據類型CategoricalDtype

category_size?=?pd.CategoricalDtype(['XS',?'S',?'M',?'L',?'XL'],?ordered=True)category_size

2、將size字段設置成上面的CategoricalDtype類型

3、我們直接對size使用sort_values就可以達到我們的目的,和上面的map映射的效果是相同的

而且通過查看df的數據類型,我們也看到size的類型是category:

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件

本站qq群955171419,加入微信群請掃碼:

總結

以上是生活随笔為你收集整理的【Python】Pandas数据排序实现的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。