當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pandas 常用操作

發布時間：2025/5/22 编程问答 11 豆豆

生活随笔收集整理的這篇文章主要介紹了 pandas 常用操作小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

刪除操作

刪除列：
df=df.drop('column_label',axis=1)
刪除行：
df=df.drop('row_label')
刪除重復的行: df=df.drop_duplicates(['column_label_one','column_label_two'])
查看

查看行數
len(df) or len(df.index) or df.shape[0]
列數
len(df.columns) or df.shape[1]
數據類型
df.dtypes
重命名

列標簽的重命名
df.rename(columns={"old label": "new label"})?
行標簽的重命名
df.rename(index={"old label": "new label"}?
時間序列的操作

將時間字符串轉換成datetime數據
dt['StartTime'] = pd.to_datetime(dt['StartTime'])
排序

按值排序，可指定列名和排序方式，默認的是升序排序
dt.sort(['StartTime'], inplace=True) or dt.sort(['StartTime'])
照索引（行名）或者列名進行排序,指定axis=0表示按索引（行名）排序，axis=1表示按列名排序，并可指定升序或者降序：
df.sort_index(axis=1, ascending=False)
讀寫操作

讀csv
pd.read_csv('input.csv') | pd.read_table('input.csv', sep=',')

參數 header = None pandas分配默認列名
參數 name = [‘a’, ‘b’, ‘c’] 指定列名
參數 index_col=’idx 指定索引
參數 shiprows = [0, 2, 4] 跳過文件部分行
參數 nrows = 20 只讀取文件前xx行
參數 chunksize = 10000 指定每次讀取行數，分塊讀取，返回TextParse對象
寫csv
pd.to_csv('output.csv')

參數 na_rep = ‘NULL’ 缺失值輸出為指定標記值，默認為空字符串
參數 index = False, header = False 禁止輸出行和列的標簽, 默認輸出
參數 cols=[‘a’, ‘b’] 指定輸出以部分列，并以指定順序排序

原文：https://blog.csdn.net/jekxi/article/details/52936841

轉載于:https://www.cnblogs.com/qbdj/p/11041259.html

總結

以上是生活随笔為你收集整理的pandas 常用操作的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。