pandas 常用操作
刪除操作
刪除列:
df=df.drop('column_label',axis=1)
刪除行:
df=df.drop('row_label')
刪除重復的行: df=df.drop_duplicates(['column_label_one','column_label_two'])
查看
查看行數
len(df) or len(df.index) or df.shape[0]
列數
len(df.columns) or df.shape[1]
數據類型
df.dtypes
重命名
列標簽的重命名
df.rename(columns={"old label": "new label"})?
行標簽的重命名
df.rename(index={"old label": "new label"}?
時間序列的操作
將時間字符串轉換成datetime數據
dt['StartTime'] = pd.to_datetime(dt['StartTime'])
排序
按值排序,可指定列名和排序方式,默認的是升序排序
dt.sort(['StartTime'], inplace=True) or dt.sort(['StartTime'])
照索引(行名)或者列名進行排序,指定axis=0表示按索引(行名)排序,axis=1表示按列名排序,并可指定升序或者降序:
df.sort_index(axis=1, ascending=False)
讀寫操作
讀csv
pd.read_csv('input.csv') | pd.read_table('input.csv', sep=',')
參數 header = None pandas分配默認列名
參數 name = [‘a’, ‘b’, ‘c’] 指定列名
參數 index_col=’idx 指定索引
參數 shiprows = [0, 2, 4] 跳過文件部分行
參數 nrows = 20 只讀取文件前xx行
參數 chunksize = 10000 指定每次讀取行數,分塊讀取,返回TextParse對象
寫csv
pd.to_csv('output.csv')
參數 na_rep = ‘NULL’ 缺失值輸出為指定標記值,默認為空字符串
參數 index = False, header = False 禁止輸出行和列的標簽, 默認輸出
參數 cols=[‘a’, ‘b’] 指定輸出以部分列,并以指定順序排序
?
原文:https://blog.csdn.net/jekxi/article/details/52936841
轉載于:https://www.cnblogs.com/qbdj/p/11041259.html
總結
以上是生活随笔為你收集整理的pandas 常用操作的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: shell 运算符
- 下一篇: 使用Swagger创建Api