pandas基础操作
生活随笔
收集整理的這篇文章主要介紹了
pandas基础操作
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
3.1panda基礎操作
頭文件:
import numpy as np import pandas as pd創建pandas序列
pandas會默認添加序號
s = pd.Series([1,3,6,np.nan,44,1])創建時間序列。periods=6:生成六個數據
dates = pd.date_range('20160101',periods=6)自己定義數據標簽
index是值行標簽。colums是列標簽
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['A','B','C','D'])字典創建法
df2 = pd.DataFrame({'A':1.,'B':pd.Timestamp('20130102'),'C':pd.Series(1,index=list(range(4)),dtype='float32'),'D':np.array([3]*4,dtype='int32'),'E':pd.Categorical(["test","train","test","train"]),'F':'foo' })打印各列的數據形式
print(df2.dtypes)返回所有行的序號
print(df2.index)返回所有列的序號
print(df2.columns)返回所有的值
print(df2.values)對各列的描述:count mean min等等
df2.describe()轉置!行變列,列變行
df2.T排序
#按列標簽排序 False是倒序,True是正序 df2.sort_index(axis=1,ascending=False)#按指定標簽下的數值進行排序 df2.sort_values(by='E')3.2pandas選擇數據
頭文件:
import numpy as np import pandas as pd選擇標簽‘A’的數據
dates = pd.date_range('20130101',periods=6) df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['A','B','C','D']) print(df['A']) #等同與df.A切片
print(df[0:3]) print(df['20130102':'20130104'])根據標簽選擇數據:loc
print(df.loc['20130102']) print(df.loc['20130102',['A','B']])根據位置選擇數據:iloc
print(df.iloc[3:5,1:3])綜合選擇:ix (已被棄用)
#print(df.ix[:3,['A','C']])根據閾值選擇數據
print(df[df.A > 1])#若只打印A這一列大于8的數據 print(df['A'][df['A']>1])3.3pandas設置值
頭文件:
import numpy as np import pandas as pd根據序列改
dates = pd.date_range('20130101',periods=6) df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['A','B','C','D'])df.iloc[2,2] = 1111根據標簽改
df.loc['20130101','B'] = 2222把A>1的部分的所有值都改成0(不止標簽A部分)
df[df.A>1] = 0只把A部分大于1的部分改成0
df.A[df.A>1] = 0增加一列標簽
df['F'] = np.nan df['E'] = pd.Series([1,2,3,4,5,6],index = pd.date_range('20130101',periods=6)) 創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的pandas基础操作的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 女性做梦梦到好多蟑螂是什么征兆
- 下一篇: pandas处理丢失数据与数据导入导出