當前位置:
首頁 >
pandas使用笔记大全
發布時間:2024/1/23
32
豆豆
生活随笔
收集整理的這篇文章主要介紹了
pandas使用笔记大全
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
DataFrame使用筆記
dates=pd.date_range('20160728',periods=6) #創建固定頻度的時間序列 df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) #創建6*4的隨機數,索引,列名稱。 df2=pd.DataFrame({'A':pd.Timestamp('20160728'),'B':pd.Series(1)})#字典創建Dataframe,假如字典的數據長度不同,以最長的數據為準。 df2.dtypes #查看各行的數據格式 df2.head() df2.tail(5) #查看前、后幾列 df.columns df.value #查看列名、value df.describe() #查看描述性的統計,比如每一列的count、mean、std... df.T df.sort(columns='C') #轉秩、排序 df['A'] df[1:3]#選擇A列數據,選擇1-2行數據,切片操作得到的是行數據。 df.loc[:,['A','B']] #選擇多列數據 df.loc['20160728':'20160730',['A','B']] #選擇局部區域 df.at[dates[0],'A'] #選擇某個值 df.iloc[3] df.iloc[1,1]#提取第四行數據,取第2行第2列的這個數 df.iloc[3:5,0:2] #像array一樣切片操作 df.iloc[[1,2,4],[0,2]] #提取不連續的行和列 df.iat[1,1]#專門取某個數,效率比較高 df[(df.D>0)&(df.C<0)] #選擇D列數據大于0的行 df[['A','B']][(df.D>0)&(df.C<0)]#選擇D列數據大于0的行,只返回A,B兩列 df['D'].isin(alist)#alist是一個預先定義的列表,把要篩選的值寫到列表中,查找D數據中含有alist的值 os.getcwd()#獲得當前的工作目錄 df=pd.read_csv('',encoding='gbk',sep=',')#讀取csv文件 counts=df[u'專業名稱'].value_counts() #計數統計 plt=counts.plot(kind='bar').get_figure() plt.savefig('d/plot.png') #畫圖 good=df[df[u'高考分數']>520] #篩選 good_counts=good[u'專業名稱'].value_counts() per=good_counts/counts #計算百分比,直接利用矩陣的除法 df.groupby('A').first() #按A列分組,輸出每一組的第一行數據 df.groupby(['A','B']) #按兩列分組 #創建函數,作為分組標準。 下例:如果列名是abem中的之一,就分為組別v反之為w def get_type(letter):if letter.lower() in 'abem':return 'v'else:return 'w' grouped=df.groupby(get_type,axis=1)import pandas.util.testing as tm colors=tm.choice(['red','green'],size=10) foods=tm.choice(['eggs','ham'],size=10) #隨機創建兩個數組 index=pd.MultiIndex.from.arrays([colors,foods],names=['color','food']) #創建MultiIndex對象,然后創建DataFrame對象 df.pd.DataFrame(np.random.randn(10,2),index=index) print df.query('color=="red"') #查詢 grouped=df.groupby(level='food')#在分組中使用索引 df.index.names=[None,None] print df.query('ilevel_0=="red"')#刪除了索引名稱,只能使用ilevel_0表示第一個索引- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
#讀寫數據庫 import MySQLdb con=MySQLdb.connect(host="localhost",db="") sql="SELECT * FROM..." df=pd.read_sql(sql,con,index_col='id') con2=execute('DROP TABLE IF EXISTS wheather') pd.io.sql.write_frame(df,"wheather",con2)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
總結
以上是生活随笔為你收集整理的pandas使用笔记大全的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 特征工程——categorical特征
- 下一篇: 使用sklearn进行数据预处理 ——