Pandas数据结构简介
Series
Series 類似一維數(shù)組,由一組數(shù)據(jù)及一組相關(guān)數(shù)據(jù)標(biāo)簽組成。使用pandas的Series類即可創(chuàng)建。
import pandas as pd s1 = pd.Series(['a', 'b', 'c,', 'd']) print(s1) 復(fù)制代碼#輸出: 0 a # 1 b # 2 c # 3 d # dtype: object復(fù)制代碼上面是傳入一個(gè)列表實(shí)現(xiàn),上面的0,1,2,3就是數(shù)據(jù)的默認(rèn)標(biāo)簽。另外可以通過index屬性自定義標(biāo)簽。
s2 = pd.Series(['1', '2', '3,', '4'],index=['a', 'b', 'c,', 'd']) # index設(shè)置自定義索引 print(s2)復(fù)制代碼另外Series還可以通過字典傳參。
s3 = pd.Series({'a':1,'b':2}) print(s3.values) # 通過values獲取它的值復(fù)制代碼DataFrame
DataFrame是由一組數(shù)據(jù)和一組索引組成的數(shù)據(jù)結(jié)構(gòu),有行索引和列索引。和excel類似,是一種表格型數(shù)據(jù)結(jié)構(gòu)。下面的就是一種簡單的DataFrame數(shù)據(jù)格式。
技能 0 python 1 Java復(fù)制代碼DataFrame類中可傳入列表實(shí)例化一個(gè)dataframe的表格數(shù)據(jù)對象,此時(shí)行和列索引默認(rèn)都是0.常見的是傳入嵌套的列表,嵌套的里面的列表也可以是元祖,如果不指定索引行列索引都是從0,1開始自增,并可以通過columns、index自定義的列索引和行索引。詳見下面的代碼。
import pandas as pd df2 = pd.DataFrame([('a','A'),('b','B'),('c','C'),('d','D')]) # 傳一個(gè)嵌套列表,嵌套里的數(shù)據(jù)可以是元祖,也可是列表 print(df2)復(fù)制代碼輸出的格式如下:? ??
? ? 0? ? ?1?
0? ?a? ? A?
1? ?b? ? B?
2? ? c? ? C?
3? ? d? ? D
? ? 小寫? 大寫??
0? a? ? ? ? A
1? b? ? ? ? B
2? c? ? ? ? C
3? d? ? ? ?D
DataFrame類中也可傳入字典來實(shí)例化一個(gè)dataframe的表格數(shù)據(jù)對象,此時(shí)字典的key就相當(dāng)于列索引,此時(shí)行索引默認(rèn)還是從0開始,另外也可通過 index來自定義列索引。
轉(zhuǎn)載于:https://juejin.im/post/5cc0895a5188250a80187d2e
總結(jié)
以上是生活随笔為你收集整理的Pandas数据结构简介的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 高吞吐、低延迟 Java 应用的 GC
- 下一篇: 绘图和可视化---matplotlib包