當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pandas的一些理解

發(fā)布時(shí)間：2023/12/16 编程问答 59 豆豆

生活随笔收集整理的這篇文章主要介紹了 pandas的一些理解小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

pandas 簡(jiǎn)介

numpy 能夠幫我們處理的是數(shù)值型數(shù)據(jù)，但是這還不夠，很多時(shí)候，我們的數(shù)據(jù)除了數(shù)值之外，還有字符串，還有時(shí)間序列等，
這是就需要 pandas 幫我們處理它們了。
什么是Pandas?
Pandas的名稱來自于面板數(shù)據(jù)(panel data)
Pandas是一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集，基于NumPy構(gòu)建，提供了高級(jí)數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作工具，它是使Python成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。
。一個(gè)強(qiáng)大的分析和操作大型結(jié)構(gòu)化數(shù)據(jù)集所需的工具集
?；A(chǔ)是NumPy，提供了高性能矩陣的運(yùn)算
。提供了大量能夠快速便捷地處理數(shù)據(jù)的函數(shù)和方法
。應(yīng)用于數(shù)據(jù)挖掘，數(shù)據(jù)分析
。提供數(shù)據(jù)清洗功能

pandas 的數(shù)據(jù)結(jié)構(gòu)

pandas 庫有兩個(gè)重要的數(shù)據(jù)結(jié)構(gòu)：

Series 系列 [?s??ri?z]

DataFrame Frame [fre?m] 框架

我們可以將 Series 看作顯示了索引的一維數(shù)組，將 DataFrame 看作顯示了縱橫軸索引的二維數(shù)組，因此 numpy 的許多方法與函數(shù)可以用在 Series 與 DataFrame 上。

Series對(duì)象

我們首先來了解 Series ，因?yàn)?Pandas 是基于NumPy構(gòu)建的，所以我們可以參考一維數(shù)組對(duì)象來理解 Series對(duì)象。

import numpy as np import pandas as pd list_1=list(range(1,6)) arr=np.array(list_1) ser=pd.Series(list_1) print(f'這是由 1 到 5 構(gòu)成的一維數(shù)組，只有數(shù)據(jù)元素：\n{arr}') print(f'這是由 1 到 5 構(gòu)成的Series對(duì)象，由數(shù)據(jù)元素及其索引：\n{ser}')

由此我們可以更好的理解 Ndarray 對(duì)象和 Series 對(duì)象，

數(shù)據(jù)類型不同：兩者都是一系列同類型數(shù)據(jù)的集合，不同之處在于 Ndarray 對(duì)象只能存儲(chǔ)數(shù)值型數(shù)據(jù)，而一個(gè)Series 對(duì)象中可以同時(shí)包含數(shù)值型數(shù)據(jù)；字符串和python 對(duì)象等等；

兩者的索引都是由 0 開始的，不同之處在于 Series 對(duì)象的索引可以重新指定，而 Ndarray 對(duì)象的索引不能變更；且 Series 對(duì)象的索引會(huì)在內(nèi)容中顯示出來，而Ndarray 對(duì)象的索引不會(huì)在內(nèi)容中顯示出來。

Series 對(duì)象的創(chuàng)建：

pandas. Series ( data , index , dtype , name , copy )

data：只要是數(shù)據(jù)都可以，當(dāng)data的類型為字典時(shí)，鍵為索引，值作內(nèi)容。

index：默認(rèn)從零開始，當(dāng)指定索引時(shí)，索引的個(gè)數(shù)要等于數(shù)據(jù)元素的個(gè)數(shù)。

dtype：元素的數(shù)據(jù)類型，默認(rèn)會(huì)自己判斷

name：設(shè)置索引和元素值的名稱
Series . name=str 設(shè)置元素值的名稱
Series . index.name=str 設(shè)置索引的名稱

copy：拷貝數(shù)據(jù)，默認(rèn)為 False

import numpy as np import pandas as pd data={'name':'張三','age':20,'class':'三班'} ser=pd.Series(data) print(ser) print('利用 Series 對(duì)象的屬性，index和values訪問其索引值與元素值：') print(ser.index) print(ser.values)

DataFrame 對(duì)象

DataFrame 是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu)，它含有一組有序的列，每列可以是不同的值類型（數(shù)值、字符串、布爾型值）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 組成的字典（共同用一個(gè)索引）。可以參考 excel 表格

DataFrame 構(gòu)造方法如下：

pandas.DataFrame( data, index, columns, dtype, copy)

參數(shù)說明：

data：一組數(shù)據(jù)(ndarray、series, map, lists, dict 等類型)。

index：索引值，或者可以稱為行標(biāo)簽，默認(rèn)為 RangeIndex (0, 1, 2, …, n) 。

columns：列標(biāo)簽，默認(rèn)為 RangeIndex (0, 1, 2, …, n) 。

dtype：數(shù)據(jù)類型。

copy：拷貝數(shù)據(jù)，默認(rèn)為 False。

Pandas DataFrame 是一個(gè)二維的數(shù)組結(jié)構(gòu)，類似二維數(shù)組。
DataFrame 的構(gòu)建

data 為字典類型：

鍵作索引，值作內(nèi)容。

由數(shù)組，列表或元組構(gòu)成的字典；

import numpy as np import pandas as pd data={'a':[1,2,3,4],'b':(4,5,6,7),'c':np.arange(9,13)} frame=pd.DataFrame(data) print(f'DataFrame對(duì)象：\n{frame}') string='''通過屬性 index 查看對(duì)象的行索引;columns查看對(duì)象列索引；values查看對(duì)象的值。''' print(string) print(f'行索引：{frame.index}') print(f'列索引：{frame.columns}') print(f'元素值：\n{frame.values}') print('指定索引：') frame=pd.DataFrame(data,index=['A','B','C','D'],columns=['a','b','c','d']) print(frame)

2. 由 Series對(duì)象構(gòu)成的字典；

import numpy as np import pandas as pd data={'a':pd.Series(np.arange(3)),'b':pd.Series(np.arange(3,5)) } frame=pd.DataFrame(data) print(frame)

由字典構(gòu)成的字典；

import numpy as np import pandas as pd data={'a':{'apple':3.6,'banana':5.6},'b':{'apple':3,'banana':5},'c':{'apple':3.6} } frame=pd.DataFrame(data) print(frame)

data 為列表類型：

data為二維數(shù)組時(shí)；

由 Series對(duì)象構(gòu)成的列表；

由字典構(gòu)成的列表；

import numpy as np import pandas as pd arr=np.arange(12).reshape(4,3) frame_arr=pd.DataFrame(arr) print('data為二維數(shù)組時(shí)；') print(frame_arr) list_dic=[{'apple':3.6,'banana':5.6},{'apple':3,'banana':5},{'apple':3.6}] frame_list_dic=pd.DataFrame(list_dic) print('由字典構(gòu)成的列表；') print(frame_list_dic) list_ser=[pd.Series(np.random.rand(3)),pd.Series(np.random.rand(2))] frame_list_ser=pd.DataFrame(list_ser) print(f'由字典構(gòu)成的列表；\n{frame_list_ser}')

索引

與python列表一樣，在 Series對(duì)象和 DataFrame 對(duì)象中我們同樣可以使用索引來進(jìn)行數(shù)據(jù)的增，刪，改，查。

在 pandas 中索引分為以下種：

位置索引：對(duì)象默認(rèn)的索引，從 0 開始。Series 對(duì)象中的index 和 DataFrame對(duì)象中的 index 和 columns 都是默認(rèn)從 0 開始。

標(biāo)簽索引：對(duì)默認(rèn)索引進(jìn)行指定后的索引稱為標(biāo)簽索引。

布爾索引：用布爾運(yùn)算布爾運(yùn)算充當(dāng)索引，返回一個(gè)由布爾值組成的對(duì)象。

切邊索引：用逗號(hào)分隔不同維度，同一維度之間通過冒號(hào)分隔切片參數(shù) start:stop:step 來進(jìn)行切片操作，位置標(biāo)索引和標(biāo)簽索引都可以充當(dāng)切片參數(shù)。

import numpy as np import pandas as pd ser_1=pd.Series(['張三',24,'三班','男']) print(f'未指定索引時(shí)：\n{ser_1}') ser_2=pd.Series(['張三',24,'三班','男'],index=('name','age','class','sex')) print(f'重新編輯索引后：\n{ser_2}') arr=np.random.randint(0,12,(3,4)) df_1=pd.DataFrame(arr) print(f'未指定索引時(shí)：\n{df_1}') df_2=pd.DataFrame(arr,index=list('abc'),columns=list('ABCD')) print(f'重新編輯索引后：\n{df_2}')

我們可以通過兩種索引來進(jìn)行數(shù)據(jù)的增，刪，改，查。

通過索引獲取元素

因?yàn)?Pandas 是基于NumPy構(gòu)建的，所以 pandas 可以使用數(shù)組的操作，可以參考數(shù)組的索引來獲取元素值。

import numpy as np import pandas as pd data={'name':'張三','age':20,'class':'三班','sex':'男'} ser=pd.Series(data) print(f'Series對(duì)象：\n{ser}') print('獲取單個(gè)元素：') print(f'方法一通過下標(biāo) ser[1]：{ser[1]}') print(f"方法二通過標(biāo)簽名 ser['age']：{ser['age']}") print('獲取多個(gè)元素：') print(f'方法一通過下標(biāo)與標(biāo)簽名：\n下標(biāo):ser[[1,3]]=\n{ser[[1,3]]}') print(f"標(biāo)簽名：ser[['name','sex']]=\n{ser[['name','sex']]}") print(f"通過下標(biāo)切片：\n{ser[0:3]}") print(f"通過標(biāo)簽名切片：\n{ser['name':'sex']}")

Series對(duì)象的常用屬性與方法

屬性：

Series. index
Series.values

作用：訪問Series對(duì)象的索引值與元素值

方法

Series. isnull ( )
Series. notnull ( )

作用：查找缺失值，也就是 nan。

import numpy as np import pandas as pd from pandas.core.indexes.base import Index data={'name':'張三','age':20,'class':'三班'} string='''在使用字典作為數(shù)據(jù)時(shí)，指定索引的個(gè)數(shù)可以超出元素值的個(gè)數(shù)，多余的索引對(duì)應(yīng)值為 nan：''' print(string) ser=pd.Series(data,index=['name','age','class','sex']) print(ser) print(f'isnull()方法判斷Series對(duì)象中是否有缺失值 nan，空為True：\n{ser.isnull()}') print(f'notnull()方法與上述類似，這個(gè)是非空為True：\n{ser.notnull()}')

Series. head ( n : int = 5)
Series. tail ( n : int = 5)

作用：在 Series 對(duì)象中從前面取 n 行；從后面取 n 行，默認(rèn) n = 5

Series. unique ( ) - - - >array

作用：去重

Series. value_counts ( ) - - - >Series

作用：檢查每個(gè)元素出現(xiàn)的次數(shù)。

import numpy as np import pandas as pd ser=pd.Series([2,5,6,7,4,5,2,3,6,4]) print(ser) print('*'*20) print(ser.unique()) print('*'*20) print(ser.value_counts())

DataFrame對(duì)象常見的屬性與方法

屬性：

DataFrame. values - - -> 返回一個(gè)二維數(shù)組
DataFrame. index - - -> 返回一個(gè)Index對(duì)象
DataFramecolumns - - -> 返回一個(gè)Index對(duì)象

方法：

apply與applymap

DataFrame. apply ( func, axis = 0) -> DataFrame
DataFrame. applymap ( func )-> DataFrame

func：函數(shù)
apply 中應(yīng)用對(duì)象中于每列或每行的函數(shù) ；applymap中應(yīng)用于對(duì)象中每個(gè)有元素的函數(shù)。

axis : 軸：{0或’index’，1或’columns’}，默認(rèn)為0
沿其應(yīng)用功能的軸：
0或’index’：將函數(shù)應(yīng)用于每個(gè)縱軸。
1或’columns’：將函數(shù)應(yīng)用于每個(gè)橫軸。

apply ( ) 方法同樣適用于 Series 對(duì)象。

import numpy as np import pandas as pd df=pd.DataFrame(np.random.randn(4,3)) print(df) df=df.abs() print(f'求每個(gè)元素中的絕對(duì)值：\n{df}') f=lambda x : x.max() df_apply=df.apply(f) print(f'求每一列中的最大值：\n{df_apply}') f=lambda x:f'{x:.2f}' df_applymap=df.applymap(f) print(f'將每個(gè)元素保留兩位小數(shù)：\n{df_applymap}')

排序方法：

索引排序

sort_index( axis , ascending)

axis ['?ks?s] : int, default 0
指定軸來直接排序。對(duì)于系列，此值只能為0。
ascending [?’send??] 升序：布爾值或布爾值列表，默認(rèn)為True，當(dāng)索引為多索引時(shí)，可以單獨(dú)控制每個(gè)級(jí)別的排序方向。

import numpy as np import pandas as pd ser=pd.Series([2,1,4,3],index=list('cbda')) df=pd.DataFrame(np.arange(12).reshape(3,4),index=list('cab'),columns=list('DACB')) print(ser,df,sep='\n') print(f'按索引排序，默認(rèn)升序：\n{ser.sort_index()}') print(f'按縱軸排序，默認(rèn)升序：\n{df.sort_index()}') print(f'按橫軸排序，默認(rèn)升序：\n{df.sort_index(axis=1)}')

2. 按值排序

sort_values (by , axis , ascending)

by : str or list of str。指定要排序的名稱或名稱列表。
作用：沿任一軸按值排序。

import numpy as np import pandas as pd ser=pd.Series([2,1,4,3],index=list('cbda')) df=pd.DataFrame(np.random.randint(0,12,(4,3)),index=list('cabd'),columns=list('ACB')) print(ser,df,sep='\n') print(f"按值引排序，默認(rèn)升序：\n{ser.sort_values()}") print(f"按值引排序，指定單軸，默認(rèn)升序：\n{df.sort_values(by='A')}") print(f"按值引排序，指定多軸，默認(rèn)升序：\n{df.sort_values(by=['A','B'])}")

成員關(guān)系判斷

isin ( values )

參數(shù)
values : iterable, Series, DataFrame or dict
返回
DataFrame of booleans 布爾型數(shù)據(jù)框
Series of booleans 布爾型系列

處理缺失數(shù)據(jù)的方法

第一步：判斷是否存在缺失值

isnull ( ) - - - > DataFrame of booleans

第二步：丟失缺失數(shù)據(jù)或填充缺失數(shù)據(jù)

dropna ( axis = 0)
作用：丟失缺失值所在的行或列。

fillna ( values )
作用：將值 values 填充在 nan 值所在的位置

簡(jiǎn)介介紹：

轉(zhuǎn)置

print(f'轉(zhuǎn)置之后，行列交換：\n{frame.T}')

通過列索引獲取列數(shù)據(jù)（ Series 類型）

print(f"查看其中一列frame['a']：\n{frame['a']}")

增加列數(shù)據(jù)

frame['e']=9 frame['f']=[7,8,5,2]

刪除列

del frame['e'] del frame['f'] import numpy as np import pandas as pd arr=np.arange(12).reshape(4,3) frame=pd.DataFrame(arr,index=['A','B','C','D'],columns=['a','c','d']) print(f'DataFrame對(duì)象：\n{frame}') print(f'轉(zhuǎn)置之后，行列交換：\n{frame.T}') print(f"查看其中一列frame['a']：\n{frame['a']}") print(f"frame['a']的類型：{type(frame['a'])}") frame['e']=9 frame['f']=[7,8,5,2] print(f"插入一列：\n{frame}") del frame['e'] del frame['f'] print(f"刪除一列：\n{frame}")

索引操作：

Series 和 DataFrame 中的索引都是 Index 對(duì)象。

import numpy as np import pandas as pd arr=np.arange(12).reshape(4,3) ser=pd.Series(range(7)) frame=pd.DataFrame(arr,index=['A','B','C','D'],columns=['a','c','d']) print(f'Series對(duì)象的索引類型type(ser.index)：\n{type(ser.index)}') print(f'DataFrame對(duì)象的索引類型type(frame.index)：\n{type(frame.index)}') print(f'type(frame.columns)： {type(frame.columns)}')

重建索引：

Series. reindex ( )
DataFrame. reindex ( )

增：
增加Series對(duì)象的索引：

Series [ new_index ] = value
在原基礎(chǔ)上新增一個(gè)
Series. append ( other_Series )
將兩個(gè)對(duì)象合并成一個(gè)新的對(duì)象，并不改變?cè)瓉淼膶?duì)象

增加 DataFrame 對(duì)象的索引：

import numpy as np import pandas as pd arr=np.arange(9).reshape(3,3) ser=pd.Series(range(5),index=['a','b','c','d','e']) frame=pd.DataFrame(arr,index=['a','b','c'],columns=['A','B','C']) print(frame) print('默認(rèn)增加列 :') frame['4']=9 frame['D']=[10,11,12] frame.insert(0,'E',[6,66,666]) print(frame) print('使用標(biāo)簽索引增加行：') frame.loc['x']=[1,11,111,111,11,1] print(frame)

刪：

改：

查：

pandas庫的一些算數(shù)方法

pandas庫的一些統(tǒng)計(jì)方法

方法說明

count	非NA值的個(gè)數(shù)
min , max	最小值與最大值
idxmin , idxmax	最小值與最大值的索引值
sum , mean	總和與平均數(shù)
var , std	樣本值的方差與標(biāo)準(zhǔn)差
cumsum	樣本值的累計(jì)和
cumprod	樣本值的累計(jì)積
cummin , cummax	樣本值的累計(jì)最大值和最小值
describe	計(jì)算匯總統(tǒng)計(jì)

參數(shù)：

axis = 0 按縱軸求，默認(rèn)為0；axis = 1 按橫軸求。

skipna = True,跳過缺失值。

pandas庫的一些算術(shù)方法

方法描述

add , radd	加法（+）
sub , rsub	減法（-）
div , rdiv	除法（/）
floordiv , rfloordiv	整除（//）
mul , rmul	乘法（*）
pow , rpow	冪次方（**）

參數(shù)

fill_value：填充值，將na值填充掉

r：r 代表者翻轉(zhuǎn)，即參數(shù)位置互換，除數(shù)變成被除數(shù)；被除數(shù)變成除數(shù)。

pandas庫中數(shù)據(jù)的加載與存儲(chǔ)

從電腦中讀取CSV文件：

方法說名

read_csv ( )	從文件對(duì)象中加載帶分隔符的數(shù)據(jù)，默認(rèn)逗號(hào)為分割符
read_table ( )	從文件對(duì)象中加載帶分隔符的數(shù)據(jù)，默認(rèn)制表符為分割符
read_excel ( )	從 excel 中讀取表格數(shù)據(jù)

參數(shù)：

參數(shù)說明

path	表示文件對(duì)象所在系統(tǒng)位置的字符串
sep	拆分每行字段的字符串或正則表達(dá)式
header	默認(rèn)第一行為列索引，若沒有索引時(shí)應(yīng)設(shè)置為None
index_col	從列索引中選一個(gè)或多個(gè)組成列表，當(dāng)作行索引
names	用于結(jié)果的列名稱，結(jié)合 header = None使用
skipeows	跳過幾行，（從 0 開始）
skip_footer	忽略幾行，（從文件末尾處算起）
nrows	讀取幾行，（從 0 開始）
na_values	替換 NA 值
iterator	布爾類型，返回一個(gè)TextParser進(jìn)行迭代讀取
chunksize	整型，作用同上，兩者結(jié)和文件對(duì)象方法 get_chunksize ( ) 使用。

將pandas數(shù)據(jù)寫入電腦

DataFrame. to_csv ( path )

path：寫入路徑

數(shù)據(jù)清洗與準(zhǔn)備

刪除缺失數(shù)據(jù)

方法說明

isnull	返回布爾值組成的對(duì)象，空為True
notnull	返回布爾值組成的對(duì)象，非空為True
dropna	刪除缺失值所在的行或列
fillna	替換缺失值

dropna (axis , how , thresh , inplace )

參數(shù)：

axis 軸：{0或’index’，1或’columns’}，默認(rèn)為0
刪除缺少值所在的行或列

how 如何刪除：{‘a(chǎn)ny’，‘a(chǎn)ll’}，默認(rèn)為’any’.
“any”：只要存在一個(gè)NA值，就刪除該行或列。
“all”：只有全部為NA值，才刪除該行或列。

thresh： int, optional，NA值的數(shù)量是 int 的行或列才會(huì)被刪除。

inplace就地；原地bool類型, default False
False：返回一個(gè)新對(duì)象，不改變?cè)瓕?duì)象
True：不返回對(duì)象，直接改變?cè)瓕?duì)象。

填充缺失數(shù)據(jù)

fillna ( value , axis , method , inplace , limit )

參數(shù)：

value ：替換NA值

axis ,

method 填充方法：{‘backfill’，‘bfill’，‘pad’，‘ffill’，None}，默認(rèn)無。
pad/ffill：將上一個(gè)有效觀察向前傳播到下一個(gè)有效觀察，
backfill / bfill：使用下一個(gè)有效觀測(cè)值填充間隙。

inplace , 同上

limit ：int, default None
如果指定了method方法，則這是要向前/向后填充的連續(xù)NaN值的最大數(shù)目。
如果未指定method方法，則這是沿整個(gè)軸填充NAN的最大條目數(shù)。
如果不是無，則必須大于0。

替換數(shù)據(jù)

replace ( to_replace , value , method , inplace , limit )

作用：將對(duì)象內(nèi)的值 to_replace 用指定值 value 進(jìn)行替換

刪除重復(fù)項(xiàng)

drop_duplicates ( subset , keep , inplace , ignore_index) - - -> DataFrame

參數(shù)：

subset ：列標(biāo)簽組成的列表，默認(rèn)情況下使用所有列。
以選中的列為標(biāo)準(zhǔn)，進(jìn)行去重

keep ：保留：{‘first’，‘last’，False}，默認(rèn)值為’first’
‘first’：除去第一次出現(xiàn)的重復(fù)項(xiàng)。
‘last’：刪除除最后一次出現(xiàn)之外的重復(fù)項(xiàng)。
False：刪除所有重復(fù)項(xiàng)。

inplace ：同上

ignore_index ：忽略索引：bool，默認(rèn)為False

軸索引的重命名：

區(qū)分：方法 reindex ( ) 只能調(diào)整索引的順序，而不能改變索引的名稱。

import numpy as np import pandas as pd df=pd.DataFrame(np.arange(12).reshape(3,4),index=['BeiJing','Tokyo','New York'],columns=['one','two','three','four']) print(df) print('*'*20) print(df.reindex(['BeiJing','New York','Tokyo'])) print('*'*20) print(df.reindex(['a','b','c']))

改變索引的名稱：

利用對(duì)象屬性 index , columns 進(jìn)行重命名，直接更改原對(duì)象。

import numpy as np import pandas as pd df=pd.DataFrame(np.arange(12).reshape(3,4),index=['BeiJing','Tokyo','New York'],columns=['one','two','three','four']) print(df) up=lambda x:x[:4].upper() df.index=df.index.map(up) print('*'*20) print(df) df.index=['a','b','c'] print('*'*20) print(df)

使用方法 rename 對(duì)索引進(jìn)行更新與重命名

rename ( index , columns , inplace)

import numpy as np from numpy.core.defchararray import index import pandas as pd df=pd.DataFrame(np.arange(12).reshape(3,4),index=['BeiJing','Tokyo','New York'],columns=['one','two','three','four']) print(df) print('*'*20) print(df.rename(index=str.title,columns=str.upper)) print('*'*20) print(df.rename(index={'Tokyo':'東京'},columns={'three':'第三年'}))

數(shù)據(jù)清洗總結(jié)：

常見問題解決方法檢測(cè)方法解決方法

異常數(shù)據(jù)	刪除異常數(shù)據(jù)所在的行		drop ( )
NA值問題	填充或刪除	isnull ( )	fillna( ) , dropna( )
重復(fù)數(shù)據(jù)	刪除重復(fù)數(shù)據(jù)	duplicated ( )	drop_duplicates ( )
數(shù)據(jù)類型變更	變更數(shù)據(jù)類型,指定新類型		astype ( )
部分?jǐn)?shù)據(jù)包含數(shù)值和字符串	進(jìn)行字符串操作，		map ( )
不利于分析的數(shù)據(jù)	替換數(shù)據(jù)元素		replace ( )

數(shù)據(jù)規(guī)整

層次化索引

數(shù)據(jù)連接

DataFrame. merge ( left , right , how=‘inner’ , on=None , left_on=None , right_on = None )

未完待續(xù)！！！！！

總結(jié)

以上是生活随笔為你收集整理的pandas的一些理解的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

pandas

上一篇： java中的character_什么是J
下一篇： Pygame实战：这款“欢乐打地鼠”小游

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

pandas的一些理解

pandas 簡(jiǎn)介

pandas 的數(shù)據(jù)結(jié)構(gòu)

Series對(duì)象

Series 對(duì)象的創(chuàng)建：

DataFrame 對(duì)象

DataFrame 構(gòu)造方法如下：

data 為字典類型：

data 為列表類型：

索引

通過索引獲取元素

Series對(duì)象的常用屬性與方法

屬性：

方法

DataFrame對(duì)象常見的屬性與方法

屬性：

方法：

apply與applymap

排序方法：

成員關(guān)系判斷

處理缺失數(shù)據(jù)的方法

簡(jiǎn)介介紹：

索引操作：

pandas庫的一些算數(shù)方法

pandas庫的一些統(tǒng)計(jì)方法

pandas庫的一些算術(shù)方法

pandas庫中數(shù)據(jù)的加載與存儲(chǔ)

從電腦中讀取CSV文件：

將pandas數(shù)據(jù)寫入電腦

數(shù)據(jù)清洗與準(zhǔn)備

刪除缺失數(shù)據(jù)

填充缺失數(shù)據(jù)

替換數(shù)據(jù)

刪除重復(fù)項(xiàng)

軸索引的重命名：

數(shù)據(jù)清洗總結(jié)：

數(shù)據(jù)規(guī)整

層次化索引

數(shù)據(jù)連接

總結(jié)