當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

一个参数一个Excel表，让你玩转Pandas中read_excel()表格读取！

發(fā)布時(shí)間：2024/9/15 编程问答 44 豆豆

生活随笔收集整理的這篇文章主要介紹了一个参数一个Excel表，让你玩转Pandas中read_excel()表格读取！小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本文大綱

我覺(jué)得很有必要講述這個(gè)文章，進(jìn)行數(shù)據(jù)處理的第一步就是Python數(shù)據(jù)讀取。但是你可能沒(méi)想到，在進(jìn)行數(shù)據(jù)讀取的同時(shí)，我們其實(shí)可以配合相關(guān)參數(shù)做很多事兒，這對(duì)于后續(xù)的數(shù)據(jù)處理都是極其有幫助。

read_excel()函數(shù)和read_csv()函數(shù)，在參數(shù)上面有很多相同點(diǎn)，因此我就以read_excel()函數(shù)為例，進(jìn)行詳細(xì)的說(shuō)明。

參數(shù)詳解

1）sheet_name參數(shù)

含義：選擇要讀取的sheet表；
sheet_name=0表示默認(rèn)讀取第一個(gè)sheet表，等同于sheet_name=“sheet名稱(chēng)”；
sheet_name=[“sheet名”，0]會(huì)返回一個(gè)字典，然后可以利用鍵獲取每一個(gè)sheet表中的數(shù)據(jù)；
sheet_name=None也會(huì)返回一個(gè)字典，但是會(huì)返回全部的sheet表；

① sheet_name=0和sheet_name="Sheet1"

#?下面這兩個(gè)讀取方式等同。 #df2?=?pd.read_excel("readexcel.xlsx",sheet_name=0) df2?=?pd.read_excel("readexcel.xlsx",sheet_name="Sheet1") df2

結(jié)果如下：

② sheet_name=[“sheet名”，0]

df2?=?pd.read_excel("readexcel.xlsx",sheet_name=[0,1]) df2

結(jié)果如下：

接著，我們可以使用鍵值對(duì)的方式，獲取每個(gè)sheet表中的數(shù)據(jù)。

注：關(guān)于sheet_name=None效果同上，只不過(guò)會(huì)返回所有的sheet表中的數(shù)據(jù)。

2）header參數(shù)

含義：指定某一行作為表頭；
header=None專(zhuān)門(mén)針對(duì)沒(méi)有表頭的表，這也是默認(rèn)值；
header=1指定第一行作為表頭；
header=[]主要針對(duì)復(fù)合表頭的情況；

① header=None

df3?=?pd.read_excel("header.xlsx",header=None) df3

結(jié)果如下：

② ?header=1

df3?=?pd.read_excel("header.xlsx",sheet_name=2,header=1)? df3

結(jié)果如下：

③ header=[]

df3?=?pd.read_excel("header.xlsx",sheet_name=3,header=[0,1],index_col=0)? df3

結(jié)果如下：

注意：上述用到了一個(gè)index_col參數(shù)，這個(gè)參數(shù)用于指定作為行索引的列，我就不詳細(xì)舉例了，看看下圖。

3）usecols參數(shù)

含義：選擇讀取一張表中的指定列；
usecols=None也是默認(rèn)情況，表示讀取所有列；
usecols=[A,C]表示只選取A列和C列。usecols=[A,C:E]表示選擇A列，C列、D列和E列；
usecols=[0,2]表示只選擇第一列和第三列；
usecols=["列名1","列名2"...]這也是推薦使用的一種寫(xiě)法；

① usecols=None

df4?=?pd.read_excel("usecols.xlsx",usecols=None)?#?默認(rèn) df4

結(jié)果如下：

② usecols=[A,C]

df4?=?pd.read_excel("usecols.xlsx",usecols="A,C")? df4

結(jié)果如下：

③ usecols=[A,C:D]

df4?=?pd.read_excel("usecols.xlsx",usecols="A,C:D")? df4

結(jié)果如下：

④ usecols=[0,2]

df4?=?pd.read_excel("usecols.xlsx",usecols=[0,2])? df4

結(jié)果如下：

⑤ usecols=["列名1","列名2"...]

這種方式照說(shuō)是沒(méi)有任何問(wèn)題的，但是在我這邊運(yùn)行總是無(wú)結(jié)果，我很納悶，大家可以下去試試。

4）names參數(shù)

含義：如果表中沒(méi)有表頭，可以用這個(gè)參數(shù)添加一個(gè)標(biāo)題。如果表中有表頭，可以用這個(gè)參數(shù)修改標(biāo)題。

names?=?["月份","語(yǔ)文","英語(yǔ)"] df6?=?pd.read_excel("names.xlsx",header=None,names=names)? df6

結(jié)果如下：

5）dtype參數(shù)

含義：讀取數(shù)據(jù)時(shí)，設(shè)置每一列的數(shù)據(jù)類(lèi)型（重要）；
dtype={}傳入一個(gè)字典，類(lèi)似于{"列名":"類(lèi)型"}；

df7?=?pd.read_excel("dtype.xlsx") df7.dtypes ------------------------------------------------------ df7?=?pd.read_excel("dtype.xlsx",dtype={"年齡":"str"}) df7.dtypes

結(jié)果如下：

6）parse_dates參數(shù)

含義：指定將哪些列，解析為日期格式；
parse_dates=True是專(zhuān)門(mén)用于將行索引，解析為日期格式；
parse_dates=[0,1,2,3,4]和parse_dates=["列名1","列名2","列名3","列名4"]，都是將指定列一起解析為日期格式；
parse_dates=[[1,2,3]]和parse_dates=[["年","月","日"]]，都是將多個(gè)列，解析為單個(gè)日期列；
parse_dates={"日期":[1,2,3]}不僅將多個(gè)日期列解析為單個(gè)日期列，同時(shí)還為這一列命名；

① parse_dates=True

df8?=?pd.read_excel("parse_dates",index_col=2,parse_dates=True) df8.index

結(jié)果如下：

② parse_dates=[0,1]和parse_dates=["列名1","列名2"]

df8?=?pd.read_excel("parse_dates",parse_dates=[0,1,2,3,4]) df8.dtypes #?這個(gè)代碼效果同上 df8?=?pd.read_excel("parse_dates.xlsx",parse_dates=["數(shù)值日期1","文本日期2","文本日期3","文本日期4","文本日期5"])

結(jié)果如下：

③ parse_dates=[[1,2,3]]和parse_dates=[["年","月","日"]]

#df8?=?pd.read_excel("parse_dates.xlsx",sheet_name="Sheet2",parse_dates=[["年","月","日"]]) df8?=?pd.read_excel("parse_dates.xlsx",sheet_name="Sheet2",parse_dates=[[1,2,3]]) df8

結(jié)果如下：

④ parse_dates={"日期":[1,2,3]}

df8?=?pd.read_excel("parse_dates.xlsx",sheet_name="Sheet2",parse_dates={"日期":[1,2,3]}) df8

結(jié)果如下：

7）date_parser參數(shù)

含義：利用lambda函數(shù)，將某個(gè)字符串列，解析為日期格式；
一般是配合parse_dates參數(shù)，一起使用；

df9?=?pd.read_excel("date_parser.xlsx",parse_dates=[1],date_parser=lambda?x:?pd.to_datetime(x,format="%Y年%m月%d")) print(df9.dtypes) df9

結(jié)果如下：

8）na_values參數(shù)

含義：用于將某些特定的值，解析為NaN值，然后便于我們后面做缺失值的處理；
na_values=”值1“表示將所有數(shù)據(jù)中值1全部替換為NaN；
na_values=[”值1“,"值2"]表示將所有數(shù)據(jù)中值1、值2全部替換為NaN；
na_values={"列1":[”值1“,"值2"]}表示將第一列中所有的值1、值2全部替換為NaN；

① na_values=”值1“

df10?=?pd.read_excel("na_values.xlsx",na_values="?") df10

結(jié)果如下：

② na_values=[”值1“,"值2"]

df10?=?pd.read_excel("na_values.xlsx",na_values=["a","0"]) df10

結(jié)果如下：

③ na_values={"列1":[”值1“,"值2"]}

#??只替換某一列中的某些值為NaN df10?=?pd.read_excel("na_values.xlsx",na_values={"列2":["0","?"]}) df10

結(jié)果如下：

9）converters參數(shù)

含義：對(duì)某一列使用Lambda函數(shù)，進(jìn)行某種運(yùn)算；
例如：converters={"工資":lambda x: x + 1000}；

df11?=?pd.read_excel("converters.xlsx",converters={"地址":lambda?x:?"中國(guó)"+x,"工資":lambda?x:?x?+?1000}) df11

結(jié)果如下：

后臺(tái)回復(fù)"readexcel" 獲取本文所用到的素材！

由于微信平臺(tái)算法改版，公號(hào)內(nèi)容將不再以時(shí)間排序展示，如果大家想第一時(shí)間看到我們的推送，強(qiáng)烈建議星標(biāo)我們和給我們多點(diǎn)點(diǎn)【在看】。星標(biāo)具體步驟為：

（1）點(diǎn)擊頁(yè)面最上方“小詹學(xué)Python”，進(jìn)入公眾號(hào)主頁(yè)。（2）點(diǎn)擊右上角的小點(diǎn)點(diǎn)，在彈出頁(yè)面點(diǎn)擊“設(shè)為星標(biāo)”，就可以啦。感謝支持，比心。

總結(jié)

以上是生活随笔為你收集整理的一个参数一个Excel表，让你玩转Pandas中read_excel()表格读取！的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：七夕了！！聊聊《最受欢迎的男友职业排行榜
下一篇：毕业三年，快手总包 90W 值得去吗？

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

一个参数一个Excel表，让你玩转Pandas中read_excel()表格读取！

本文大綱

參數(shù)詳解

1）sheet_name參數(shù)

① sheet_name=0和sheet_name="Sheet1"

② sheet_name=[“sheet名”，0]

2）header參數(shù)

① header=None

② ?header=1

③ header=[]

3）usecols參數(shù)

① usecols=None

② usecols=[A,C]

③ usecols=[A,C:D]

④ usecols=[0,2]

⑤ usecols=["列名1","列名2"...]

4）names參數(shù)

5）dtype參數(shù)

6）parse_dates參數(shù)

① parse_dates=True

② parse_dates=[0,1]和parse_dates=["列名1","列名2"]

③ parse_dates=[[1,2,3]]和parse_dates=[["年","月","日"]]

④ parse_dates={"日期":[1,2,3]}

7）date_parser參數(shù)

8）na_values參數(shù)

① na_values=”值1“

② na_values=[”值1“,"值2"]

③ na_values={"列1":[”值1“,"值2"]}

9）converters參數(shù)

總結(jié)