當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

np读取csv文件_pandas.read_csv函数参数详解

發(fā)布時(shí)間：2023/12/19 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 np读取csv文件_pandas.read_csv函数参数详解小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Pandas.read_csv

Hello大家好，歡迎來(lái)到【統(tǒng)計(jì)GO】，本公眾號(hào)內(nèi)容主要針對(duì)數(shù)據(jù)分析的愛(ài)好者，不定期分享一些好用的數(shù)據(jù)分析工具和機(jī)器學(xué)習(xí)資料，以及一些求職必備技能，幫助大家花更少的時(shí)間學(xué)更多的知識(shí)。

本期為大家推薦的是Python語(yǔ)言中用的最多的一條命令：pandas.raad_csv.小編接下來(lái)將一些使用頻率比較高的參數(shù)逐一解釋給大家，對(duì)于一些不推薦使用的參數(shù)小編將會(huì)省略掉。

下一期將會(huì)為大家解讀如何用Python讀取時(shí)間型數(shù)據(jù)。

如果本期內(nèi)容對(duì)您有所幫助，記得及時(shí)關(guān)注。

pandas.read_csv

1.filepath_or_buffer：設(shè)置需要訪問(wèn)的文件的有效路徑.

2.sep：str, default ','.

指定讀取文件的分隔符.支持自定義分隔符.

3.delimiter：str, default None

定界符.備選分隔符（如果指定該參數(shù)，則sep參數(shù)失效）

4.header：str, default None

指定作為整個(gè)數(shù)據(jù)集列名的行.如果數(shù)據(jù)集中沒(méi)有列名，則需要設(shè)置header=None.對(duì)有表頭的數(shù)據(jù)識(shí)別第一行作為header.

5.names ：array-like, default None

用于結(jié)果的列名列表，如果數(shù)據(jù)文件中沒(méi)有列標(biāo)題行，就需要執(zhí)行header=None。

6.index_col：int or sequence or False, default None

指定數(shù)據(jù)集中的某1列作為索引(index_col = 1/2).

7.usecols：array-like, default None

指定只讀取文件中的某一列數(shù)據(jù).例如：只讀取前四列，usecols = [0,1,2,3])

8.squeeze：boolean, default False

如果文件值包含一列，則返回一個(gè)Series.

pandas.read_csv

9.dtype : Type name or dict of column -> type, default None

每列數(shù)據(jù)的數(shù)據(jù)類型。例如 {‘a(chǎn)’: np.float64, ‘b’: np.int32}

10.skiprows : list-like or integer, default None

需要忽略的行數(shù)（從文件開(kāi)始處算起），或需要跳過(guò)的行號(hào)列表（從0開(kāi)始）。

11.nrows : int, default None

需要讀取的行數(shù)（從文件頭開(kāi)始算起）。

12.na_values: scalar, str, list-like, or dict, default None

一組用于替換NA/NaN的值。如果傳參，需要制定特定列的空值。默認(rèn)'N/A','NA','NULL', 'NaN', 'nan'.

13.keep_default_na : bool, default True

如果指定na_values參數(shù)，并且keep_default_na =False，那么默認(rèn)的NaN將被覆蓋，否則添加。

14.na_filter : boolean, default True

是否檢查丟失值（空字符串或者是空值）。對(duì)于大文件來(lái)說(shuō)數(shù)據(jù)集中沒(méi)有空值，設(shè)定為False可以提升讀取速度。

13.skip_blank_lines : boolean, default True
如果為False，則記為NaN；否跳過(guò)。

14.parse_dates : boolean or list of ints or names or list of lists or dict, default False

讀取文件時(shí)，以時(shí)間格式讀取某幾列。小編下一期會(huì)針對(duì)時(shí)間專門(mén)出一期。

boolean. True -> 解析索引 [1, 2, 3] -> 解析1,2,3列的值作為獨(dú)立的日期列； [[1, 2]] -> 合并1,2列作為一個(gè)日期列使用 {'time': [1, 2]} -> 將1,2列合并，并給合并后的列起名為"time"

15.encoding : str, default None
指定字符集類型，通常指定為'utf-8'，支持切換其它格式.

# 一次性讀取文件夾中所有CSV數(shù)據(jù) import os import pandas as pd frame = [] path = (".../COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports") for file in os.listdir(path):filepath = path + "/" + file# print(filepath)frame.append(pd.read_csv(filepath,usecols = ["Country/Region","Province/State","Last Update","Confirmed"])) df = pd.concat(frame,ignore_index = True) print(df.head(10)

總結(jié)

以上是生活随笔為你收集整理的np读取csv文件_pandas.read_csv函数参数详解的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Visual Studio Code 前
下一篇：第四次作业类测试代码+036+吴心怡

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

np读取csv文件_pandas.read_csv函数参数详解

pandas.read_csv

pandas.read_csv

總結(jié)