np读取csv文件_pandas.read_csv函数参数详解
Pandas.read_csv
Hello大家好,歡迎來(lái)到【統(tǒng)計(jì)GO】,本公眾號(hào)內(nèi)容主要針對(duì)數(shù)據(jù)分析的愛(ài)好者,不定期分享一些好用的數(shù)據(jù)分析工具和機(jī)器學(xué)習(xí)資料,以及一些求職必備技能,幫助大家花更少的時(shí)間學(xué)更多的知識(shí)。
本期為大家推薦的是Python語(yǔ)言中用的最多的一條命令:pandas.raad_csv.小編接下來(lái)將一些使用頻率比較高的參數(shù)逐一解釋給大家,對(duì)于一些不推薦使用的參數(shù)小編將會(huì)省略掉。
下一期將會(huì)為大家解讀如何用Python讀取時(shí)間型數(shù)據(jù)。
如果本期內(nèi)容對(duì)您有所幫助,記得及時(shí)關(guān)注。
pandas.read_csv
1.filepath_or_buffer:設(shè)置需要訪問(wèn)的文件的有效路徑.
2.sep:str, default ','.
指定讀取文件的分隔符.支持自定義分隔符.
3.delimiter:str, default None
定界符.備選分隔符(如果指定該參數(shù),則sep參數(shù)失效)
4.header:str, default None
指定作為整個(gè)數(shù)據(jù)集列名的行.如果數(shù)據(jù)集中沒(méi)有列名,則需要設(shè)置header=None.對(duì)有表頭的數(shù)據(jù)識(shí)別第一行作為header.
5.names :array-like, default None
用于結(jié)果的列名列表,如果數(shù)據(jù)文件中沒(méi)有列標(biāo)題行,就需要執(zhí)行header=None。
6.index_col:int or sequence or False, default None
指定數(shù)據(jù)集中的某1列作為索引(index_col = 1/2).
7.usecols:array-like, default None
指定只讀取文件中的某一列數(shù)據(jù).例如:只讀取前四列,usecols = [0,1,2,3])
8.squeeze:boolean, default False
如果文件值包含一列,則返回一個(gè)Series.
pandas.read_csv
9.dtype : Type name or dict of column -> type, default None
每列數(shù)據(jù)的數(shù)據(jù)類型。例如 {‘a(chǎn)’: np.float64, ‘b’: np.int32}
10.skiprows : list-like or integer, default None
需要忽略的行數(shù)(從文件開(kāi)始處算起),或需要跳過(guò)的行號(hào)列表(從0開(kāi)始)。
11.nrows : int, default None
需要讀取的行數(shù)(從文件頭開(kāi)始算起)。
12.na_values: scalar, str, list-like, or dict, default None
一組用于替換NA/NaN的值。如果傳參,需要制定特定列的空值。默認(rèn)'N/A','NA','NULL', 'NaN', 'nan'.
13.keep_default_na : bool, default True
如果指定na_values參數(shù),并且keep_default_na =False,那么默認(rèn)的NaN將被覆蓋,否則添加。
14.na_filter : boolean, default True
是否檢查丟失值(空字符串或者是空值)。對(duì)于大文件來(lái)說(shuō)數(shù)據(jù)集中沒(méi)有空值,設(shè)定為False可以提升讀取速度。
13.skip_blank_lines : boolean, default True
如果為False,則記為NaN;否跳過(guò)。
14.parse_dates : boolean or list of ints or names or list of lists or dict, default False
讀取文件時(shí),以時(shí)間格式讀取某幾列。小編下一期會(huì)針對(duì)時(shí)間專門(mén)出一期。
boolean. True -> 解析索引 [1, 2, 3] -> 解析1,2,3列的值作為獨(dú)立的日期列; [[1, 2]] -> 合并1,2列作為一個(gè)日期列使用 {'time': [1, 2]} -> 將1,2列合并,并給合并后的列起名為"time"15.encoding : str, default None
指定字符集類型,通常指定為'utf-8',支持切換其它格式.
總結(jié)
以上是生活随笔為你收集整理的np读取csv文件_pandas.read_csv函数参数详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Visual Studio Code 前
- 下一篇: 第四次作业类测试代码+036+吴心怡