np读取csv文件_pandas.read_csv函数参数详解
Pandas.read_csv
Hello大家好,歡迎來到【統計GO】,本公眾號內容主要針對數據分析的愛好者,不定期分享一些好用的數據分析工具和機器學習資料,以及一些求職必備技能,幫助大家花更少的時間學更多的知識。
本期為大家推薦的是Python語言中用的最多的一條命令:pandas.raad_csv.小編接下來將一些使用頻率比較高的參數逐一解釋給大家,對于一些不推薦使用的參數小編將會省略掉。
下一期將會為大家解讀如何用Python讀取時間型數據。
如果本期內容對您有所幫助,記得及時關注。
pandas.read_csv
1.filepath_or_buffer:設置需要訪問的文件的有效路徑.
2.sep:str, default ','.
指定讀取文件的分隔符.支持自定義分隔符.
3.delimiter:str, default None
定界符.備選分隔符(如果指定該參數,則sep參數失效)
4.header:str, default None
指定作為整個數據集列名的行.如果數據集中沒有列名,則需要設置header=None.對有表頭的數據識別第一行作為header.
5.names :array-like, default None
用于結果的列名列表,如果數據文件中沒有列標題行,就需要執行header=None。
6.index_col:int or sequence or False, default None
指定數據集中的某1列作為索引(index_col = 1/2).
7.usecols:array-like, default None
指定只讀取文件中的某一列數據.例如:只讀取前四列,usecols = [0,1,2,3])
8.squeeze:boolean, default False
如果文件值包含一列,則返回一個Series.
pandas.read_csv
9.dtype : Type name or dict of column -> type, default None
每列數據的數據類型。例如 {‘a’: np.float64, ‘b’: np.int32}
10.skiprows : list-like or integer, default None
需要忽略的行數(從文件開始處算起),或需要跳過的行號列表(從0開始)。
11.nrows : int, default None
需要讀取的行數(從文件頭開始算起)。
12.na_values: scalar, str, list-like, or dict, default None
一組用于替換NA/NaN的值。如果傳參,需要制定特定列的空值。默認'N/A','NA','NULL', 'NaN', 'nan'.
13.keep_default_na : bool, default True
如果指定na_values參數,并且keep_default_na =False,那么默認的NaN將被覆蓋,否則添加。
14.na_filter : boolean, default True
是否檢查丟失值(空字符串或者是空值)。對于大文件來說數據集中沒有空值,設定為False可以提升讀取速度。
13.skip_blank_lines : boolean, default True
如果為False,則記為NaN;否跳過。
14.parse_dates : boolean or list of ints or names or list of lists or dict, default False
讀取文件時,以時間格式讀取某幾列。小編下一期會針對時間專門出一期。
boolean. True -> 解析索引 [1, 2, 3] -> 解析1,2,3列的值作為獨立的日期列; [[1, 2]] -> 合并1,2列作為一個日期列使用 {'time': [1, 2]} -> 將1,2列合并,并給合并后的列起名為"time"15.encoding : str, default None
指定字符集類型,通常指定為'utf-8',支持切換其它格式.
總結
以上是生活随笔為你收集整理的np读取csv文件_pandas.read_csv函数参数详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Visual Studio Code 前
- 下一篇: 第四次作业类测试代码+036+吴心怡