python:dataframe保存成csv文件和读取
生活随笔
收集整理的這篇文章主要介紹了
python:dataframe保存成csv文件和读取
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
一、從csv文件讀取數(shù)據(jù)為dataframe
函數(shù)原型: pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False,infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer',thousands=None, decimal=b'.', lineterminator=None, quotechar='"',quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)常用參數(shù):filepath_or_buffer : 類型str,代表CSV文件地址。sep : 類型str, 默認(rèn)值為‘,’,用于指定分隔符。如果不指定參數(shù),則會(huì)嘗試使用逗號(hào)分隔。header : 類型為int或者int的列表,它指定用來(lái)作為列名行號(hào),然后數(shù)據(jù)從行號(hào)的下一行開(kāi)始讀取。 默認(rèn)情況下header是根據(jù)參數(shù)names(如下) 來(lái)推斷header的值。如果names為None,則等價(jià)于header=0,默認(rèn)把文件中第一行作為列名,數(shù)據(jù)從第一行開(kāi)始讀取。如果names顯示地傳入, 則等價(jià)于header=None,則數(shù)據(jù)從0行開(kāi)始讀取。如果傳入header=0,names不為None,則將替換原有的列名。header參數(shù)可以是一個(gè)list。 例如:[0,1,3],這個(gè)list表示將文件中的這些行作為列標(biāo)題(意味著每一列有多個(gè)標(biāo)題),介于中間的行將被忽略掉(例如本例中的2; 本例中的數(shù)據(jù)1,2,4行將被作為多級(jí)標(biāo)題出現(xiàn),第3行數(shù)據(jù)將被丟棄,dataframe的數(shù)據(jù)從第5行開(kāi)始。)。names : 一個(gè)數(shù)組, 默認(rèn)為None。列名列表,如果數(shù)據(jù)文件中沒(méi)有列標(biāo)題行,就需要執(zhí)行header=None。usecols : 一個(gè)數(shù)組, 默認(rèn)為None,返回?cái)?shù)據(jù)列一個(gè)子集。如果傳入字符,則列名需要與表中列名對(duì)應(yīng)。如果傳入整數(shù)列表,則表示列的索引值。 例如:usecols有效參數(shù)可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。prefix : 類型str, 默認(rèn)為None。在沒(méi)有列標(biāo)題時(shí),給列添加前綴。例如:添加‘X’ 成為 X0, X1, ...engine : {‘c’, ‘python’},可選。使用的分析引擎。可以選擇C或者是python。C引擎快但是Python引擎功能更加完備。nrows : 類型int, 默認(rèn)為None。需要讀取的行數(shù)(從文件頭開(kāi)始算起)。iterator : 類型boolean, 默認(rèn)為False。返回一個(gè)TextFileReader 對(duì)象,以便逐塊處理文件。二、dataframe保存為csv文件
函數(shù)原型: DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,escapechar=None, decimal='.') 常用參數(shù):path_or_buf : 文件路徑,如果沒(méi)有指定則將會(huì)直接返回字符串的 jsonsep : 輸出文件的字段分隔符,默認(rèn)為 “,”na_rep : 用于替換空數(shù)據(jù)的字符串,默認(rèn)為''float_format : 設(shè)置浮點(diǎn)數(shù)的格式(幾位小數(shù)點(diǎn))columns : 要寫的列header : 是否保存列名,默認(rèn)為 True ,保存index : 是否保存索引,默認(rèn)為 True ,保存總結(jié)
以上是生活随笔為你收集整理的python:dataframe保存成csv文件和读取的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Scala,Spark和IDEA学习笔记
- 下一篇: python出现Unknown labe