Python—实训day7下—Pandas统计分析基础
1讀寫不同數(shù)據(jù)源的數(shù)據(jù)
1.1讀寫文本文件
1.1.1文件讀取
文本文件(txt文件)是一種由若干行字符構(gòu)成的計(jì)算機(jī)文件,它是一種典型的順序文件。使用read_table來讀取文本文件:
pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)csv是一種逗號(hào)分隔的文件格式,因?yàn)槠浞指舴灰欢ㄊ嵌禾?hào),又被稱為字符分隔文件,文件以純文本形式存儲(chǔ)表格數(shù)據(jù)(數(shù)字和文本)。使用read_csv函數(shù)來讀取csv文件:
pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)read_table和read_csv常用參數(shù)及其說明。
注:pands.read_table中參數(shù)encoding默認(rèn)的編碼是“utf-8”,但meal_order_info.csv文件的編碼格式是“gbk”,所以需要進(jìn)行encoding參數(shù)的設(shè)置。一般情況下,編碼格式不是“utf-8"的話,先試試是不是”gbk“的,不是再接著試utf-16、gb2312、gb18030這幾個(gè)編碼格式。
1.1.2文件存儲(chǔ)
文本文件的存儲(chǔ)和讀取類似,結(jié)構(gòu)化數(shù)據(jù)可以通過pandas中的to_csv函數(shù)實(shí)現(xiàn)以csv文件格式存儲(chǔ)文件。
DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=”, columns=None, header=True, index=True,index_label=None,mode=’w’,encoding=None) info.to_csv(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\info.csv', encoding='gbk')有時(shí)候保存出來的數(shù)據(jù)是亂碼的情況,這時(shí)就需要設(shè)置下encoding這個(gè)參數(shù)。
1.2讀寫Excel文件
1.2.1Excel文件讀取
pandas提供了read_excel函數(shù)來讀取“xls”“xlsx”兩種Excel文件。
pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)
detail = pd.read_excel(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\meal_order_detail.xlsx')1.2.2Excel文件存儲(chǔ)
將文件存儲(chǔ)為Excel文件,可以使用to_excel方法。其語(yǔ)法格式如下。
DataFrame.to_excel(excel_writer=None, sheet_name=None’, na_rep=”, header=True, index=True, index_label=None, mode=’w’, encoding=None)to_csv方法的常用參數(shù)基本一致,區(qū)別之處在于指定存儲(chǔ)文件的文件路徑參數(shù)名稱為excel_writer,并且沒有sep參數(shù),增加了一個(gè)sheet_name參數(shù)用來指定存儲(chǔ)的Excel sheet的名稱,默認(rèn)為sheet1。
detail.to_excel(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\detail.xlsx', sheet_name='A') info.to_excel(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\detail.xlsx', sheet_name='B') #會(huì)覆蓋原始數(shù)據(jù)#將數(shù)據(jù)保存在一個(gè)Excel的多個(gè)字表中 with pd.ExcelWriter(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\detail.xlsx') as w:detail.to_excel(w, sheet_name='A')info.to_excel(w, sheet_name='B')?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的Python—实训day7下—Pandas统计分析基础的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐16款最棒的Visual Studi
- 下一篇: Python—实训day8—掌握Data