當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

Python—实训day7下—Pandas统计分析基础

發(fā)布時(shí)間：2023/12/18 python 38 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python—实训day7下—Pandas统计分析基础小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1讀寫不同數(shù)據(jù)源的數(shù)據(jù)

1.1讀寫文本文件

1.1.1文件讀取

文本文件（txt文件）是一種由若干行字符構(gòu)成的計(jì)算機(jī)文件，它是一種典型的順序文件。使用read_table來讀取文本文件：

pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)

csv是一種逗號(hào)分隔的文件格式，因?yàn)槠浞指舴灰欢ㄊ嵌禾?hào)，又被稱為字符分隔文件，文件以純文本形式存儲(chǔ)表格數(shù)據(jù)（數(shù)字和文本）。使用read_csv函數(shù)來讀取csv文件：

pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)

read_table和read_csv常用參數(shù)及其說明。

read_table和read_csv函數(shù)中的sep參數(shù)是指定文本的分隔符的，如果分隔符指定錯(cuò)誤，在讀取數(shù)據(jù)的時(shí)候，每一行數(shù)據(jù)將連成一片。

header參數(shù)是用來指定列名的，如果是None則會(huì)添加一個(gè)默認(rèn)的列名。

encoding代表文件的編碼格式，常用的編碼有utf-8、utf-16、gbk、gb2312、gb18030等。如果編碼指定錯(cuò)誤數(shù)據(jù)將無法讀取，IPython解釋器會(huì)報(bào)解析錯(cuò)誤。

import pandas as pd data = pd.read_table(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\meal_order_info.csv', encoding='gbk', sep=',') info = pd.read_csv(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\meal_order_info.csv', encoding='gbk')

注：pands.read_table中參數(shù)encoding默認(rèn)的編碼是“utf-8”，但meal_order_info.csv文件的編碼格式是“gbk”，所以需要進(jìn)行encoding參數(shù)的設(shè)置。一般情況下，編碼格式不是“utf-8"的話，先試試是不是”gbk“的，不是再接著試utf-16、gb2312、gb18030這幾個(gè)編碼格式。

1.1.2文件存儲(chǔ)

文本文件的存儲(chǔ)和讀取類似，結(jié)構(gòu)化數(shù)據(jù)可以通過pandas中的to_csv函數(shù)實(shí)現(xiàn)以csv文件格式存儲(chǔ)文件。

DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=”, columns=None, header=True, index=True,index_label=None,mode=’w’,encoding=None)

info.to_csv(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\info.csv', encoding='gbk')

有時(shí)候保存出來的數(shù)據(jù)是亂碼的情況，這時(shí)就需要設(shè)置下encoding這個(gè)參數(shù)。

1.2讀寫Excel文件

1.2.1Excel文件讀取

pandas提供了read_excel函數(shù)來讀取“xls”“xlsx”兩種Excel文件。

pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)

detail = pd.read_excel(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\meal_order_detail.xlsx')

1.2.2Excel文件存儲(chǔ)

將文件存儲(chǔ)為Excel文件，可以使用to_excel方法。其語(yǔ)法格式如下。

DataFrame.to_excel(excel_writer=None, sheet_name=None’, na_rep=”, header=True, index=True, index_label=None, mode=’w’, encoding=None)

to_csv方法的常用參數(shù)基本一致，區(qū)別之處在于指定存儲(chǔ)文件的文件路徑參數(shù)名稱為excel_writer，并且沒有sep參數(shù)，增加了一個(gè)sheet_name參數(shù)用來指定存儲(chǔ)的Excel sheet的名稱，默認(rèn)為sheet1。

detail.to_excel(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\detail.xlsx', sheet_name='A') info.to_excel(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\detail.xlsx', sheet_name='B') #會(huì)覆蓋原始數(shù)據(jù)#將數(shù)據(jù)保存在一個(gè)Excel的多個(gè)字表中 with pd.ExcelWriter(r'F:\Desktop\2020.09.21-30廣東海洋大學(xué)實(shí)訓(xùn)\9.23Pandas統(tǒng)計(jì)分析基礎(chǔ)\detail.xlsx') as w:detail.to_excel(w, sheet_name='A')info.to_excel(w, sheet_name='B')

總結(jié)

以上是生活随笔為你收集整理的Python—实训day7下—Pandas统计分析基础的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：推荐16款最棒的Visual Studi
下一篇： Python—实训day8—掌握Data

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

python

Python—实训day7下—Pandas统计分析基础

總結(jié)