用于python环境下的数据操作_数据分析(一):环境搭建,以及初步操作文件
1、準(zhǔn)備工作
①定義:用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來的大量數(shù)據(jù)進(jìn)行分析,提取有用信息和形成結(jié)論,對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程
②環(huán)境部署,可以再pycharm中做也可以再jupyter中做
③jupyter的介紹:基于web的在線編輯器 ,可交互式 ,.ipynb文件分享 ,支持markdown
④jupyter的安裝:首先要安裝python解釋器(就是python),然后pip install jupyter ,如果安裝了conda,它是自帶jupyter和python解釋器的直接打開就好,不建議用conda
⑤jupyter的使用:直接win+r 輸入jupyter notebook,注意不能關(guān)掉命令行,不然無法使用jupyter,它相當(dāng)于服務(wù)器,ctrl+c終止服務(wù)端,如果電腦中裝有多個(gè)python解釋器,分不清了可以用python -m notebook進(jìn)入
⑤jupyter的常用命令,或者直接用可視化的圖形工具實(shí)現(xiàn)想要的效果
ctrl+enter:運(yùn)行當(dāng)前行
shift+enter:向下插入一格
esc:進(jìn)入命令模式,再這個(gè)模式下
'''
輸入A表示在活躍單元之上插入一個(gè)新單元
輸入B在活躍單元之下插入一個(gè)新單元
連續(xù)按兩次D可以刪除一個(gè)單元
輸入Z表示撤銷被刪除的單元
輸入Y表示 會(huì)將當(dāng)前活躍的單元變成一個(gè)代碼單元
按住 Shift +上或下箭頭可選擇多個(gè)單元。
在多選模式時(shí),按住 Shift + M 可合并你的選擇。
'''
enter:進(jìn)入編輯模式
'''
Ctrl + Home 到達(dá)單元起始位置
Ctrl + S 保存進(jìn)度
Ctrl + Enter 會(huì)運(yùn)行整個(gè)單元塊
Alt + Enter 不止會(huì)運(yùn)行你的單元塊,還會(huì)在下面添加一個(gè)新單元
'''
按esc進(jìn)入命令行模式按h就可以看到所有的命令,不區(qū)分大小寫
一個(gè)問號(hào)查看概要信息,兩個(gè)問號(hào)查看源代碼
2、文件操作
在實(shí)際操作中,通常采集本地?cái)?shù)據(jù)來進(jìn)行數(shù)據(jù)分析,那么就需要學(xué)習(xí)Python去對(duì)本地文檔進(jìn)行讀取與寫入等操作。比如:txt文件,json文件,csv文件,excel文件等。
2.1python操作txt文件
open(file, mode=‘r’,encoding=None) --> 打開文件
file:文件路徑如果不在同級(jí)目錄之下要采用絕對(duì)路徑
mode操作文件模式:r只讀模式,w寫入,a追加寫入
encoding指定文件編碼:utf-8當(dāng)文件中文亂碼時(shí),則指定編碼為utf-8解決。
①再jupyter中即使不指定編碼格式,中文也不會(huì)亂碼,是指針讀取,如果不重新打開文件,那么下述的readline則會(huì)返回null
f.read():讀取全部
f.readline():逐行讀取
f.readlines():讀取全部,且為列表
讀取不可逆,內(nèi)部以指針讀取為基準(zhǔn),所以不可逆,逐行讀取,只顯示最后一條命令
注意w模式再次寫入內(nèi)容的時(shí)候回覆蓋之前的內(nèi)容,a不會(huì),寫入完畢必須close不然相當(dāng)于只寫入到了內(nèi)存,并沒有保存文件
2.2python操作json文件
JSON是一種使用廣泛的輕量數(shù)據(jù)格式. Python標(biāo)準(zhǔn)庫中的json模塊提供了JSON數(shù)據(jù)的處理功能。
讀取文件數(shù)據(jù)
2.3python操作csv文件
CSV即Comma Separate Values,有時(shí)也稱為字符分隔值,因?yàn)榉指糇址部梢圆皇嵌禾?hào),其文件以純文本形式存儲(chǔ)表格數(shù)據(jù)(數(shù)字和文本)。經(jīng)常用來作為不同程序之間的數(shù)據(jù)交互的格式。
可以直接使用pandas讀取寫入csv文件需要pip install pandas
2.4python操作excel數(shù)據(jù)
在Python中,有很多第三方模塊用來操作excel,比如說:xlwt,xlrd,openpyxl等。openpyxl只支持2010版本以上的xlsx文件
使用openpyxl將數(shù)據(jù)寫入demo03.xlsx
實(shí)現(xiàn)步驟:①創(chuàng)建工作簿②創(chuàng)建工作表③寫入數(shù)據(jù)④保存
使用openpyxl讀取demo03.xlsx數(shù)據(jù)
使用pandas操作excel對(duì)象需要pip install pandas如果安裝過濾就不用再安裝了
原文鏈接:https://blog.csdn.net/weixin_49088841/article/details/109555654
總結(jié)
以上是生活随笔為你收集整理的用于python环境下的数据操作_数据分析(一):环境搭建,以及初步操作文件的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 炼油机出来的什么油_轮胎炼油出来的炭黑有
- 下一篇: 青少年学python第六节_青少年学Py