月均数据_利用Python进行数据分析(附详细案例)
一、前期準(zhǔn)備
分析要用到兩個包:NumPy和Pandas,首先確保jupyter中成功安裝了這兩個包。
#導(dǎo)入numpy包 import numpy as np #導(dǎo)入pandas包 import pandas as pd二、基礎(chǔ)知識
2.1 一維數(shù)據(jù)分析:NumPy
2.2 一維數(shù)據(jù)結(jié)構(gòu):Pandas
2.3 二維數(shù)據(jù)分析:numpy對應(yīng)array
2.4 二維數(shù)據(jù)分析:pandas對應(yīng)數(shù)據(jù)框DateFrame
此處遇到一個問題:讀取Excel文件報錯。
解決方法:
1 查看Excel文件存放路徑
具體操作:點擊文件名,鼠標(biāo)右鍵,選擇“屬性”,找到下面標(biāo)紅的兩個地方。
2 將上面標(biāo)紅的兩處合成文件的路徑,
格式為文件夾文件名,比如F:annUntitled1.ipynb
3 最后把路徑中全部的斜杠(/)或者反斜杠()替換為雙反斜杠()
最后的路徑為F:annUntitled1.ipynb
三、Python具體案例分析:藥店銷售數(shù)據(jù)
3.1 提出問題
分析指標(biāo):
- 月均消費(fèi)次數(shù)
- 月均消費(fèi)金額
- 客單件
- 消費(fèi)趨勢
3.2 理解數(shù)據(jù)
3.3 清洗數(shù)據(jù)
3.3.1 選擇子集
3.3.2 列名重命名
3.3.3 缺失數(shù)據(jù)處理(dropna()函數(shù))
Python缺失值有3種:None,NA,NaN。(分析數(shù)據(jù)時,如果遇到什么錯誤,比如float錯誤,就要考慮是否為缺失值,若是,則需要處理掉)。
None和NaN的區(qū)別:None是Python的一種數(shù)據(jù)類型(NoneType),NaN是浮點類型(float),兩個都用作空值。
3.3.4 數(shù)據(jù)類型轉(zhuǎn)換
3.3.5 數(shù)據(jù)排序
3.3.6 異常值處理
3.4 構(gòu)建模型
3.4.1 指標(biāo)1:月均消費(fèi)次數(shù)=總消費(fèi)次數(shù)/月份數(shù)
3.4.2 指標(biāo)2:月均消費(fèi)金額=總消費(fèi)金額/月份數(shù)
3.4.3 指標(biāo)3:客單價=總消費(fèi)金額/總消費(fèi)次數(shù)
客單價(per customer transaction):商場(超市)每位顧客平均購買商品的金額,即是平均交易金額。
3.4.3 消費(fèi)趨勢
End.
總結(jié)
以上是生活随笔為你收集整理的月均数据_利用Python进行数据分析(附详细案例)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 避免流量高峰期CDN问题的10个方法
- 下一篇: python random包含尾部吗_你