python基本统计量_Python中简单统计量的计算
本篇文章給大家?guī)淼膬?nèi)容是關(guān)于Python中簡單統(tǒng)計(jì)量的計(jì)算,有一定的參考價(jià)值,有需要的朋友可以參考一下,希望對你有所幫助。
1、這些操作都要確保已經(jīng)在電腦中安裝好了Anaconda集成庫,如果安裝好后運(yùn)行出錯(cuò)誤,可以將原來電腦中的python卸載重新安裝Anaconda,建議安裝時(shí)直接將添加環(huán)境變量打勾,否則以后得自己添加環(huán)境變量,在Pycharm中的編譯器選擇Anaconda安裝文件夾中的python。在Pycharm中新建一個(gè)data文件夾用來存放數(shù)據(jù)文件。
2.打開Python Console。
3.首先在用python讀取數(shù)據(jù),需要先輸入import pandas as pd引入pandas包,再輸入df=pd.read_csv("./data/CityData.csv")讀取數(shù)據(jù),最后輸入df顯示數(shù)據(jù)。
4.分別輸入type(df)和type(df["cid"])可以發(fā)現(xiàn)兩種數(shù)據(jù)類型不同。
5.計(jì)算平均值:df.mean()或df["xid"].mean()
6.計(jì)算中位數(shù):輸入df.median()或df["yid"].median
7.求四分位數(shù):輸入df.quantile(q=0.25)
8.求眾數(shù):輸入df.mode()或df["xid"].mode()
9.求標(biāo)準(zhǔn)差:輸入df.std()或df["yid"].std()
10.計(jì)算方差:df.var()或df["xid"].var()
11.求和:df.sum()或df["xid"].sum()
12.計(jì)算偏態(tài)系數(shù):df.skew()或df["yid"].skew()
13.計(jì)算峰態(tài)系數(shù):df.kurt()或df["yid"].kurt()
14.生成正態(tài)分布函數(shù),pandas無法直接生成,需要先引入scipyimport scipy.stats as ss,再輸入ss.norm,這時(shí)生成的是一個(gè)正態(tài)分布的對象,我們輸入ss.norm.stats(moments="mvsk")查看一下,mvsk分別代表的是均值、方差、偏態(tài)系數(shù)、峰態(tài)系數(shù)。
這時(shí)我們可以看到生成四個(gè)值,分別對應(yīng)正態(tài)分布的mvsk分別為0、1、0、0。
15.ss.norm.pdf(0.0)表示橫坐標(biāo)為0時(shí)的縱坐標(biāo)的值。ss.norm.ppf(0.9)表示從負(fù)無窮累積到返回值時(shí)得到的值為0.9,其中ppf后的值必須在0-1之間。ss.norm.cdf(2)表示從負(fù)無窮積分到2時(shí)的返回值,ss.norm.rvs(size=10)可以得到10個(gè)隨機(jī)的符合正態(tài)分布的數(shù)字。
16.類似的,我們可以分別輸入ss.chi2和ss.t得到卡方分布和T分布。
17.此外我們還可以進(jìn)行抽樣,輸入df.sample(n=10)從數(shù)據(jù)中抽取10個(gè)樣本,輸入df.sample(frac=0.1)從數(shù)據(jù)中抽取10%的樣本。
總結(jié)
以上是生活随笔為你收集整理的python基本统计量_Python中简单统计量的计算的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python读取usb扫码枪数据_USB
- 下一篇: 德州仪器发布全新 Arm Cortex-