日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深入浅出统计学 第二三章 量度

發布時間:2025/3/21 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 深入浅出统计学 第二三章 量度 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

量度

兩類量度:

(1) 集中趨勢的量度—>平均值,中位數,眾數

(2) 分散性與變異性的亮度—>全距(極值),四分位數(擴展:箱型圖),方差與標準差,標準分

獲取數據

import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline# 定義讀取數據的函數 def ReadAndSaveDataByPandas(target_url = None,file_save_path = None ,save=False):if target_url !=None:target_url = ("http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv") if file_save_path != None:file_save_path = "/home/fonttian/Data/UCI/Glass/glass.csv"wine = pd.read_csv(target_url, header=0, sep=";")if save == True:wine.to_csv(file_save_path, index=False)return wine wine = pd.read_csv("/home/font/Data/UCI/WINE/wine.csv") wine.head()

代碼實現

利用Pandas實現深入淺出統計學中的這兩章內容是十分簡單的,大部分都已經封裝好,
只有極值與標準分需要我們自己編寫.
箱型圖之前已經給出了相應的畫法,所以這次我把它放在了最后.

print('葡萄酒評分的均值為:%.3f'%(wine['quality'].mean())) print('葡萄酒評分的中位數為:%.3f'%(wine['quality'].median())) print('葡萄酒評分的眾數為:%.3f'%(wine['quality'].mode())) 葡萄酒評分的均值為:5.636 葡萄酒評分的中位數為:6.000 葡萄酒評分的眾數為:5.000 print('葡萄酒評分的全距(極值)為:%.3f'%(wine['quality'].max()-wine['quality'].min())) print('葡萄酒評分的方差為:%.3f'%(wine['quality'].var())) print('葡萄酒評分的標準差為:%.3f'%(wine['quality'].std())) 葡萄酒評分的全距(極值)為:5.000 葡萄酒評分的方差為:0.652 葡萄酒評分的標準差為:0.808 print('葡萄酒評分的四分位數為:\n',(wine['quality'].quantile([0,0.25,0.5,0.75,1]))) 葡萄酒評分的全距(極值)為:5.000 葡萄酒評分的方差為:0.652 葡萄酒評分的標準差為:0.808 葡萄酒評分的四分位數為:0.00 3.0 0.25 5.0 0.50 6.0 0.75 6.0 1.00 8.0 Name: quality, dtype: float64

我們也可以直接使用describe獲取我們想要的東西,而標準分的計算則需要我們再多動一動手。
下面的示例分別有兩種不同的實現方式,因為數值問題結果略有差異,但是沒有什么影響。

wine.describe()

def Zscore_columns_bysklearn(Dataframe):from sklearn.preprocessing import StandardScalerscaler = StandardScaler() Dataframe_tofit = Dataframe.astype('float64')scaler.fit(Dataframe_tofit)returnResult = pd.DataFrame(scaler.transform(Dataframe))return wine_zscore_quality_bysklearn = Zscore_columns_bysklearn(wine) wine_zscore_quality_bysklearn.head()

def Zscore_columns(Dataframe): return (Dataframe-Dataframe.mean())/Dataframe.std()wine_zscore_quality = Zscore_columns(wine) wine_zscore_quality.head()

wine[['fixed acidity', 'residual sugar', 'alcohol', 'quality']].plot.box()# vert=False, 橫向 # positions=[1, 4, 6, 8], y軸位置 # color=color, 顏色 # sym='r+', 異常點的樣式 color = dict(boxes='DarkGreen', whiskers='DarkOrange', medians='DarkBlue', caps='Gray') wine[['fixed acidity', 'residual sugar', 'alcohol', 'quality']].plot.box(vert=False, positions=[1, 4, 6, 8],color=color,sym='r+') plt.show()

參考

1.pandas用戶指南 計算工具 中文版
2.深入淺出統計學 第一章 數據的可視化

總結

以上是生活随笔為你收集整理的深入浅出统计学 第二三章 量度的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。