深入浅出统计学 第二三章 量度
生活随笔
收集整理的這篇文章主要介紹了
深入浅出统计学 第二三章 量度
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
量度
兩類量度:
(1) 集中趨勢的量度—>平均值,中位數,眾數
(2) 分散性與變異性的亮度—>全距(極值),四分位數(擴展:箱型圖),方差與標準差,標準分
獲取數據
import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline# 定義讀取數據的函數 def ReadAndSaveDataByPandas(target_url = None,file_save_path = None ,save=False):if target_url !=None:target_url = ("http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv") if file_save_path != None:file_save_path = "/home/fonttian/Data/UCI/Glass/glass.csv"wine = pd.read_csv(target_url, header=0, sep=";")if save == True:wine.to_csv(file_save_path, index=False)return wine wine = pd.read_csv("/home/font/Data/UCI/WINE/wine.csv") wine.head()代碼實現
利用Pandas實現深入淺出統計學中的這兩章內容是十分簡單的,大部分都已經封裝好,
只有極值與標準分需要我們自己編寫.
箱型圖之前已經給出了相應的畫法,所以這次我把它放在了最后.
我們也可以直接使用describe獲取我們想要的東西,而標準分的計算則需要我們再多動一動手。
下面的示例分別有兩種不同的實現方式,因為數值問題結果略有差異,但是沒有什么影響。
參考
1.pandas用戶指南 計算工具 中文版
2.深入淺出統計學 第一章 數據的可視化
總結
以上是生活随笔為你收集整理的深入浅出统计学 第二三章 量度的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python实现 灰色关联分析 与结果可
- 下一篇: R语言简介与案例