日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python花萼长度表_python描述性统计实践

發布時間:2024/8/23 python 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python花萼长度表_python描述性统计实践 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、加載相關庫和數據集

使用的庫主要有:pandas、numpy、sklearn、matplotlib、seaborn

使用的數據集:sklearn庫中的鳶尾花數據集

import pandas as pd

import numpy as np

from sklearn.datasets import load_iris

import matplotlib.pyplot as plt

import seaborn as sns

import warnings

plt.rcParams["font.family"] = "SimHei" # 設置可以顯示中文字體

plt.rcParams["axes.unicode_minus"] = False

warnings.filterwarnings("ignore") # 忽略警告信息

2、數據集數據概覽

2.1 數據總體概覽

iris = load_iris() # 加載鳶尾花數據集

print(type(iris))

print(iris)

In [1]: list(iris.keys())

Out[1]: ['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename']

2.2 使用主要信息構造DataFrame

使用 np.concatenate 拼接不同的數據信息

# 拼接data信息和target信息,用于構造DataFrame

data = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)

feature_names = iris.feature_names # 特征名列,包含花萼和花瓣的長度和寬度

feature_names.append("target") # 將"target"添加至特征名列表,作為拼接數據的列名

df = pd.DataFrame(data,columns=feature_names)

2.3 構造后的數據概覽

df.info() # 展示df的概覽信息

df.describe() # 展示df 數值類型字段的統計信息

df.sample(10) # 隨機抽樣10條數據

3、使用相關函數進行描述性統計

3.1 頻率和頻數分析

數據的頻數與頻率統計適用于類別變量

頻數:數據中類別變量每個不同取值出現的次數

頻率:每個類別變量的頻數與總次數的比值,通常采用百分數進行表示。

frequency = df["target"].value_counts() # value_counts() 計算頻數

percentage = frequency / len(df["target"]) # 計算頻率

print(frequency)

print(percentage)

3.2 數據的集中趨勢分析

均值:即平均值,為一組數據的總和除以數據的個數。

中位數:將一組數據升序排列,位于該組數據最中間位置的值(如果數據個數為偶數,則取中間兩個數值的均值)。

眾數:一組數據中出現次數最多的值。

分位數:通過n-1個分位將數據劃分為n個區間,使得每個區間的數值個數相等(或近似相等),那么n為分位數的數量。

以鳶尾花的花萼長度為例,下同:

sepal_length = df["sepal length (cm)"]sepal_length.mean() # mean() 計算均值

sepal_length.median() # median() 計算中位數

sepal_length.mode().iloc[0] # mode() 計算眾數

df.describe() # 統計信息中包含分位數

# numpy內置函數quantile計算分位值,q取值范圍[0,1]np.quantile(sepal_length, q=[0.25, 0.5, 0.75])

# numpy內置函數percentile計算分位值,q取值范圍[0,100]np.percentile(sepal_length, q=[25, 50, 75])

3.3 手動計算分位數

常用的分位數有四分位數與百分位數

分位值未必一定等同于數組中的某個元素

分位值是數組中的某個元素:

list1 = np.arange(9)

n = len(list1)

# 計算四分位的位置(索引)

q1_index = (n-1) * 0.25

q2_index = (n-1) * 0.5

q3_index = (n-1) * 0.75

q_index = np.array([q1_index, q2_index, q3_index])

q_index = q_index.astype(np.int32) # 將索引轉成int類型

q = list1[q_index] # 根據索引獲取分位值

分位值不是數組中的某個元素:

sepal_length = sorted(sepal_length) # 記得計算分位值之前要先給數據排序

sepal_length = np.array(sepal_length) # 轉成數組

n = len(sepal_length)

q1_index = (n-1) * 0.25

q2_index = (n-1) * 0.5

q3_index = (n-1) * 0.75

q_index = np.array([q1_index, q2_index, q3_index])

left_index = np.floor(q_index).astype(np.int32) # np.floor() 向下取整

right_index = np.ceil(q_index).astype(np.int32) # np.ceil() 向上取整

weight,_ = np.modf(q_index) # np.modf() 獲取小數部分作為權重

# 按照權重計算分位值,每個整數的權重為距離的反比。

q = sepal_length[left_index] * (1-weight) + sepal_length[right_index] * weight

3.4 數據的離散程度分析

極差:一組數據中,最大值與最小值之差

方差:每個樣本值與全體樣本值的平均數之差的平方值的平均數,體現一組數據中,每個元素與均值偏離的大小。

標準差:標準差是方差的開方

sepal_length.max() - sepal_length.min() # max() - min() 計算極差

sepal_length.var() # var() 計算方差

sepal_length.std() # std() 計算標準差

3.5 數據的分布形狀分析

偏度:統計數據分布偏斜方向和程度的度量,是統計數據分布非對稱程度的數字特征。(如果數據對稱分布,如正態分布,則偏度為0;如果數據左偏分布,則偏度小于0;如果數據右偏分布,則偏度大于0)

峰度:描述總體中所有取值分布形態陡緩程度的統計量,可以連接為數據分布的高矮程度。(峰度的比較是相對于標準正太分布的,對于標準正太分布,峰度為0;如果峰度大于0,則密度圖高于標準正太分布,此時方差較小;如果峰度小于0,則密度圖低于標準正太分布,此時方差較大。)

# 標準正態分布的偏度和峰度,np.random.normal() 構造標準正態分布數據

standard_normal = pd.Series(np.random.normal(0, 1, size=10000))

standard_normal.skew()# skew() 計算偏度

standard_normal.kurt()# kurt() 計算峰度

# 鳶尾花花萼長度的偏度和峰度

sepal_length = df["sepal length (cm)"]sepal_length.skew()

sepal_length.kurt()

繪制標準正太分布、鳶尾花花萼寬度的密度圖:

# 繪制核密度圖

sns.kdeplot(standard_normal, shade=True, label="標準正太分布")

sns.kdeplot(df["sepal width (cm)"], shade=True, label="鳶尾花花萼寬度")

plt.legend()

作者:Minions2020

總結

以上是生活随笔為你收集整理的python花萼长度表_python描述性统计实践的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 永久免费看黄 | 91人妻一区二区三区蜜臀 | 欧美成人免费网站 | 在线看黄色av | 日本高清视频免费观看 | 国产调教 | 亚洲成人黄色小说 | 性渴老太作爱 | 国产精品av在线免费观看 | 国产又黄又 | 欧美午夜一区二区三区 | 久久亚洲一区二区三区四区 | 超碰pron| 久久久久久91亚洲精品中文字幕 | 中文字幕av影视 | 91深夜福利 | 国产乱人乱偷精品视频a人人澡 | 欧美自拍色图 | 伦理片av| 久久私人影院 | av网子| 免费观看h片 | h在线免费| 黄色特一级| 男女做事网站 | 亚洲性xx | 一区二区三区黄 | 天海翼中文字幕 | 欧美一区二区三区粗大 | 亚洲s码欧洲m码国产av | 香港三级日本三级三69 | 麻豆视频官网 | 性色av无码久久一区二区三区 | 久久久精品影院 | 欧美自拍亚洲 | 国产人成一区二区三区影院 | 九一九色国产 | 色婷婷av一区二区三区软件 | 久久久久9999 | 亚洲美女久久久 | 在线观看中文字幕 | 少妇性l交大片 | 色婷婷免费视频 | 黄色伊人网| 人人色网| 性爱视频免费 | 免费av软件 | 香蕉视频色版 | 欧美做爰全过程免费观看 | 激情六月丁香 | 中文字字幕第183页 欧美特级一级片 | 国产成人精品亚洲线观看 | 黄色性视频 | 精品一区二区在线看 | 男女日批视频 | 欧美熟妇另类久久久久久不卡 | 免费观看黄色av | 欧美日韩在线一区二区 | 红色假期黑色婚礼2 | 天堂在线一区二区 | 婷婷久久久久 | 18男女无套免费视频 | 欧美 日韩 国产 激情 | 美日韩精品一区二区 | 国产精品毛片久久久久久久av | 精品美女一区二区 | 国产免费www | 欧洲做受高潮欧美裸体艺术 | 一区二区三区伦理片 | 成人免费国产 | 澳门黄色一级片 | 原创真实夫妻啪啪av | 日韩精品一区在线 | 久久中出| 中国免费毛片 | 亚洲av永久无码精品放毛片 | 国产日韩av一区二区 | 国产美女无遮挡免费视频 | 欧美 国产 日本 | 亚洲干| 91网址在线观看 | 精彩毛片| www.九色| 久久精品视 | 午夜视频福利 | 一区视频在线 | 日韩欧美高清一区 | youjizz欧美| 欧美a一级片 | 久久精品国产亚洲av麻豆图片 | 日韩av看片 | 中文幕无线码中文字蜜桃 | 国产三级理论 | 韩国成人在线 | 国产精品免费入口 | 夜夜夜网站 | 成人亚洲区 | 最近最新mv字幕观看 | 韩国精品视频在线观看 |