日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

格拉布斯离群值检验——理论与 Python 实现

發(fā)布時間:2023/12/31 python 96 豆豆
生活随笔 收集整理的這篇文章主要介紹了 格拉布斯离群值检验——理论与 Python 实现 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

  • 原理
  • Python 代碼

參考文章: https://en.wikipedia.org/wiki/Grubbs%27s_test

原理

格拉布斯檢驗1是一種假設(shè)檢驗方法(顯著檢驗法),其原假設(shè)為:
H0:H_0:H0?: 數(shù)據(jù)集中沒有離群值
H1:H_1:H1?: 數(shù)據(jù)集中存在離群值

設(shè)數(shù)據(jù)集為:x1,x2,?,xnx_1, x_2, \cdots, x_nx1?,x2?,?,xn?計算 Grubbs 檢驗的檢驗統(tǒng)計量如下:
G=max?∣xi?xˉ∣sG=\frac{\max |x_i-\bar{x}|}{s} G=smaxxi??xˉ?
其中 sss 為樣本的標準差:
s=∑i=1n(xi?xˉ)2n?1s=\sqrt{\frac{\sum_{i=1}^{n} (x_i-\bar{x})^2}{n-1}} s=n?1i=1n?(xi??xˉ)2??
其中檢驗統(tǒng)計量 G 服從:
G~n?1n×t(1?α)/2n2(n?2)n?2+t(1?α)/2n2(n?2)G\sim \frac{n-1}{\sqrt{n}} \times \sqrt{\frac{t^2_{(1-\alpha)/2n}(n-2)}{n-2+t^2_{(1-\alpha)/2n}(n-2)}} Gn?n?1?×n?2+t(1?α)/2n2?(n?2)t(1?α)/2n2?(n?2)??
取顯著水平為 α=0.95\alpha=0.95α=0.95,若:
G>n?1n×t(1?α)/2n2(n?2)n?2+t(1?α)/2n2(n?2)G > \frac{n-1}{\sqrt{n}} \times \sqrt{\frac{t^2_{(1-\alpha)/2n}(n-2)}{n-2+t^2_{(1-\alpha)/2n}(n-2)}} G>n?n?1?×n?2+t(1?α)/2n2?(n?2)t(1?α)/2n2?(n?2)??
拒絕原假設(shè),意味著樣本中存在離群值,而離群值就是那個離 xˉ\bar{x}xˉ 最遠的樣本,一般只要將其從樣本中刪除即可。

于是,對樣本 x1,x2,?,xnx_1, x_2, \cdots, x_nx1?,x2?,?,xn?,重復(fù)上述過程,直到 格拉布斯 檢驗無法檢驗的離群值為止。

Python 代碼

def grubbs_test(x, alpha=0.95):'''格拉布斯檢驗Parameters----------x : array, series樣本.alpha : float, optional置信水平. The default is 0.95.Returns-------x : np.array移除了 outliers 后的樣本.'''# https://en.wikipedia.org/wiki/Grubbs%27s_testif isinstance(x, pd.Series) or isinstance(x, pd.DataFrame):x = x.astype('float').valueselif isinstance(x, list):x = np.array(x)# 樣本個數(shù)p = len(x)beta = 1-alphawhile True:# 格拉布斯法算出離群值if p > 2:# 求均值和方差mean, std, _ = mean_standard(x)G_arr = np.abs(x-mean)/std# 最有可能是離群值的樣本的 indexG_idx = G_arr.argmax()# 求出 Grubbs test 的能力統(tǒng)計量 GG = G_arr[G_idx]t_crital = t.ppf(beta/(2*p), p-2)# 求檢驗統(tǒng)計量在顯著性水平中的臨界值criteria = (p-1)/np.sqrt(p)*np.sqrt(t_crital**2/(p-2+t_crital**2))if G > criteria:# 若樣本中有離群值, 刪除離群值x = np.delete(x, G_idx)# 重新求取參加者個數(shù)p = len(x)else:# 若樣本中沒有離群值,則返回return xelse:return x
  • 這里介紹的方法是雙邊(two-sides)格拉布斯檢驗法。也即同時檢驗兩個方向的離群值,若需要單邊,則只需把 (1?α)/2n(1-\alpha)/2n(1?α)/2n 換做 (1?α)/n(1-\alpha)/n(1?α)/n,把 G 換成 (xmax?xˉ)/s(x_{max}-\bar{x})/s(xmax??xˉ)/s(xˉ?xmin)/s(\bar{x}-x_{min})/s(xˉ?xmin?)/s 即可。 ??

  • 總結(jié)

    以上是生活随笔為你收集整理的格拉布斯离群值检验——理论与 Python 实现的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 美女人人操 | 国产精品无码AV无码国产 | 久久久久久无码午夜精品直播 | 欧美福利一区二区三区 | 国产午夜性春猛交ⅹxxx | 伊人久久香 | 日韩一级免费片 | 亚洲1234区 | 亚洲天堂成人在线观看 | 国产午夜精品福利视频 | 国产精品无码专区av免费播放 | 先锋资源网av | 亚洲欧美中文字幕5发布 | 国产欧美一区二区三区视频在线观看 | 久久免费福利视频 | 色777| 国产欧美日韩另类 | 青青草成人在线 | 午夜视频污 | 日韩黄色网 | 久久精品国产亚洲7777 | 少妇又紧又色又爽又刺激视频 | www.狠狠操.com | 国产69精品久久久久999小说 | 国产曰肥老太婆无遮挡 | 日本黄页网站 | 三级网站国产 | cao死你| 亚洲一级黄色 | 男女激情免费网站 | 在线亚洲不卡 | 亚洲天堂网站在线 | 亚洲精品无码久久久久 | 亚洲综合五月天婷婷丁香 | 1024日韩| 国产激情在线视频 | 亚洲黄视频 | 丰满人妻老熟妇伦人精品 | 日韩中文字幕不卡 | 日一区二区三区 | 色婷av | 久久精品视频在线免费观看 | 一个人看的www日本高清视频 | 日本视频在线免费 | 美女洗澡隐私免费网站 | 911看片 | 国产91热爆ts人妖在线 | 亚洲免费av网站 | 加勒比hezyo黑人专区 | 全程偷拍露脸中年夫妇 | 欧美另类v | 日韩激情在线观看 | 少妇精品偷拍高潮白浆 | 久久91精品国产91久久小草 | 日本美女动态图 | 奇米网久久 | 中国国产毛片 | 狠狠躁日日躁夜夜躁 | jav中文字幕 | 天天爱天天色 | 欧美亚洲三级 | 毛片毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 777精品久无码人妻蜜桃 | 黄色avav | 久久精品视频国产 | 自拍偷拍亚洲欧美 | 黑人干亚洲 | 久久国产精品免费看 | 2017天天干 | 黄色片视频免费 | 日一日干一干 | 开心成人激情 | 日本肉体xxxx裸体137大胆图 | www裸玉足久久久 | 6080亚洲精品一区二区 | 久久黄色影视 | 色婷婷视频在线 | 性爽爽 | 黑人专干日本人xxxx | 少妇久久久久久被弄高潮 | 春色校园激情 | 色哟哟日韩精品 | 免费av国产| 精品国模一区二区三区欧美 | 嫩草在线播放 | av福利片| 美女张开腿流出白浆 | 伊人开心网 | 成人黄色电影网址 | 一区二区三区四区亚洲 | 午夜美女网站 | 婷婷久久久久 | 亚洲一区福利视频 | 日本爽爽 | 欧美三级小说 | 在线免费视频一区 | 亚洲精品永久免费 | 日韩视频一区二区三区在线播放免费观看 | 丝袜美女被c |