grubbs准则 matlab_(转)格拉布斯准则(Grubbs Criterion)处理数据异常
簡(jiǎn)介
Grubbs測(cè)試(以1950年發(fā)表測(cè)試的Frank E. Grubbs命名),也稱為最大歸一化殘差測(cè)試或極端學(xué)生化偏差測(cè)試,是一種統(tǒng)計(jì)測(cè)試,用于檢測(cè)假設(shè)的單變量數(shù)據(jù)集中的異常值來(lái)自正常分布的人口。
定義
格拉布斯的測(cè)試基于正態(tài)假設(shè)。也就是說(shuō),在應(yīng)用Grubbs測(cè)試之前,應(yīng)首先驗(yàn)證數(shù)據(jù)是否可以通過(guò)正態(tài)分布合理地近似。
格拉布斯的測(cè)試一次檢測(cè)到一個(gè)異常值。從數(shù)據(jù)集中刪除該異常值,并且迭代測(cè)試直到?jīng)]有檢測(cè)到異常值。但是,多次迭代會(huì)改變檢測(cè)概率,并且測(cè)試不應(yīng)該用于六個(gè)或更少的樣本大小(n>6),因?yàn)樗?jīng)常將大多數(shù)點(diǎn)標(biāo)記為異常值。
Grubbs測(cè)試是根據(jù)假設(shè)定義的:
:數(shù)據(jù)集中沒(méi)有異常值
:數(shù)據(jù)集中只有一個(gè)異常值
公式
?和?分別表示樣本均值和標(biāo)準(zhǔn)差。
Grubbs檢驗(yàn)統(tǒng)計(jì)量是樣本標(biāo)準(zhǔn)差的單位與樣本均值的最大絕對(duì)偏差。
這是測(cè)試的雙邊版本。
Grubbs測(cè)試也可以定義為單側(cè)測(cè)試。
要測(cè)試最小值是否為異常值
公式:
要測(cè)試最大值是否為異常值
公式:
表示最小值。
表示最大值。
對(duì)于雙邊測(cè)試,沒(méi)有異常值的假設(shè)在顯著級(jí)別a級(jí)被拒絕
表示的上臨界值的的t分布與N?- 2?自由度和 顯著性水平a/(2N)。對(duì)于單側(cè)檢驗(yàn),用a/N代替a/(2N)。
t分布可用于構(gòu)建真實(shí)均值的置信區(qū)間。
缺點(diǎn)
格拉布斯和和狄克遜法均給出了嚴(yán)格的結(jié)果,但存在狄克遜法同樣的缺陷。
優(yōu)化
朱宏等人采用數(shù)據(jù)值的中位數(shù)取代平均值,改進(jìn)得到了更為穩(wěn)健的處理方法,有效消除了同側(cè)異常值的屏蔽效應(yīng)。
國(guó)際上常推薦采用格拉布斯準(zhǔn)則法。
總結(jié)
以上是生活随笔為你收集整理的grubbs准则 matlab_(转)格拉布斯准则(Grubbs Criterion)处理数据异常的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 计算机桌面有浮层,win7电脑桌面便签小
- 下一篇: kettle下载百度网盘地址含入门教程8