R统计工具:正态性检验
P-P圖是根據變量的累積比例與指定分布的累積比例之間的關系所繪制的圖形。通過P-P圖可以檢驗數據是否符合指定的分布。當數據符合指定分布時,P-P圖中各點近似呈一條直線。如果P-P圖中各點不呈直線,但有一定規律,可以對變量數據進行轉換,使轉換后的數據更接近指定分布。
Q-Q圖是用樣本的分位數與所指定分布的分位數之間的關系曲線來進行檢驗。縱坐標為分布分位數,橫坐標為樣本分位數,要利用Q-Q圖鑒別樣本數據是否近似于正態分布,只需看Q-Q圖上的點是否近似地在一條直線附近,而且該直線的斜率為標準差,截距為均值, 用Q-Q圖還可獲得樣本偏度和峰度的粗略信息.
#畫QQ圖
x<-rnorm(35,0,1)#正態分布的隨機抽樣數據的Q-Q圖
qqnorm(x, main = "Normal Q-Q Plot",
xlab = "Theoretical Normal Quantiles",
ylab = "Sample Normal Quantiles",pch=19)
qqline(x)
#畫P-P圖
x<-rnorm(35)
plot(ppoints(length(x)),pnorm(sort(x)),pch=19,xlab ='Theoretical cumulative distribution', ylab = "Empirical cumulative distribution")
abline(0,1)
StatDA包里邊的函數ppplot.das和qqplot.das或許更好理解一些。
#ppplot.das
library(StatDA)
ppplot.das(x, pdist = pnorm, xlab ='Theoretical cumulative distribution', ylab = "Empirical cumulative distribution", line = TRUE,pch=19
分布的正態性檢驗的幾個方法
(1)Shapiro-Wilk檢驗(W檢驗)
一種非參數檢驗,常用于小樣本,以觀測樣本和對應的理論分位數相關為基礎,適用樣本數在3到5000之間。R中函數為shapiro.test()。
原假設:檢驗的樣本來自正態分布。
例:set.seed(123)
?????? shapiro.test(rnorm(35))
結果:Shapiro-Wilk normality test
????????? data: rnorm(35)
????????? W = 0.9849, p-value = 0.9027
(2)Kolmogorov-Smirnov Test(D檢驗)
這是對經驗分布的擬合檢驗,檢驗的是經驗分布函數和假設總體分布函數的差異,適應于大樣本。
Kolmogorov-Smirnov統計量計算的是:
例:?set.seed(123)
??????? y<-rlnorm(3500,0,1)
??????? ks.test(y,'pnorm',0,1)
結果:??One-sample Kolmogorov-Smirnov test
??????????? data: y
???? D = 0.5321, p-value < 2.2e-16
??? alternative hypothesis: two-sided
即y并非來自正態分布。
(3)其他
Jarque-Bera 檢驗:tseries包的函數jarque.bera.test?,使用峰度和偏度檢驗分布的正態性。
Anderson-Darling檢驗,R包ADGofTest
特別的,R包fbasic的 NormalityTests提供了一組用于檢驗金融收益正態性的單樣本檢驗函數,包含了以上的檢驗。
?
原文:
http://site.douban.com/182577/widget/notes/10568316/note/265289957/?
總結
以上是生活随笔為你收集整理的R统计工具:正态性检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌大裁员“幸存者”:搜索巨头不再特别,
- 下一篇: R概率函数