R语言与非参数检验之单样本位置检验
學習筆記
學習書目:《統計學:從數據到結論》–吳喜之
非參數檢驗
- 啥是非參數檢驗
很多檢驗都假定了總體的背景分布,但也有些檢驗沒有假定總體分布的具體形式,這些檢驗多根據數據觀測值的相對大小建立檢驗統計量,然后找到在零假設下這些統計量的分布,并且看這些統計量的數據實現是否在零假設下屬于小概率事件。這種和數據本身的總體分布無關的檢驗稱為非參數檢驗。
- 非參數檢驗的優越性
在分布未知時,如果還假定總體有諸如正態分布那樣的己知分布,在進行推斷性統計時,就可能產生錯誤甚至災難。非參數檢驗總是比傳統檢驗安全,但在總體分布形式已知時,非參數檢驗就不如傳統方法效率高,這是因為非參數的方法利用的信息要少一些,往往在傳統方法可以拒絕零假設的情況下,非參數檢驗無法拒絕。但非參數統計在總體分布未知時,效率要比假定了錯誤總體分布時的傳統方法要高,有時要高很多.
關于單樣本位置檢驗
符號檢驗
符號檢驗,它是對位置參數中位數的檢驗,而且不需要任何關于總體的假定。當然,對于像正態分布或ttt分布那樣的對稱分布,總體中位數就是總體均值.這時,對中位數的檢驗等價于對均值的檢驗.
檢驗一般以兩種形式出現,一種是看中位數或α\alphaα分位數是否是某個事先認定的值(零假設),一種是大于(或小于)某數的觀測值是否為一個事先認定的比例(零假設).
符號秩檢驗的原理是這樣的,有樣本x1,x2,...,xnx_1,x_2,...,x_nx1?,x2?,...,xn?,如果零假設為中位數m=m0m=m_0m=m0?,則需要計算在n個差xi?m0(i=1,2,...,n)x_i-m_0(i=1,2,...,n)xi??m0?(i=1,2,...,n)中有多少正負符號,即可利用二項分布的概率來計算ppp值,進而判斷是否拒絕原假設。
Wilcoxon符號秩檢驗
符號檢驗利用了觀察值和零假設的中位數之差的符號來進行檢驗,但是它并沒有利用這些差的絕對值大小所包含的信息,不同的符號僅僅代表了在中位數的哪一邊,而差的絕對值的秩的大小代表了距離中心的遠近。如果把這兩者結合在一起,自然比僅僅利用正負號的數目要更有效。這也是馬上要引入的Wilcoxon符號秩檢驗的宗旨,它把差的絕對值的秩分別按照不同的符號相加作為其檢驗統計量。
與符號檢驗不同,Wilcoxon符號秩檢驗對數據總體分布有一點了解,它要求假定樣本點來自連續對稱總體分布,而符號檢驗不需要知道任何總體分布的性質。
Wilcoxon符號秩檢驗的原理是這樣的,假定x1,x2,...,xnx_1,x_2,...,x_nx1?,x2?,...,xn?為來自連續對稱總體的一個樣本,如果零假設為中位數m=m0m=m_0m=m0?, 則需要把∣xi?m0∣|x_i -m_0|∣xi??m0?∣排序,得到∣xi?m0∣|x_i -m_0|∣xi??m0?∣的秩,然后把xi?m0x_i-m_0xi??m0?的符號加到相應的秩上面。于是,可以得到既有帶正號的秩,又有帶負號的秩.對帶負號的秩的絕對值求和.即把滿足xi?m0<0x_i-m_0<0xi??m0?<0 的∣xi?m0∣|x_i -m_0|∣xi??m0?∣的秩求和,并用W?W^-W?表示;類似地,對帶正號的秩的絕對值也求和,即把滿足xi?m0>0x_i-m_0>0xi??m0?>0 的∣xi?m0∣|x_i -m_0|∣xi??m0?∣的秩求和,并用W+W^+W+表示.如果m0m_0m0?的確是中位數,那么W?W^-W?和W+W^+W+應該大體上差不多。如果W?W^-W?或W+W^+W+過大或過小,則懷疑中位數m=m0m=m_0m=m0?的零假設. 令W=min(W?,W+)W=min(W^-, W^+)W=min(W?,W+),則當WWW太小時,應該拒絕零假設,這個WWW就是Wilcoxon符號秩檢驗統計量。
R語言實現
我們現在有一個樣本量為40的樣本(假設總體分布是對稱的):
74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5經過計算,樣本中位數為73.5,現在我做出如下零假設:
H0:m=74H1:m<74H_0:m=74 \\H_1:m <74 H0?:m=74H1?:m<74
現在我用上面學過的兩種方法進行檢驗。
符號檢驗:
> pbinom(sum(new_data>74), 40, 0.5) [1] 0.4373147Wilcoxon符號秩檢驗:
> wilcox.test(new_data, m=74, alternative = "less")Wilcoxon signed rank test with continuity correctiondata: new_data V = 360, p-value = 0.2527 alternative hypothesis: true location is less than 74可以看到,雖然兩個檢驗都不能拒絕原假設,但是Wilcoxon符號秩檢驗的ppp值要比符號檢驗的ppp值小很多。所以,當數據來自對稱分布時,Wilcoxon符號秩檢驗比符號檢驗效率要高。
總結
以上是生活随笔為你收集整理的R语言与非参数检验之单样本位置检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 全民才艺大赛口号文案28句
- 下一篇: 存档丢失以后再补之R语言与logisti