當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

R语言与非参数检验之单样本位置检验

發布時間：2023/12/19 编程问答 48 豆豆

生活随笔收集整理的這篇文章主要介紹了 R语言与非参数检验之单样本位置检验小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

學習筆記

學習書目：《統計學：從數據到結論》–吳喜之

非參數檢驗

啥是非參數檢驗

很多檢驗都假定了總體的背景分布，但也有些檢驗沒有假定總體分布的具體形式，這些檢驗多根據數據觀測值的相對大小建立檢驗統計量，然后找到在零假設下這些統計量的分布，并且看這些統計量的數據實現是否在零假設下屬于小概率事件。這種和數據本身的總體分布無關的檢驗稱為非參數檢驗。

非參數檢驗的優越性

在分布未知時，如果還假定總體有諸如正態分布那樣的己知分布，在進行推斷性統計時，就可能產生錯誤甚至災難。非參數檢驗總是比傳統檢驗安全，但在總體分布形式已知時，非參數檢驗就不如傳統方法效率高，這是因為非參數的方法利用的信息要少一些，往往在傳統方法可以拒絕零假設的情況下，非參數檢驗無法拒絕。但非參數統計在總體分布未知時，效率要比假定了錯誤總體分布時的傳統方法要高，有時要高很多.

關于單樣本位置檢驗

符號檢驗

符號檢驗，它是對位置參數中位數的檢驗，而且不需要任何關于總體的假定。當然，對于像正態分布或 $t$ 分布那樣的對稱分布，總體中位數就是總體均值.這時，對中位數的檢驗等價于對均值的檢驗.

檢驗一般以兩種形式出現，一種是看中位數或 $α\alpha$ 分位數是否是某個事先認定的值(零假設)，一種是大于(或小于)某數的觀測值是否為一個事先認定的比例(零假設).

符號秩檢驗的原理是這樣的，有樣本 $x_1,x_2,...,x_n$ ，如果零假設為中位數 $m=m_0$ ,則需要計算在n個差 $x_i-m_0(i=1,2,...,n)$ 中有多少正負符號，即可利用二項分布的概率來計算 $p$ 值，進而判斷是否拒絕原假設。

Wilcoxon符號秩檢驗

符號檢驗利用了觀察值和零假設的中位數之差的符號來進行檢驗，但是它并沒有利用這些差的絕對值大小所包含的信息，不同的符號僅僅代表了在中位數的哪一邊，而差的絕對值的秩的大小代表了距離中心的遠近。如果把這兩者結合在一起，自然比僅僅利用正負號的數目要更有效。這也是馬上要引入的Wilcoxon符號秩檢驗的宗旨，它把差的絕對值的秩分別按照不同的符號相加作為其檢驗統計量。

與符號檢驗不同，Wilcoxon符號秩檢驗對數據總體分布有一點了解，它要求假定樣本點來自連續對稱總體分布，而符號檢驗不需要知道任何總體分布的性質。

Wilcoxon符號秩檢驗的原理是這樣的，假定 $x_1,x_2,...,x_n$ 為來自連續對稱總體的一個樣本,如果零假設為中位數 $m=m_0$ , 則需要把 $x_i -m_0|$ 排序，得到 $x_i -m_0|$ 的秩，然后把 $x_i-m_0$ 的符號加到相應的秩上面。于是，可以得到既有帶正號的秩，又有帶負號的秩.對帶負號的秩的絕對值求和.即把滿足 $x_i-m_0<0$ 的 $x_i -m_0|$ 的秩求和，并用 $W^-$ 表示；類似地，對帶正號的秩的絕對值也求和，即把滿足 $x_i-m_0>0$ 的 $x_i -m_0|$ 的秩求和，并用 $W^+$ 表示.如果 $m_0$ 的確是中位數，那么 $W^-$ 和 $W^+$ 應該大體上差不多。如果 $W^-$ 或 $W^+$ 過大或過小，則懷疑中位數 $m=m_0$ 的零假設. 令 $W=min(W^-, W^+)$ ，則當 $W$ 太小時，應該拒絕零假設，這個 $W$ 就是Wilcoxon符號秩檢驗統計量。

R語言實現

我們現在有一個樣本量為40的樣本(假設總體分布是對稱的)：

74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5

經過計算，樣本中位數為73.5，現在我做出如下零假設：
$H_0:m=74 \\H_1:m <74$

現在我用上面學過的兩種方法進行檢驗。

符號檢驗：

> pbinom(sum(new_data>74), 40, 0.5) [1] 0.4373147

Wilcoxon符號秩檢驗：

> wilcox.test(new_data, m=74, alternative = "less")Wilcoxon signed rank test with continuity correctiondata: new_data V = 360, p-value = 0.2527 alternative hypothesis: true location is less than 74

可以看到，雖然兩個檢驗都不能拒絕原假設，但是Wilcoxon符號秩檢驗的 $p$ 值要比符號檢驗的 $p$ 值小很多。所以，當數據來自對稱分布時，Wilcoxon符號秩檢驗比符號檢驗效率要高。

總結

以上是生活随笔為你收集整理的R语言与非参数检验之单样本位置检验的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：全民才艺大赛口号文案28句
下一篇：存档丢失以后再补之R语言与logisti