统计分析干货 | 秩和检验及其两两比较的思路与解析
在之前的文章中,我們介紹了兩組和多組正態分布數據的組間比較方法。在本文中,我們將要講解的則是用于檢驗非正態分布數據差異的統計方法——秩和檢驗。本文將重點介紹以下內容:非獨立樣本秩和檢驗、單樣本秩和檢驗和配對樣本秩和檢驗。
為了幫助更多的臨床醫師學習如何運用JMP高效地開展數據分析,提高日常工作和發表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統計學家馮國雙博士及其團隊將在JMP數據分析平臺為大家分享一系列統計及數據分析、JMP實戰操作、JMP分析報表解讀等干貨內容,每期一個經典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫師,對所有運用JMP軟件開展數據分析的小伙伴都適用。本文為此系列文章的第14期。
秩和檢驗屬于非參數檢驗,非參數檢驗不考慮總體的參數和總體的分布類型,而是對樣本所代表的總體的分布和分布位置進行假設檢驗。秩和檢驗的基本思想是:首先進行編秩,然后用秩次代替原始數據信息來進行檢驗。基于秩次檢驗各組的平均秩是否相等,如果經檢驗得各組的平均秩不相等,則可以推論數據的分布不同。
本文主要用到兩個數據進行講解,一個是BMI的數據(圖1),另一個是IgA的數據(圖2)。
圖1 BMI數據
圖2 IgA數據
01 獨立樣本秩和檢驗
獨立樣本的秩和檢驗主要有兩種方法:用于兩組比較的Wilcoxon秩和檢驗和用于多組比較的Kruskal-Wallis秩和檢驗,詳見前文(一個神奇的JMP菜單,實現數據的所有組間比較)。二者的關系有點類似于t檢驗和方差分析的關系。
兩組比較可以用Wilcoxon秩和檢驗,也可以用Kruskal-Wallis秩和檢驗;多組比較只能用Kruskal-Wallis秩和檢驗。
兩組和多組獨立樣本秩和檢驗的操作一致,為了避免重復介紹,本文僅以多組樣本的秩和檢驗為例進行介紹。
圖1數據中,擬比較不同心功能分級患者的BMI是否存在差異。心功能分級分為四級,分別用1-4表示,BMI為非正態分布,因此考慮Kruskal-Wallis秩和檢驗。
首先通過點選JMP“分析”→“以X擬合Y”(圖3),進入組間差異比較的界面。
圖3 獨立樣本秩和檢驗操作——菜單選擇
本例中BMI為結果,心功能分級為分組,因此在對話框中將BMI放入“Y,響應”,將“心功能分級”放入“X,因子”(圖4)。
圖4 獨立樣本秩和檢驗操作——變量選擇
進入結果界面后,點擊“心功能分級-BMI”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“非參數→Wilcoxon檢驗”(圖5)。
圖5 獨立樣本秩和檢驗操作——方法選擇
輸出結果見圖6. 結果主要有兩部分:
第一部分是數據描述,給出每組的例數、秩和、平均秩等信息。從得分均值的結果可知,心功能分級為4的患者BMI最高。
第二部分為統計檢驗結果,給出了Kruskal-Wallis秩和檢驗的結果。表明不同心功能分級患者的BMI差異有統計學意義(卡方=10.4306,P=0.0152)。
注意:這里給出的統計量是卡方,是因為Kruskal-Wallis秩和檢驗的結果服從卡方分布,并不是說做了卡方檢驗,大家不要搞混了。
圖6 獨立樣本秩和檢驗操作——檢驗結果
請注意,如果進行兩組樣本的秩和檢驗,會同時給出Wilcoxon秩和檢驗和Kruskal-Wallis秩和檢驗兩個結果,兩種檢驗的結果一致。
Kruskal-Wallis秩和檢驗結果顯示有統計學差異,通常我們還對具體哪兩組有差異感興趣,這就需要進行組間兩兩比較。
點擊“心功能分級-BMI”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“非參數”→“非參數多重比較”→“對所有對執行Steel-Dwass檢驗”,操作見圖7。
圖7 獨立樣本秩和檢驗操作——兩兩比較操作
輸出結果見圖8,兩兩比較結果表明,心功能分級中的水平2和4(Z=3.089,P=0.0108);水平3和4(Z=3.057,P=0.0120)的差異有統計學意義。
圖8 獨立樣本秩和檢驗操作——兩兩比較檢驗結果
本例分析結果表明,不同心功能分級患者的BMI的差異有統計學意義。兩兩比較結果顯示,心功能分級水平2和4;3和4的差異有統計學意義。
02 單樣本秩和檢驗
基于圖1數據,探索患者的BMI與健康人群的正常值是否存在差異。假定BMI的正常值為19,BMI為非正態分布,則進行單樣本秩和檢驗。
在既往的文章中我們已經為大家講解了正態分布數據如何進行單樣本t檢驗,若數據為非正態分布,應如何操作呢?
單樣本秩和檢驗操作的前四步與單樣本t檢驗相同:
①選擇JMP菜單“分析”→“分布”;
②在彈出的對話框中,將BMI放入“Y,列”;
③在結果界面中點擊BMI左側的紅色三角形按鈕,在下拉菜單中選擇“檢驗均值”;
④在彈出的對話框中的指定假設均值中填寫19。
上述步驟詳見《一文學會t檢驗的3種常用方法》。
完成以上步驟后,點擊確定則輸出單樣本t檢驗結果。
若想輸出單樣本秩和檢驗結果,則繼續在對話框中勾選“Wilcoxon符號秩”(圖9)。
圖9 單樣本秩和檢驗操作——方法選擇
結果如圖10所示,結果不僅包含t檢驗的結果,還包含秩和檢驗的結果(“符號秩”部分的結果)。結果顯示差異有統計學意義(檢驗統計量=3114.500,P<0.0001)。
圖10 單樣本秩和檢驗操作——檢驗結果
03 配對樣本的秩和檢驗
本例采用圖2數據,分析患者化療前后IgA是否有差異。在既往的文章中我們已經為大家講解了配對t檢驗的操作步驟。
配對秩和檢驗的前兩步操作與配對t檢驗相同,操作流程為:
①選擇JMP菜單“分析”→“專業建模”→“配對”;
②在彈出的對話框中的“Y,配對響應”中先放化療前IgA,再放化療后IgA。
上述步驟詳見《一文學會t檢驗的3種常用方法》。
完成上述步驟后,在結果界面中點擊“配對”旁邊的紅色三角形按鈕,在下拉菜單中選擇“Wilcoxon符號秩”,即可獲得配對秩和檢驗的結果(圖11)。
圖11 配對秩和檢驗操作——方法選擇
結果如圖12所示,患者化療前后IgA差異有統計學意義(S=-2523.0,p<0.0001)。
圖12 配對秩和檢驗操作——檢驗結果
04 小結
通常情況下,組間比較的數據呈明顯偏態,我們會考慮采用秩和檢驗而不是t檢驗或方差分析。很多人可能對秩和檢驗存在一定誤解,總覺得秩和檢驗像是“備胎”,實際上秩和檢驗的效率并不低。
如果數據服從正態分布,秩和檢驗的檢驗效率比t檢驗、方差分析等差不了多少;而如果數據呈偏態分布,秩和檢驗的效率則遠高于t檢驗和方差分析。
想要在JMP中親自動手練習的朋友,可點擊這里下載最新的JMP 16免費試用。
總結
以上是生活随笔為你收集整理的统计分析干货 | 秩和检验及其两两比较的思路与解析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机1级题库软件,计算机一级软件哪个好
- 下一篇: WAV文件解析