统计分析干货 | 秩和检验及其两两比较的思路与解析
在之前的文章中,我們介紹了兩組和多組正態(tài)分布數(shù)據(jù)的組間比較方法。在本文中,我們將要講解的則是用于檢驗非正態(tài)分布數(shù)據(jù)差異的統(tǒng)計方法——秩和檢驗。本文將重點介紹以下內(nèi)容:非獨立樣本秩和檢驗、單樣本秩和檢驗和配對樣本秩和檢驗。
為了幫助更多的臨床醫(yī)師學(xué)習(xí)如何運用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計學(xué)家馮國雙博士及其團隊將在JMP數(shù)據(jù)分析平臺為大家分享一系列統(tǒng)計及數(shù)據(jù)分析、JMP實戰(zhàn)操作、JMP分析報表解讀等干貨內(nèi)容,每期一個經(jīng)典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫(yī)師,對所有運用JMP軟件開展數(shù)據(jù)分析的小伙伴都適用。本文為此系列文章的第14期。
秩和檢驗屬于非參數(shù)檢驗,非參數(shù)檢驗不考慮總體的參數(shù)和總體的分布類型,而是對樣本所代表的總體的分布和分布位置進行假設(shè)檢驗。秩和檢驗的基本思想是:首先進行編秩,然后用秩次代替原始數(shù)據(jù)信息來進行檢驗。基于秩次檢驗各組的平均秩是否相等,如果經(jīng)檢驗得各組的平均秩不相等,則可以推論數(shù)據(jù)的分布不同。
本文主要用到兩個數(shù)據(jù)進行講解,一個是BMI的數(shù)據(jù)(圖1),另一個是IgA的數(shù)據(jù)(圖2)。
圖1 BMI數(shù)據(jù)
圖2 IgA數(shù)據(jù)
01 獨立樣本秩和檢驗
獨立樣本的秩和檢驗主要有兩種方法:用于兩組比較的Wilcoxon秩和檢驗和用于多組比較的Kruskal-Wallis秩和檢驗,詳見前文(一個神奇的JMP菜單,實現(xiàn)數(shù)據(jù)的所有組間比較)。二者的關(guān)系有點類似于t檢驗和方差分析的關(guān)系。
兩組比較可以用Wilcoxon秩和檢驗,也可以用Kruskal-Wallis秩和檢驗;多組比較只能用Kruskal-Wallis秩和檢驗。
兩組和多組獨立樣本秩和檢驗的操作一致,為了避免重復(fù)介紹,本文僅以多組樣本的秩和檢驗為例進行介紹。
圖1數(shù)據(jù)中,擬比較不同心功能分級患者的BMI是否存在差異。心功能分級分為四級,分別用1-4表示,BMI為非正態(tài)分布,因此考慮Kruskal-Wallis秩和檢驗。
首先通過點選JMP“分析”→“以X擬合Y”(圖3),進入組間差異比較的界面。
圖3 獨立樣本秩和檢驗操作——菜單選擇
本例中BMI為結(jié)果,心功能分級為分組,因此在對話框中將BMI放入“Y,響應(yīng)”,將“心功能分級”放入“X,因子”(圖4)。
圖4 獨立樣本秩和檢驗操作——變量選擇
進入結(jié)果界面后,點擊“心功能分級-BMI”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“非參數(shù)→Wilcoxon檢驗”(圖5)。
圖5 獨立樣本秩和檢驗操作——方法選擇
輸出結(jié)果見圖6. 結(jié)果主要有兩部分:
第一部分是數(shù)據(jù)描述,給出每組的例數(shù)、秩和、平均秩等信息。從得分均值的結(jié)果可知,心功能分級為4的患者BMI最高。
第二部分為統(tǒng)計檢驗結(jié)果,給出了Kruskal-Wallis秩和檢驗的結(jié)果。表明不同心功能分級患者的BMI差異有統(tǒng)計學(xué)意義(卡方=10.4306,P=0.0152)。
注意:這里給出的統(tǒng)計量是卡方,是因為Kruskal-Wallis秩和檢驗的結(jié)果服從卡方分布,并不是說做了卡方檢驗,大家不要搞混了。
圖6 獨立樣本秩和檢驗操作——檢驗結(jié)果
請注意,如果進行兩組樣本的秩和檢驗,會同時給出Wilcoxon秩和檢驗和Kruskal-Wallis秩和檢驗兩個結(jié)果,兩種檢驗的結(jié)果一致。
Kruskal-Wallis秩和檢驗結(jié)果顯示有統(tǒng)計學(xué)差異,通常我們還對具體哪兩組有差異感興趣,這就需要進行組間兩兩比較。
點擊“心功能分級-BMI”單因子分析旁邊的紅色三角形按鈕,在下拉菜單中選擇“非參數(shù)”→“非參數(shù)多重比較”→“對所有對執(zhí)行Steel-Dwass檢驗”,操作見圖7。
圖7 獨立樣本秩和檢驗操作——兩兩比較操作
輸出結(jié)果見圖8,兩兩比較結(jié)果表明,心功能分級中的水平2和4(Z=3.089,P=0.0108);水平3和4(Z=3.057,P=0.0120)的差異有統(tǒng)計學(xué)意義。
圖8 獨立樣本秩和檢驗操作——兩兩比較檢驗結(jié)果
本例分析結(jié)果表明,不同心功能分級患者的BMI的差異有統(tǒng)計學(xué)意義。兩兩比較結(jié)果顯示,心功能分級水平2和4;3和4的差異有統(tǒng)計學(xué)意義。
02 單樣本秩和檢驗
基于圖1數(shù)據(jù),探索患者的BMI與健康人群的正常值是否存在差異。假定BMI的正常值為19,BMI為非正態(tài)分布,則進行單樣本秩和檢驗。
在既往的文章中我們已經(jīng)為大家講解了正態(tài)分布數(shù)據(jù)如何進行單樣本t檢驗,若數(shù)據(jù)為非正態(tài)分布,應(yīng)如何操作呢?
單樣本秩和檢驗操作的前四步與單樣本t檢驗相同:
①選擇JMP菜單“分析”→“分布”;
②在彈出的對話框中,將BMI放入“Y,列”;
③在結(jié)果界面中點擊BMI左側(cè)的紅色三角形按鈕,在下拉菜單中選擇“檢驗均值”;
④在彈出的對話框中的指定假設(shè)均值中填寫19。
上述步驟詳見《一文學(xué)會t檢驗的3種常用方法》。
完成以上步驟后,點擊確定則輸出單樣本t檢驗結(jié)果。
若想輸出單樣本秩和檢驗結(jié)果,則繼續(xù)在對話框中勾選“Wilcoxon符號秩”(圖9)。
圖9 單樣本秩和檢驗操作——方法選擇
結(jié)果如圖10所示,結(jié)果不僅包含t檢驗的結(jié)果,還包含秩和檢驗的結(jié)果(“符號秩”部分的結(jié)果)。結(jié)果顯示差異有統(tǒng)計學(xué)意義(檢驗統(tǒng)計量=3114.500,P<0.0001)。
圖10 單樣本秩和檢驗操作——檢驗結(jié)果
03 配對樣本的秩和檢驗
本例采用圖2數(shù)據(jù),分析患者化療前后IgA是否有差異。在既往的文章中我們已經(jīng)為大家講解了配對t檢驗的操作步驟。
配對秩和檢驗的前兩步操作與配對t檢驗相同,操作流程為:
①選擇JMP菜單“分析”→“專業(yè)建模”→“配對”;
②在彈出的對話框中的“Y,配對響應(yīng)”中先放化療前IgA,再放化療后IgA。
上述步驟詳見《一文學(xué)會t檢驗的3種常用方法》。
完成上述步驟后,在結(jié)果界面中點擊“配對”旁邊的紅色三角形按鈕,在下拉菜單中選擇“Wilcoxon符號秩”,即可獲得配對秩和檢驗的結(jié)果(圖11)。
圖11 配對秩和檢驗操作——方法選擇
結(jié)果如圖12所示,患者化療前后IgA差異有統(tǒng)計學(xué)意義(S=-2523.0,p<0.0001)。
圖12 配對秩和檢驗操作——檢驗結(jié)果
04 小結(jié)
通常情況下,組間比較的數(shù)據(jù)呈明顯偏態(tài),我們會考慮采用秩和檢驗而不是t檢驗或方差分析。很多人可能對秩和檢驗存在一定誤解,總覺得秩和檢驗像是“備胎”,實際上秩和檢驗的效率并不低。
如果數(shù)據(jù)服從正態(tài)分布,秩和檢驗的檢驗效率比t檢驗、方差分析等差不了多少;而如果數(shù)據(jù)呈偏態(tài)分布,秩和檢驗的效率則遠高于t檢驗和方差分析。
想要在JMP中親自動手練習(xí)的朋友,可點擊這里下載最新的JMP 16免費試用。
總結(jié)
以上是生活随笔為你收集整理的统计分析干货 | 秩和检验及其两两比较的思路与解析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机1级题库软件,计算机一级软件哪个好
- 下一篇: WAV文件解析