r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验
前面幾期我們介紹了參數(shù)檢驗,t檢驗和方差分析:
臨度科研:數(shù)據(jù)統(tǒng)計的理解和運用(三)方差分析?zhuanlan.zhihu.com臨度科研:數(shù)據(jù)統(tǒng)計的理解和運用(二)t檢驗的應(yīng)用?zhuanlan.zhihu.com今天我們來介紹非參數(shù)檢驗——迷人的卡方檢驗(Chi-square test/Chi-Square Goodness-of-Fit Test)。
卡方檢驗是一種用途很廣的計數(shù)資料的假設(shè)檢驗方法。它屬于非參數(shù)檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構(gòu)成比)以及兩個分類變量的關(guān)聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實際頻數(shù)的吻合程度或擬合優(yōu)度問題。
卡方檢驗是以 χ2 分布為基礎(chǔ)的一種常用假設(shè)檢驗方法,它的假設(shè)檢驗為:
H0:觀察頻數(shù)與期望頻數(shù)沒有差別。H1:觀察頻數(shù)與期望頻數(shù)有差別。
卡方檢驗的基本思想是:首先假設(shè) H0 成立,基于此前提計算出 χ2 值,它表示觀察值與理論值之間的偏離程度。根據(jù) χ2 分布及自由度可以確定在H0 假設(shè)成立的情況下獲得當(dāng)前統(tǒng)計量及更極端情況的概率P。
如果 P 值很小,說明觀察值與理論值偏離程度太大,應(yīng)當(dāng)拒絕無效假設(shè),表示比較資料之間有顯著差異;否則就不能拒絕無效假設(shè),尚不能認(rèn)為樣本所代表的實際情況和理論假設(shè)有差別。
適用于四格表應(yīng)用條件:
兩個獨立樣本比較可以分以下3種情況:(1) 所有的理論數(shù) T≥5 并且總樣本量 n≥40,用 Pearson 卡方進(jìn)行檢驗。(2) 如果理論數(shù) T<5 但 T≥1,并且 n≥40,用連續(xù)性校正的卡方進(jìn)行檢驗。(3) 如果有理論數(shù) T<1 或 n<40,則用 Fisher’s 檢驗。
R×C表卡方檢驗應(yīng)用條件:
(1) R×C表中理論數(shù)小于5的格子不能超過1/5;(2) 不能有小于1的理論數(shù);不滿足 (1) 或 (2) 時,均采用 Fisher’s 檢驗。如果實驗中有不符合R×C表的卡方檢驗,可以通過增加樣本數(shù)、列合并來實現(xiàn)。
列聯(lián)表的資料大致分為以下 10 類:
由于篇幅限制,因此本次僅講解兩條(感興趣的讀者可以先關(guān)注我們,我們后續(xù)推出精彩講解),也是常見的兩類:
· 成組設(shè)計橫斷面研究四格表資料統(tǒng)計分析
· 單因素多水平設(shè)計雙向無序RXC表資料統(tǒng)計分析
例1. 某研究隨機抽取了某大學(xué)四年級學(xué)生124人,調(diào)查大學(xué)英語六級通過情況,結(jié)果見下表。問該大學(xué)男生和女生英語六級通過率有無差別?
表1: 大學(xué)英語六級通過情況對數(shù)據(jù)結(jié)構(gòu)的分析
該資料設(shè)計上屬于結(jié)果變量為二值的成組設(shè)計定性資料,列聯(lián)表分類上屬于橫斷面研究設(shè)計四格表資料。
該目的是比較兩個性別組英語六級通過率是否相等,可采用一般 χ2 檢驗或 Fisher 精確檢驗來處理。
軟件操作:SAS
圖1:頻數(shù)分布圖2:統(tǒng)計結(jié)果結(jié)果解答:第一步,先看期望頻數(shù),從上圖得知,四個頻數(shù)分別為:49.453、23.548、34.548和16.452,均>5,故采用 Pearson 卡方檢驗,結(jié)果 χ2=10.887,P=0.001,拒絕H0 假設(shè),認(rèn)為女生的通過率高于男生(χ2=10.887,P=0.001),差異有統(tǒng)計學(xué)意義。
軟件操作:R語言
圖3:數(shù)據(jù)矩陣圖4:卡方檢驗結(jié)果結(jié)果只有統(tǒng)計量,并沒有出現(xiàn)期望頻數(shù),因此我們需要再次敲入代碼:
圖5:期望頻數(shù)從結(jié)果得知,所有頻數(shù)均>5,與SAS結(jié)果一致,結(jié)果,χ2=9.637,P=0.001,拒絕 H0 假設(shè),認(rèn)為女生的通過率高于男生(χ2=9.637,P=0.001),差異有統(tǒng)計學(xué)意義。
軟件操作:SPSS
1、建立數(shù)據(jù)庫
圖6:卡方檢驗數(shù)據(jù)庫2、對數(shù)據(jù)進(jìn)行加權(quán)
數(shù)據(jù) → 加權(quán)個案 → 對需要加權(quán)的變量進(jìn)行加權(quán) → 確定
分析 → 描述統(tǒng)計 → 交叉表 → 選擇行變量和列變量 → 統(tǒng)計量選擇卡方 → 單元格選擇期望 → 勾選列百分比
圖8:卡方檢驗圖9:結(jié)果從結(jié)果得知,所有頻數(shù)均>5,與SAS和R結(jié)果一致,結(jié)果,χ2=10.887,P=0.001,拒絕 H0 假設(shè),認(rèn)為女生的通過率高于男生(χ2=10.887,P=0.001),差異有統(tǒng)計學(xué)意義。
例2.某大學(xué)對計算機專業(yè)、金融專業(yè)、傳媒專業(yè)各50名學(xué)生進(jìn)行心理測試,并判斷每個學(xué)生屬于哪一類典型氣質(zhì)類型,所得結(jié)果整理成下表,請進(jìn)行合理的統(tǒng)計分析。
表2:心理測試結(jié)果對數(shù)據(jù)結(jié)構(gòu)的分析
本例屬于原因變量和結(jié)果變量均為多值名義變量單因素多水平設(shè)計定型資料,從列聯(lián)表的分類上來看屬于雙向無序R×C表。
比較原因變量各水平的頻數(shù)分布情況,可以用一般χ2檢驗。
圖10:頻數(shù)分布圖11:統(tǒng)計結(jié)果結(jié)果解答:第一步,先看期望頻數(shù),從上圖10得知,頻數(shù)均>5,故采用Pearson卡方檢驗,結(jié)果,χ2=3.434,P=0.753,不能拒絕 H0假設(shè),因此尚不能認(rèn)為不同人格的專業(yè)分布不同(χ2=3.434,P=0.753)。差異無統(tǒng)計學(xué)意義。
軟件操作:R語言
圖12:建立矩陣圖13:卡方檢驗結(jié)果圖14:輸出期望頻數(shù)結(jié)果解答:第一步,先看期望頻數(shù),從上圖14得知,頻數(shù)均>5,故采用Pearson卡方檢驗,結(jié)果,χ2=3.434,P=0.753,不能拒絕 H0假設(shè),因此尚不能認(rèn)為不同人格的專業(yè)分布不同(χ2=3.434,P=0.753)。差異無統(tǒng)計學(xué)意義。
軟件操作:SPSS
1、建立數(shù)據(jù)庫
圖15:建立數(shù)據(jù)庫2、對數(shù)據(jù)進(jìn)行加權(quán)
數(shù)據(jù) → 加權(quán)個案 → 對需要加權(quán)的變量進(jìn)行加權(quán) → 確定
圖16:數(shù)據(jù)加權(quán)圖17:進(jìn)行卡方檢驗圖18:卡方檢驗結(jié)果結(jié)果解答:第一步,先看期望頻數(shù),從上圖18得知,頻數(shù)均>5,故采用Pearson卡方檢驗,結(jié)果,χ2=3.434,P=0.753,不能拒絕H0假設(shè),因此尚不能認(rèn)為不同人格的專業(yè)分布不同(χ2=3.434,P=0.753)。差異無統(tǒng)計學(xué)意義。
好啦,本期講解到此結(jié)束,更多類型的列聯(lián)表分析,下次再分享!
歡迎大家在評論區(qū)提出自己的問題~
總結(jié)
以上是生活随笔為你收集整理的r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: halcon旋转后坐标_基于FPGA的图
- 下一篇: android 结束if循环_Andro