商务与经济统计学习 --多个比率的比较、独立性及拟合优度检验
多個比率的比較、獨立性及擬合優度檢驗
前面介紹了關于一個和兩個總體的總體均值、比率和方差的假設檢驗的統計推斷方法
本章進行的假設檢驗所使用的檢驗統計量都基于χ2χ2分布,在所有情形中數據都是分類型的 這些χ2χ2檢驗是多用途的,并由檢驗下列的應用擴充了假設
P1:檢驗三個或多個總體比率的相等性
P2:檢驗兩個分類變量的獨立性
P3:檢驗一個總體的概率分布是否服從一個特殊的歷史或理論的概率分布
三個或多個總體比率來的相等性的檢驗
兩個總體比率的統計推斷方法,其假設檢驗的結論基于標準正態檢驗統計量zz。
這里使用檢驗統計量χ2χ2,對三個或多個總體比率的相等性進行統計推斷
p1p1——總體11的總體比率
p2p2——總體22的總體比率
pkpk——總體kk的總體比率
關于kk個總體比率相等性的假設陳述如下:
H0:p1=p2=...=pkH0:p1=p2=...=pk
Ha:Ha: 所有總體比率不全相等
如果樣本數據和χ2χ2檢驗計算結果表明H0H0沒有拒絕,不能斷定kk個總體比率有差異。然而,如果樣本數據和χ2χ2檢驗計算結果表明H0H0被拒絕,有統計證據得出kk個總體比率不全相等的結論 也就是說 一個或多個總體比率與其他總體比率不相等,可以進一步分析,以得出哪個或哪些總體比率與其他總體比率有顯著差異
假設:H0:p1=p2=...=p3H0:p1=p2=...=p3 Ha:Ha:所有總體比例不全相等
#觀察頻數——樣本結果# 樣本1 樣本2 樣本3 合計# p 69 120 123 312# 1-p 56 80 52 188# 合計 125 200 175 500根據原假設H0:p1=p2=p3=312500=0.624H0:p1=p2=p3=312500=0.624為每一類總體比例的總體最佳估計量
在假定H0H0為真時的期望頻數:
eij=第i行合計數×第j列合計數總樣本容量eij=第i行合計數×第j列合計數總樣本容量
# 原假設為真時:期望頻數 # 總體1 總體2 總體3 合計 # p 125x0.624=78 124.8 109.2 312 # 1-p 47 75.2 65.8 188 # 合計 125 200 175 500檢驗統計量χ2χ2
χ2=∑i∑j(fij?eij)2eijχ2=∑i∑j(fij?eij)2eij
式中:fijfij為第ii行和第jj列的單元格的觀察頻數,eijeij代表在假定H0H0為真時第ii行和第jj列的單元格的期望頻數
注意:在涉及kk個總體比率相等性的χ2χ2檢驗中, 上述檢驗統計量服從自由度為k?1k?1的χ2χ2分布,其中每個單元格的期望頻數都大于或等于5
檢驗總體比率相等性的檢驗統計量χ2χ2的計算
# 總體 觀察頻數(f_ij) 期望頻數(e_ij) 差(f_ij - e_ij) 差的平方 差的平方除以期望頻數 # p1 1 69 78 -9 81 1.04 # p2 2 120 124.8 -4.8 23.04 0.18 # p3 3 123 109.2 13.8 190.44 1.74 # 1-p1 1 56 47 9 81 1.72 # 1-p2 2 80 75.2 4.8 23.04 0.31 # 1-p3 3 52 65.8 13.8 190.44 2.89χ2χ2=7.89 自由度為3-1=2 根據p值法, p?≤0.05p?≤0.05,因此拒絕H0H0
多重比較方法
使用χ2χ2檢驗得到三個總體的總體比率不全相等(H0H0被拒絕),因此有些總體比率之間存在差異 為了研究總體比率之間存在的差異 先計算三個總體的比率
# 品牌忠誠度的樣本比率 # p1=69/125=0.552 # p2=120/200=0.600 # p3=123/175=0.7029由于χ2χ2檢驗表明總體比率不全相等 因此 進行嘗試性確定哪些總體比率之間存在差異是合理的 ——采用Marascuilo方法
# 首先計算每對總體的樣本比率之差的絕對值 # 總體1和總體2 |p1 - p2|=0.048 # 總體1和總體3 |p1 - p3|=0.1509 # 總體2和總體3 |p2 - p3|=0.1029kk個總體比率的Marascuilo成對比較方法的臨界值
CVij=χ2α??√pˉi(1?pˉi)ni+pˉj(1?pˉj)nj??????????????√CVij=χα2pˉi(1?pˉi)ni+pˉj(1?pˉj)nj
式中,χ2αχα2為顯著性水平為αα且自由度為k?1k?1的χ2χ2值, pˉipˉi和pˉjpˉj為總體ii和jj的樣本比率,nini和njnj為總體ii和總體jj的樣本容量
利用χ2χ2分布表 k?1=3?1=2k?1=3?1=2的自由度和顯著性水平0.05,我們有χ20.05=5.991χ02.05=5.991
CV12=5.991????√0.552(1?0.552)125+0.6(1?0.6)200??????????????????√=0.138CV12=5.9910.552(1?0.552)125+0.6(1?0.6)200=0.138
CV13=0.1379CV13=0.1379
CV23=0.1198CV23=0.1198
# |pi-pj| CV_ij 如果|pi - pj|>CV_ij,則顯著 # 0.048 0.1380 不顯著 # 0.1509 0.1379 顯著 # 0.1029 0.1198 不顯著# 得出 總體1與總體3之間呈現顯著差異 總體3比總體1具有優勢獨立性檢驗
χ2χ2檢驗的一個重要應用是利用樣本數據檢驗兩個分類變量的獨立性
從一個總體中抽取樣本 并記錄兩個分類變量的觀測值 通過對分類變量kk的每一對組合統計回答的個數來匯總數據
檢驗的原假設是兩個分類變量獨立,因此這種檢驗被稱為獨立性檢驗
兩個分類變量獨立性的χ2χ2檢驗
H0:兩個分類變量獨立H0:兩個分類變量獨立 (例子:啤酒偏好與性別獨立)
Hα:兩個分類變量不獨立Hα:兩個分類變量不獨立 (例子:啤酒偏好與性別不獨立)
χ2=∑i∑j(fij?eij)2eijχ2=∑i∑j(fij?eij)2eij
p?p?值法:如果p?p?值 ≤α≤α,則拒絕H0H0
臨界值法:如果χ2≥χ2αχ2≥χα2,則拒絕H0H0
χ2χ2分布的自由度為(r?1)(c?1),α(r?1)(c?1),α為檢驗的顯著性水平
擬合優度檢驗
使用χ2χ2檢驗來確定一個被抽樣的總體是否服從某個特殊的概率分布
首先考慮總體服從一個歷史的多項概率分布情形 并使用擬合優度檢驗來確定新的樣本數據的總體分布在與歷史的分布中相比較 是否顯示存在改變
然后考慮假設總體服從正態概率分布的情形 理由擬合優度檢驗來確定樣本數據是否顯示正態概率分布的假設是適當還是不適當
以上兩個檢驗都被稱為擬合優度檢驗
多項概率分布
多項概率分布式二項概率分布每次試驗有三個或多個結果情形的推廣
多項概率分布的概率之和等于1
對于多項概率分布,總體中的每一個個體被分配到三個或多個類中的一個或多個類中的一個且僅一個
擬合優度的檢驗統計量
χ2=∑i=1k(fi?ei)2eiχ2=∑i=1k(fi?ei)2ei
式中,fifi為第ii類的觀察頻數,eiei為第ii類的期望頻數,kk為類別個數
注意:當所有類別的期望頻數都是大于或等于5時,檢驗統計量服從自由度為k?1k?1的χ2χ2分布
多項概率分布的擬合優度檢驗
P1:建立原假設和備選假設
H0:H0:總體服從kk類中每類都有指定的概率的多項概率分布
Hα:Hα:總體不服從kk類中每類都有指定的概率的多項概率分布
P2:選擇一個隨機樣本,并記錄美衣類別的觀察頻數fifi
P3:假定原假設為真,由此確定每一類別的期望頻數eiei,eiei等于樣本容量與各類概率的乘積
P4:如果每一類的期望頻數eiei都大于或等于55,計算檢驗統計量
χ2=∑i=1k(fi?ei)2eiχ2=∑i=1k(fi?ei)2ei
P5:拒絕法則:
p?p?值法:如果p?p?值 ≤α≤α,則拒絕H0H0
臨界值法:如果χ2≥χ2αχ2≥χα2,則拒絕H0H0
式中,αα為檢驗的顯著性水平,k?1k?1為自由度
正態分布擬合優度檢驗
正態分布擬合優度檢驗也是基于χ2χ2分布的應用。在總體服從正態分布的假設下,將樣本數據的若干類別的觀察頻數同時期望頻數進行比較。
正態分布的擬合優度檢驗
P1:建立原假設和備選假設
H0:總體服從正態概率分布H0:總體服從正態概率分布
Hα:總體不服從正態概率分布Hα:總體不服從正態概率分布
P2:抽取一個隨機樣本,并且
a.計算樣本均值和樣本標準差
b.定義kk個取值區間使得每個區間中的期望頻數至少為5——使用等概率區間是很好的方法
c.記錄每個確定好的區間的數據值的觀察頻數
P3:對于步驟2(b)中確定每個區間,計算發生次數的期望頻數eiei,即樣本容量與正態隨機變量落入每個區間的概率的乘積
P4:計算檢驗統計量
χ2=∑i=1k(fi?ei)2eiχ2=∑i=1k(fi?ei)2ei
P5:拒絕法則:
p?p?值法:如果p?p?值 ≤α≤α,則拒絕H0H0
臨界值法:如果χ2≥χ2αχ2≥χα2,則拒絕H0H0
式中,αα為檢驗的顯著性水平,自由度為k?p?1k?p?1,其中pp是有樣本估計的分布參數的個數 在步驟2(a)中利用樣本估計了均值和標準差 因此 p=2 自由度為k?2?1=k?3k?2?1=k?3
總結
以上是生活随笔為你收集整理的商务与经济统计学习 --多个比率的比较、独立性及拟合优度检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 最全的PHP后台管理系统源码
- 下一篇: IOUtils使用介绍