當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

商务与经济统计学习 --多个比率的比较、独立性及拟合优度检验

發布時間：2023/12/20 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了商务与经济统计学习 --多个比率的比较、独立性及拟合优度检验小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

多個比率的比較、獨立性及擬合優度檢驗

前面介紹了關于一個和兩個總體的總體均值、比率和方差的假設檢驗的統計推斷方法
本章進行的假設檢驗所使用的檢驗統計量都基于χ2分布，在所有情形中數據都是分類型的這些χ2檢驗是多用途的，并由檢驗下列的應用擴充了假設
P1：檢驗三個或多個總體比率的相等性
P2：檢驗兩個分類變量的獨立性
P3：檢驗一個總體的概率分布是否服從一個特殊的歷史或理論的概率分布

三個或多個總體比率來的相等性的檢驗

兩個總體比率的統計推斷方法，其假設檢驗的結論基于標準正態檢驗統計量z。

這里使用檢驗統計量 $χ 2$ ，對三個或多個總體比率的相等性進行統計推斷

p1——總體1的總體比率
$p 2$ ——總體2的總體比率
$p k$ ——總體k的總體比率
關于 $k$ 個總體比率相等性的假設陳述如下：
H0:p1=p2=...=pk
Ha: 所有總體比率不全相等
如果樣本數據和χ2檢驗計算結果表明H0沒有拒絕，不能斷定k個總體比率有差異。然而，如果樣本數據和 $χ 2$ 檢驗計算結果表明H0被拒絕，有統計證據得出k個總體比率不全相等的結論也就是說一個或多個總體比率與其他總體比率不相等，可以進一步分析，以得出哪個或哪些總體比率與其他總體比率有顯著差異

假設： $H 0 : p 1 = p 2 = . . . = p 3$ Ha:所有總體比例不全相等

#觀察頻數——樣本結果# 樣本1 樣本2 樣本3 合計# p 69 120 123 312# 1-p 56 80 52 188# 合計 125 200 175 500

根據原假設H0:p1=p2=p3=312500=0.624為每一類總體比例的總體最佳估計量

在假定H0為真時的期望頻數：

eij=第i行合計數×第j列合計數總樣本容量

# 原假設為真時：期望頻數 # 總體1 總體2 總體3 合計 # p 125x0.624=78 124.8 109.2 312 # 1-p 47 75.2 65.8 188 # 合計 125 200 175 500

檢驗統計量χ2

χ2=∑i∑j(fij?eij)2eij

式中：fij為第i行和第 $j$ 列的單元格的觀察頻數，eij代表在假定H0為真時第i行和第 $j$ 列的單元格的期望頻數

注意：在涉及k個總體比率相等性的 $χ 2$ 檢驗中，上述檢驗統計量服從自由度為k?1的χ2分布，其中每個單元格的期望頻數都大于或等于5

檢驗總體比率相等性的檢驗統計量χ2的計算

# 總體觀察頻數(f_ij) 期望頻數(e_ij) 差(f_ij - e_ij) 差的平方差的平方除以期望頻數 # p1 1 69 78 -9 81 1.04 # p2 2 120 124.8 -4.8 23.04 0.18 # p3 3 123 109.2 13.8 190.44 1.74 # 1-p1 1 56 47 9 81 1.72 # 1-p2 2 80 75.2 4.8 23.04 0.31 # 1-p3 3 52 65.8 13.8 190.44 2.89

χ2=7.89 自由度為3-1=2 根據p值法, p?≤0.05,因此拒絕H0

多重比較方法

使用χ2檢驗得到三個總體的總體比率不全相等（H0被拒絕）,因此有些總體比率之間存在差異為了研究總體比率之間存在的差異先計算三個總體的比率

# 品牌忠誠度的樣本比率 # p1=69/125=0.552 # p2=120/200=0.600 # p3=123/175=0.7029

由于χ2檢驗表明總體比率不全相等因此進行嘗試性確定哪些總體比率之間存在差異是合理的 ——采用Marascuilo方法

# 首先計算每對總體的樣本比率之差的絕對值 # 總體1和總體2 |p1 - p2|=0.048 # 總體1和總體3 |p1 - p3|=0.1509 # 總體2和總體3 |p2 - p3|=0.1029

k個總體比率的Marascuilo成對比較方法的臨界值

$C V i j = χ 2 α ? ? \sqrt p ˉ i ( 1 ? p ˉ i ) n i + p ˉ j ( 1 ? p ˉ j ) n j ? ? ? ? ? ? ? ? ? ? ? ? ? ? \sqrt$

式中，χ2α為顯著性水平為α且自由度為k?1的χ2值， pˉi和pˉj為總體i和 $j$ 的樣本比率，ni和nj為總體i和總體 $j$ 的樣本容量

利用χ2分布表 k?1=3?1=2的自由度和顯著性水平0.05,我們有χ20.05=5.991
CV12=5.991????√0.552(1?0.552)125+0.6(1?0.6)200??????????????????√=0.138

CV13=0.1379

CV23=0.1198

# |pi-pj| CV_ij 如果|pi - pj|>CV_ij,則顯著 # 0.048 0.1380 不顯著 # 0.1509 0.1379 顯著 # 0.1029 0.1198 不顯著# 得出總體1與總體3之間呈現顯著差異總體3比總體1具有優勢

獨立性檢驗

χ2檢驗的一個重要應用是利用樣本數據檢驗兩個分類變量的獨立性

從一個總體中抽取樣本并記錄兩個分類變量的觀測值通過對分類變量k的每一對組合統計回答的個數來匯總數據

檢驗的原假設是兩個分類變量獨立，因此這種檢驗被稱為獨立性檢驗

兩個分類變量獨立性的 $χ 2$ 檢驗

建立原假設與備選假設

H0:兩個分類變量獨立H0:兩個分類變量獨立（例子：啤酒偏好與性別獨立）

Hα:兩個分類變量不獨立Hα:兩個分類變量不獨立（例子：啤酒偏好與性別不獨立)

從總體中選擇一個隨機樣本，收集樣本中每個個體對兩個變量的數據記錄

rr行和

c

列的表中的觀察頻數

fijfij

假定原假設為真，計算期望頻數

eijeij

如果期望頻數

eijeij都大于或等于5，計算檢驗統計量：

χ2=∑i∑j(fij?eij)2eijχ2=∑i∑j(fij?eij)2eij

拒絕法則：

p?p?值法：如果

p?p?值

≤α≤α,則拒絕

H0H0
臨界值法：如果

χ2≥χ2αχ2≥χα2，則拒絕

H0H0

χ2χ2分布的自由度為

(r?1)(c?1),α(r?1)(c?1),α為檢驗的顯著性水平

擬合優度檢驗

使用χ2檢驗來確定一個被抽樣的總體是否服從某個特殊的概率分布

首先考慮總體服從一個歷史的多項概率分布情形并使用擬合優度檢驗來確定新的樣本數據的總體分布在與歷史的分布中相比較是否顯示存在改變

然后考慮假設總體服從正態概率分布的情形理由擬合優度檢驗來確定樣本數據是否顯示正態概率分布的假設是適當還是不適當

以上兩個檢驗都被稱為擬合優度檢驗

多項概率分布

多項概率分布式二項概率分布每次試驗有三個或多個結果情形的推廣

多項概率分布的概率之和等于1

對于多項概率分布，總體中的每一個個體被分配到三個或多個類中的一個或多個類中的一個且僅一個

擬合優度的檢驗統計量

χ2=∑i=1k(fi?ei)2ei
式中，fi為第i類的觀察頻數， $e i$ 為第i類的期望頻數， $k$ 為類別個數
注意：當所有類別的期望頻數都是大于或等于5時，檢驗統計量服從自由度為k?1的χ2分布

多項概率分布的擬合優度檢驗

P1：建立原假設和備選假設
H0:總體服從k類中每類都有指定的概率的多項概率分布
$H α :$ 總體不服從k類中每類都有指定的概率的多項概率分布
P2：選擇一個隨機樣本，并記錄美衣類別的觀察頻數 $f i$
P3：假定原假設為真，由此確定每一類別的期望頻數ei,ei等于樣本容量與各類概率的乘積
P4：如果每一類的期望頻數ei都大于或等于5,計算檢驗統計量
$χ 2 = \sum i = 1 k ( f i ? e i ) 2 e i$
P5：拒絕法則：
p?值法：如果p?值 ≤α,則拒絕H0
臨界值法：如果χ2≥χ2α，則拒絕H0
式中，α為檢驗的顯著性水平，k?1為自由度

正態分布擬合優度檢驗

正態分布擬合優度檢驗也是基于χ2分布的應用。在總體服從正態分布的假設下，將樣本數據的若干類別的觀察頻數同時期望頻數進行比較。

正態分布的擬合優度檢驗

P1：建立原假設和備選假設
H0:總體服從正態概率分布
Hα:總體不服從正態概率分布
P2：抽取一個隨機樣本，并且
a.計算樣本均值和樣本標準差
b.定義k個取值區間使得每個區間中的期望頻數至少為5——使用等概率區間是很好的方法
c.記錄每個確定好的區間的數據值的觀察頻數
P3：對于步驟2（b）中確定每個區間，計算發生次數的期望頻數 $e i$ ，即樣本容量與正態隨機變量落入每個區間的概率的乘積
P4：計算檢驗統計量
χ2=∑i=1k(fi?ei)2ei
P5：拒絕法則：
p?值法：如果p?值 ≤α,則拒絕H0
臨界值法：如果χ2≥χ2α，則拒絕H0
式中，α為檢驗的顯著性水平，自由度為k?p?1,其中p是有樣本估計的分布參數的個數在步驟2（a）中利用樣本估計了均值和標準差因此 p=2 自由度為 $k ? 2 ? 1 = k ? 3$

總結

以上是生活随笔為你收集整理的商务与经济统计学习 --多个比率的比较、独立性及拟合优度检验的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

商务与经济统计学习 --多个比率的比较、独立性及拟合优度检验

多個比率的比較、獨立性及擬合優度檢驗

三個或多個總體比率來的相等性的檢驗

兩個總體比率的統計推斷方法，其假設檢驗的結論基于標準正態檢驗統計量zz。

這里使用檢驗統計量χ2χ2，對三個或多個總體比率的相等性進行統計推斷

在假定H0H0為真時的期望頻數：

eij=第i行合計數×第j列合計數總樣本容量eij=第i行合計數×第j列合計數總樣本容量

檢驗統計量χ2χ2