日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH566 统计理论5 假设检验简介

發布時間:2025/4/14 编程问答 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH566 统计理论5 假设检验简介 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH566 統計理論5 假設檢驗簡介

  • Neyman-Pearson Lemma
  • 一個例子
    • 構造拒絕域
    • 分析檢驗的勢
    • ROC曲線

這一講根據最簡單的一類假設檢驗介紹假設檢驗的思想。假設θ0,θ1∈Θ\theta_0,\theta_1 \in \Thetaθ0?,θ1?Θ,原假設和備擇假設是
H0:θ=θ0Ha:θ=θ1H_0:\theta = \theta_0 \\ H_a:\theta = \theta_1 H0?:θ=θ0?Ha?:θ=θ1?
我們需要根據樣本來決定是拒絕原假設或者不能拒絕原假設。假設檢驗有可能出現兩種錯誤,Type I error(假陽性)是在錯誤地拒絕了為真的原假設,Type II error(假陰性)是在原假設非真時沒能拒絕原假設。記α\alphaα為Type I error發生的概率,α\alphaα又叫顯著性水平,則
α=P(rejectH0∣θ=θ0)\alpha = P(reject\ H_0|\theta=\theta_0) α=P(reject?H0?θ=θ0?)
β\betaβ為Type II error發生的概率,
β=P(acceptH0∣θ=θ1)\beta = P(accept\ H_0| \theta=\theta_1) β=P(accept?H0?θ=θ1?)
1?β1-\beta1?β為檢驗的勢(power)。記樣本為X={X1,?,Xn}X=\{X_1,\cdots,X_n\}X={X1?,?,Xn?},定義critical region,或者說拒絕域為
X∈C?rejectH0X \in C \Leftrightarrow reject\ H_0 XC?reject?H0?
記顯著性水平α\alphaα下,most powerful的拒絕域為C?C^*C?,若對所有(顯著性水平α\alphaα下的)拒絕域CCC

  • α=P(X∈C?∣θ=θ0)=P(X∈C∣θ=θ0)\alpha=P(X \in C^*|\theta=\theta_0)=P(X \in C|\theta=\theta_0)α=P(XC?θ=θ0?)=P(XCθ=θ0?),即相同的顯著性水平
  • β?≤β\beta^* \le \betaβ?β,即最大的勢。其中β?=P(X∈C?∣θ=θ1)\beta^*=P(X \in C^*|\theta=\theta_1)β?=P(XC?θ=θ1?)β=P(X∈C∣θ=θ1)\beta=P(X \in C|\theta=\theta_1)β=P(XCθ=θ1?)
  • ROC曲線可以比較直觀地比較不同檢驗的power。定義Receiving Operator Curve(ROC)為1?β1-\beta1?β關于α\alphaα的圖像,如果某個檢驗的ROC曲線在其他檢驗的上方,則這個檢驗就有更大的勢。
    定義上面那個簡單檢驗的似然比為
    λ(X)=sup?{θ=θ0}L(θ∣X)sup?{θ=θ0,θ1}L(θ∣X)=L(θ0∣X)max?{L(θ0∣X),L(θ1∣X)}\lambda(X) = \frac{\sup_{\{\theta=\theta_0\}} L(\theta|X)}{\sup_{\{\theta=\theta_0,\theta_1\}} L(\theta|X)} = \frac{L(\theta_0|X)}{\max\{L(\theta_0|X),L(\theta_1|X)\}} λ(X)=sup{θ=θ0?,θ1?}?L(θX)sup{θ=θ0?}?L(θX)?=max{L(θ0?X),L(θ1?X)}L(θ0?X)?
    顯然λ(X)∈[0,1]\lambda(X) \in [0,1]λ(X)[0,1],用這個統計量(似然比統計量,這個檢驗叫似然比檢驗)構造拒絕域為
    C?={X:λ(X)≤c}C^*=\{X:\lambda(X) \le c\} C?={X:λ(X)c}
    其中c∈[0,1]c \in [0,1]c[0,1],它的選取與顯著性水平相關。這個拒絕域的定義也比較合理,如果原假設的似然相比備擇假設來說非常小的話,我們是應該拒絕原假設的。注意到如果max?{L(θ0∣X),L(θ1∣X)}=L(θ0∣X)\max\{L(\theta_0|X),L(\theta_1|X)\}=L(\theta_0|X)max{L(θ0?X),L(θ1?X)}=L(θ0?X),這個時候λ(X)=1\lambda(X)=1λ(X)=1,顯然不會拒絕原假設,所以對于這個簡單的假設檢驗,一般把拒絕域寫成
    C?={X:L(θ0∣X)L(θ1∣X)≤cα}C^*=\{X:\frac{L(\theta_0|X)}{L(\theta_1|X)}\le c_{\alpha}\} C?={X:L(θ1?X)L(θ0?X)?cα?}

    Neyman-Pearson Lemma

    這個引理告訴我們一個非常簡單有深刻的道理:給定顯著性水平下根據似然比統計量構造的拒絕域是most power的!
    證明:
    思路是計算β?β?\beta-\beta^*β?β?,并證明其非負。
    給定顯著性水平α\alphaα,對任一拒絕域CCCi=0,1i=0,1i=0,1
    P(X∈C∣θ=θi)=P(X∈C∩C?∣θ=θi)+P(X∈C?C?∣θ=θi)P(X∈C?∣θ=θi)=P(X∈C∩C?∣θ=θi)+P(X∈C??C∣θ=θi)P(X \in C|\theta=\theta_i) = P(X \in C\cap C^*|\theta=\theta_i) + P(X \in C\setminus C^*|\theta=\theta_i) \\ P(X \in C^*|\theta=\theta_i) = P(X \in C\cap C^*|\theta=\theta_i) + P(X \in C^*\setminus C|\theta=\theta_i) P(XCθ=θi?)=P(XCC?θ=θi?)+P(XC?C?θ=θi?)P(XC?θ=θi?)=P(XCC?θ=θi?)+P(XC??Cθ=θi?)
    首先這兩個拒絕域的顯著性水平是一樣的,即
    α=P(X∈C?∣θ0)=P(X∈C∣θ0)\alpha=P(X \in C^*|\theta_0)=P(X \in C|\theta_0)α=P(XC?θ0?)=P(XCθ0?)
    排除掉兩個拒絕域的并集,那么
    P(X∈C??C∣θ0)=P(X∈C?C?∣θ0)P(X \in C^*\setminus C|\theta_0)=P(X \in C\setminus C^*|\theta_0)P(XC??Cθ0?)=P(XC?C?θ0?)
    計算
    β?β?=P(X?C∣θ1)?P(X?C?∣θ1)=P(X∈C?∣θ1)?P(X∈C∣θ1)\beta - \beta^* = P(X \notin C|\theta_1) - P(X \notin C^*|\theta_1) \\ = P(X \in C^*|\theta_1) - P(X \in C|\theta_1) β?β?=P(X/?Cθ1?)?P(X/?C?θ1?)=P(XC?θ1?)?P(XCθ1?)
    同樣排除掉兩個拒絕域的并集
    β?β?=P(X∈C??C∣θ1)?P(X∈C?C?∣θ1)\beta - \beta^* = P(X \in C^*\setminus C|\theta_1) - P(X \in C \setminus C^*|\theta_1) β?β?=P(XC??Cθ1?)?P(XC?C?θ1?)
    根據似然比檢驗的定義
    L(θ0∣X)L(θ1∣X)≤cα?L(θ1∣X)≥kαL(θ0∣X),?kα,?X∈C?\frac{L(\theta_0|X)}{L(\theta_1|X)}\le c_{\alpha} \Rightarrow L(\theta_1|X) \ge k_{\alpha}L(\theta_0|X),\exists k_{\alpha},\forall X \in C^* L(θ1?X)L(θ0?X)?cα??L(θ1?X)kα?L(θ0?X),?kα?,?XC?
    因此
    P(X∈C??C∣θ1)=∫C??CL(θ1∣X)dX≥kα∫C??CL(θ0∣X)dX=kαP(X∈C??C∣θ0)P(X \in C^*\setminus C|\theta_1) = \int_{C^*\setminus C} L(\theta_1|X)dX \\ \ge k_{\alpha}\int_{C^*\setminus C} L(\theta_0|X)dX = k_{\alpha}P(X \in C^*\setminus C|\theta_0) P(XC??Cθ1?)=C??C?L(θ1?X)dXkα?C??C?L(θ0?X)dX=kα?P(XC??Cθ0?)
    對于不在C?C^*C?中的XXX
    L(θ1∣X)≤kαL(θ0∣X),?kα,?X?C?L(\theta_1|X) \le k_{\alpha}L(\theta_0|X),\exists k_{\alpha},\forall X \notin C^* L(θ1?X)kα?L(θ0?X),?kα?,?X/?C?
    因此
    P(X∈C?C?∣θ1)=∫C?C?L(θ1∣X)dX≤kα∫C?C?L(θ0∣X)dX=kαP(X∈C?C?∣θ0)P(X \in C\setminus C^*|\theta_1) = \int_{C\setminus C^*} L(\theta_1|X)dX \\ \le k_{\alpha}\int_{C\setminus C^*} L(\theta_0|X)dX = k_{\alpha}P(X \in C\setminus C^*|\theta_0) P(XC?C?θ1?)=C?C??L(θ1?X)dXkα?C?C??L(θ0?X)dX=kα?P(XC?C?θ0?)
    將這兩個不等式帶入到β?β?\beta - \beta^*β?β?中,
    β?β?≥kα(P(X∈C?C?∣θ0)?P(X∈C?C?∣θ0))=0\beta - \beta^* \ge k_{\alpha} (P(X \in C\setminus C^*|\theta_0)-P(X \in C\setminus C^*|\theta_0))=0 β?β?kα?(P(XC?C?θ0?)?P(XC?C?θ0?))=0

    一個例子

    假設總體是正態分布N(μ,σ02)N(\mu,\sigma_0^2)N(μ,σ02?),其中σ0\sigma_0σ0?是已知的。我們猜測均值可能是μ0\mu_0μ0?或者μ1\mu_1μ1?(不失一般性假設μ1<μ0\mu_1 < \mu_0μ1?<μ0?),現在有樣本XXX,我們想要用假設檢驗的思路判斷均值是哪個:
    H0:μ=μ0Ha:μ=μ1H_0:\mu = \mu_0 \\ H_a:\mu = \mu_1 H0?:μ=μ0?Ha?:μ=μ1?

    構造拒絕域

    計算這個假設檢驗的似然比
    L(μ0∣X)L(μ1∣X)=(2πσ0)n(2πσ0)n∏i=1nexp?(?(2σ02)?1(Xi?μ0)2)∏i=1nexp?(?(2σ02)?1(Xi?μ1)2)=exp?(?(2σ02)?1∑i=1n[(Xi?μ0)2?(Xi?μ1)2])=exp?(n(2σ02)?1(μ0?μ1)(2Xˉ?μ0?μ1))\frac{L(\mu_0|X)}{L(\mu_1|X)} = \frac{(\sqrt{2\pi}\sigma_0)^n}{(\sqrt{2\pi}\sigma_0)^n} \frac{\prod_{i=1}^n \exp (-(2\sigma^2_0)^{-1}(X_i-\mu_0)^2)}{\prod_{i=1}^n \exp (-(2\sigma^2_0)^{-1}(X_i-\mu_1)^2)} \\ = \exp \left( -(2\sigma^2_0)^{-1} \sum_{i=1}^n [(X_i-\mu_0)^2- (X_i-\mu_1)^2] \right) \\ = \exp \left( n(2\sigma^2_0)^{-1} (\mu_0 - \mu_1)(2 \bar{X}-\mu_0 - \mu_1)\right) L(μ1?X)L(μ0?X)?=(2π?σ0?)n(2π?σ0?)n?i=1n?exp(?(2σ02?)?1(Xi??μ1?)2)i=1n?exp(?(2σ02?)?1(Xi??μ0?)2)?=exp(?(2σ02?)?1i=1n?[(Xi??μ0?)2?(Xi??μ1?)2])=exp(n(2σ02?)?1(μ0??μ1?)(2Xˉ?μ0??μ1?))
    只需要找到一個滿足
    α=P(X∈C?∣θ=θ0)\alpha = P(X \in C^*|\theta = \theta_0)α=P(XC?θ=θ0?)
    的常數cαc_{\alpha}cα?就可以寫出似然比檢驗的拒絕域
    C?={X:L(μ0∣X)L(μ1∣X)≤cα}C^*=\{X:\frac{L(\mu_0|X)}{L(\mu_1|X)}\le c_{\alpha}\} C?={X:L(μ1?X)L(μ0?X)?cα?}
    注意到似然比與Xˉ\bar{X}Xˉ成正比,因此上面定義的拒絕域等價于
    C?={X:Xˉ≤xα},?xα,α=P(X∈C?∣θ=θ0)C^*=\{X:\bar{X} \le x_{\alpha}\}, \exists x_{\alpha}, \alpha = P(X \in C^*|\theta = \theta_0) C?={X:Xˉxα?},?xα?,α=P(XC?θ=θ0?)
    因為Xˉ~N(μ,σ02n)\bar{X}\sim N(\mu,\frac{\sigma_0^2}{n})XˉN(μ,nσ02??),對上式做標準化
    P(X∈C?∣θ=θ0)=Φ(xα?μ0σ0/n)P(X \in C^*|\theta = \theta_0) = \Phi(\frac{x_{\alpha}-\mu_0}{\sigma_0/\sqrt{n}}) P(XC?θ=θ0?)=Φ(σ0?/n?xα??μ0??)
    zαz_{\alpha}zα?為標準正態分布的α\alphaα上分位點,則
    xα?μ0σ0/n=?zα?xα=μ0?zασ0n\frac{x_{\alpha}-\mu_0}{\sigma_0/\sqrt{n}} = -z_{\alpha} \Leftrightarrow x_{\alpha} = \mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}} σ0?/n?xα??μ0??=?zα??xα?=μ0??zα?n?σ0??
    所以用似然比檢驗構造的這個檢驗的拒絕域為
    C?={X:Xˉ≤μ0?zασ0n}C^*=\{X:\bar{X} \le \mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}}\} C?={X:Xˉμ0??zα?n?σ0??}

    分析檢驗的勢

    上面這個似然比檢驗的勢函數為
    Power=P(X∈C?∣μ=μ1)=P(Xˉ≤μ0?zασ0n∣μ=μ1)=P(Xˉ?μ1σ0/n≤μ0?zασ0n?μ1σ0/n∣μ=μ1)=Φ(μ0?μ1σ0/n?zα)Power=P(X \in C^*|\mu=\mu_1) = P(\bar{X} \le \mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}}| \mu = \mu_1) \\ = P(\frac{\bar{X}-\mu_1}{\sigma_0/\sqrt{n}}\le \frac{\mu_0 - z_{\alpha}\frac{\sigma_0}{\sqrt{n}}-\mu_1}{\sigma_0/\sqrt{n}}| \mu = \mu_1) = \Phi(\frac{\mu_0-\mu_1}{\sigma_0/\sqrt{n}}-z_{\alpha}) Power=P(XC?μ=μ1?)=P(Xˉμ0??zα?n?σ0??μ=μ1?)=P(σ0?/n?Xˉ?μ1??σ0?/n?μ0??zα?n?σ0???μ1??μ=μ1?)=Φ(σ0?/n?μ0??μ1???zα?)
    顯然這個檢驗的勢與∣μ0?μ1∣|\mu_0-\mu_1|μ0??μ1?成正比,與σ0\sigma_0σ0?成反比,與樣本量nnn成正比,與顯著性水平α\alphaα成正比。

    ROC曲線

    作出勢函數關于顯著性水平的圖像,即為ROC曲線:
    Power=Φ(μ0?μ1σ0/n?zα)Power= \Phi(\frac{\mu_0-\mu_1}{\sigma_0/\sqrt{n}}-z_{\alpha}) Power=Φ(σ0?/n?μ0??μ1???zα?)
    根據Neyman-Pearson引理,這個勢已經是給定μ1,μ0,n,α\mu_1,\mu_0,n,\alphaμ1?,μ0?,n,α的條件下最優的了。ROC曲線想展示的是給定顯著性水平下,power怎么受檢驗本身參數的影響,也就是受∣μ0?μ1∣|\mu_0-\mu_1|μ0??μ1?的影響。

    總結

    以上是生活随笔為你收集整理的UA MATH566 统计理论5 假设检验简介的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。