日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH566 统计理论5 假设检验:p值

發布時間:2025/4/14 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH566 统计理论5 假设检验:p值 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH566 統計理論5 假設檢驗:p值

  • p-value

做實證研究的paper大多數都要匯報p值,并且幾乎是只看p值的。2016年ASA做了一個關于p值的statement,指出了關于p值的六個錯用與濫用:

Statement指出,p值表示統計數據與某個特定的統計模型之間兼容性的強弱,并不能衡量研究假說為真的概率。科學結論、政策評估不能偏信p值,合理的推斷應該以試驗結果的充分性與透明性為基礎。p值或者說顯著性更不能衡量某種效應的強弱或者某個結果的重要性,因此它并不是支撐研究假說的好論據。

下面是這個statement給出的合理的統計研究的一些特征:

Statement指出,合理的統計研究需要根據研究背景選擇適當的模型、對原始數據做充分的可視化與描述性統計、正確使用統計模型、對模型結果做出合理的解釋、保證試驗結果具有可重復性。

這一講介紹一下p值,幫助大家更好地理解statement的精神。

p-value

假設θ0\theta_0θ0?是真實的參數(也假設這個就是原假設),檢驗統計量T(X)T(X)T(X)(似然比檢驗那一篇會提到)的真實分布為FT(X)(t∣θ0)F_{T(X)}(t|\theta_0)FT(X)?(tθ0?),假設這個分布函數可逆。則p值等于
pvalue=1?FT(X)(T(X)∣θ0)pvalue = 1-F_{T(X)}(T(X)|\theta_0)pvalue=1?FT(X)?(T(X)θ0?)
做一般性分析的時候,T(X)T(X)T(X)是隨機變量,因此p值本質上也是一個隨機變量。假設u∈[0,1]u \in [0,1]u[0,1],計算
P(FT(X)(T(X)∣θ0)≤u∣θ0)=P(T(X)≤FT(X)?1(u∣θ0)∣θ0)=FT(X)(FT(X)?1(u∣θ0)∣θ0)=uP(F_{T(X)}(T(X)|\theta_0) \le u|\theta_0) = P(T(X) \le F_{T(X)}^{-1}(u|\theta_0)|\theta_0) \\ = F_{T(X)}(F_{T(X)}^{-1}(u|\theta_0)|\theta_0)=uP(FT(X)?(T(X)θ0?)uθ0?)=P(T(X)FT(X)?1?(uθ0?)θ0?)=FT(X)?(FT(X)?1?(uθ0?)θ0?)=u
也就是說FT(X)(T(X)∣θ0)F_{T(X)}(T(X)|\theta_0)FT(X)?(T(X)θ0?)服從均勻分布,所以p值也服從均勻分布。

假設顯著性水平為α\alphaα,則備擇假設下(簡單點,假設為θ=θ1\theta=\theta_1θ=θ1?),拒絕域寫成
C={X:T(X)≥kα}C=\{X:T(X) \ge k_{\alpha}\}C={X:T(X)kα?}
p值的分布為
P(1?FT(X)(T(X)∣θ0)≤α∣θ1)=P(FT(X)(T(X)∣θ0)≥1?α∣θ1)=P(FT(X)(T(X)∣θ0)≥FT(X)(kα∣θ0)∣θ1)=P(T(X)≥kα∣θ1)=1?β(α)P(1-F_{T(X)}(T(X)|\theta_0) \le \alpha |\theta_1) = P(F_{T(X)}(T(X)|\theta_0) \ge 1-\alpha|\theta_1) \\ =P(F_{T(X)}(T(X)|\theta_0) \ge F_{T(X)}(k_{\alpha}|\theta_0)|\theta_1) = P(T(X)\ge k_{\alpha}|\theta_1) = 1-\beta(\alpha)P(1?FT(X)?(T(X)θ0?)αθ1?)=P(FT(X)?(T(X)θ0?)1?αθ1?)=P(FT(X)?(T(X)θ0?)FT(X)?(kα?θ0?)θ1?)=P(T(X)kα?θ1?)=1?β(α)
正好是ROC。

結合這兩部分推導,p值的本質是隨機變量,在原假設下,p值服從均勻分布;在備擇假設下,p值的分布就是ROC。一般報告出來的p值是對給出的統計量的值在原假設下計算出來的概率,這個概率的含義與用統計量和相應分位點比較的方法本質上是一回事,沒有提供額外的信息。如果是能夠在備擇假設下計算p值反而會稍微有點幫助,因為這樣能直接給出type II error的概率,但實際應用中這個概率應該是求不出來的。綜上,p值的含義其實相當局限,我們要打破唯p值論!

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的UA MATH566 统计理论5 假设检验:p值的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。