《统计会犯错——如何避免数据分析中的统计陷阱》—第2章置信区间的优势
本節書摘來自異步社區《統計會犯錯——如何避免數據分析中的統計陷阱》一書中的第2章置信區間的優勢,作者【美】Alex Reinhart(亞歷克斯·萊因哈特),更多章節內容可以訪問云棲社區“異步社區”公眾號查看。
置信區間的優勢
與考慮試驗結果的顯著性相比,置信區間是一種更合理的結論表述,它可以給出效應的大小。即使置信區間包含0,它的寬度也會告訴你很多信息:一個狹窄的包含 0 的置信區間表明效應可能比較小,而一個較寬的包含 0 的置信區間則表明測量值并不十分精確,因而不足以作出結論。
對于那些與0沒有顯著差異的測量,物理學家常常使用置信區間給出它們的界值。例如,在搜索基礎粒子時,“該信號在統計上是不顯著的”這種說法沒有意義。相反,對于粒子撞擊時的速率,物理學家一般利用置信區間賦給它們一個上界,然后將這個結果與預測粒子行為的已有理論進行比較(促進未來的試驗人員建造更大的試驗設備來發現它)。
利用置信區間來解釋結果為試驗設計提供了一種新思路。不再關注顯著性假設檢驗的功效,轉而問這樣的問題:“我應該搜集多少數據來度量理想精度的效應?”盡管高功效的試驗可以產生顯著性的結果,但如果其置信區間很寬的話,結論同樣難以解釋。
每次試驗的數據會不一樣,所以每次試驗得到的置信區間大小也會發生變化。以前是選擇一個樣本大小以達到某種程度的功效水平,現在我們選擇一個樣本容量大小,只要使得到的置信區間的寬度小于目標寬度的概率達到99% 即可(這個數字被稱為其并沒有固定的標準,或者是95%)16。
在常見的假設檢驗里,已經發展出很多依賴于置信度的樣本量選擇方法;不過這仍然是一個新的領域,統計學家還沒有研究透徹17(這些方法的名字是樣本估計的精度,英文縮寫為AIPE)。統計功效比置信度使用更多,在各領域里統計學家還沒有采用置信度。盡管如此,這些方法非常有用。統計顯著性經常是拐杖,名字雖然中聽,但并不能像一個好的置信區間那樣提供多少有用的信息。
總結
以上是生活随笔為你收集整理的《统计会犯错——如何避免数据分析中的统计陷阱》—第2章置信区间的优势的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在 Linux 下使用 RAID(二):
- 下一篇: Linux性能优化2.1 CPU性能统计