當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH566 统计理论10 Bootstrap简介

發布時間：2025/4/14 编程问答 44 豆豆

生活随笔收集整理的這篇文章主要介紹了 UA MATH566 统计理论10 Bootstrap简介小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH566 統計理論10 Bootstrap簡介

Bootstrap是用來替代基于CDF的一些統計計算的手段：當真實的CDF（記為 $\in \mathbb{F}$ ， $F\mathbb{F}$ 是CDF的函數空間）未知時，我們選擇用經驗分布函數（記為 $F^n\hat{F}_n$ ）代替真實的CDF，輔以重抽樣的方法，用來估計隨機變量的函數的期望、隨機變量的分位點等統計量。根據 $F^n\hat{F}_n$ 的不同構造方法，Bootstrap分為Parametric Bootstrap和Non-parametric Bootstrap。

假設 $X=(X1,?,Xn)X=(X_1,\cdots,X_n)$ 是 $F$ 的一組簡單隨機樣本，總體是定義在 $(Ω,F,P)(\Omega,\mathcal{F},P)$ 中的隨機變量， $F$ 的參數為 $θ∈Θ\theta \in \Theta$ ，假設 $θ^\hat{\theta}$ 是參數的估計量，則可以根據這個估計量來構造經驗分布函數：
$F^n(x)=F(x∣θ^)\hat{F}_n(x) = F(x|\hat{\theta})$
基于這種構造的Bootstrap叫做Parametric Bootstrap。如果直接根據樣本構造經驗分布函數：
$F^n(x)=1n∑i=1nI{Xi∈(?∞,x]}\hat{F}_n(x) = \frac{1}{n}\sum_{i=1}^n I\{X_i \in (-\infty,x]\}$
基于這種構造的Bootstrap叫做Non-parametric Bootstrap。

假設我們想要用Bootstrap估計的量是 $r = R (X, F)$ ：
$\mathcal{X} \times \mathbb{F} \to \mathbb{R}$
這里 $X\mathcal{X}$ 是樣本空間，可以理解成 $n$ 個概率空間的直積，這個映射的含義是我們要估計的這個 $r$ 依賴于樣本和分布函數。現在記 $X^*$ 是重抽樣的樣本（以 $F^n\hat{F}_n$ 為分布函數的重抽樣），則 $r$ 的Bootstrap估計是
$r^Bootstrap=R(X?,F^n)\hat{r}^{Bootstrap} = R(X^*,\hat{F}_n)$
下面 $r^Bootstrap\hat{r}^{Bootstrap}$ 簡單記作 $r^\hat{r}$ 。

例子

光學中有一個Snell定律：光在兩個均勻透明介質交接處發生折射的現象，假設光從介質1中射入介質2中，光在介質1中的傳播速度是 $v_1$ ，入射角是 $θ1\theta_1$ ；光在介質2中的傳播速度為 $v_2$ ，出射角為 $θ2\theta_2$ ，則
$v1sin?θ1=v2sin?θ2v_1 \sin \theta_1 = v_2 \sin \theta_2$
假設數量 $β\beta$ 表示光在介質2中的傳播速度是 $β\beta$ 個光速，則介質1是空氣時，
$β=sin?θ1sin?θ2\beta = \frac{\sin \theta_1}{\sin \theta_2}$
現在我們做了多組獨立重復試驗，試圖測量光在介質2中的傳播速度。下面是試驗的數據和估計：（用的我老師的slides的截圖）

根據這些測量數據估計出來的結果是水在介質2中的傳播速度是0.7363個光速，稱這個估計量為Snell估計。我們可以用bootstrap方法估計這個估計量的置信區間與方差：

這里的for循環就是做boostrap的過程，我們計算了1萬個boostrap估計量 $β^\hat{\beta}$ 。循環體第一句話是用sample()對theta1做重抽樣，第二句話是用sample()對theta2做重抽樣，第三句話是計算第 $i$ 個bootstrap估計量。用summary()看一下這一萬個估計量的描述性統計，發現我們用Snell定律得到的那個估計差不多是在中位數的水平。我們把這一萬個估計量當成是真實的 $β\beta$ 的一組樣本，可以根據這組樣本的經驗分布函數做區間估計，以及計算Snell估計量的方差。

根據quantile()函數返回的分位點，我們可以發現99%置信區間為[0.7019,0.7681]，95%置信區間為[0.7102,0.7607]。根據sd()的返回值，Snell估計的方差為0.01288。

不用bootstrap方法也可以近似Snell估計的誤差，我們可以用Delta方法：如果這個測量是多元變量，則Gaussian誤差 $Y$ ， $Y～Nn(0,Σ)Y\sim N_n(0,\Sigma)$ ，做一階Taylor展開為
$\approx g(X^*) + Dg(X^*)Y$
對式子兩邊求期望與方差：
$\approx Eg(X^*) \\ Var[g(X)] \approx [g'(X^*)]^2 Var(Y) = Dg(X^*) \Sigma [Dg(X^*)]^T$

這里用qnorm()簡單判斷一下正態性：

對比發現正態性還是可以接受的。所以可以用delta方法：

總結

以上是生活随笔為你收集整理的UA MATH566 统计理论10 Bootstrap简介的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： UA MATH ECE636 信息论10
下一篇： UA MATH575B 数值分析下统计

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

UA MATH566 统计理论10 Bootstrap简介

UA MATH566 統計理論10 Bootstrap簡介

總結