當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH564 概率论IV 次序统计量

發布時間：2025/4/14 编程问答 46 豆豆

生活随笔收集整理的這篇文章主要介紹了 UA MATH564 概率论IV 次序统计量小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH564 概率論IV 次序統計量

次序統計量的分布
例子
- 例1：均勻分布的次序統計量
- 例2：Dirichlet分布

次序統計量的分布

次序統計量的作用是比較大的，經常可以作為某些分布的充分統計量，統計量的含義以及次序統計量的重要性可以參考統計理論那個系列。假設樣本為 ${X1,X2,?,Xn}\{X_1,X_2,\cdots,X_n\}$ ，總體分布為 $F (X)$ ，概率密度為 $f (x)$ 。將這組樣本按從小到大的順序排列，并記為 ${X(1),X(2),?,X(n)}\{X_{(1)},X_{(2)},\cdots,X_{(n)}\}$ ，則這種統計量叫做樣本的次序統計量。

定理1（單個次序統計量的分布）
$FX(j)=∑k=jnCnk[F(x)]k[1?F(x)]n?kF_{X_{(j)}} = \sum_{k=j}^n C_n^k [F(x)]^k[1-F(x)]^{n-k}$
證明
先描述一個比較直觀的推導：要計算 $X_{(j)}$ 的分布就是要想辦法估計 $P(X(j)≤x)P(X_{(j)} \le x)$ ，顯然 $X_{(1)}$ 到 $X_{(j-1)}$ 也要小于 $x$ 。這意味著在原來的 $n$ 個樣本 ${X1,X2,?,Xn}\{X_1,X_2,\cdots,X_n\}$ 中，至少有 $j$ 個比 $x$ 小。簡單隨機樣本獨立同分布，因此比 $x$ 小的樣本數目服從二項分布 $b i n o m (n, F (x))$ 。如果有 $k≥jk\ge j$ 個比 $x$ 小，那么概率就是 $C_n^k [F(x)]^k[1-F(x)]^{n-k}$ ，對所有可能的 $k$ 求和就可以得到 $P(X(j)≤x)P(X_{(j)} \le x)$ 。
下面給出正式證明：
定義 $Yj=I(?∞,x](Xj)Y_j = I_{(-\infty,x]}(X_j)$ ，記
$P(Y_j=1)=P(X_j \le x) = F(x)$
從而 $Yj～Ber(F(x))Y_j \sim Ber(F(x))$ 。定義 $Sn=∑j=1nYjS_n = \sum_{j=1}^n Y_j$ ，根據Bernoulli分布的可加性， $Sn～Binom(n,F(x))S_n \sim Binom(n,F(x))$ 。從而
$FX(j)=P(X(j)≤x)=P(Sn≥j)=∑k=jnCnk[F(x)]k[1?F(x)]n?kF_{X_{(j)}} = P(X_{(j)} \le x) = P(S_n \ge j) \\ = \sum_{k=j}^n C_n^k [F(x)]^k[1-F(x)]^{n-k}$

定理2（單個次序統計量的概率密度）
$f_{X_{(j)}}(x) = jC_n^j [F(x)]^{j-1}[1-F(x)]^{n-j}f(x)$
證明
這個其實可以直接硬算，但這里給一個比較直觀的推導：考慮
$fX(j)(x)Δx=P(x≤X(j)<x+Δx)f_{X_{(j)}}(x) \Delta x = P(x \le X_{(j)}<x+\Delta x)$
這個概率可以分成三部分來求：

有一個樣本在

[x,x+Δx)[x,x+\Delta x)

中；

有

j ? 1

個樣本在

(∞,x)(\infty,x)

中；

有

n ? j

個樣本在

[x+Δx,+∞)[x+\Delta x,+\infty)

中；

第一條對應的概率為 $Cn1f(x)ΔxC_n^1f(x) \Delta x$ ；第二條對應的概率為 $C_{n-1}^{j-1}[F(x)]^{j-1}$ ；第三條對應的概率為 $1-F(x)]^{n-j}$ 。因此
$fX(j)(x)Δx=[Cn1f(x)Δx][Cn?1j?1[F(x)]j?1][[1?F(x)]n?j]=jCnj[F(x)]j?1[1?F(x)]n?jf(x)Δxf_{X_{(j)}}(x) \Delta x = [C_n^1f(x) \Delta x][C_{n-1}^{j-1}[F(x)]^{j-1}][[1-F(x)]^{n-j}] \\ =jC_n^j [F(x)]^{j-1}[1-F(x)]^{n-j}f(x) \Delta x$
這里只用了一個 $nC_{n-1}^{j-1} = jC_n^j$ 的關系。

定理3（兩個次序統計量的聯合概率密度）不妨假設 $j > i$ ，則
$f_{X_{(i)},X_{(j)}}(x_i,x_j)=(n)_2f(x_{i})f(x_{j}) C_{n-2}^{i-1}C_{n-i-3}^{j-i-1}[F(x_i)]^{i-1}[F(x_j)-F(x_i)]^{j-i-1}[1-F(x_j)]^{n-j}$
證明
用上面那個定理那種比較直觀的推導辦法。
$fX(i),X(j)(xi,xj)(Δx)2=P(xi≤X(i)<xi+Δx,xj≤X(j)<xj+Δx)f_{X_{(i)},X_{(j)}}(x_i,x_j) (\Delta x)^2 = P(x_i \le X_{(i)} < x_i + \Delta x, x_j\le X_{(j)} < x_j + \Delta x)$
將這個概率分成四部分計算：

有兩個樣本，一個在

[xi,xi+Δx)[x_i,x_i+\Delta x)

中，另一個在

[xj,xj+Δx)[x_j,x_j+\Delta x)

中；

有

i ? 1

個樣本在

(∞,xi)(\infty,x_i)

中；

有

j ? i ? 1

個樣本在

[xi+Δx,xj][x_i+\Delta x,x_j]

中；

有

n ? j

個樣本在

[xj+Δx,+∞)[x_j+\Delta x,+\infty)

中；

第一條對應的概率是 $(n)2f(xi)Δxf(xj)Δx(n)_2f(x_i)\Delta x f(x_j)\Delta x$ ；第二條對應的概率是 $C_{n-2}^{i-1}[F(x_i)]^{i-1}$ ；第三條對應的概率是 $C_{n-i-3}^{j-i-1}[F(x_j)-F(x_i)]^{j-i-1}$ ；第四條對應的概率是 $1-F(x_j)]^{n-j}$ 。因此
$fX(i),X(j)(xi,xj)(Δx)2=[(n)2f(xi)Δxf(xj)Δx][Cn?2i?1[F(xi)]i?1][Cn?i?3j?i?1[F(xj)?F(xi)]j?i?1][[1?F(xj)]n?j]f_{X_{(i)},X_{(j)}}(x_i,x_j) (\Delta x)^2=[(n)_2f(x_i)\Delta x f(x_j)\Delta x][C_{n-2}^{i-1}[F(x_i)]^{i-1}][C_{n-i-3}^{j-i-1}[F(x_j)-F(x_i)]^{j-i-1}][[1-F(x_j)]^{n-j}]$

例子

例1：均勻分布的次序統計量

假設 ${U1,?,Un}\{U_1,\cdots,U_n\}$ 是一組 $[0, 1]$ 上的均勻分布的簡單隨機樣本，則
$F (x) = x, f (x) = 1$
根據定理2：
$fU(j)(x)=jCnj[F(x)]j?1[1?F(x)]n?jf(x)=n!(j?1)!(n?j)!xj?1(1?x)n?j=Γ(n+1)Γ(j)Γ(n?j+1)xj?1(1?x)n?jf_{U_{(j)}}(x) = jC_n^j [F(x)]^{j-1}[1-F(x)]^{n-j}f(x) \\ = \frac{n!}{(j-1)!(n-j)!}x^{j-1}(1-x)^{n-j} \\ = \frac{\Gamma(n+1)}{\Gamma{(j)}\Gamma(n-j+1)}x^{j-1}(1-x)^{n-j}$
因此 $U(j)～Beta(j,n?j+1)U_{(j)} \sim Beta(j,n-j+1)$ 。即均勻分布 $U [0, 1]$ 的次序統計量會服從beta分布。根據定理3：
$fU(i),U(j)(xi,xj)=(n)2Cn?2i?1Cn?i?3j?i?1[F(xi)]i?1[F(xj)?F(xi)]j?i?1[1?F(xj)]n?j=n!(i?1)!(j?i?1)!(n?j)!xii?1(xj?xi)j?i?1(1?xj)n?j=Γ(n+1)Γ(i)Γ(j?i)Γ(n?j+1)xii?1(xj?xi)j?i?1(1?xi?(xj?xi))n?jf_{U_{(i)},U_{(j)}}(x_i,x_j)=(n)_2C_{n-2}^{i-1}C_{n-i-3}^{j-i-1}[F(x_i)]^{i-1}[F(x_j)-F(x_i)]^{j-i-1}[1-F(x_j)]^{n-j} \\ = \frac{n!}{(i-1)!(j-i-1)!(n-j)!}x_i^{i-1}(x_j-x_i)^{j-i-1}(1-x_j)^{n-j} \\ =\frac{\Gamma(n+1)}{\Gamma(i)\Gamma(j-i)\Gamma(n-j+1)} x_i^{i-1}(x_j-x_i)^{j-i-1}(1-x_i - (x_j-x_i))^{n-j}$
記 $u_i=x_i,u_j=x_j-x_i$ ，
$fU(i),U(j)(ui,uj)=Γ(n+1)Γ(i)Γ(j?i)Γ(n?j+1)uii?1ujj?i?1(1?ui?uj)n?jf_{U_{(i)},U_{(j)}}(u_i,u_j)=\frac{\Gamma(n+1)}{\Gamma(i)\Gamma(j-i)\Gamma(n-j+1)} u_i^{i-1}u_j^{j-i-1}(1-u_i-u_j)^{n-j}$
這個是二元的beta分布，可以記為 $b e t a (i, j ? i, n ? j + 1)$ 。

例2：Dirichlet分布

在上面的例子中，提到一個多元beta分布的東西，但它一般被稱為Dirichlet分布，其一般形式為
$f(x∣α)=Γ(∑i=1nαi)∏i=1nΓ(αi)∏i=1nxiαi?1f(x|\alpha) = \frac{\Gamma(\sum_{i=1}^n \alpha_i)}{\prod_{i=1}^n \Gamma(\alpha_i)} \prod_{i=1}^n x_i^{\alpha_i-1}$
這個分布定義在 $n ? 1$ 維（因為是 $n ? 1$ 維的線性流形）的單純形 $Δn?1={x:∑i=1nxi=1,xi≥0}\Delta^{n-1}=\{x:\sum_{i=1}^n x_i=1,x_i \ge 0\}$ 上，分布可以記為 $Dir(α1,?,αn)Dir(\alpha_1,\cdots,\alpha_n)$ 。關于Dirichlet分布有幾個有趣的性質：

αi=1,?i\alpha_i=1,\forall i

，Dirichlet分布退化為單純形

Δn\Delta^n

上的均勻分布；

(X1,?,Xi+Xi+1,?,Xn)～Dir(α1,?,αi+αi+1,?,αn)(X_1,\cdots,X_i+X_{i+1},\cdots,X_n)\sim Dir(\alpha_1,\cdots,\alpha_i+\alpha_{i+1},\cdots,\alpha_n)

Xi～beta(αi,∑j=1nαj?αi)X_i \sim beta(\alpha_i,\sum_{j=1}^n \alpha_j - \alpha_i)

{U1,?,Un}\{U_1,\cdots,U_n\}

的

m

個次序統計量（序號為

i1,?,imi_{1},\cdots,i_{m}

）的聯合分布為

Dir(i1,i2?i2,?,n?im+1)Dir(i_1,i_2-i_2,\cdots,n-i_m+1)

總結

以上是生活随笔為你收集整理的UA MATH564 概率论IV 次序统计量的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： UA MATH636 信息论5 信道编码
下一篇： UA MATH636 信息论6 微分熵

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

UA MATH564 概率论IV 次序统计量

UA MATH564 概率論IV 次序統計量

次序統計量的分布

例子

例1：均勻分布的次序統計量

例2：Dirichlet分布

總結