當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

方差学习总结

發(fā)布時(shí)間：2024/4/17 编程问答 47 豆豆

生活随笔收集整理的這篇文章主要介紹了方差学习总结小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

在分析之前，要嚴(yán)格區(qū)分一個(gè)概念是在概率學(xué)上的定義還是在統(tǒng)計(jì)學(xué)上的定義。概率學(xué)比統(tǒng)計(jì)學(xué)更加的抽象一點(diǎn)，概率學(xué)研究一個(gè)事件的理想的情況，但是在真實(shí)的世界，這種理想的情況是很難或者不可能達(dá)到的，所以利用統(tǒng)計(jì)學(xué)中的樣本來(lái)估計(jì)這個(gè)理想的結(jié)果。

方差的概念和定義

概率論中方差用來(lái)度量隨機(jī)變量和其數(shù)學(xué)期望（均值）之間的偏離程度。

統(tǒng)計(jì)學(xué)中的方差（樣本方差）是各個(gè)數(shù)據(jù)分別與其平均數(shù)之差的平方和的平均數(shù)。

設(shè)X是一個(gè)隨機(jī)變量，若$E\{ {[X - E(X)]^2}\} $存在，則稱(chēng)$E\{ {[X - E(X)]^2}\} $為X的方差，記為D(X)或者Var(X)。

D(X)是刻畫(huà)X取值分散程度的一個(gè)量，它是衡量取值分散程度的一個(gè)尺度。

?方差的種類(lèi)與計(jì)算

?離散型方差：

$D(x) = \sum\nolimits_{i = 1}^n {{p_i} \cdot {{({x_i} - u)}^2}} $。其中$u = E(x) = \sum\nolimits_{i = 1}^n {{p_i} \cdot {x_i}} $

注意：在統(tǒng)計(jì)學(xué)中，樣本的均值為$\widehat u = \frac{1}{n}\sum\nolimits_{i = 1}^n {{x_i}} $

將上面的D(x)展開(kāi)后得到\[D(x) = Var(x) = \sum\nolimits_{i = 1}^n {({p_i} \cdot x_i^2) - {u^2}} \]

?連續(xù)型方差：

對(duì)于連續(xù)型隨機(jī)變量，$Var(x) = {\sigma ^2} = \int {{{(x - u)}^2}f(x)dx = } \int {{x^2}f(x)dx - {u^2}} $其中$u = \int {xf(x)dx} $并且此處的積分是以x的取值范圍（一般是負(fù)無(wú)窮~正無(wú)窮）為積分上下界的定積分。所以$\int_{ - \infty }^{ + \infty } {f(x)dx} ?= 1$。

根據(jù)方差的定義：$D(x) = E\{ {[X - E(X)]^2}\} $

所以：?

方差的特性

重點(diǎn)分布的方差

?統(tǒng)計(jì)學(xué)中的樣本方差

方差是各個(gè)數(shù)據(jù)與平均值之差的平方和的平均數(shù)，即：

\[{s^2} = \frac{1}{n}[{({x_1} - \overline x )^2} + {({x_2} - \overline x )^2} + ... + {({x_n} - \overline x )^2}]\]

其中$\overline x $是樣本的平均數(shù)。

注意這里的${s^2}$并不是隨機(jī)變量的方差，它是利用樣本數(shù)據(jù)對(duì)隨機(jī)變量方差的一個(gè)估計(jì)。

現(xiàn)在樣本只是總體的一部分，用樣本得到的樣本方差也不可能那么理想的正好等于總體方差。為了能準(zhǔn)確的估計(jì)總體方差，希望這個(gè)樣本方差能夠是總體方差的一個(gè)無(wú)偏估計(jì)。也就是說(shuō)$E({s^2}) = {\sigma ^2}$。其中${s^2}$是樣本方差，${\sigma ^2}$是總體方差。

但是上面的${s^2}$不是${\sigma ^2}$的無(wú)偏估計(jì)：

從公式推導(dǎo)可以看到，這里的${s^2}$不是${\sigma ^2}$的無(wú)偏估計(jì)。

所以一般的樣本方差用一個(gè)修正值：

\[{s^2} = \frac{1}{{n - 1}}{\sum\nolimits_{i = 1}^n {({X_i} - \overline X )} ^2}\]

對(duì)上面的公式做一個(gè)解釋

樣本方差公式里分母為n-1的目的是為了讓方差的估計(jì)無(wú)偏，因?yàn)闊o(wú)偏的估計(jì)比有偏估計(jì)更好的符合直覺(jué)。盡管有的統(tǒng)計(jì)學(xué)家認(rèn)為讓mean square error即MSE最小才更具有意義。

在做出解釋前先給出結(jié)論：

\[E[\frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{({X_i} - \overline X )}^2}} ] = {\sigma ^2}\]

也就是說(shuō)$\frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{({X_i} - \overline X )}^2}} $是總體樣本方差${\sigma ^2}$的無(wú)偏估計(jì)。

第一種情況：

假設(shè)隨機(jī)變量X的數(shù)學(xué)期望u是已知的，然而${\sigma ^2}$是未知的。在這種情況下，樣本方差可以直接用定義寫(xiě)出來(lái)：各個(gè)數(shù)據(jù)分別與平均數(shù)（這里的平均數(shù)是均值u）之差的平方和的平均數(shù)。也就是：${s^2} = \frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2}$。

\[\begin{array}{l}E({s^2})\\ = E(\frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2})\\ = \frac{1}{n}E({\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2})\\ = \frac{1}{n}{\sum\nolimits_{i = 1}^n {E[({X_i} - u)} ^2}]\\ = \frac{1}{n}\sum\nolimits_{i = 1}^n {E[{X_i}^2 - 2u} {X_i} + {u^2}]\\ = \frac{1}{n}\sum\nolimits_{i = 1}^n {[E{X_i}^2 - 2uE{X_i} + {u^2}]} \\ = \frac{1}{n}\sum\nolimits_{i = 1}^n {[{\sigma ^2} + {u^2} - 2{u^2} + {u^2}]} \\ = {\sigma ^2}\end{array}\]

所以$E(\frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2}) = {\sigma ^2}$

即在隨機(jī)變量X的數(shù)學(xué)期望u已知的條件下，$\frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2}$是總體方差的無(wú)偏估計(jì)。

第二種情況：

在隨機(jī)變量X的數(shù)學(xué)期望u未知的情況下，我們被迫使用樣本均值 ${\overline X }$代替上面的u，也就是使用$\frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - \overline X )} ^2}$作為總體方差${{\sigma ^2}}$的估計(jì)。

但是這種情況往往會(huì)低估總體方差。因?yàn)?#xff1a;

而$\frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2}$才是對(duì)總體方差的無(wú)偏估計(jì)。

綜合上面的兩種情況來(lái)說(shuō)：

在不知道隨機(jī)變量真實(shí)數(shù)學(xué)期望的條件下，把分母n換成n-1，就是把原來(lái)偏小的估計(jì)放大了一點(diǎn)，這樣就能得到正確的估計(jì)了。

$E(\frac{1}{n}{\sum\nolimits_{i = 1}^n {({X_i} - u)} ^2}) = E[\frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{({X_i} - \overline X )}^2}} ] = {\sigma ^2}$至于為什么是n-1，而不是n-2或者什么別的數(shù)，上面的公式已經(jīng)推導(dǎo)過(guò)了。

?一般化

轉(zhuǎn)載于:https://www.cnblogs.com/stemon/p/5032909.html

總結(jié)

以上是生活随笔為你收集整理的方差学习总结的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

方差

上一篇： nagios监控cfg模块
下一篇：关于db link权限分配的苦旅(一)