當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

可汗学院学习总结（一）

發布時間：2023/12/15 编程问答 49 豆豆

生活随笔收集整理的這篇文章主要介紹了可汗学院学习总结（一）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.總體（Population）與樣本（Sample）

總體是研究對象的整體，通常數目很大，直接對總體進行分析費時費力。因此通過對總體進行抽樣得到可以代表總體的樣本。
一般都是采用樣本估計總體的方式，畢竟總體數量太大，將總體可劃分為訓練集，驗證集和測試集。

2.均值(mean)

令總體數為N,樣本數為n，每一個樣本的取值用表示 $x_{i}$ ，則：

總體均值： $μ=1N∑i=1Nxi\mu=\frac{1}{N} \sum_{i=1}^{N} x_{i}$
樣本均值： $x￣=1n∑i=1nxi\overline{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i}$

3.方差(Variance)與標準差（Standard deviation）

方差和標準差描述的是數據的離散程度，也就是遠離中心的程度：

總體方差： $σ2=1N∑i=1N(xi?μ)2\sigma^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}$
樣本方差： $sn2=1n∑i=1n(xi?x￣)2s_{n}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}$

這個公式計算的方差通常會低估總體的方差：當樣本分布與總體分布相近時，計算得到的樣本均值接近總體均值，這時得到的樣本方差也就接近總體方差；但是可能的情況是，采樣得到的樣本與總體偏差較大時（有偏的），由于樣本均值總是分布在樣本點的中心，這時樣本點與樣本均值之間的距離小于與總體均值的距離，計算得到的樣本方差小于總體方差。這是一種更普遍的情況，因此用上式計算得到的方差通常會低估總體方差。

無偏的樣本方差： $s2=1n?1∑i=1n(xi?x￣)2s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}$

將分母改為n-1，相當于以一個大于1的系數修正了有偏的方差。實驗證明，這個公式能更好地估計總體方差。上述情況是在我們不知道總體的均值時，否則就不需要用n-1來保持無偏了。

總體標準差： $σ=1N∑i=1N(xi?μ)2\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}$
樣本標準差： $s=1n?1∑i=1n(xi?x￣)2s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}}$

4.隨機變量、概率密度函數、期望

隨機變量實際上是一種函數，只有在隨機過程中才給它賦值。
概率密度函數下方的面積表示的才是概率，是概率密度函數在某一個區間內的積分。任何一個確切的點的概率值為0
期望值（Expected value）：對于隨機變量來說，總體數是無窮的，計算總體均值時我們無法將所有的值相加再除以無窮。因此，將每個數值的出現的頻率乘以數值然后對所有數值求和，就得到了期望。期望值實際上等同于總體均值。

5.二項分布

二項分布就是重復n次獨立的伯努利實驗。在每次試驗中只有兩種可能的結果，而且兩種結果發生與否互相對立，并且相互獨立，與其它各次試驗結果無關，事件發生與否的概率在每一次獨立實驗中都保持不變，則這一系列試驗總稱為n重伯努利實驗，當試驗次數為1時，二項分布服從0-1分布。

用p表示一次實驗中成功的概率，1-p表示一次實驗中失敗的概率，則二項分布n次獨立重復性實驗中，成功的次數k的概率為：

$P(x=k)=n!k!(n?k)!pk(1?p)n?kP(x=k)=\frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k}$

6.二項分布的期望

$E(X)=npE(x)=∑k=0nk?(nk)?pk(1?p)n?k=∑k=0nk?n!k!(n?k)!?pk(1?p)n?k=∑k=1nk?n(n?1)!k(k?1)!(n?k)!?p?pk?1(1?p)n?k=np∑a=0n?1b!a(k?1)!(n?k)!?p?pk?1(1?p)n?k=npn?1b!a!(b?a)!?p?pk?1(1?p)n?k=np?1=np\begin{aligned} E(X) &=n p \\ E(\mathrm{x}) &=\sum_{k=0}^{n} k \cdot\left(\begin{array}{c}{n} \\ {k}\end{array}\right) \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=0}^{n} k \cdot \frac{n !}{k !(n-k) !} \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k \cdot \frac{n(n-1) !}{k(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \sum_{a=0}^{n-1} \frac{b !}{a(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p^{n-1} \frac{b !}{a !(b-a) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \cdot 1 \\ &=n p \end{aligned}$

二項分布的方差： $E (X) = n p (1 ? p)$

總結

以上是生活随笔為你收集整理的可汗学院学习总结（一）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：硬件模拟面试题整理
下一篇： Augmented Reality La