可汗学院学习总结(一)
1.總體(Population)與樣本(Sample)
- 總體是研究對象的整體,通常數目很大,直接對總體進行分析費時費力。因此通過對總體進行抽樣得到可以代表總體的樣本。
- 一般都是采用樣本估計總體的方式,畢竟總體數量太大,將總體可劃分為訓練集,驗證集和測試集。
2.均值(mean)
令總體數為N,樣本數為n,每一個樣本的取值用表示xix_{i}xi?,則:
- 總體均值:μ=1N∑i=1Nxi\mu=\frac{1}{N} \sum_{i=1}^{N} x_{i}μ=N1?∑i=1N?xi?
- 樣本均值:x ̄=1n∑i=1nxi\overline{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i}x=n1?∑i=1n?xi?
3.方差(Variance)與標準差(Standard deviation)
方差和標準差描述的是數據的離散程度,也就是遠離中心的程度:
- 總體方差:σ2=1N∑i=1N(xi?μ)2\sigma^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}σ2=N1?∑i=1N?(xi??μ)2
- 樣本方差:sn2=1n∑i=1n(xi?x ̄)2s_{n}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}sn2?=n1?∑i=1n?(xi??x)2
這個公式計算的方差通常會低估總體的方差:當樣本分布與總體分布相近時,計算得到的樣本均值接近總體均值,這時得到的樣本方差也就接近總體方差;但是可能的情況是,采樣得到的樣本與總體偏差較大時(有偏的),由于樣本均值總是分布在樣本點的中心,這時樣本點與樣本均值之間的距離小于與總體均值的距離,計算得到的樣本方差小于總體方差。這是一種更普遍的情況,因此用上式計算得到的方差通常會低估總體方差。
- 無偏的樣本方差:s2=1n?1∑i=1n(xi?x ̄)2s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}s2=n?11?∑i=1n?(xi??x)2
將分母改為n-1,相當于以一個大于1的系數修正了有偏的方差。實驗證明,這個公式能更好地估計總體方差。上述情況是在我們不知道總體的均值時,否則就不需要用n-1來保持無偏了。
- 總體標準差:σ=1N∑i=1N(xi?μ)2\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}σ=N1?∑i=1N?(xi??μ)2?
- 樣本標準差: s=1n?1∑i=1n(xi?x ̄)2s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}}s=n?11?∑i=1n?(xi??x)2?
4.隨機變量、概率密度函數、期望
-
隨機變量實際上是一種函數,只有在隨機過程中才給它賦值。
-
概率密度函數下方的面積表示的才是概率,是概率密度函數在某一個區間內的積分。任何一個確切的點的概率值為0
-
期望值(Expected value):對于隨機變量來說,總體數是無窮的,計算總體均值時我們無法將所有的值相加再除以無窮。因此,將每個數值的出現的頻率乘以數值然后對所有數值求和,就得到了期望。期望值實際上等同于總體均值。
5.二項分布
二項分布就是重復n次獨立的伯努利實驗。在每次試驗中只有兩種可能的結果,而且兩種結果發生與否互相對立,并且相互獨立,與其它各次試驗結果無關,事件發生與否的概率在每一次獨立實驗中都保持不變,則這一系列試驗總稱為n重伯努利實驗,當試驗次數為1時,二項分布服從0-1分布。
用p表示一次實驗中成功的概率,1-p表示一次實驗中失敗的概率,則二項分布n次獨立重復性實驗中,成功的次數k的概率為:
- P(x=k)=n!k!(n?k)!pk(1?p)n?kP(x=k)=\frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k}P(x=k)=k!(n?k)!n!?pk(1?p)n?k
6.二項分布的期望
E(X)=npE(x)=∑k=0nk?(nk)?pk(1?p)n?k=∑k=0nk?n!k!(n?k)!?pk(1?p)n?k=∑k=1nk?n(n?1)!k(k?1)!(n?k)!?p?pk?1(1?p)n?k=np∑a=0n?1b!a(k?1)!(n?k)!?p?pk?1(1?p)n?k=npn?1b!a!(b?a)!?p?pk?1(1?p)n?k=np?1=np\begin{aligned} E(X) &=n p \\ E(\mathrm{x}) &=\sum_{k=0}^{n} k \cdot\left(\begin{array}{c}{n} \\ {k}\end{array}\right) \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=0}^{n} k \cdot \frac{n !}{k !(n-k) !} \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k \cdot \frac{n(n-1) !}{k(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \sum_{a=0}^{n-1} \frac{b !}{a(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p^{n-1} \frac{b !}{a !(b-a) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \cdot 1 \\ &=n p \end{aligned}E(X)E(x)?=np=k=0∑n?k?(nk?)?pk(1?p)n?k=k=0∑n?k?k!(n?k)!n!??pk(1?p)n?k=k=1∑n?k?k(k?1)!(n?k)!n(n?1)!??p?pk?1(1?p)n?k=npa=0∑n?1?a(k?1)!(n?k)!b!??p?pk?1(1?p)n?k=npn?1a!(b?a)!b!??p?pk?1(1?p)n?k=np?1=np?
二項分布的方差:E(X)=np(1?p)E(X)=n p(1-p)E(X)=np(1?p)
總結
以上是生活随笔為你收集整理的可汗学院学习总结(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 硬件模拟面试题整理
- 下一篇: Augmented Reality La