日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

可汗学院学习总结(一)

發(fā)布時(shí)間:2023/12/15 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 可汗学院学习总结(一) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1.總體(Population)與樣本(Sample)

  • 總體是研究對(duì)象的整體,通常數(shù)目很大,直接對(duì)總體進(jìn)行分析費(fèi)時(shí)費(fèi)力。因此通過(guò)對(duì)總體進(jìn)行抽樣得到可以代表總體的樣本。
  • 一般都是采用樣本估計(jì)總體的方式,畢竟總體數(shù)量太大,將總體可劃分為訓(xùn)練集,驗(yàn)證集和測(cè)試集。

2.均值(mean)

令總體數(shù)為N,樣本數(shù)為n,每一個(gè)樣本的取值用表示xix_{i}xi?,則:

  • 總體均值:μ=1N∑i=1Nxi\mu=\frac{1}{N} \sum_{i=1}^{N} x_{i}μ=N1?i=1N?xi?
  • 樣本均值:x ̄=1n∑i=1nxi\overline{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i}x=n1?i=1n?xi?

3.方差(Variance)與標(biāo)準(zhǔn)差(Standard deviation)

方差和標(biāo)準(zhǔn)差描述的是數(shù)據(jù)的離散程度,也就是遠(yuǎn)離中心的程度:

  • 總體方差:σ2=1N∑i=1N(xi?μ)2\sigma^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}σ2=N1?i=1N?(xi??μ)2
  • 樣本方差:sn2=1n∑i=1n(xi?x ̄)2s_{n}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}sn2?=n1?i=1n?(xi??x)2

這個(gè)公式計(jì)算的方差通常會(huì)低估總體的方差:當(dāng)樣本分布與總體分布相近時(shí),計(jì)算得到的樣本均值接近總體均值,這時(shí)得到的樣本方差也就接近總體方差;但是可能的情況是,采樣得到的樣本與總體偏差較大時(shí)(有偏的),由于樣本均值總是分布在樣本點(diǎn)的中心,這時(shí)樣本點(diǎn)與樣本均值之間的距離小于與總體均值的距離,計(jì)算得到的樣本方差小于總體方差。這是一種更普遍的情況,因此用上式計(jì)算得到的方差通常會(huì)低估總體方差。

  • 無(wú)偏的樣本方差:s2=1n?1∑i=1n(xi?x ̄)2s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}s2=n?11?i=1n?(xi??x)2

將分母改為n-1,相當(dāng)于以一個(gè)大于1的系數(shù)修正了有偏的方差。實(shí)驗(yàn)證明,這個(gè)公式能更好地估計(jì)總體方差。上述情況是在我們不知道總體的均值時(shí),否則就不需要用n-1來(lái)保持無(wú)偏了。

  • 總體標(biāo)準(zhǔn)差:σ=1N∑i=1N(xi?μ)2\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}σ=N1?i=1N?(xi??μ)2?
  • 樣本標(biāo)準(zhǔn)差: s=1n?1∑i=1n(xi?x ̄)2s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}}s=n?11?i=1n?(xi??x)2?

4.隨機(jī)變量、概率密度函數(shù)、期望

  • 隨機(jī)變量實(shí)際上是一種函數(shù),只有在隨機(jī)過(guò)程中才給它賦值。

  • 概率密度函數(shù)下方的面積表示的才是概率,是概率密度函數(shù)在某一個(gè)區(qū)間內(nèi)的積分。任何一個(gè)確切的點(diǎn)的概率值為0

  • 期望值(Expected value):對(duì)于隨機(jī)變量來(lái)說(shuō),總體數(shù)是無(wú)窮的,計(jì)算總體均值時(shí)我們無(wú)法將所有的值相加再除以無(wú)窮。因此,將每個(gè)數(shù)值的出現(xiàn)的頻率乘以數(shù)值然后對(duì)所有數(shù)值求和,就得到了期望。期望值實(shí)際上等同于總體均值。

5.二項(xiàng)分布

二項(xiàng)分布就是重復(fù)n次獨(dú)立的伯努利實(shí)驗(yàn)。在每次試驗(yàn)中只有兩種可能的結(jié)果,而且兩種結(jié)果發(fā)生與否互相對(duì)立,并且相互獨(dú)立,與其它各次試驗(yàn)結(jié)果無(wú)關(guān),事件發(fā)生與否的概率在每一次獨(dú)立實(shí)驗(yàn)中都保持不變,則這一系列試驗(yàn)總稱為n重伯努利實(shí)驗(yàn),當(dāng)試驗(yàn)次數(shù)為1時(shí),二項(xiàng)分布服從0-1分布。

用p表示一次實(shí)驗(yàn)中成功的概率,1-p表示一次實(shí)驗(yàn)中失敗的概率,則二項(xiàng)分布n次獨(dú)立重復(fù)性實(shí)驗(yàn)中,成功的次數(shù)k的概率為:

  • P(x=k)=n!k!(n?k)!pk(1?p)n?kP(x=k)=\frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k}P(x=k)=k!(n?k)!n!?pk(1?p)n?k

6.二項(xiàng)分布的期望

E(X)=npE(x)=∑k=0nk?(nk)?pk(1?p)n?k=∑k=0nk?n!k!(n?k)!?pk(1?p)n?k=∑k=1nk?n(n?1)!k(k?1)!(n?k)!?p?pk?1(1?p)n?k=np∑a=0n?1b!a(k?1)!(n?k)!?p?pk?1(1?p)n?k=npn?1b!a!(b?a)!?p?pk?1(1?p)n?k=np?1=np\begin{aligned} E(X) &=n p \\ E(\mathrm{x}) &=\sum_{k=0}^{n} k \cdot\left(\begin{array}{c}{n} \\ {k}\end{array}\right) \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=0}^{n} k \cdot \frac{n !}{k !(n-k) !} \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k \cdot \frac{n(n-1) !}{k(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \sum_{a=0}^{n-1} \frac{b !}{a(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p^{n-1} \frac{b !}{a !(b-a) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \cdot 1 \\ &=n p \end{aligned}E(X)E(x)?=np=k=0n?k?(nk?)?pk(1?p)n?k=k=0n?k?k!(n?k)!n!??pk(1?p)n?k=k=1n?k?k(k?1)!(n?k)!n(n?1)!??p?pk?1(1?p)n?k=npa=0n?1?a(k?1)!(n?k)!b!??p?pk?1(1?p)n?k=npn?1a!(b?a)!b!??p?pk?1(1?p)n?k=np?1=np?

二項(xiàng)分布的方差:E(X)=np(1?p)E(X)=n p(1-p)E(X)=np(1?p)

總結(jié)

以上是生活随笔為你收集整理的可汗学院学习总结(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。