机器学习储备(12):二项分布的例子解析
01
—
二項(xiàng)分布
如果實(shí)驗(yàn)滿足以下兩種條件:
在每次試驗(yàn)中只有兩種可能的結(jié)果,而且兩種結(jié)果發(fā)生與否互相對(duì)立;
相互獨(dú)立,與其它各次試驗(yàn)結(jié)果無(wú)關(guān);
事件發(fā)生與否的概率在每一次獨(dú)立試驗(yàn)中都保持不變。
則實(shí)驗(yàn)的結(jié)果對(duì)應(yīng)的分布為二項(xiàng)分布。
當(dāng)試驗(yàn)次數(shù)為1時(shí),二項(xiàng)分布服從0-1分布。
02
—
例子解析
例如,一堆蘋(píng)果有好的,有壞的,從中取10次,定義隨機(jī)變量:從中取得好蘋(píng)果的個(gè)數(shù) X,那么認(rèn)為X服從二項(xiàng)分布。
實(shí)驗(yàn)得到的結(jié)果:比如經(jīng)過(guò)10次實(shí)驗(yàn)后分布結(jié)果為:7好,3壞;再經(jīng)過(guò)10次實(shí)驗(yàn)后分布結(jié)果為:8好,2壞。經(jīng)過(guò)這20次實(shí)驗(yàn),可以根據(jù)最大似然估計(jì)求出我們可求出二項(xiàng)分布的參數(shù)theta:從這堆蘋(píng)果中取到一個(gè)好蘋(píng)果的概率。
因?yàn)樵谖覀兯龅?0次實(shí)驗(yàn)中,出現(xiàn)了15好,5壞,因此一次取到好蘋(píng)果概率為:15/20 = 0.75,根據(jù)最大似然估計(jì)的精神,認(rèn)為從整個(gè)樣本中取到一個(gè)好蘋(píng)果的概率也為:0.75。
下面看下,出現(xiàn)這種分布的概率有多大,由二項(xiàng)分布的概率計(jì)算公式:
其中:k表示出現(xiàn)好蘋(píng)果的個(gè)數(shù),p表示一次實(shí)驗(yàn)出現(xiàn)好蘋(píng)果的概率
k的取值范圍為:0~m,最小值為0個(gè)好蘋(píng)果,最大值為m個(gè)好蘋(píng)果(所有的都是好蘋(píng)果)。
03
—
二項(xiàng)分布圖
在以上我們的20次隨機(jī)試驗(yàn)中,最終得到了15個(gè)好果,那么如果依次看下好蘋(píng)果的個(gè)數(shù) k = 0~20,它們的各自的分布概率P,變化曲線圖是怎樣的呢?
為此在Jupyter NoteBook中實(shí)驗(yàn)下,
#計(jì)算組合數(shù) from scipy.special import comb, perm import numpy as np import matplotlib.pyplot as plt#二項(xiàng)分布概率計(jì)算公式 def getp(m,n,pa):if m < n:return 0.0return comb(m,n)*(pa**n)*((1-pa)**(m-n))#獲得畫(huà)圖數(shù)據(jù) klist = np.arange(21) plist = [ getp(m=20,n=k,pa=0.75) for k in klist] plt.plot(klist,plist) plt.xlabel('number of good apples') plt.ylabel('k-distribution proba') plt.title('distribution proba') plt.xticks(np.arange(0,22,1)) plt.grid() plt.show()最終得到的二項(xiàng)分布圖如下:可以看到在k = 15時(shí),取得概率的最大值為0.2,也就是說(shuō)在取到15個(gè)好蘋(píng)果的概率是最大的。
取到0~8個(gè)好果的概率是很低的,但是取到19,20個(gè)好果的概率同樣也是很低的
說(shuō)明一點(diǎn):
在這20個(gè)蘋(píng)果分布中,我們對(duì)所取得的好果的個(gè)數(shù)的期望值:20*0.75=15個(gè),可以看到上面的二項(xiàng)分布圖在 k = 15即取得15個(gè)好果的概率是最大的,言外之意,期望值就是分布中最有可能發(fā)生的那個(gè)分布吧:15好果,5壞果。
04
—
二項(xiàng)分布總結(jié)
二項(xiàng)分布是隨機(jī)變量為離散型隨機(jī)變量且當(dāng)試驗(yàn)次數(shù)為1時(shí)服從0-1分布,它是重復(fù)n次的獨(dú)立的伯努利試驗(yàn)。這種分布下,對(duì)個(gè)數(shù)的期望等于二項(xiàng)分布中概率發(fā)生最大的取值個(gè)數(shù)。
總結(jié)
以上是生活随笔為你收集整理的机器学习储备(12):二项分布的例子解析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: GameKlip连接器: Android
- 下一篇: Buildroot 开发