二项分布
目錄:
定義
期望與方差
兩個二項分布的協(xié)方差
python畫圖
二項分布與其他分布的關(guān)系
一、定義
在n次獨立重復(fù)的伯努利試驗中,設(shè)每次試驗中事件A發(fā)生的概率為p。用X表示n重伯努利試驗中事件A發(fā)生的次數(shù),則X的可能取值為0,1,…,n,且對每一個k(0≤k≤n),事件{X=k}即為“n次試驗中事件A恰好發(fā)生k次”,隨機變量X的離散概率分布即為二項分布(Binomial Distribution)。
在概率論和統(tǒng)計學(xué)中,二項分布是n個獨立的成功/失敗試驗中成功的次數(shù)的離散概率分布,其中每次試驗的成功概率為p。這樣的單次成功/失敗試驗又稱為伯努利試驗。實際上,當(dāng)n=1時,二項分布就是伯努利分布
一般地,如果隨機變量 X 服從參數(shù)為 n 和 p 的二項分布,我們記為 X~B(n,p) 或 X~b(n,p) 。n 次試驗中正好得到 k 次成功的概率由概率質(zhì)量函數(shù)給出:
式中k=0,1,2...,n,
是二項分布,又記為Cnk 該公式可以用以下方法理解:我們希望有k次成功(p)和n?k次失敗(1 ?p)。并且,k次成功可以在n次試驗的任何地方出現(xiàn),而把k次成功分布在n次試驗中共有Cnk 個不同的方法
二、期望與方差
如果X~B(n,p)(也就是說,X是服從二項分布的隨機變量),那么X的期望為:
X的方差為:
這個事實很容易證明。首先假設(shè)有一個伯努利試驗。試驗有兩個可能的結(jié)果:1和0,前者發(fā)生的概率為p,后者的概率為1?p。該試驗的期望值等于μ= 1?* p+ 0? * (1?p) =p。該試驗的方差,也可以類似地計算:σ2= (1?μ)2p+ (0?μ)2(1?p) =p(1???p)
一般的二項分布是n次獨立的伯努利試驗的和。它的期望值和方差分別等于每次單獨試驗的期望值和方差的和:
三、兩個二項分布的協(xié)方差
如果有兩個服從二項分布的隨機變量X和Y,我們可以求它們的協(xié)方差。利用協(xié)方差的定義,當(dāng)n= 1時我們有:
E(XY)為當(dāng)X和Y都等于1時的概率,而E(X)和E(Y)分別為X= 1和Y= 1的概率。定義P,B為X和Y都等于1的概率,便得到:
對于n次獨立的試驗,我們便有:
如果X和Y是相同的變量,便化為前文所述的的二項分布方差公式
四、python畫圖
import matplotlib.pyplot as plt
import numpy as np
from scipy import stats
#二項分布
n=100
p=0.3
k=np.arange(0,n)#生成一個0到N-1的數(shù)列
y1=stats.binom.pmf(k,n,p)
plt.plot(k,y1)
plt.show()
###畫泊松分布的圖
m=n*p
y2=stats.poisson.pmf(k,m)
plt.plot(k,y2,'g^-')
plt.show()
###再畫個正態(tài)分布的圖
l=np.sqrt(m)
y3=stats.norm.pdf(k,m,l)
plt.plot(k,y3,'ro-')
plt.show()
#畫完三個圖之后就把他們放一下對比一下吧,為了方便改變參數(shù),我們把它寫成一個函數(shù)吧。
def draw(times,possibility):
import matplotlib.pyplot as plt
import numpy as np
from scipy import stats
n=times
p=possibility
k=np.arange(0,n)#生成一個0到N-1的數(shù)列
y1=stats.binom.pmf(k,n,p)
m=n*p#確定泊松分布的參數(shù)
y2=stats.poisson.pmf(k,m)
l=np.sqrt(m)#確定正態(tài)分布的另一個參數(shù)
y3=stats.norm.pdf(k,m,l)#注意一下前兩個是pmf最后一個是pdf
plt.xlabel('k')
plt.ylabel('possibility')
plt.title('three distribution :n=%d p=%.2f' % (n,p) )#用到了python的格式化
binomial=plt.plot(k,y1,color='r',label='binomial')
poisson=plt.plot(k,y2,color='g',label='poisson')
normal=plt.plot(k,y3,color='b',label='normal')#對圖的參數(shù)進(jìn)行調(diào)整
plt.legend(loc='upper right')#把圖例放在右上角
plt.show()
draw(100,0.3)
從上圖中可以看出,對于固定的n以及p,當(dāng)k增加時,概率P{X=k}先是隨之增加直至達(dá)到最大值,隨后單調(diào)減少。可以證明,一般的二項分布也具有這一性質(zhì),且:
當(dāng)(n+1)p不為整數(shù)時,二項概率P{X=k}在k=[(n+1)p]時達(dá)到最大值;
當(dāng)(n+1)p為整數(shù)時,二項概率P{X=k}在k=(n+1)p和k=(n+1)p-1時達(dá)到最大值。
注:[x]為取整函數(shù),即為不超過x的最大整數(shù)
五、二項分布與其他分布的關(guān)系
兩個二項分布的和
如果X~ B(n,p)和Y~ B(m,p),且X和Y相互獨立,那么X+Y也服從二項分布;它的分布為:
伯努利分布
伯努利分布是二項分布在n= 1時的特殊情況。X~ B(1,p)與X~ Bern(p)的意思是相同的。相反,任何二項分布B(n,p)都是n次獨立伯努利試驗的和,每次試驗成功的概率為p
泊松近似
當(dāng)試驗的次數(shù)趨于無窮大,而乘積np固定時,二項分布收斂于泊松分布。因此參數(shù)為λ=np的泊松分布可以作為二項分布B(n,p)的近似,近似成立的前提要求n足夠大,而p足夠小,np不是很小
正態(tài)近似
如果n足夠大,那么分布的偏度就比較小。在這種情況下,如果使用適當(dāng)?shù)倪B續(xù)性校正,那么B(n,p)的一個很好的近似是正態(tài)分布:
當(dāng)n越大(至少20)且p不接近0或1時近似效果更好。不同的經(jīng)驗法則可以用來決定n是否足夠大,以及p是否距離0或1足夠遠(yuǎn),其中一個常用的規(guī)則是np和n(1 ?p)都必須大于 5
回到頂部
總結(jié)
- 上一篇: 用发膜会掉头发吗 发膜不能接触头皮
- 下一篇: 蓝雪花枯萎了还有救吗