泊松分布的分布函数_常见概率分布汇总
注:本篇內(nèi)容均摘自《商務(wù)與經(jīng)濟統(tǒng)計學》,目的是方便個人查閱相關(guān)基本概念。
隨機變量是對實驗結(jié)果的數(shù)值描述,分為離散型隨機變量和連續(xù)型隨機變量。下面列舉常見的離散型概率分布和連續(xù)型概率分布。
離散型概率分布
1、柏松概率分布
定義
柏松分布是一種常見的離散型概率分布,它主要用來估計在特定時間段或空間中某事件發(fā)生的次數(shù)。泊松實驗的性質(zhì):
第一、在任意兩個相等長度的區(qū)間上,事件發(fā)生的概率相等;第二、事件在某一區(qū)間上是否發(fā)生與事件在其他區(qū)間上是否發(fā)生是獨立的。
泊松分布的另外一個重要性質(zhì)數(shù)學期望和方差相等。
泊松概率函數(shù):
,其中 為事件在一個區(qū)間發(fā)生x次的概率, 為事件在一個區(qū)間發(fā)生次數(shù)的數(shù)學期望或均值,e=2.71828;泊松概率分布的一個案例:
假定感興趣的是工作日早上15分鐘內(nèi)到達某汽車銀行出納窗口處的汽車數(shù)量。如果假設(shè)在任意兩個相等的時間段上汽車到達的概率是相等的,并且在任意時間段上是否有汽車到達與其他時間段上是否有汽車到達是相互獨立的,那么泊松概率函數(shù)是適用的。假定以上假設(shè)都成立,并且對歷史數(shù)據(jù)的分析顯示,15分鐘的時間段上到達車輛數(shù)目的平均值為10.這時,采用以下概率函數(shù):
,其中隨機變量x=15分鐘的時間段上到達的汽車數(shù)。一個有趣的題目:已知某app的日活為10000人,那么請判斷是否某一天會有15000人同時訪問該app?
X=np.arange(8000,16000,100) y=poisson.pmf(X,mu=10000) plt.plot(X,y)圖1X=np.arange(9500,11000,100) y=poisson.pmf(X,mu=10000) plt.plot(X,y)圖2由圖1和圖2可知,在[9600,10400]之間柏松分布的概率都不為0外,其余取值的概率基本都為0,所以幾乎日活不會取到15000.
2、二項概率分布
二項概率分布是一種離散型概率分布,具有廣泛的應(yīng)用。它與一個稱為二項實驗的多步驟實驗有關(guān)。
伯努利實驗的性質(zhì):
第一、實驗由一系列相同的實驗組成;第二、每次實驗有兩種可能的結(jié)果。我們把其中的一個稱為成功,另一個稱為失敗;
第三、每次實驗成功的概率都是相同的,用p來表示;失敗的概率也都相同,用1-p表示;
第四、實驗是相互獨立的。
二項概率函數(shù):
,其中x為成功的次數(shù),p為每次實驗中成功的概率;n為實驗的次數(shù);f(x)為n次實驗中有x次成功的概率;二項分布的期望與方差:
; ;3、超幾何概率分布
超幾何概率分布與二項分布聯(lián)系密切。這兩種概率分布主要有兩處不同:在超幾何概率分布中,各次實驗不是獨立的,并且各次實驗中成功的概率不等。對于超幾何概率分布,符號N表示總體容量,r表示總體中具有成功標志的元素個數(shù),N-r表示總體中有失敗標志的元素個數(shù)。采用不放回抽樣方法,從總體中抽取n個元素,超幾何概率函數(shù)用來計算在這n個元素中恰有x個元素具有成功標志,n-x個元素具有失敗標志的概率。當這種實驗結(jié)果出現(xiàn)時,我們是從總體的r個具有成功標志的元素中抽取x個,從總體的N-r個具有失敗標志的元素中抽取n-x個。下面的超幾何概率函數(shù)f(x)給出了n次實驗中有x次成功的概率。
考慮拋5次硬幣的實驗,每一次都觀察硬幣著地時正面朝上還是反面朝上。假設(shè)我們想要計算5次拋擲中正面出現(xiàn)的次數(shù)。這個實驗具備二次實驗的性質(zhì)嗎?感興趣的隨機變量是什么?注意:
于是,該實驗滿足二項實驗的性質(zhì)。感興趣的隨機變量為x=拋擲5次硬幣正面朝上的次數(shù),這時x的可能取值為0,1,2,3,4或5.
超幾何概率函數(shù):
,其中,x為成功的次數(shù);n為實驗次數(shù); 為n次實驗中x次成功的概率;N為總體中元素的個數(shù);r為總體中具有成功標志的元素的個數(shù)。超幾何概率分布的期望與方差:
; ;當總體容量足夠大的時候,超幾何分布可以用實驗次數(shù)為n,成功概率
的二項分布近似。連續(xù)型概率分布
離散型隨機變量和連續(xù)型隨機變量之間最根本的區(qū)別在與,二者在概率計算上是不同的。對于一個離散型隨機變量,概率函數(shù)f(x)給出了隨機變量x取某個特定值的概率,而對連續(xù)型隨機變量,與概率函數(shù)相對應(yīng)的是概率密度函數(shù),也記作f(x).不同的是,概率密度函數(shù)并沒有直接給出概率。但是,給定區(qū)間上曲線f(x)下的面積是連續(xù)型隨機變量在該區(qū)間取值的概率。因此,當計算連續(xù)型隨機變量的概率時,我們計算的是隨機變量在某個區(qū)間內(nèi)取值的概率。
均勻分布
一般的,如果隨機變量x服從均勻分布,則它的密度函數(shù)的公式如下:
, else ;正態(tài)分布
正態(tài)密度函數(shù):
; 為均值, 為標準差;標準正態(tài)密度函數(shù):
;二項概率的正態(tài)近似:
當實驗次數(shù)很大時,筆算或者用計算器求解二項概率函數(shù)都是很困難的。在 和 的情況下,正態(tài)分布是對二項分布的一個簡便易行的近似。當使用正態(tài)分布近似二項分布時,正態(tài)曲線中取 和 .舉例說明二項分布的正態(tài)近似。假定歷史經(jīng)驗表明,某公司發(fā)票出錯的概率為10%。現(xiàn)選取100張發(fā)票組成一個樣本,我們想計算恰好有12張發(fā)票有錯的概率,即想計算100次實驗中恰好有12次成功的二項概率。在應(yīng)用二項分布的正態(tài)近似時,另
和 ,下面我們使用 的正態(tài)分布計算恰好有12張發(fā)票有錯的概率。對連續(xù)型概率分布,概率是通過計算密度函數(shù)下方的面積得出的。因此,隨機變量取任意單個值的概率是0。為了對恰好有12次成功的二項概率進行近似,我們必須計算1.5和12.5之間正態(tài)曲線下的面積。其中11.5和12.5是將12加減0.5得到的,我們稱0.5為連續(xù)性正交因子。由于我們是用連續(xù)型分布來近似一個離散分布,從而離散型二項分布的概率
可以用連續(xù)型正態(tài)分布的概率 來近似,從而可以轉(zhuǎn)換成標準正態(tài)分布來求解概率。指數(shù)分布
指數(shù)概率分布可用于描述諸如到達某洗車處的兩輛車的時間間隔,裝載一輛卡車所需要的事件,高速公路上兩起重大事故發(fā)生地之間的距離等隨機變量。
指數(shù)概率密度函數(shù):
,其中 為期望值或均值;泊松分布和指數(shù)分布的關(guān)系:
泊松分布描述了某一區(qū)間中事件發(fā)生的次數(shù),而指數(shù)分布描述了事件發(fā)生的時間間隔長度。舉例如下,假定1h中叨叨某一洗車處的汽車的數(shù)量可以用泊松分布描述,其均值為每小時10輛。泊松概率函數(shù)給出了每小時有x輛汽車到達的概率:
由于車輛到達的平均數(shù)是每小時10輛,則兩車到達額度時間間隔的均值為:
,于是描述兩車到達的時間間隔的對應(yīng)分布是指數(shù)分布,其均值為 ,從而指數(shù)概率密度函數(shù)為: .總結(jié)
以上是生活随笔為你收集整理的泊松分布的分布函数_常见概率分布汇总的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 拔除牙齿再镶牙需要去几次
- 下一篇: 寻仙新马源码一键端_强大,腾讯开源前后端