泊松分布和指数分布,包你学会
當你學習指數分布的時候,經常會看到泊松分布的身影,網上的大部分教程講的非常復雜,看完之后還是一頭霧水。
本文本著通俗易懂的原則,使用生活中的例子,說明泊松分布和指數分布的關系。一下子學會了兩種分布,有沒有很有成就感?
泊松分布
在日常生活中,許多事件是有一定的頻率的,比如下面的例子。
某公司平均每一小時接到三個用戶電話。
某超市平均每五小時賣掉一個玩具。
一個網站平均每一分鐘有二次訪問。
你有沒有發現上面事件的一些共同點?細心的你會發現,上面的事件,只能估計事件發生的總數,但是不能知道具體發生的時間。如果我問你,上面的第一個例子,平均每一小時接到一個用戶電話,下一小時接到幾個電話?我們并不能準確知道。
泊松分布便是描述某段時間內,事件發生的次數的概率。
泊松分布的概率密度函數公式如下,
P(N(t)=n)=(λt)ne?λtn!P(N(t)=n)=\frac{(\lambda t)^ne^{-\lambda t}}{n!}P(N(t)=n)=n!(λt)ne?λt?
上面的式子中,PPP表示概率,NNN表示某種函數關系,ttt表示時間段,nnn表示事件發生的次數。一小時內接到一個用戶電話的概率表示為P(N(1)=3)P(N(1)=3)P(N(1)=3)。λ\lambdaλ表示事件的頻率。
為了理解的更深入,咱們再多舉一些例子。
接下來兩個小時,一個用戶電話也沒有的概率是0.025%,發生概率約等于零,計算方法如下所示,
P(N(2)=0)=(3×2)0e?3×20!≈0.0025P(N(2)=0)=\frac{(3\times2)^0e^{-3\times2}}{0!}\approx 0.0025P(N(2)=0)=0!(3×2)0e?3×2?≈0.0025
接下來一個小時,至少有兩個用戶電話的概率是80%。計算方法如下所示,
P(N(1)≥2)=1?P(N(1)=0)?P(N(1)=1)=1?(3×1)0e?3×10!?(3×1)1e?3×11!=1?e?3?3e?3=1?4e?3≈0.8009\begin{aligned} P(N(1)\geq 2)&=1-P(N(1)=0)-P(N(1)=1) \\ &=1-\frac{(3\times1)^0e^{-3\times1}}{0!}-\frac{(3\times1)^1e^{-3\times1}}{1!} \\ &=1-e^{-3}-3e^{-3} \\ &=1-4e^{-3} \\ &\approx 0.8009 \end{aligned}P(N(1)≥2)?=1?P(N(1)=0)?P(N(1)=1)=1?0!(3×1)0e?3×1??1!(3×1)1e?3×1?=1?e?3?3e?3=1?4e?3≈0.8009?
通過上面的例子,相信大家對泊松分布的理解又上了一層樓。
泊松分布的概率密度圖大概長下面的樣子,
在頻率附近,事件的發生的概率最大。兩邊對稱下降,意思是事件發生次數越大和越小概率越來越小。每小時接到三個用戶的電話的概率是最大的,接到更多和更少的電話次數的概率變得越來越小。
指數分布
下面這些例子全是指數分布。
來電的時間間隔。
玩具銷售的時間間隔。
網站訪問的時間間隔。
細心的你發現了,上面的例子的共同點,時間間隔。
指數分布描述事件發生的時間間隔的概率。
指數分布和泊松分布有什么關系呢?指數分布的概率密度函數能從泊松分布的概率密度函數推導出來。
為了通俗易懂,還是舉例子來說明。
假如下一個用戶電話的間隔時間是ttt,等價于ttt時間內沒有任何用戶打電話。用公式表示如下所示,
P(X>t)=P(N(t)=0)=(λt)0e?λt0!=e?λt\begin{aligned} P(X>t)&=P(N(t)=0) \\ &=\frac{(\lambda t)^0e^{-\lambda t}}{0!} \\ &=e^{-\lambda t} \end{aligned}P(X>t)?=P(N(t)=0)=0!(λt)0e?λt?=e?λt?
有了上式,用戶在ttt時間內打電話的概率是1減去上面的概率
P(X≤t)=1?P(X>t)=1?e?λt\begin{aligned} P(X\leq t)&=1-P(X>t) \\ &=1-e^{-\lambda t} \end{aligned}P(X≤t)?=1?P(X>t)=1?e?λt?
有了上面的公式,我們計算一下接下來15分鐘內,有用戶打電話的概率是
P(X≤0.25)=1?P(X>t)=1?e?3×0.25≈0.5276\begin{aligned} P(X\leq 0.25)&=1-P(X>t) \\ &=1-e^{-3\times 0.25} \\ &\approx0.5276 \end{aligned}P(X≤0.25)?=1?P(X>t)=1?e?3×0.25≈0.5276?
我們再計算一下,用戶接下來在15到30分鐘內打電話的概率是
P(0.25≤X≤0.5)=P(X≤0.5)?P(X≤0.25)=(1?e?3×0.5)?(1?e?3×0.25)=e?0.75?e?1.5≈0.2492\begin{aligned} P(0.25\leq X\leq 0.5)&=P(X\leq 0.5)-P(X\leq 0.25) \\ &=(1-e^{-3\times 0.5})-(1-e^{-3\times 0.25}) \\ &=e^{-0.75}-e^{-1.5} \\ &\approx 0.2492 \end{aligned}P(0.25≤X≤0.5)?=P(X≤0.5)?P(X≤0.25)=(1?e?3×0.5)?(1?e?3×0.25)=e?0.75?e?1.5≈0.2492?
理解了嗎?指數分布描述的是時間發生的時間間隔的概率。
指數分布的概率密度函數長下面的樣子。
因為概率密度函數圖像呈現指數衰減的樣子,所以起名叫指數分布。
從上圖能知道,隨著時間間隔變長,事件發生的概率急劇下降。是指數式衰減的。
還是上面的例子,每個小時內有三個用戶打電話,下一個用戶間隔2小時打電話的概率是0.25%,那么間隔3小時,4小時的概率,更加接近于0。
總結
一句話來說。
泊松分布是單位時間內獨立事件發生次數的概率分布。
指數分布是獨立事件的時間間隔的概率分布。
總結
以上是生活随笔為你收集整理的泊松分布和指数分布,包你学会的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QuickCHM 2.6中“不支持此接口
- 下一篇: 学习路上遇到的Error1