反直觉的三门问题,为什么80%的人都错了?
導讀:在本文中我們將討論條件概率:給定結果受到先前事件影響的概率。
作者:貝內迪克特·格羅斯、喬·哈里斯、埃米莉·里爾
來源:大數據DT(ID:hzdashuju)
01?三門問題
三門問題來源于一個被稱作“讓我們做個交易”的古老游戲節目中多次上演的一個場景。雖然這個場景的設置在細節上各不相同,但總體都差不多。
首先,主持人蒙提霍爾會選擇一名觀眾來參與這個游戲。這名觀眾會看見三副門簾,其中一副門簾的后面會有一個值得期待的獎品(諾加海德革的一整套客廳套裝或一輛汽車),在另外兩副之后是有趣卻沒什么價值的獎品,比如山羊。游戲參與者要從三副門簾中選擇其中一副,并且可以獲得這副門簾后的獎品。
然而此時,蒙提霍爾會在揭曉選手所選門簾后面的獎品之前,打開其中一個未被選中的門簾,并揭曉門簾后面的山羊。然后,參與者可以堅持原來的選擇或換成剩下的那副。問題是:參與者是否要改變呢?每種情況成功的概率是多少?
(注意到蒙提霍爾不是在參與者未選擇的兩扇門中隨機地選擇,并展示出那個門后的物品。他總是選取一個后面是羊的門。所以,如果參與者最初選了一扇有山羊的門,則蒙提霍爾無法選擇打開哪扇門,他只能選擇另一扇有山羊的門。但如果參與者最初選了有汽車的門,則蒙提霍爾可以從剩下的兩個門中任選一個打開,此時他可以隨機選擇。)
首先要指出的是,如果你堅持原來的選擇,那么獲勝的可能性與蒙提霍爾選擇之前一樣:1/3。另外一方面,為了計算你的選擇改變后選中的概率,我們可以列出選擇改變后的結果:
你原來的猜測有1/3的可能性是正確的;在這種情況下你輸了。但是:
你原來的猜測有2/3的可能性是錯誤的;在這種情況下你贏了。
這樣,你的選擇改變獲勝的概率是2/3!
讓我們來試試這個游戲的一些變形,看看會是什么結果。例如,如果有四扇門,后面有一輛汽車和三只山羊。我們玩同樣的游戲:先選一扇門,蒙提霍爾給我們看是一只山羊,那么我們選擇堅持還是改變?注意現在有四扇門。在這種情況下,每種選擇的概率是多少?
像之前一樣,如果我們堅持原來的選擇,那么有1/4的概率會贏。如果我們決定選擇剩余兩扇門中的一扇門會是怎樣?在這種情況下:
你原來的猜測有1/4的可能性是正確的;在這種情況下你輸了,但是:
你原來的猜測有3/4的可能性是錯誤的。在這種情況下,贏的門是剩下的兩扇中的一個,那么你有一半的機會猜對。
這樣說吧:你將有3/4一半的可能性是正確的,也就是說3/8的可能性。同樣,比堅持原來的選擇要好。
此時,我們可以考慮n扇門時的情況,其中一扇門后同樣是汽車,其他n-1扇門后是山羊。如果我們堅持原來的選擇,和以前一樣,獲勝的概率是1/n。如果我們選擇改變,邏輯是:
你原來的猜測有1/n的可能性是正確的;在這種情況下你輸了。
你原來的猜測有1/n-1的可能性是錯誤的。在這種情況下,后面有車的門是剩下的n-2扇中的一個,那么你有1/(n-2)的機會猜對。
于是你獲勝的概率就是
可以寫成
因為n-1/n-2>1,所以我們發現改變總比堅持原來的選擇的獲勝概率1/n好。
我們不得不問:如果有多扇門和多輛汽車會是怎樣?例如,假設有5扇門,后面有兩輛車和3只山羊,該堅持還是改變?同樣的邏輯仍然適用:如果你堅持原來的選擇,獲勝的概率只有2/5。另一方面,如果你選擇改變:
你原來的猜測有2/5的可能性是正確的。這時,在蒙提霍爾展示一只山羊之后,剩下的3扇門中有一輛汽車和兩只山羊;在這種情況下,你贏的概率是1/3。
你原來的猜測有3/5的可能性是錯誤的。這時,剩下的3扇門后有兩輛汽車和一只山羊;在這種情況下,你贏的概率是2/3。
也就是說,2/5的時候你有1/3的機會獲勝;3/5的時候你有2/3的機會獲勝。因此,你獲勝的概率是
此時,我們可以考慮有任意n扇門和任意k輛汽車的情形。(其實也不是完全任意的:至少要有3扇門,否則我們不能進行這個游戲;同樣,至少要有兩只山羊,使得無論你選擇哪扇門蒙提霍爾都可以給你展示出一只山羊;換句話說,n≥3且k≤n-2。)在這種情況下,我們堅持原來選擇的概率是k/n。另外一方面,如果我們選擇改變,則由前面的邏輯得:
你原來的猜測有k/n的概率是正確的。在這種情形下,蒙提霍爾給你展示一只山羊后,剩下的n-2扇門中有k-1輛汽車和n-k-1只山羊;相應地,你獲勝的概率為(k-1)/(n-2)。另外一方面:
你原來的猜測有(n-k)/n的概率是錯誤的。在這種情形下,剩下的 n-2扇門中有k輛汽車和n-k-2只山羊;你獲勝的概率將是k/n-2。
將上面的概率加起來,你獲勝的概率為
注意這總是大于k/n的(因為n-1比n-2大),所以最終結果是:總是要改變選擇。
02?什么是條件概率
所有這些版本的三門問題都說明了條件概率的概念:我們不知道最初的猜測正確與否,但可以計算在這兩種情形下的概率,并以此來確定獲勝的概率。
為了具體起見,我們引入一些符號。一般情況下,用P(A)表示事件A發生的概率。例如,我們在分析有n扇門和k輛車的三門問題時,令A代表“我們初始猜測是正確的”這個事件,令B代表“我們初始猜測是錯誤的”這個事件,那么有
注意在一般情形下,P(A)是一個介于0和1之間的數,如果A是一個必然事件,則P(A)=1,如果A是一個不可能發生事件,那么P(A)=0。還要注意到,如果隨機試驗只有兩個事件A和B,且A和B中有一個一定發生,但不會同時發生,則一定有
現在,我們考慮三門問題中通過改變選擇后贏得游戲的事件,并用W表示。在這種情況下,我們也許開始并不知道W發生的概率,但知道如果A發生則W發生的概率。此時,記為P(W|A)。
同樣,在蒙提霍爾的例子中,情況是這樣的:假設開始的猜測是正確的,那么我們改變選擇后贏的概率用新的符號可表示為
類似地
上式中,P(W∩A)表示A和W都發生的概率。事實上,我們可以看到
即A和W同時發生的概率(記為P(W∩A))等于A發生的概率乘以已知A發生的條件下W發生的概率。
假設我們現在遇到的情形是要么A發生要么B發生,但不會同時發生。在計算上,這種情形對應于條件P(A)+P(B)=1。于是,說W發生就是說,要么W和A同時發生,要么W和B同時發生,即
此外,因為P(W∩A)=P(A)·P(W|A),同樣,對B也有類似的公式,因此可以將其寫為更一般的公式:
設兩個事件A或B會發生,但不同時發生。則對其結果可能依賴于A和B的第三個事件W,有
換句話說,假設事件A發生的概率為P(A),那么在A發生的次數中,W發生的概率為P(W|A);類似地,如果B發生的概率為P(B),那么在這些次數中,W發生的概率為P(W|B)。于是W發生的總概率P(W)就是A和W同時發生的可能性P(A)·P(W|A)加上B和W同時發生的可能性P(B)·P(W|B)。
這正是在三門游戲中我們在計算決定改變策略而獲勝的概率時所做的運算。
例如,如果P(A)=P(B)=1/2,即A和B的發生是等概率的,那么我們贏的概率就是P(W|A)和P(W|B)的平均,這是有意義的。當P(A)增加,則P(B)減小(這里因為A和B發生的概率之和為1),這樣我們得到一個加權平均值,其中P(W|A)的權重更大一些;同樣,這也是有意義的。
在這種設定下,我們稱P(W|A)為假設A發生時獲勝的條件概率;類似地,稱P(W|B)為假設B發生時獲勝的條件概率。
我們可以很自然地得到更一般的版本。如果n個事件A1,…,An中有一個事件必須發生;設P(Ai)為Ai發生的概率。假設Ai發生的情形下獲勝的概率是P(W|Ai)。于是獲勝的概率P(W)是
問題1?有兩個賭徒內森和卡爾,由于缺乏想象力,他們正在玩一個簡單的游戲:每人擲一個骰子,點數高的人獲勝。如果是平局,那么內森擲一個骰子來打破平局:如果是1、2、3或4,則內森獲勝,如果是5或者6,則卡爾獲勝。這給了內森多少優勢?換言之,他獲勝的概率是多大?
解?第一次擲可能有三種結果:內森直接獲勝,卡爾直接獲勝,或者平局。將這些結果分別記為AN,AC,AT,我們要做的第一件事就是確定它們發生的概率。
這很直接。內森和卡爾第一次擲骰子有36種可能的結果。其中6種是平局,剩下的30種結果中內森獲勝和卡爾獲勝的次數是相同的。于是,
下面的問題是,在給定第一次擲的結果后內森獲勝的概率是多少呢?同樣,這并不難計算:如果AN發生了,則內森直接獲勝;換句話說(或用符號表示),如果記內森獲勝為W,那么
類似地,如果AC發生,那么內森將沒有獲勝的機會,也就是說,
最后,如果AT發生,即第一輪的結果是平局,那么內森將有4/6的概率會獲勝,于是
現在我們只需把它們都加起來:根據前面的公式,得到
換句話說,內森將有19/36或約52。8%的概率贏得游戲。
下面用另外一個賭博游戲來說明條件概率這個概念:
問題2?內森和卡爾已經退步到玩擲硬幣的游戲了。游戲規則如下:內森從一個裝有三枚硬幣的袋子里隨機挑選一枚,然后進行投擲。如果是“正面”,則內森獲勝,如果是“反面”,則卡爾獲勝。有意思的是,袋子中有兩枚硬幣是“公平的”,即出現“正面”和“反面”的概率相同,但一枚是特制的:出現“反面”的概率是60%,即3/5,出現“正面”的概率只有2/5。問題是,內森獲勝的概率有多大?
解?因為我們不知道內森選擇了哪枚硬幣,所以不知道他投擲的概率是多少,但是知道每一種情況下的概率,所以可以使用我們的公式。按照這個邏輯:內森選擇“公平”硬幣的概率是2/3,在這種情況下,有一半的概率會獲勝;他選擇“特制”硬幣的概率是1/3,在這種情況下,獲勝的概率只有2/5。換句話說,內森獲勝的概率是2/3的1/3加上1/3的2/5,即
用符號來表示的話:如果內森選擇“公平”硬幣的事件是A,選擇“特制”硬幣的事件是B,則有
現在,如果用W表示內森獲勝,那么題設告訴我們
應用前面的公式,像之前一樣,我們有
本文摘編自《哈佛概率論公開課》,經出版方授權發布。
延伸閱讀《哈佛概率論公開課》
點擊上圖了解及購買
轉載請聯系微信:DoctorData
推薦語:本書為對基本概率論感興趣的讀者以及之前未接觸過此方向的人提供了一個堅實的基礎。通過對話的方式和詳細的數學推導,在迷人的風格和信息豐富的討論上取得了平衡。
劃重點????
干貨直達????
盤點數據科學最流行的29個Python庫
硅谷企業的大數據平臺架構什么樣?看看Twitter、Airbnb、Uber的實踐
終于有人把p值講明白了
超詳細!17 步全解四象限導圖的使用方法
更多精彩????
在公眾號對話框輸入以下關鍵詞
查看更多優質內容!
PPT?|?讀書?|?書單?|?硬核?|?干貨?|?講明白?|?神操作
大數據?|?云計算?|?數據庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學習?|?深度學習?|?NLP
5G?|?中臺?|?用戶畫像?|?1024?|?數學?|?算法?|?數字孿生
據統計,99%的大咖都關注了這個公眾號
????
總結
以上是生活随笔為你收集整理的反直觉的三门问题,为什么80%的人都错了?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vivo真实案例:中台到底解决了什么问题
- 下一篇: 手把手教你做用户画像:3种标签类型、8大