经典的囚徒困境
經(jīng)典的囚徒困境
1950年,由就職于蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關(guān)困境的理論,后來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,并命名為“囚徒困境”。經(jīng)典的囚徒困境如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:
?* 若一人認(rèn)罪并作證檢控對(duì)方(相關(guān)術(shù)語稱“背叛”對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年。
?* 若二人都保持沉默(相關(guān)術(shù)語稱互相“合作”),則二人同樣判監(jiān)半年。
?* 若二人都互相檢舉(互相“背叛”),則二人同樣判監(jiān)2年。
用表格概述如下:
解說
如同博弈論的其他例證,囚徒困境假定每個(gè)參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關(guān)心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為“嚴(yán)格劣勢(shì)”,理性的參與者絕不會(huì)選擇。另外,沒有任何其他力量干預(yù)個(gè)人決策,參與者可完全按照自己意愿選擇策略。
囚徒到底應(yīng)該選擇哪一項(xiàng)策略,才能將自己個(gè)人的刑期縮至最短?兩名囚徒由于隔絕監(jiān)禁,并不知道對(duì)方選擇;而即使他們能交談,還是未必能夠盡信對(duì)方不會(huì)反口。就個(gè)人的理性選擇而言,檢舉背叛對(duì)方所得刑期,總比沉默要來得低。試設(shè)想困境中兩名理性囚徒會(huì)如何作出選擇:
* 若對(duì)方沉默、背叛會(huì)讓我獲釋,所以會(huì)選擇背叛。
* 若對(duì)方背叛指控我,我也要指控對(duì)方才能得到較低的刑期,所以也是會(huì)選擇背叛。
二人面對(duì)的情況一樣,所以二人的理性思考都會(huì)得出相同的結(jié)論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場(chǎng)博弈中唯一可能達(dá)到的納什均衡,就是雙方參與者都背叛對(duì)方,結(jié)果二人同樣服刑2年。
這場(chǎng)博弈的納什均衡,顯然不是顧及團(tuán)體利益的帕累托最優(yōu)解決方案。以全體利益而言,如果兩個(gè)參與者都合作保持沉默,兩人都只會(huì)被判刑半年,總體利益更高,結(jié)果也比兩人背叛對(duì)方、判刑2年的情況較佳。但根據(jù)以上假設(shè),二人均為理性的個(gè)人,且只追求自己個(gè)人利益。均衡狀況會(huì)是兩個(gè)囚徒都選擇背叛,結(jié)果二人判決均比合作為高,總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了:非零和博弈中,帕累托最優(yōu)和納什均衡是相沖突的。
總結(jié)
- 上一篇: 模拟简易二维码的形成
- 下一篇: 不欠费销号也要缴保证金有么有 青海移动霸