日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

博弈论笔记1:囚徒困境与纳什均衡

發布時間:2025/4/5 编程问答 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 博弈论笔记1:囚徒困境与纳什均衡 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1?個體最優與社會最優

1.1 社會基本問題

社會:個體之間有互動行為&相互依賴的群體

羊群效應:大家做什么,我就跟著做什么,不管對錯和原因

?

協調問題:兩人迎面走來,誰左誰右?(核心:人們如何預測他人的行為)

合作問題:囚徒困境(核心:個體理性和集體理性的折衷)

等邊際原理:如果每一種資源都存在著邊際收益遞減,那么最優的資源配置策略應該滿足:最后一單位資源無論用在哪一種用途上,都會產生相同的收益。 【資源在每一種用途上的邊際貢獻相等】

1.2 個體理性行為

理性人:有一個明確的偏好+在給定約束條件下,這個人總是追求自我偏好最大化。

?

輸贏的不對稱:當人們面臨風險決策時, 他們更在乎的是成功與失敗,贏和輸, 財富的變化,而不是最終的財富狀態;(比如說,100元損失導致的效用的減少遠遠大于100收益導致的效用的增加)——>人們是損失規避型的(loss aversion);

1.3 社會最優

1.3.1 帕累托效率標準:

帕累托效率:一種社會狀態,與該狀態相比,不存在任何一種可選擇的狀態,使得至少一個人的狀態更好,同時沒有任意一個人的狀態變差

帕累托改進:改變一種狀態,使得沒有任何一個人的處境變壞,但是至少有一個人的處境變好了

**從非帕累托最優點到帕累托最優點不一定是帕累托改進

1.3.2 卡爾多-希克斯標準

總量最大化

2 囚徒困境

2.1 占優策略

不管對方使用什么樣的戰略,只要參與人使用這一戰略,都可以給自己帶來最大的收益。

理性人做決策的時候,不需要假定對方是理性的。

占優戰略均衡:由占優戰略組成的戰略組合。

2.2 囚徒困境

盡管合作能讓雙方更好,但雙方仍然不會合作

怎么比較好地去記一個方框里面哪個是甲的收益哪個是乙的收益呢?我們畫一條線,斜線上方的就是表格“上方”的乙的收益;斜線左邊的就是表格“左邊”的甲的收益。

兩個假設:

? ? ? ?R>T>P>S

? ? ? ?T+T>R+S

只要滿足這兩個條件,一定是個人理性選擇不滿足集體理性選擇。

在這兩個假設下,集體理性肯定是選擇(合作,合作),這樣總體的利益最高。

但是個人理性觀點下呢?

以甲為例,當乙合作的時候,我們看下圖藍框框住的部分。如果甲合作,那么甲收益為T;甲不合作,甲的收益為R,又R>T,所以乙合作的時候,甲會不合作;同理,乙不合作的時候,甲也不合作(P>S)。所以無論乙怎么選擇,甲都不合作。

乙同理,不論甲怎么選擇,乙的占優策略都是不合作

2.2.1 囚徒困境的解決方法

設立獎懲機制,適當地減少R,增大S

如果需要二者合作,那么T+aT≥R+aS,S+aR≥P+aP

3 智豬博弈

我們先考慮小豬:

如果大豬做,那么小豬不做;如果大豬不做,那么小豬也不做——>小豬的占優策略是不做

我們考慮大豬:

如果小豬做,那么大豬不做;如果小豬不做,那么大豬做——>大豬沒有占優策略。

但如果大豬事先知道小豬是理性的,那么大豬就會知道小豬不做,所以對于大豬來說,只剩下一半的博弈矩陣,那么大豬選擇做就可以了。

所以最后的均衡狀態是(做,不做)

4 納什均衡

納什均衡:所有參與人的最優戰略的組合,給定這一組合中其他參與人的選擇,沒有任何人有積極性改變自己的選擇。

?

混合戰略納什均衡:均衡結果是參與人以某一概率隨機選擇行動。

純戰略納什均衡:參與人確定的選擇某一個特定的戰略【退化混合戰略納什均衡】。

4.1 監督博弈

假如一開始是(偷懶,偷懶)

->如果老板偷懶,那么工人不偷懶

->如果工人不偷懶,那么老板不偷懶

->如果老板不偷懶,那么工人偷懶

->如果工人偷懶,那么老板偷懶

這樣又循環回去了,也就是說,這里沒有純戰略的納什均衡。

?

假如老板認為員工偷懶的概率是P,不偷懶的概率是1-P。

從老板的角度,自己不偷懶的期望收益是-2*P+2*(1-P)=2-4P,偷懶的期望收益是1*P+-1*(1-P)=2P-1

從員工的角度,自己不希望老板猜到自己偷懶還是不偷懶:

2-4P=2P-1 ->? P=1/2

這時,員工1/2的概率偷懶,1/2的概率不偷懶

?

假如老板以Q的概率偷懶,1-Q的概率不偷懶

從員工的角度,自己偷懶的期望收益是-1*Q+3*(1-Q)=3-4Q

自己不偷懶的期望收益是2*Q+2&(1-Q)=2

還是兩者應該相等

所以Q=1/4

也就是老板以1/4的概率偷懶,3/4的概率不偷懶

?

所以,這個博弈的納什均衡是,員工1/2的概率偷懶,1/2的概率不偷懶;老板1/4的概率偷懶,3/4的概率不偷懶。

4.2 納什均衡的存在性

每一個有限博弈至少存在一個納什均衡(純戰略或混合戰略);

? 如果一個博弈存在兩個純戰略納什均衡,那么,一定存在第三個混合戰略納什均衡。如果有偶數個純納什均衡,那么必然至少存在一個混合納什均衡)

?

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的博弈论笔记1:囚徒困境与纳什均衡的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 澳门久久 | 日本精品一区在线 | 久久精品人人爽 | 欧美天堂在线 | 四色最新网址 | 国产精品不卡一区二区三区 | 免费一级肉体全黄毛片 | xzjzjzjzjzj欧美大片 | 亚洲一区国产精品 | 在线观看欧美视频 | 欧美久久网 | 91免费网站在线观看 | 美女又黄又爽 | 亚洲毛片儿 | 青青草欧美| 日韩欧美在线观看一区二区三区 | 国产99色| 成人久久久精品乱码一区二区三区 | 久久综合国产精品 | 一级片aaa| 精品热久久 | 欧美精品成人一区二区三区四区 | 国产无精乱码一区二区三区 | 亚洲春色在线观看 | 午夜日韩 | 日日夜夜免费精品 | 欧美啪啪小视频 | 欧美性爱视频久久 | 亚洲人成7777 | 欧美极品jizzhd欧美 | 丰满多毛的大隂户视频 | 精品久久无码视频 | 黄色网页观看 | 青青草伊人久久 | 午夜在线免费视频 | 国内视频一区二区 | 国产成人三级在线观看 | 国产精品欧美性爱 | 亚洲成人精品网 | 中日韩精品在线 | 伊人开心网 | 国产成人自拍在线 | 特级西西人体 | 成人污污视频 | 青青在线视频观看 | 91精品国产综合久久久久 | 亚洲福利网 | 午夜电影网站 | 欧美一级生活片 | 天天碰天天碰 | 国产精品亚洲天堂 | 污的视频在线观看 | 日本不卡影院 | jizz处女| 影音先锋中文字幕在线视频 | 免费毛片一区二区三区 | 另类小说久久 | 人人插人人射 | 激情综合影院 | av手机免费在线观看 | 日韩一级伦理片 | 精品日韩一区二区三区四区 | 青青草av| 国产人与禽zoz0性伦 | 丁香婷婷六月天 | 激情综合网五月激情 | 爱露出 | 国产午夜伦鲁鲁 | 天天综合网永久 | 寂寞人妻瑜伽被教练日 | av第一区| www四虎精品视频免费网站 | 国产尤物视频在线观看 | 国产精品一区二区免费看 | 草民午夜理伦三级 | 无码aⅴ精品一区二区三区浪潮 | 你懂的视频在线播放 | 国产对白刺激视频 | 亚洲毛片一区二区三区 | 午夜在线观看影院 | 七仙女欲春2一级裸体片 | 午夜网站在线 | 懂色av一区二区三区四区 | 国产com | 黄色一级视频免费观看 | 性高潮久久久久久 | 91一区二区国产 | 伊人色av| 91欧美一区二区三区 | 欧美色图视频在线 | aaaa视频| 亚洲产国偷v产偷v自拍涩爱 | 亚洲精品a区 | 色干干 | 国产理论在线观看 | 国产懂色av | 免费在线观看一区二区三区 | 无码精品人妻一区二区三区湄公河 | 国产一级视频免费观看 |