日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

DeepMind将博弈论融入多智能体研究,让纳什均衡变得更简单

發布時間:2025/3/15 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 DeepMind将博弈论融入多智能体研究,让纳什均衡变得更简单 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

雷鋒網 AI 科技評論按,隨著 AI 系統在現實生活中變得越來越重要,我們自然該探索不同系統間的交互方式了,這些多智能體間到底用了什么獨特的方式呢?

在 DeepMind 的最新論文(發表在 Scientific Reports , Nature 出版社旗下雜志)中,研究人員用了博弈論來闡明這一問題。雷鋒網(公眾號:雷鋒網)了解到,具體來說,他們研究了兩套智能系統在非對稱博弈游戲(asymmetric game)中的反應和表現,這些游戲包括 Leduc 撲克和一些圖版游戲(如 Scotland Yard)。

在現實生活中,我們會遇到許多類似非對稱博弈游戲的場景,自動拍賣(automated auction)就是其中之一。在這一過程中,會混入許多 AI 扮演的買家或賣家,而真正參與其中的人類買家和賣家也都有自己的小算盤。最終的測試結果讓研究人員對這種奇怪的情況有了深刻了解,他們還拿出了一個相當簡單的分析方法。

雖然 DeepMind 的主要目標是如何將博弈論應用到多個 AI 系統的交互中去,但研究人員得出的結果也可以用在經濟、生物進化和實證博弈論等學科中。

眾所周知,博弈論是數學界的重量級理論,研究人員通常會用它來研究競爭態勢下決策者們的戰略,該理論幾乎可通用于人類、動物和計算機世界。不過,在 AI 研究中,它一般會被用在“多智能體”環境下的研究中。舉例來說,多款家政機器人合作清潔房間就屬于其中的應用場景之一。

一般來說,多智能體系統的演化動力學都靠簡單的對稱博弈論來分析,比如經典的囚徒困境理論。雖然此類游戲能幫我們對多智能體系統的工作方式有一定了解,并告訴我們如何實現你好我好大家好的理想結果(即所謂的納什均衡),但卻無法模擬所有情況。

DeepMind 的新技術讓研究人員能快速容易地在更復雜的不對稱博弈游戲中找到取得納什均衡的策略,這類游戲中玩家通常有不同的戰略、目標和獎勵。如果你想了解 DeepMind 是如何用新技術“破解”這類游戲的,可以試著去了解“性別博弈”,它也是博弈論研究的經典案例之一。

在“性別博弈”中,兩個玩家要協調晚上到底去哪玩,是去看歌劇還是看電影?令人遺憾的是,他們中有一個人傾向于看歌劇,另一個人則偏愛電影。這樣的情境下,不對稱的情況就出現了,因為即使兩個人達成一致,其中也有一個人會不高興。因此,要想繼續維持兩人的友誼(劃掉),或者說均衡,玩家就該共進退(畢竟產生分歧換來的只有零回報)。

這個游戲有三種“勢均力敵”的均衡情況:

  • 兩個玩家都決定去看歌劇,

  • 兩人都選擇去看電影,

  • 則是混合選項,即每位玩家在夜晚外出的五分之三時間內享用自己的心頭好。

  • 第三種選項是一種“不穩定”(unstable)選項,用 DeepMind 的方法很輕松就能進行簡化或者分解,非對稱博弈游戲也就轉換成為對稱的對應部分。這一方法將兩個玩家的獎勵表分別當作獨立的雙玩家對稱博弈,這樣也能輕松地找到原本不對稱博弈游戲的納什均衡點。

    在下圖中,b 和 c 圖的納什均衡點很容易找到,借助它們我們就能在非對稱博弈中找到 a 圖中的最佳策略。當然,我們也可以反過來,通過非對稱博弈來找尋對應體中的平衡點。

    紅點代表納什均衡。對于非對稱博弈游戲(a),可以從(b)與(c)代表的兩個對應圖中找到納什均衡。如圖所示,x軸和y軸分別代表玩家1和2選擇看歌劇的可能性。

    這種方法還可運用于其他游戲,比如 Leduc 撲克,在論文中研究人員還對它進行了詳細解讀。無論哪種情況下,這種方法都足夠簡單,它能幫玩家快速和直接的分析非對稱博弈游戲,進而幫助我們理解不同的動態系統,其中就包括多主題環境下的系統交互。

    Via.?DeepMind

    論文地址:https://www.nature.com/articles/s41598-018-19194-4, 雷鋒網編譯

    總結

    以上是生活随笔為你收集整理的DeepMind将博弈论融入多智能体研究,让纳什均衡变得更简单的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。