日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习方法求解平均场博弈论问题

發(fā)布時間:2023/12/8 pytorch 92 豆豆
生活随笔 收集整理的這篇文章主要介紹了 深度学习方法求解平均场博弈论问题 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

背 景

Mean field games (MFG, 平均場博弈論)和Mean field control (MFC, 平均場控制論)可以模擬大量對象之間的博弈,探索在一個競爭的環(huán)境中,對象如何選擇最優(yōu)的決策。例如股市里大量根據(jù)其他用戶行為交易股票的股民,海里游動的魚群,在世界杯現(xiàn)場看足球賽的觀眾等。它們在物理、經(jīng)濟學和數(shù)據(jù)科學等各學科中發(fā)揮核心作用。雖然MFG的數(shù)學理論已經(jīng)相當成熟,但數(shù)值方法的發(fā)展并沒有跟上問題規(guī)模和海量數(shù)據(jù)集的增長。由于MFG通常不存在顯式解,有效的數(shù)值算法至關(guān)重要。大多數(shù)現(xiàn)有的數(shù)值方法都使用網(wǎng)格,因此容易受到維數(shù)災(zāi)難的限制。

近些年來,結(jié)合機器學習方法對MFG和MFC問題進行求解得到了學術(shù)界的大量關(guān)注。尤其是針對解決具有復雜結(jié)構(gòu),高維度的問題。本文將介紹基于深度學習求解MFG和MFC的三類方法。

問題定義

MFG和MFC模型包括下列參數(shù):

?

?

?

?

?

?

?

?

?

?

這里神經(jīng)網(wǎng)絡(luò)估計的最優(yōu)控制和狀態(tài)概率分布都與理論值相符合:

1. 最優(yōu)控制是狀態(tài)的線性函數(shù);

2. 狀態(tài)的概率分布會向0逐漸移動。

?總結(jié)與展望?

本文著重介紹了三種運用深度學習求解MFG和MFC相關(guān)問題的方法。第一個方法通過神經(jīng)網(wǎng)絡(luò)直接擬合控制函數(shù),第二種方法通過Deep BSDE求解FBSDE,最后一個方法通過神經(jīng)網(wǎng)絡(luò)去求解偏微分方程,進而求解HJB方程與FKP方程組成的方程組。基于上述方法,學術(shù)界已經(jīng)對多個高維度的復雜問題進行了各種嘗試,取得了一些初步成果 。但是由于神經(jīng)網(wǎng)絡(luò)通常由多個項組成,因此是高度非凸優(yōu)化問題。在訓練過程中,損失函數(shù)中的各項可能會相互競爭,訓練過程可能不是魯棒和足夠穩(wěn)定的,無法保證收斂到全局最小值。為了解決這個問題,需要開發(fā)更加魯棒的網(wǎng)絡(luò)結(jié)構(gòu)和訓練算法。

目前MindSpore團隊分別從物理驅(qū)動和數(shù)據(jù)驅(qū)動的AI方法出發(fā),致力于在科學計算領(lǐng)域發(fā)展新的算法并開發(fā)高性能和易用的AI仿真框架,后續(xù)有機會再跟大家分享。

同時,我們也歡迎廣大的AI科學計算愛好者和研究者加入我們,共同探索AI科學計算這一新課題。

參考文獻:

[1]?en.wikipedia.org/wiki/Fokker%25E2%2580%2593Planck_equation

[2]?en.wikipedia.org/wiki/Hamilton%25E2%2580%2593Jacobi%25E2%2580%2593Bellman_equation

[3]?papers.ssrn.com/sol3/papers.cfm%3Fabstract_id%3D2557457

[4]?arxiv.org/abs/1811.08782

[5]?DeepBSDE?pnas.org/content/115/34/8505

[6]?Optimal transport and crowd motion?pnas.org/content/117/17/9183

MindSpore官方資料

GitHub?:?https://github.com/mindspore-ai/mindspore

Gitee?:?https?:?//gitee.com/mindspore/mindspore

官方QQ群?:?486831414?

總結(jié)

以上是生活随笔為你收集整理的深度学习方法求解平均场博弈论问题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。