當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

学习+彭伟《揭秘深度强化学习》PDF+源代码+资料

發布時間：2023/12/20 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了学习+彭伟《揭秘深度强化学习》PDF+源代码+资料小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

深度強化學習(Deep Reinforcement Learning，DRL)是深度學習算法和強化學習算法的巧妙結合，它是一種新興的通用人工智能算法技術，也是機器學習的前沿技術，DRL 算法潛力無限，AlphaGo 是目前該算法成功的使用案例。
DRL 算法以馬爾科夫決策過程為基礎，是在深度學習強大的非線性函數的擬合能力下構成的一種增強算法。深度強化學習算法主要包括基于動態規劃（DP）的算法以及基于策略優化的算法。

《揭秘深度強化學習》是要把這兩種主要的算法（及設計技巧）講解清楚，使算法研究人員能夠熟練地掌握。

學習參考：

《揭秘深度強化學習》PDF，376頁，帶目錄，文字可以復制。配套源代碼。作者：彭偉
下載: https://pan.baidu.com/s/1eVCDyse_FveXboet8w5s6A
提取碼: 78ry

《揭秘深度強化學習人工智能機器學習技術叢書》共10 章，首先以AlphaGo 在圍棋大戰的偉大事跡開始，引起對人工智能發展和現狀的介紹，進而介紹深度強化學習的基本知識。然后分別介紹了強化學習（重點介紹蒙特卡洛算法和時序差分算法）和深度學習的基礎知識、功能神經網絡層、卷積神經網絡（CNN）、循環神經網絡（RNN），以及深度強化學習的理論基礎和當前主流的算法框架。介紹了深度強化學習在不同領域的幾個應用實例。引例、基礎知識和實例相結合，方便讀者理解和學習。

《揭秘深度強化學習人工智能機器學習技術叢書》內容豐富，講解全面、語言描述通俗易懂，是深度強化學習算法入門的選擇。

轉載于:https://www.cnblogs.com/davvv/p/10706565.html

總結

以上是生活随笔為你收集整理的学习+彭伟《揭秘深度强化学习》PDF+源代码+资料的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：加密芯片大对比
下一篇：乖离率背离公式_乖离率指标——BIAS