日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR

發布時間:2024/10/8 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


上周我們發布了《攻略 | 雖然票早已被搶光,你可以從機器之心關注 NIPS 2017》,在 NIPS 2017 正式開始前,我們將選出數篇優質論文,邀請論文作者來做線上分享,聊聊理論、技術和研究方法。


所以,第一期分享來了。


北京時間 11 月 8 日 20:00 至 21:00,多倫多大學在讀三年級博士生 Yuhuai Wu(吳宇懷)將為大家分享一篇 NIPS 2017 論文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。



分享者簡介


Yuhuai Wu(吳宇懷),多倫多大學在讀三年級博士生,師從 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指導下做研究。主要研究方向是優化算法、強化學習。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做實習,開源了 ACKTR 算法。



演講主題


這次演講主要研討一個最近研發的似自然梯度的優化算法 -- KFAC(似二階算法)。我們將其用在強化學習的問題上,并提出了新的強化學習算法 -- ACKTR,發現比前人的算法有效 2-3 倍。


針對這篇論文,機器之心曾發布過一篇簡介:《OpenAI 開源算法 ACKTR 與 A2C:把可擴展的自然梯度應用到強化學習》,請大家做課前預習。


參與方式


線上分享將在「NIPS 2017 機器之心官方學霸群」中進行。加群方式:長按掃描下方二維碼,添加「機器之心小助手Ⅱ」,備注暗號:147,由小助手拉大家入群。



「閱讀原文」,查看機器之心 NIPS 2017 專題策劃并參與其中。


總結

以上是生活随笔為你收集整理的NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。