报名 | AlphaGo Zero是如何实现无师自通的?
「論文共讀」是由 PaperWeekly 發起的協同閱讀小組。我們每周精選一篇優質好文,由學術大咖帶大家解讀論文并展開討論,在碎片化時代堅持深度閱讀。
Google DeepMind 團隊在 Nature 上發表的最新論文,闡述了新版 AlphaGo 是如何從空白狀態學起,不使用任何人類棋譜,通過自對弈強化學習,僅用 3 天訓練時間就以 100:0 擊敗了上一版本的 AlphaGo,并用 21 天達到 AlphaGo Master 水平。
AlphaGo Zero 的核心在于強化學習下的自我博弈。本期論文共讀,我們邀請到?深入淺出看懂AlphaGo Zero?一文的作者,圣何塞州立大學研究生劉遙行,帶大家揭秘 AlphaGo 的前世今生。
論文介紹
Mastering the Game of Go without Human Knowledge
@PaperWeekly 推薦
#Deep Reinforcement Learning
DeepMind 最新成果,無師自通下圍棋。
嘉賓介紹
?
劉遙行,圣何塞州立大學研究生,幕布(mubu.com)實習生,關注人工智能和現實生活的工業結合、人工智能和區塊鏈技術的聯合應用。
? ? ?論文共讀 ? ??
?AlphaGo Zero是如何實現無師自通的?
AlphaGo Zero
論文解讀√在線討論√
活動形式:語音直播
?
?活動時間?
10 月 29 日(周日)13:00-14:15
45 min 串講 + 30 min 討論
*請在活動開始前完成論文精讀
?
長按識別二維碼,馬上報名
*報名成功后,關注系統彈出的公眾號獲取活動提醒
往期回顧
?
“陽奉陰違”的半監督學習算法 - Virtual Adversarial Training
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 進行報名
總結
以上是生活随笔為你收集整理的报名 | AlphaGo Zero是如何实现无师自通的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第二届「机器智能前沿论坛」强势来袭,众多
- 下一篇: 这 8 份「Paper + Code」,