深度学习(三十二)——AlphaGo, AlphaStar
AlphaGo
樊麾講解AlphaGo與李世石的五番棋:
https://deepmind.com/research/alphago/alphago-games-simplified-chinese/
論文:
《Mastering the game of Go with deep neural networks and tree search》
DarkForest
DarkForest是田淵棟2015年11月的作品,雖然棋力和稍后的AlphaGo相去甚遠(yuǎn),但畢竟也算是用到了RL和DNN了。
代碼:
https://github.com/facebookresearch/darkforestGo
Leela Zero
Leela Zero是比利時(shí)人Gian-Carlo Pascutto開(kāi)源的圍棋AI。它的算法與AlphaGo Zero相同。而訓(xùn)練采用GTP協(xié)議,集合全球算力,進(jìn)行分布式訓(xùn)練。
官網(wǎng):
http://zero.sjeng.org/
代碼:
https://github.com/gcp/leela-zero
十多年前,當(dāng)我還是一個(gè)中二青年的時(shí)候,就幻想有朝一日能夠拿圍棋世界冠軍。當(dāng)然,就算再中二,我自己也明白靠實(shí)力那是不可能的,當(dāng)時(shí)做夢(mèng)的法寶是制造一個(gè)AI,然后碾壓一下所謂的國(guó)手。
按照當(dāng)時(shí)(2000年前后)人們的預(yù)計(jì),這個(gè)AI在2030年之前,都不可能造出來(lái),然而,最終的結(jié)果實(shí)際上只花了一半左右的時(shí)間。
再之后,隨著AI圍棋的平民化,我的中二夢(mèng)終于也有人將之付諸實(shí)現(xiàn)了:
https://mp.weixin.qq.com/s/npt2zZrKwPnNdY-hsa2RjQ
AI再亂圍棋圈:“食言之戰(zhàn)”柯潔落敗;首例素人作弊引風(fēng)波
這次作弊風(fēng)波所使用的AI就是Leela Zero,可見(jiàn)目前(2018.5)它的棋力已經(jīng)超過(guò)了頂尖棋手。
ELF OpenGo
ELF OpenGo是Facebook開(kāi)源的圍棋AI,它是FB的AI游戲框架ELF的一部分。
官網(wǎng):
https://github.com/pytorch/ELF
參考:
https://mp.weixin.qq.com/s/lOAx3suLIS-pEWyi8xZl6Q
“全民體驗(yàn)”AlphaZero:FAIR田淵棟首次開(kāi)源超級(jí)圍棋AI
PhoenixGo
PhoenixGo是騰訊微信團(tuán)隊(duì)的AlphaGo Zero復(fù)刻版。
官網(wǎng):
https://github.com/Tencent/PhoenixGo
參考:
https://mp.weixin.qq.com/s/tJDmxsuS1QigYS75ZIdzRA
微信團(tuán)隊(duì)開(kāi)源圍棋AI技術(shù)PhoenixGo,復(fù)現(xiàn)AlphaGo Zero論文
參考
https://mp.weixin.qq.com/s/Sfv-jzQAkN0PsZOGZUQhkQ
AlphaGo Zero橫空出世,DeepMind Nature論文解密不使用人類知識(shí)掌握圍棋
https://mp.weixin.qq.com/s/oAxouYX7-wDC5okbu--Wuw
Nature重磅:人工智能從0到1, 無(wú)師自通完爆阿法狗100-0
https://zhuanlan.zhihu.com/p/30262872
關(guān)于AlphaGo Zero
https://zhuanlan.zhihu.com/p/30263585
DeepMind新一代圍棋程序AlphaGo Zero再次登上Nature
https://www.zhihu.com/question/66861459
如何評(píng)價(jià)DeepMind發(fā)表在Nature上的AlphaGo Zero?
http://www.alphago-games.com/
AlphaGo的棋譜
https://deepmind.com/blog/alphago-zero-learning-scratch/
AlphaGo Zero官方聲明
https://zhuanlan.zhihu.com/mathNote
某牛的專欄,主要講自制AlphaGo
https://mp.weixin.qq.com/s/DC9QqHdWT0xFnowEBuJDbw
自動(dòng)化所解讀“深度強(qiáng)化學(xué)習(xí)”:從AlphaGo到AlphaGoZero
https://mp.weixin.qq.com/s/uZtaxRwROCqYmL2k6Muxaw
從阿爾法狗元(AlphaGo Zero)的誕生看終極算法的可能性
https://mp.weixin.qq.com/s/i5OmLu8aNbypiTUmP4teeQ
劉遙行:深入淺出看懂AlphaGo Zero
https://mp.weixin.qq.com/s/aBrwbB_DOGTen-6XL7LGFQ
鄧侃:白話蒙特卡洛樹(shù)搜索和ResNet
https://mp.weixin.qq.com/s/nbTkr0PImlXUSYl91HD91Q
AlphaGo背后的力量:蒙特卡洛樹(shù)搜索入門指南
https://mp.weixin.qq.com/s/-tH7DQo1cK9gA0bcpBJSDA
AlphaGo Zero:筆記與偽代碼
https://mp.weixin.qq.com/s/CJuVoOf7idUChFIn7dH0Lg
圍棋中的數(shù)學(xué)原理
https://mp.weixin.qq.com/s/d46qNFaftt4wxpV4sZnG-w
一張圖看懂AlphaGo Zero
https://zhuanlan.zhihu.com/p/31749249
比AlphaGo Zero更強(qiáng)的AlphaZero問(wèn)世,8小時(shí)解決一切棋類!
https://mp.weixin.qq.com/s/L7bZMkqyncwEt6D5tK1OdQ
AlphaZero煉成最強(qiáng)通用棋類AI,DeepMind強(qiáng)化學(xué)習(xí)算法8小時(shí)完爆人類棋類游戲
https://mp.weixin.qq.com/s/tFdnxqV5a5xZrFtB6E0AiQ
新AlphaZero出世稱霸棋界,8小時(shí)搞定一切棋類!自對(duì)弈通用強(qiáng)化學(xué)習(xí)無(wú)師自通!
https://mp.weixin.qq.com/s/qYWsFBKNCKCGUmizX_1sVg
AlphaGo 教學(xué)工具終于上線了!
https://mp.weixin.qq.com/s/JxbIeDk8_wnYu_ewUHp29g
深度學(xué)習(xí)與圍棋實(shí)戰(zhàn)書籍《Deep Learning and the Game of Go》
https://mp.weixin.qq.com/s/gsRnbknytz2FY2dWgdWEYg
精通國(guó)際象棋的AI研究員:AlphaZero真的是一次突破嗎?
https://mp.weixin.qq.com/s/Przl4ivbNuOFmz4pcYTrpQ
淺述:從Minimax到AlphaZero,完全信息博弈之路(1)
https://zhuanlan.zhihu.com/p/32089487
AlphaZero實(shí)戰(zhàn):從零學(xué)下五子棋
http://mp.weixin.qq.com/s/72riTTC3w0q9oF5H-51kXA
手把手教你搭建AlphaZero(使用Python和Keras)
https://mp.weixin.qq.com/s/Qw2tT7H1PwDvPgOYy8YUsQ
AlphaGo Zero代碼遲遲不開(kāi)源,TF等不及自己推了一個(gè)
https://mp.weixin.qq.com/s/Vq-osjgNXJQu5avGkxQdsw
手把手:AlphaGo有啥了不起,我也能教你做一個(gè)
https://mp.weixin.qq.com/s/ajajJ9yJZsOy4Vc0ULBxXg
國(guó)際象棋版AlphaZero出來(lái)了誒,還開(kāi)源了Keras實(shí)現(xiàn)
https://zhuanlan.zhihu.com/p/41814142
從源碼解密AlphaGo Zero背后基本原理
https://www.ifanr.com/630602
AlphaGo的棋局,與人工智能有關(guān),與人生無(wú)關(guān)
https://mp.weixin.qq.com/s/J0w6kzzdKTbsaiZitbQdoA
達(dá)觀數(shù)據(jù):一文詳解AlphaGo原理
https://mp.weixin.qq.com/s/BBQ54HHrFiqxXkC-EI6ELw
Science封面:AlphaZero達(dá)成終極進(jìn)化體,史上最強(qiáng)棋類AI降臨!
https://mp.weixin.qq.com/s/Pgw_xaCNl_kCPCg8NFzUBQ
人類沒(méi)法下了!DeepMind貝葉斯優(yōu)化調(diào)參AlphaGo,自弈勝率大漲16.5%
https://mp.weixin.qq.com/s/eE3oL6c5zHmTglHE-dgBvg
詳解AlphaGo到AlphaGo Zero!
AlphaStar
https://mp.weixin.qq.com/s/_Y0bCjTu9UrHfnen15htqQ
AlphaStar稱霸星際爭(zhēng)霸2!AI史詩(shī)級(jí)勝利,DeepMind再度碾壓人類
https://mp.weixin.qq.com/s/axr5VFbHQmYo0shW9ilBaQ
DeepMind回應(yīng)一切:AlphaStar兩百年相當(dāng)于人類多長(zhǎng)時(shí)間?
https://www.zhihu.com/question/310011363
如何評(píng)價(jià)DeepMind在北京時(shí)間19年1月25日2點(diǎn)的《星際爭(zhēng)霸 2》項(xiàng)目演示?
https://mp.weixin.qq.com/s/k0l2uoik-Z9aA9zax7AoZg
中科院自動(dòng)化所深度解析:Deepmind AlphaStar如何戰(zhàn)勝人類職業(yè)玩家
https://zhuanlan.zhihu.com/p/55781614
AlphaStar背后的機(jī)器學(xué)習(xí)原理
httphttps://zhuanlan.zhihu.com/p/56043646管飯s://zhuanlan.zhihu.com/p/56043646
https://zhuanlan.zhihu.com/p/56043646
AlphaStar之IMPALA
https://mp.weixin.qq.com/s/XljE82cJZfFOgf2KrXWSKA
DeepMind首個(gè)戰(zhàn)勝星際2職業(yè)玩家的AI為何無(wú)敵?新視角揭秘AI里程碑
總結(jié)
以上是生活随笔為你收集整理的深度学习(三十二)——AlphaGo, AlphaStar的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 深度学习(三十一)——Style Tra
- 下一篇: 深度学习(三十三)——GAN参考资源