當(dāng)前位置：首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习（三十二）——AlphaGo, AlphaStar

發(fā)布時(shí)間：2023/12/20 pytorch 51 豆豆

生活随笔收集整理的這篇文章主要介紹了深度学习（三十二）——AlphaGo, AlphaStar 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

AlphaGo

樊麾講解AlphaGo與李世石的五番棋：

https://deepmind.com/research/alphago/alphago-games-simplified-chinese/

論文：

《Mastering the game of Go with deep neural networks and tree search》

DarkForest

DarkForest是田淵棟2015年11月的作品，雖然棋力和稍后的AlphaGo相去甚遠(yuǎn)，但畢竟也算是用到了RL和DNN了。

代碼：

https://github.com/facebookresearch/darkforestGo

Leela Zero

Leela Zero是比利時(shí)人Gian-Carlo Pascutto開源的圍棋AI。它的算法與AlphaGo Zero相同。而訓(xùn)練采用GTP協(xié)議，集合全球算力，進(jìn)行分布式訓(xùn)練。

官網(wǎng)：

http://zero.sjeng.org/

代碼：

https://github.com/gcp/leela-zero

十多年前，當(dāng)我還是一個(gè)中二青年的時(shí)候，就幻想有朝一日能夠拿圍棋世界冠軍。當(dāng)然，就算再中二，我自己也明白靠實(shí)力那是不可能的，當(dāng)時(shí)做夢的法寶是制造一個(gè)AI，然后碾壓一下所謂的國手。
按照當(dāng)時(shí)(2000年前后)人們的預(yù)計(jì)，這個(gè)AI在2030年之前，都不可能造出來，然而，最終的結(jié)果實(shí)際上只花了一半左右的時(shí)間。
再之后，隨著AI圍棋的平民化，我的中二夢終于也有人將之付諸實(shí)現(xiàn)了：
https://mp.weixin.qq.com/s/npt2zZrKwPnNdY-hsa2RjQ
AI再亂圍棋圈：“食言之戰(zhàn)”柯潔落敗；首例素人作弊引風(fēng)波

這次作弊風(fēng)波所使用的AI就是Leela Zero，可見目前（2018.5）它的棋力已經(jīng)超過了頂尖棋手。

ELF OpenGo

ELF OpenGo是Facebook開源的圍棋AI，它是FB的AI游戲框架ELF的一部分。

官網(wǎng)：

https://github.com/pytorch/ELF

參考：

https://mp.weixin.qq.com/s/lOAx3suLIS-pEWyi8xZl6Q

“全民體驗(yàn)”AlphaZero：FAIR田淵棟首次開源超級圍棋AI

PhoenixGo

PhoenixGo是騰訊微信團(tuán)隊(duì)的AlphaGo Zero復(fù)刻版。

官網(wǎng)：

https://github.com/Tencent/PhoenixGo

參考：

https://mp.weixin.qq.com/s/tJDmxsuS1QigYS75ZIdzRA

微信團(tuán)隊(duì)開源圍棋AI技術(shù)PhoenixGo，復(fù)現(xiàn)AlphaGo Zero論文

參考

https://mp.weixin.qq.com/s/Sfv-jzQAkN0PsZOGZUQhkQ

AlphaGo Zero橫空出世，DeepMind Nature論文解密不使用人類知識掌握圍棋

https://mp.weixin.qq.com/s/oAxouYX7-wDC5okbu--Wuw

Nature重磅：人工智能從0到1, 無師自通完爆阿法狗100-0

https://zhuanlan.zhihu.com/p/30262872

關(guān)于AlphaGo Zero

https://zhuanlan.zhihu.com/p/30263585

DeepMind新一代圍棋程序AlphaGo Zero再次登上Nature

https://www.zhihu.com/question/66861459

如何評價(jià)DeepMind發(fā)表在Nature上的AlphaGo Zero？

http://www.alphago-games.com/

AlphaGo的棋譜

https://deepmind.com/blog/alphago-zero-learning-scratch/

AlphaGo Zero官方聲明

https://zhuanlan.zhihu.com/mathNote

某牛的專欄，主要講自制AlphaGo

https://mp.weixin.qq.com/s/DC9QqHdWT0xFnowEBuJDbw

自動(dòng)化所解讀“深度強(qiáng)化學(xué)習(xí)”：從AlphaGo到AlphaGoZero

https://mp.weixin.qq.com/s/uZtaxRwROCqYmL2k6Muxaw

從阿爾法狗元(AlphaGo Zero)的誕生看終極算法的可能性

https://mp.weixin.qq.com/s/i5OmLu8aNbypiTUmP4teeQ

劉遙行：深入淺出看懂AlphaGo Zero

https://mp.weixin.qq.com/s/aBrwbB_DOGTen-6XL7LGFQ

鄧侃：白話蒙特卡洛樹搜索和ResNet

https://mp.weixin.qq.com/s/nbTkr0PImlXUSYl91HD91Q

AlphaGo背后的力量：蒙特卡洛樹搜索入門指南

https://mp.weixin.qq.com/s/-tH7DQo1cK9gA0bcpBJSDA

AlphaGo Zero：筆記與偽代碼

https://mp.weixin.qq.com/s/CJuVoOf7idUChFIn7dH0Lg

圍棋中的數(shù)學(xué)原理

https://mp.weixin.qq.com/s/d46qNFaftt4wxpV4sZnG-w

一張圖看懂AlphaGo Zero

https://zhuanlan.zhihu.com/p/31749249

比AlphaGo Zero更強(qiáng)的AlphaZero問世，8小時(shí)解決一切棋類！

https://mp.weixin.qq.com/s/L7bZMkqyncwEt6D5tK1OdQ

AlphaZero煉成最強(qiáng)通用棋類AI，DeepMind強(qiáng)化學(xué)習(xí)算法8小時(shí)完爆人類棋類游戲

https://mp.weixin.qq.com/s/tFdnxqV5a5xZrFtB6E0AiQ

新AlphaZero出世稱霸棋界，8小時(shí)搞定一切棋類！自對弈通用強(qiáng)化學(xué)習(xí)無師自通！

https://mp.weixin.qq.com/s/qYWsFBKNCKCGUmizX_1sVg

AlphaGo 教學(xué)工具終于上線了！

https://mp.weixin.qq.com/s/JxbIeDk8_wnYu_ewUHp29g

深度學(xué)習(xí)與圍棋實(shí)戰(zhàn)書籍《Deep Learning and the Game of Go》

https://mp.weixin.qq.com/s/gsRnbknytz2FY2dWgdWEYg

精通國際象棋的AI研究員：AlphaZero真的是一次突破嗎？

https://mp.weixin.qq.com/s/Przl4ivbNuOFmz4pcYTrpQ

淺述：從Minimax到AlphaZero，完全信息博弈之路（1）

https://zhuanlan.zhihu.com/p/32089487

AlphaZero實(shí)戰(zhàn)：從零學(xué)下五子棋

http://mp.weixin.qq.com/s/72riTTC3w0q9oF5H-51kXA

手把手教你搭建AlphaZero（使用Python和Keras）

https://mp.weixin.qq.com/s/Qw2tT7H1PwDvPgOYy8YUsQ

AlphaGo Zero代碼遲遲不開源，TF等不及自己推了一個(gè)

https://mp.weixin.qq.com/s/Vq-osjgNXJQu5avGkxQdsw

手把手：AlphaGo有啥了不起，我也能教你做一個(gè)

https://mp.weixin.qq.com/s/ajajJ9yJZsOy4Vc0ULBxXg

國際象棋版AlphaZero出來了誒，還開源了Keras實(shí)現(xiàn)

https://zhuanlan.zhihu.com/p/41814142

從源碼解密AlphaGo Zero背后基本原理

https://www.ifanr.com/630602

AlphaGo的棋局，與人工智能有關(guān)，與人生無關(guān)

https://mp.weixin.qq.com/s/J0w6kzzdKTbsaiZitbQdoA

達(dá)觀數(shù)據(jù)：一文詳解AlphaGo原理

https://mp.weixin.qq.com/s/BBQ54HHrFiqxXkC-EI6ELw

Science封面：AlphaZero達(dá)成終極進(jìn)化體，史上最強(qiáng)棋類AI降臨！

https://mp.weixin.qq.com/s/Pgw_xaCNl_kCPCg8NFzUBQ

人類沒法下了！DeepMind貝葉斯優(yōu)化調(diào)參AlphaGo，自弈勝率大漲16.5%

https://mp.weixin.qq.com/s/eE3oL6c5zHmTglHE-dgBvg

詳解AlphaGo到AlphaGo Zero！

AlphaStar

https://mp.weixin.qq.com/s/_Y0bCjTu9UrHfnen15htqQ

AlphaStar稱霸星際爭霸2！AI史詩級勝利，DeepMind再度碾壓人類

https://mp.weixin.qq.com/s/axr5VFbHQmYo0shW9ilBaQ

DeepMind回應(yīng)一切：AlphaStar兩百年相當(dāng)于人類多長時(shí)間？

https://www.zhihu.com/question/310011363

如何評價(jià)DeepMind在北京時(shí)間19年1月25日2點(diǎn)的《星際爭霸 2》項(xiàng)目演示？

https://mp.weixin.qq.com/s/k0l2uoik-Z9aA9zax7AoZg

中科院自動(dòng)化所深度解析：Deepmind AlphaStar如何戰(zhàn)勝人類職業(yè)玩家

https://zhuanlan.zhihu.com/p/55781614

AlphaStar背后的機(jī)器學(xué)習(xí)原理
httphttps://zhuanlan.zhihu.com/p/56043646管飯s://zhuanlan.zhihu.com/p/56043646
https://zhuanlan.zhihu.com/p/56043646

AlphaStar之IMPALA

https://mp.weixin.qq.com/s/XljE82cJZfFOgf2KrXWSKA

DeepMind首個(gè)戰(zhàn)勝星際2職業(yè)玩家的AI為何無敵？新視角揭秘AI里程碑

總結(jié)

以上是生活随笔為你收集整理的深度学习（三十二）——AlphaGo, AlphaStar的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：深度学习（三十一）——Style Tra
下一篇：深度学习（三十三）——GAN参考资源

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

pytorch

深度学习（三十二）——AlphaGo, AlphaStar

AlphaGo

DarkForest

Leela Zero

ELF OpenGo

PhoenixGo

參考

AlphaStar

總結(jié)