你也能与AlphaGo谈笑风生:AlphaGo教学工具上线,2万多变化,37万多步棋
2019獨(dú)角獸企業(yè)重金招聘Python工程師標(biāo)準(zhǔn)>>>
我有幾張阿里云幸運(yùn)券分享給你,用券購(gòu)買(mǎi)或者升級(jí)阿里云相應(yīng)產(chǎn)品會(huì)有特惠驚喜哦!把想要買(mǎi)的產(chǎn)品的幸運(yùn)券都領(lǐng)走吧!快下手,馬上就要搶光了。
?
微博原文如下
樊麾在微博表示:
“大家好
AlphaGo 教學(xué)工具終于上線(xiàn)了。
教學(xué)工具共有兩萬(wàn)多個(gè)變化,三十七萬(wàn)多步棋組成,通過(guò)AlphaGo的視角,分析并建議圍棋開(kāi)局的諸多下法。同時(shí)每步棋AlphaGo都會(huì)給出自己的勝率分析,希望AlphaGo對(duì)圍棋的獨(dú)特理解可以給我們一些啟發(fā)。
下邊的幾個(gè)圖是我從萬(wàn)千變化圖中發(fā)現(xiàn)比較有沖擊力的幾個(gè),類(lèi)似的變化圖有很多很多,大家可以自己找找
本教學(xué)工具使用的版本是 AlphaGo Master。具體信息可以在主頁(yè)上看到,工具設(shè)有包括中文簡(jiǎn)體在內(nèi)的多個(gè)語(yǔ)言。
順序由左往右,圖1 :原來(lái)二路虎不見(jiàn)得好! 圖2 :對(duì)付迷你中國(guó)流的新辦法!圖3 :這個(gè)! 圖4 : 小林流也不是只有大飛掛! 圖5 : 原來(lái)這里還可以飛!圖6 :妖刀定式!
溫馨提示 :打開(kāi)時(shí)請(qǐng)耐心等待幾秒。
祝大家玩得開(kāi)心”
DeepMind資深研究員黃士杰
黃士杰博士:
大家好,很高興向大家宣布,AlphaGo教學(xué)工具上線(xiàn)了。
這是一個(gè)AlphaGo教學(xué)的開(kāi)局庫(kù),相關(guān)細(xì)節(jié)如下:
?
?
受限于投稿《自然》雜志的時(shí)程,本教學(xué)工具使用的版本是AlphaGo Master。希望大家享受AlphaGo教學(xué)工具中的創(chuàng)新下法,也能從中有所收獲。
AlphaGo、AlphaGo zero、AlphaZero
2016年Google在Nature上發(fā)表基于深度學(xué)習(xí)算法的圍棋程序AlphaGo,AlphaGo在古老的圍棋比賽中以4:1的高分擊敗了世界大師級(jí)冠軍李世石,從此一炮而紅,并且二度登上《Nature》雜志封面。
許多專(zhuān)家認(rèn)為,人類(lèi)至少提前十年實(shí)現(xiàn)了這一壯舉。對(duì)于 DeepMind以及世界圍棋界而言,最激動(dòng)人心的是AlphaGo在博弈過(guò)程中所表現(xiàn)出來(lái)的創(chuàng)造力,甚至有時(shí)候它的招數(shù)對(duì)古老的圍棋智慧都造成了挑戰(zhàn)。
不到一年之后,2017年Google的DeepMind實(shí)驗(yàn)室再度開(kāi)發(fā)了基于強(qiáng)化學(xué)習(xí)的新一代圍棋程序,稱(chēng)為AlphaGo zero,AlphaGo Zero不依賴(lài)任何對(duì)局復(fù)盤(pán)和實(shí)戰(zhàn)數(shù)據(jù)進(jìn)行訓(xùn)練,僅用3天就擊敗 AlphaGo Lee、僅用40天就擊敗 AlphaGo Master的圍棋人工智能。
12月份,DeepMind推出AlphaZero,從AlphoGo Zero 到AlphaZero只是少了一個(gè)詞“圍棋”(Go), 但是背后卻代表著Hassabis將和他的DeepMind繼續(xù)朝著“創(chuàng)造解決世界上一切問(wèn)題的通用人工智能”這一目標(biāo)道路上邁出了巨大的一步。
Alpha Zero與前面幾種程序相比更具通用性。除了圍棋以外,它在國(guó)際象棋和日本將棋上的造詣也已經(jīng)超越了人類(lèi)水平。因此Alpha Zero 也從名字里去掉了圍棋(Go)一詞。DeepMind在arXiv發(fā)表論文表示其開(kāi)發(fā)的通用強(qiáng)化學(xué)習(xí)程序AlphaZero,使用蒙特卡洛樹(shù)搜索(MCTS)和深度神經(jīng)網(wǎng)絡(luò),和強(qiáng)大的算力,同時(shí)在國(guó)際象棋,日本將棋和圍棋中戰(zhàn)勝各自領(lǐng)域的最強(qiáng)代表。而且這一切都是通過(guò)自我對(duì)弈完成的,在訓(xùn)練中除了游戲規(guī)則,不提供任何額外的領(lǐng)域知識(shí)。4小時(shí)擊敗最強(qiáng)國(guó)際象棋AI、2小時(shí)擊敗最強(qiáng)將棋AI,8小時(shí)擊敗李世石版AlphaGo,連最強(qiáng)圍棋AI AlphaGo Zero也不能幸免:訓(xùn)練34小時(shí)的AlphaZero勝過(guò)了訓(xùn)練72小時(shí)的AlphaGo Zero。
轉(zhuǎn)載于:https://my.oschina.net/u/3611008/blog/1589305
總結(jié)
以上是生活随笔為你收集整理的你也能与AlphaGo谈笑风生:AlphaGo教学工具上线,2万多变化,37万多步棋的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: [原创]教你如何最快写出酷炫的dialo
- 下一篇: UITableView(UIScroll