首届“开悟AI+游戏高校大赛”启动
8月18日,騰訊宣布首屆“開悟AI+游戲高校大賽”(下稱“大賽”)初賽正式啟動(dòng),這也是騰訊開悟平臺(tái)首次面向高校開放。該大賽由騰訊 AI Lab?攜手王者榮耀、騰訊高校合作、騰訊游戲?qū)W院等共同發(fā)起,邀請(qǐng)來自清華大學(xué)、北京大學(xué)、上海交通大學(xué)等國(guó)內(nèi)18所頂尖高校的100多名學(xué)生同臺(tái)競(jìng)技。
開悟是騰訊牽頭構(gòu)建的AI多智能體與復(fù)雜決策開放研究平臺(tái),依托騰訊AI Lab和「王者榮耀」在算法、脫敏數(shù)據(jù)、算力方面的核心優(yōu)勢(shì),為學(xué)術(shù)研究人員和算法開發(fā)者開放的國(guó)內(nèi)領(lǐng)先、國(guó)際一流研究與應(yīng)用探索平臺(tái)。
本屆大賽依托王者榮耀的游戲測(cè)試環(huán)境和開悟平臺(tái)提供的算法、脫敏數(shù)據(jù)、計(jì)算平臺(tái)等資源,為研究者開放脫敏游戲數(shù)據(jù)集及游戲核心集群,并提供評(píng)估工具、計(jì)算平臺(tái)以及其他研究支持服務(wù),以測(cè)試并提升AI在復(fù)雜對(duì)戰(zhàn)游戲場(chǎng)景下的多維度決策水平。
參賽隊(duì)伍需要在指定的時(shí)間內(nèi),在給定的資源下訓(xùn)練出最優(yōu)模型,并最終部署好使用最優(yōu)模型的AI服務(wù)器,提交系統(tǒng)進(jìn)行1V1、5V5對(duì)局。大賽總獎(jiǎng)金池高達(dá)50萬元,最終成績(jī)將于今年12月發(fā)布。
騰訊AI Lab團(tuán)隊(duì)表示,在2019年8月18日的王者榮耀“無限開放計(jì)劃交流會(huì)”上,騰訊AI Lab與王者榮耀和高校攜手,開啟了對(duì)“AI+游戲開放平臺(tái)”的共建。一年后的今天,騰訊正式開放開悟平臺(tái),希望延續(xù)“818無限開放”的美好寓意,向開放生態(tài)推動(dòng)科研與應(yīng)用的愿景持續(xù)邁進(jìn)。
為進(jìn)一步促進(jìn)技術(shù)交流,騰訊 AI Lab “AI+游戲”系列高端講座視頻已于開悟官網(wǎng)免費(fèi)開放,歡迎大家前來了解國(guó)內(nèi)“AI+游戲”研究最新進(jìn)展:
官網(wǎng)地址
aiarena.tencent.com
課題挑戰(zhàn):讓AI學(xué)會(huì)像人一樣決策
《王者榮耀》是一款移動(dòng)端MOBA類游戲。基本玩法是通過推塔、擊殺敵人、賺取經(jīng)濟(jì)來得到優(yōu)勢(shì),勝利條件是摧毀敵方的水晶基地;但細(xì)節(jié)玩法因所選模式的不同而略有不同。
不論是王者“大神”還是新手“小白”,游戲水平并不妨礙人類玩家從游戲中得到樂趣,但這個(gè)游戲?qū)I來說是個(gè)巨大的挑戰(zhàn)——AI 要在不完全信息、高度復(fù)雜度的情況作出復(fù)雜快速的決策。在龐大且信息不完備的地圖上,10位參與者要在策略規(guī)劃、英雄選擇、技能應(yīng)用、路徑探索及團(tuán)隊(duì)協(xié)作上面臨大量、不間斷、即時(shí)的選擇,這帶來了極為復(fù)雜的局面,預(yù)計(jì)有高達(dá)10的20000次方種操作可能性,而整個(gè)宇宙原子總數(shù)也只是10的80次方。
具體而言,要實(shí)現(xiàn)勝利目標(biāo),需要考查AI的多項(xiàng)能力:智能體解決方案、特征、動(dòng)作空間、模型結(jié)構(gòu)設(shè)計(jì)、強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)、訓(xùn)練方式探索等。
首屆“開悟AI+游戲高校大賽”分為初賽和決賽兩個(gè)階段。初賽為1V1玩法,決賽為5V5玩法,兩種玩法的挑戰(zhàn)任務(wù)均為摧毀敵方基地水晶。
初賽期間,參賽隊(duì)伍需通過基準(zhǔn)測(cè)試(在1V1對(duì)局中擊敗主辦方提供的基準(zhǔn)模型),方可進(jìn)入與對(duì)手模型對(duì)戰(zhàn)的階段。之后參賽隊(duì)伍將進(jìn)入兩兩對(duì)戰(zhàn)階段,勝利者可獲得1分,通過循環(huán)對(duì)戰(zhàn)積分得出排行榜,最終前6名將進(jìn)入決賽。
決賽期間,每支隊(duì)伍的AI將操縱五位英雄對(duì)戰(zhàn),更大的動(dòng)作空間挑戰(zhàn),將更考驗(yàn)AI之間的配合協(xié)作。
資源支持:平臺(tái),算力,gamecore與知識(shí)
騰訊AI Lab聯(lián)合王者榮耀、騰訊高校合作、騰訊游戲?qū)W院等合作伙伴,共同為參賽團(tuán)隊(duì)提供全方位資源支持,幫助他們完成開悟大賽的課題挑戰(zhàn):
游戲核心集群(gamecore):業(yè)內(nèi)唯一讀取“王者榮耀”游戲場(chǎng)景和控制英雄行為的數(shù)據(jù)接口 Gamecore API,讓研究者可以基于這款經(jīng)受億級(jí)玩家考驗(yàn)的成熟MOBA游戲測(cè)試環(huán)境,借助10萬級(jí)脫敏對(duì)局?jǐn)?shù)據(jù),進(jìn)行在復(fù)雜對(duì)戰(zhàn)游戲場(chǎng)景下的多維度決策AI研究。
算力資源:免費(fèi)提供騰訊云計(jì)算與大數(shù)據(jù)處理平臺(tái),可用于訓(xùn)練強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí)算法和模型。
評(píng)估工具:基于 Linux 環(huán)境的游戲?qū)?zhàn)工具和對(duì)局錄像回放工具,幫助研究者即時(shí)有效地評(píng)估新算法和模型的性能表現(xiàn),便于調(diào)試。
自今年5月起,騰訊 AI Lab 為參賽選手提供賽前培訓(xùn),專人指導(dǎo)選手熟悉使用平臺(tái),了解監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)知識(shí)。6月下旬,騰訊 AI Lab 組織“開悟”內(nèi)部交流會(huì),邀請(qǐng)來自北京大學(xué)、中國(guó)科學(xué)院自動(dòng)化研究所、上海交通大學(xué)等高校的多位頂尖教授學(xué)者,為學(xué)生們分享他們?cè)凇癆I+游戲”領(lǐng)域的前沿研究成果。
目前,騰訊 AI Lab “AI+游戲”系列高端講座也同步于開悟官網(wǎng)免費(fèi)開放,面向行業(yè)共享國(guó)內(nèi)“AI+游戲”研究最新進(jìn)展。
《斗地主的游戲復(fù)雜度和智能體復(fù)雜度的度量方法研究》北京大學(xué)教授李文新??
AI 玩斗地主還是挺難的,因?yàn)橄磁剖请S機(jī)的,而玩家初始手牌對(duì)勝率影響很大。北京大學(xué)李文新團(tuán)隊(duì)研究了初始手牌對(duì)“地主”或“農(nóng)民”的獲勝難度有何影響;另外,他們還提出了另一種新方法,可以評(píng)價(jià)一個(gè)斗地主 AI 的牌技好不好。
《基于動(dòng)態(tài)不后悔策略的多智能體合作學(xué)習(xí)》中科院自動(dòng)化所研究員興軍亮
要讓多個(gè)智能體學(xué)會(huì)合作是很困難的,既要設(shè)定各個(gè)智能體的目標(biāo),還要分出主力和輔助關(guān)系,實(shí)現(xiàn)這樣的復(fù)雜設(shè)計(jì)成本很高。中國(guó)科學(xué)院自動(dòng)化研究所興軍亮團(tuán)隊(duì)提出了一種自我提升式強(qiáng)化學(xué)習(xí)框架,先讓智能體通過模仿來學(xué)習(xí),再通過自我互博來進(jìn)階進(jìn)化,加上他們提出的一種新策略,可有效緩解一些多智能學(xué)習(xí)的常見問題。
《Behavioral?Diversity?Generation?via?Multi-Agent?Determinantal?Q-Learning》上海交通大學(xué)教授溫穎
或許《王者榮耀》高手們會(huì)覺得人機(jī)AI看起來都不太聰明。上海交通大學(xué)溫穎提出了一種新技術(shù),能讓AI們的合作方式更多樣化,從而不那么容易暴露自己的套路,讓游戲變得更有挑戰(zhàn)性。另外,這個(gè)技術(shù)還可以用于訓(xùn)練自動(dòng)駕駛汽車。
開悟愿景:助力產(chǎn)學(xué)研,共享AI+游戲新生態(tài)
AI業(yè)界普遍認(rèn)為,下一個(gè) AI 里程碑可能會(huì)在復(fù)雜策略游戲中誕生:若 AI 能在如此復(fù)雜的環(huán)境中,學(xué)會(huì)人一樣實(shí)時(shí)感知、分析、理解、推理、決策到行動(dòng),就可能在多變、復(fù)雜的真實(shí)環(huán)境中發(fā)揮更大作用。世界頂級(jí)科技公司均在推進(jìn)此類研究,如Google Deepmind(星際爭(zhēng)霸2)、Facebook(星際爭(zhēng)霸2) 及 Open AI(Dota 2)等。
騰訊 AI Lab 一直是此類智能體研究的先行者。2016年起,研發(fā)的圍棋 AI “絕藝”(Fine Art),現(xiàn)擔(dān)任中國(guó)國(guó)家圍棋隊(duì)訓(xùn)練專用 AI ;2017年,基于《王者榮耀》游戲測(cè)試環(huán)境啟動(dòng)MOBA策略協(xié)作型AI“絕悟”研發(fā),2019年達(dá)到職業(yè)電競(jìng)水平;騰訊還在射擊類頂級(jí) AI 競(jìng)賽 VizDoom 奪冠,并在《星際爭(zhēng)霸2》首先研發(fā)出擊敗內(nèi)置 AI 的智能體。
在2018年對(duì)戰(zhàn)頂尖水平的非職業(yè)戰(zhàn)隊(duì)時(shí),絕悟表現(xiàn)出即時(shí)策略+團(tuán)隊(duì)協(xié)作能力:在賽區(qū)聯(lián)隊(duì)全隊(duì)覆滅后, 「絕悟」的兵線尚未到達(dá),下路高地塔還有過半血量,「絕悟」果斷選擇四人輪流抗塔,無兵線強(qiáng)拆塔。
借助開悟平臺(tái),騰訊 AI Lab 希望聯(lián)動(dòng)更多有興趣的高校和學(xué)者參與,共同探討和研究這些難題,并進(jìn)一步將在該游戲測(cè)試環(huán)境中探索得到的新技術(shù)和新方法,應(yīng)用于日常生活中的現(xiàn)實(shí)問題。
總結(jié)
以上是生活随笔為你收集整理的首届“开悟AI+游戏高校大赛”启动的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Embedding在腾讯应用宝的推荐实践
- 下一篇: 腾讯AI Lab联合清华,港中文长文解析