腾讯AI大战王者荣耀!504场1v1仅输1场,5v5达电竞职业水平
本文轉(zhuǎn)自"智東西"
看點:5v5大勝職業(yè)選手,1v1勝率達99.8%,僅有1場敗給國服第一后羿。
8月3日,騰訊策略協(xié)作型 AI “絕悟”再出山,對戰(zhàn)王者榮耀職業(yè)玩家,勝率相當(dāng)驚人。
在當(dāng)晚吉隆坡舉辦的王者榮耀最高規(guī)格電競賽事——世界冠軍杯半決賽的特設(shè)環(huán)節(jié)中,在職業(yè)選手賽區(qū)聯(lián)隊帶來的 5v5 水平測試中獲勝,升級至王者榮耀電競職業(yè)水平。
▲“絕悟”職業(yè)水平測試完整視頻(3分55秒開始)
同時,“絕悟”的 1v1 版本也在上海舉辦的國際數(shù)碼互動娛樂展覽會 ChinaJoy 首次對公眾亮相,并向頂級業(yè)余玩家開放為期四天的體驗測試。
在首日的 504 場測試中,“絕悟”測試勝率為 99.8%,僅在對方為王者榮耀國服第一后羿的情況下,輸 1 場。
當(dāng)年 AlphaGo 打敗世界圍棋冠軍李世石,直接引爆第三次 AI 浪潮。但與現(xiàn)實世界相比,它解決的問題只是九牛一毛。更為復(fù)雜的即時策略游戲(RTS)正成為研究人員們新的挑戰(zhàn)項目。
業(yè)界普遍認(rèn)為,從這些策略游戲中有望誕生下一個 AI 里程碑。
其中最受歡迎的分支是 MOBA 游戲。像谷歌 DeepMind(星際爭霸2)、Facebook(星際爭霸2) 及 Open AI(Dota 2)等 AI 界明星團隊都在推進此類研究。
騰訊也早在兩年前就透露在做 AI 打王者榮耀方面的研究。去年12月,5個相互的獨立的 AI 在學(xué)會開黑技能后,5v5對陣王者榮耀中王者段位的人類玩家。大戰(zhàn) 250 個回合后,AI 拿下 48%?的勝率,幾乎與人類打成平手。
最新這場人機大戰(zhàn)究竟戰(zhàn)況如何?其背后的技術(shù)又如何實現(xiàn)?本文將簡要介紹這場人機大戰(zhàn)背后的技術(shù),復(fù)盤全場精彩時刻,并回顧騰訊 AI 探索智能體研究的相關(guān)進程。
無需人類數(shù)據(jù),一天訓(xùn)練強度高達人類440年
“絕悟”名字寓意絕佳領(lǐng)悟力,其技術(shù)研發(fā)始于 2017 年 12 月。一年后,“絕悟”通過了由前職業(yè)選手與主播聯(lián)隊帶來的頂尖業(yè)余水平測試。
在本次測試中,新的“絕悟”版本建立了基于“觀察-行動-獎勵”的深度強化學(xué)習(xí)模型。
▲騰訊策略協(xié)作型AI“絕悟”介紹
這款模型無需人類數(shù)據(jù),從白板學(xué)習(xí)(Tabula Rasa)開始,讓 AI 自己與自己對戰(zhàn),一天的訓(xùn)練強度高達人類 440 年。
AI 完全從零開始摸索成功經(jīng)驗,不僅學(xué)會了如何站位、打野、輔助保護和躲避傷害等游戲常識,更驚喜的是,還探索出了不同于人類常規(guī)做法的全新策略。
游戲中測試的難點在于,AI 需在不完全信息、高度復(fù)雜度的情況作出復(fù)雜快速的決策。
在龐大且信息不完備的地圖上,10 位參與者要在策略規(guī)劃、英雄選擇、技能應(yīng)用、路徑探索及團隊協(xié)作上面臨大量、不間斷、即時的選擇。這帶來了極為復(fù)雜的局面,預(yù)計有高達 10 的 20000 次方種操作可能性。
要知道,整個宇宙原子總數(shù)也僅僅是10的80次方。
團隊還創(chuàng)建 One Model 模型提升訓(xùn)練效率,優(yōu)化通信效率提升 AI 的團隊協(xié)作能力,使用零和獎懲機制讓 AI 能最大化團隊利益,使其打法果斷,有舍有得。
拆解“絕悟”六大精彩時刻
下面,讓我們一起來復(fù)盤一下 AI 在打王者榮耀過程中的一些精彩時刻。
1、探索全新策略
如圖,開局時,“絕悟”沒選擇傳統(tǒng)人類對線走位策略,而是由雙 C 位英雄虞姬和王昭君先一起清理中路第一波兵線,壓制敵方中輔。之后又轉(zhuǎn)上路壓制曹操血線。
2、長線策略
在對線期,賽區(qū)聯(lián)隊三人壓迫下路,“絕悟”果斷選擇用三個 AI 反壓賽區(qū)聯(lián)隊的上路,最終雙方互換一塔,維持均勢。
3、團隊協(xié)作
到比賽中期,“絕悟”四人追擊娜可露露,AI 達摩一腳將娜可露露反踢入 AI 群中,再由四個 AI 完美配合拿下自己的首殺。
4、即時策略
一對一時,賽區(qū)聯(lián)隊實力較強的曹操追擊“絕悟”虞姬,虞姬在殘血狀態(tài)退至高地。看到曹操抗塔血量大減后,把握機會絕地反殺。
5、即時策略+團隊協(xié)作
比賽后期在賽區(qū)聯(lián)隊的上路高地塔團戰(zhàn),AI 王昭君先手被對方秒殺,“絕悟”果斷選擇反打,以漂亮的一波團戰(zhàn)全殲對手。
6、即時策略+團隊協(xié)作
在賽區(qū)聯(lián)隊全隊覆滅后, “絕悟”的兵線尚未到達,下路高地塔還有過半血量,“絕悟”果斷選擇四人輪流抗塔,無兵線強拆塔。
* 注:賽事尾聲,賽區(qū)聯(lián)隊團滅后,“絕悟”未直接推水晶,而是計算整體收益后,選擇先推最后一個高地塔,再推水晶直至勝利。
起步三年,目標(biāo)遠大
這已經(jīng)不是騰訊 AI Lab第一次秀 AI 大戰(zhàn)游戲玩家了。
從 2016 年起,騰訊 AI Lab 就開始透露關(guān)于智能體研究的進程。他們研發(fā)的圍棋 AI “絕藝”(Fine Art),現(xiàn)擔(dān)任中國國家圍棋隊訓(xùn)練專用 AI 。
2017 年,“絕悟”研發(fā)啟動,到 2018 年時,“絕悟”已經(jīng)達到業(yè)余頂尖水平。
去年5月,騰訊 AI Lab 匹茨堡大學(xué)的研究人員曾向 AI 頂會 ICML 2018 提交了一篇論文《Hierarchical Macro Strategy Model for MOBA Game AI》,嘗試了 AlphaGo Zero 中出現(xiàn)的蒙特卡洛樹搜索(MCTS)等技術(shù),并取得了不錯的效果。
那時,AI 還只能玩狄仁杰一個英雄。幾個月后,它們已經(jīng)可以“五人”組隊,在王者段位和人類玩家打得有來有回了。
在去年 12 月的 KPL 秋季決賽中,“絕悟”曾接受前職業(yè) KPL 選手辰鬼、零度和職業(yè)解說白樂、九天和立人組成的人類戰(zhàn)隊的水平測試,這些人類戰(zhàn)隊的平均水平超過 99% 玩家。
最終,AI 戰(zhàn)隊贏得比賽的勝利。
騰訊還在射擊類頂級 AI 競賽 VizDoom 奪冠,并在《星際爭霸2》首先研發(fā)出擊敗內(nèi)置 AI 的智能體。
在今年 4 月的高通人工智能開放日上,高通宣布將和騰訊 AI Lab 、王者榮耀、vivo四方共同打造一支王者榮耀 AI 電競戰(zhàn)隊“SUPEX”,希望能夠通過MOBA類游戲場景的實驗環(huán)境來不斷提升和優(yōu)化 AI 電競戰(zhàn)隊的實力,從而為移動電競帶來更好的競技體驗。
騰訊副總裁姚星介紹,“電子競技”將成為策略協(xié)作型 AI “絕悟”未來短期內(nèi)的主要應(yīng)用場景。
作為數(shù)字時代最受年輕人歡迎的運動,電競已于 2018 年成為亞運會表演項目,中國隊參賽獲兩金一銀的佳績。
與傳統(tǒng)體育項目一樣,電競職業(yè)選手也需要手眼腦協(xié)調(diào)、策略和操作快速反應(yīng)、團隊協(xié)作精神及大量刻苦訓(xùn)練。
借助在算法和數(shù)據(jù)方面的優(yōu)勢, AI 可為職業(yè)選手提供數(shù)據(jù)、戰(zhàn)略與協(xié)作類實時分析與建議,及不同強度與級別的專業(yè)陪練。以前沿科技推動電競專業(yè)化發(fā)展,AI 將繼續(xù)推動中國電競在全球范圍內(nèi)保持領(lǐng)先。
結(jié)語:解決通用人工智能的關(guān)鍵一步
據(jù)騰訊介紹,從長期應(yīng)用上,“絕悟”將是騰訊攻克 AI 終極研究難題——通用人工智能的關(guān)鍵一步。
AGI 代表研發(fā)能在通用系統(tǒng)中執(zhí)行多種復(fù)雜命令,達到或超越人類水平的 AI。
從“絕藝”到“絕悟”,騰訊 AI Lab 不斷讓 AI 從?0 到 1 去學(xué)習(xí)進化,并發(fā)展出一套合理的行為模式。
這中間的研發(fā)經(jīng)驗、方法與結(jié)論,長期來看,有望在大范圍內(nèi),如探索 AI 結(jié)合電競、醫(yī)療、制造、無人駕駛、農(nóng)業(yè)到智慧城市管理等廣闊領(lǐng)域展現(xiàn)巨大潛力。
而本次兩類技術(shù)水平測試結(jié)果,一定程度上反映出騰訊在深度強化學(xué)習(xí)、多智能體決策智能課題上的國際級 AI 研究水準(zhǔn),也標(biāo)志著騰訊在攻堅通用人工智能難題上更進一步。
騰訊 AI Lab 將通過論文等形式進一步分享技術(shù)細(xì)節(jié),通過開放研究,幫助和啟發(fā)更多研究者。
推薦閱讀:(點擊下方標(biāo)題即可跳轉(zhuǎn))
受用一生的高效PyCharm使用技巧
沒看完這11 條,別說你精通 Python 裝飾器
??長按 2 秒關(guān)注「 小詹學(xué)Python 」
喜歡就點擊“在看”吧!
總結(jié)
以上是生活随笔為你收集整理的腾讯AI大战王者荣耀!504场1v1仅输1场,5v5达电竞职业水平的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 秒半价,限三天。戴尔i7高配电脑低至27
- 下一篇: 你真敢ZAO吗?解读换脸AI “细思极恐