别的AI还在打游戏,这个AI已经当上“超级马里奥”游戏策划了|GECCO最佳论文
AI打游戲已經(jīng)不是什么新鮮事了,“沉迷”Dota 2、星際爭霸、LOL的AI一個(gè)接一個(gè)的出現(xiàn)。
但是你也許不知道,相比這些“游戲玩家”AI,還有一位優(yōu)秀的AI,直接當(dāng)起了“游戲策劃”,做的還是膾炙人口的“超級馬里奧”。
超級馬里奧:無限關(guān)卡
這位“策劃大大”誕生在由一個(gè)六位研究者組成的團(tuán)隊(duì)中,成員來自多特蒙德大學(xué)、美國西南大學(xué)、倫敦大學(xué)瑪麗皇后學(xué)院、加利福尼亞大學(xué)及哥本哈根IT大學(xué),它能用生成對抗網(wǎng)絡(luò)(GAN)自動(dòng)“設(shè)計(jì)”海量的超級馬里奧關(guān)卡。
并且,這個(gè)超級馬里奧關(guān)卡策劃AI還能充分保證新關(guān)卡的可玩性,讓每個(gè)關(guān)卡在開始的時(shí)候都相對簡單,而后逐漸增加難度,保證玩家“沉迷游戲,無法自拔”。
馬里奧策劃AI成長史
馬里奧GAN的工作流程大概長這樣:
△ 馬里奧GAN原理圖
首先,GAN學(xué)習(xí)現(xiàn)有的超級馬里奧關(guān)卡(圖上黃色部分),get到關(guān)卡策劃這一技能后,生成網(wǎng)絡(luò)開始生成關(guān)卡,然后將“作業(yè)”案例提交給判別網(wǎng)絡(luò),由判別網(wǎng)絡(luò)進(jìn)行把關(guān),判斷“作業(yè)”是否為一個(gè)合格的馬里奧關(guān)卡。
不合格的“作業(yè)”將被打回去重做,直到這一關(guān)合格為止。
神經(jīng)網(wǎng)絡(luò)如何識別游戲
GAN學(xué)習(xí)的并不是每一關(guān)的畫面,而是用專有符號系統(tǒng)表示的“游戲地圖”。地圖以“方塊”為單位——有金幣的方塊、可以頂碎的磚塊、當(dāng)?shù)鼗拇u塊、管道的磚塊等,游戲地圖中的每個(gè)方塊都有獨(dú)特的表示方式,比如怪物方塊編號為5,用大寫的E來代指。
△ 游戲地圖方塊對照表
這樣,所有的游戲地圖都可以用一個(gè)符號的矩陣來表示,比如,下面這個(gè)游戲地圖中:
我們按照方塊把每個(gè)元素劃分開,并且加以不同的表達(dá)方式:
地板是0,怪物是0,右側(cè)的“山上”可以被頂壞的“天梯”則是1。另外,由于管道占了不只一個(gè)方塊,所以管道口的左右半截分別用單引號代指,用6、7表示,而管道身體的左右半截用方括號代指,用8、9表示。如果某個(gè)格子是空氣,什么都沒有,則用2表示。
所有的學(xué)習(xí)和生成系統(tǒng),都是基于這樣的矩陣進(jìn)行的。這套系統(tǒng)又被稱作視頻游戲關(guān)卡語料庫(Video Game Level Corpus,VGLC),每一個(gè)方塊都像圖像處理中的像素一樣,能夠被神經(jīng)網(wǎng)絡(luò)解析或生成。
難度升級大法——LVE
正常的關(guān)卡游戲都有一個(gè)特點(diǎn)——每一關(guān)都比前面那一關(guān)難一點(diǎn)。
超級馬里奧也不例外。人類游戲策劃可以控制每一關(guān)的大致難度,但AI怎么控制呢?這要倚仗**潛變量進(jìn)化(latent variable evolution,LVE)的方法。
LVE由紐約大學(xué)的Philip Bontrager等人在2017年提出,具體可以跳轉(zhuǎn)arXiv:1705.07386。
在LVE的幫助下,機(jī)器可以生成越來越難的關(guān)卡,比如,像下面這張圖一樣(關(guān)卡略長,請把手機(jī)橫過來看):
像這樣,從開頭的“一馬平川”到出現(xiàn)管道、山溝、山丘和怪物,直到怪物密布、溝壑縱橫,整個(gè)過程是越來越難的。
送進(jìn)DCGAN訓(xùn)練
訓(xùn)練的過程使用的是深度卷積生成對抗網(wǎng)絡(luò)(Deep Convolutional GAN,DCGAN),使用WGAN算法進(jìn)行訓(xùn)練。
△ DCGAN生成網(wǎng)絡(luò)構(gòu)架
△ DCGAN判別網(wǎng)絡(luò)構(gòu)架
然而,生成結(jié)果并不100%完美
訓(xùn)練后的GAN生成的結(jié)果究竟如何呢?
好壞參半。
有的部分歲月靜好,除了個(gè)別小困難之外,玩家可以輕松通過:
但是,也有下面這種奇葩地形,蜀道之難難于上青天啊!
甚至還會(huì)出現(xiàn)讓人退游的神秘管道:
請問管子君是異次元穿越來的嘛?
沒辦法,GAN一直都是這么皮。所以,研究者們還準(zhǔn)備做進(jìn)一步的優(yōu)化,以期待在未來可以讓GAN生成永遠(yuǎn)玩不完的超級馬里奧。
不完美,一樣拿獎(jiǎng)
雖然馬里奧GAN的生成結(jié)果并不完美,但這并不妨礙它拿獎(jiǎng)啊。
畢竟,在人類用計(jì)算機(jī)生成馬里奧游戲關(guān)卡的歷史上,這可是個(gè)巨大突破呢。
馬里奧AI錦標(biāo)賽(http://www.marioai.org/)是一個(gè)在2009-2012年期間舉辦過幾屆的比賽,專門生成馬里奧關(guān)卡。在這項(xiàng)賽事中,雖然科學(xué)家們一直致力于創(chuàng)造出最好的自動(dòng)生成馬里奧關(guān)卡的算法,但實(shí)際絕大多數(shù)時(shí)候,參賽者依然需要手動(dòng)設(shè)置一些參數(shù)。
而GAN興起后,AI生成馬里奧關(guān)卡再也不需要進(jìn)行任何手動(dòng)了,程序員們可以和手動(dòng)設(shè)置參數(shù)說bye-bye了。
因此,這篇論文也拿到了GECCO 2018的最佳論文。
傳送門全家桶
馬里奧GAN已經(jīng)開源,量子位照例附上arXiv和github地址,歡迎自取~
論文:Evolving Mario Levels in the Latent Space of a Deep Convolutional Generative Adversarial Network
作者:Vanessa Volz, Jacob Schrum, Jialin Liu, Simon M. Lucas, Adam Smith, Sebastian Risi
GECCO 2018 Best Paper Award
arXiv:
https://arxiv.org/abs/1805.00728
data:
https://github.com/TheVGLC/TheVGLC
github:
https://github.com/TheHedgeify/DagstuhlGAN
原文發(fā)布時(shí)間為:2018-07-27
本文來自云棲社區(qū)合作伙伴“量子位”,了解相關(guān)信息可以關(guān)注“量子位”。
總結(jié)
以上是生活随笔為你收集整理的别的AI还在打游戏,这个AI已经当上“超级马里奥”游戏策划了|GECCO最佳论文的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: django redirect传递参数_
- 下一篇: AI研究的盲点:无解的神经网络内在逻辑