當(dāng)前位置：首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

别的AI还在打游戏，这个AI已经当上“超级马里奥”游戏策划了|GECCO最佳论文

發(fā)布時(shí)間：2023/12/19 ChatGpt 55 豆豆

生活随笔收集整理的這篇文章主要介紹了别的AI还在打游戏，这个AI已经当上“超级马里奥”游戏策划了|GECCO最佳论文小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

AI打游戲已經(jīng)不是什么新鮮事了，“沉迷”Dota 2、星際爭霸、LOL的AI一個(gè)接一個(gè)的出現(xiàn)。

但是你也許不知道，相比這些“游戲玩家”AI，還有一位優(yōu)秀的AI，直接當(dāng)起了“游戲策劃”，做的還是膾炙人口的“超級馬里奧”。

超級馬里奧：無限關(guān)卡

這位“策劃大大”誕生在由一個(gè)六位研究者組成的團(tuán)隊(duì)中，成員來自多特蒙德大學(xué)、美國西南大學(xué)、倫敦大學(xué)瑪麗皇后學(xué)院、加利福尼亞大學(xué)及哥本哈根IT大學(xué)，它能用生成對抗網(wǎng)絡(luò)（GAN）自動(dòng)“設(shè)計(jì)”海量的超級馬里奧關(guān)卡。

并且，這個(gè)超級馬里奧關(guān)卡策劃AI還能充分保證新關(guān)卡的可玩性，讓每個(gè)關(guān)卡在開始的時(shí)候都相對簡單，而后逐漸增加難度，保證玩家“沉迷游戲，無法自拔”。

馬里奧策劃AI成長史

馬里奧GAN的工作流程大概長這樣：

△ 馬里奧GAN原理圖
首先，GAN學(xué)習(xí)現(xiàn)有的超級馬里奧關(guān)卡（圖上黃色部分），get到關(guān)卡策劃這一技能后，生成網(wǎng)絡(luò)開始生成關(guān)卡，然后將“作業(yè)”案例提交給判別網(wǎng)絡(luò)，由判別網(wǎng)絡(luò)進(jìn)行把關(guān)，判斷“作業(yè)”是否為一個(gè)合格的馬里奧關(guān)卡。

不合格的“作業(yè)”將被打回去重做，直到這一關(guān)合格為止。

神經(jīng)網(wǎng)絡(luò)如何識別游戲

GAN學(xué)習(xí)的并不是每一關(guān)的畫面，而是用專有符號系統(tǒng)表示的“游戲地圖”。地圖以“方塊”為單位——有金幣的方塊、可以頂碎的磚塊、當(dāng)?shù)鼗拇u塊、管道的磚塊等，游戲地圖中的每個(gè)方塊都有獨(dú)特的表示方式，比如怪物方塊編號為5，用大寫的E來代指。

△ 游戲地圖方塊對照表

這樣，所有的游戲地圖都可以用一個(gè)符號的矩陣來表示，比如，下面這個(gè)游戲地圖中：

我們按照方塊把每個(gè)元素劃分開，并且加以不同的表達(dá)方式：

地板是0，怪物是0，右側(cè)的“山上”可以被頂壞的“天梯”則是1。另外，由于管道占了不只一個(gè)方塊，所以管道口的左右半截分別用單引號代指，用6、7表示，而管道身體的左右半截用方括號代指，用8、9表示。如果某個(gè)格子是空氣，什么都沒有，則用2表示。

所有的學(xué)習(xí)和生成系統(tǒng)，都是基于這樣的矩陣進(jìn)行的。這套系統(tǒng)又被稱作視頻游戲關(guān)卡語料庫（Video Game Level Corpus，VGLC），每一個(gè)方塊都像圖像處理中的像素一樣，能夠被神經(jīng)網(wǎng)絡(luò)解析或生成。

難度升級大法——LVE

正常的關(guān)卡游戲都有一個(gè)特點(diǎn)——每一關(guān)都比前面那一關(guān)難一點(diǎn)。

超級馬里奧也不例外。人類游戲策劃可以控制每一關(guān)的大致難度，但AI怎么控制呢？這要倚仗**潛變量進(jìn)化（latent variable evolution，LVE）的方法。

LVE由紐約大學(xué)的Philip Bontrager等人在2017年提出，具體可以跳轉(zhuǎn)arXiv：1705.07386。

在LVE的幫助下，機(jī)器可以生成越來越難的關(guān)卡，比如，像下面這張圖一樣（關(guān)卡略長，請把手機(jī)橫過來看）：

像這樣，從開頭的“一馬平川”到出現(xiàn)管道、山溝、山丘和怪物，直到怪物密布、溝壑縱橫，整個(gè)過程是越來越難的。

送進(jìn)DCGAN訓(xùn)練

訓(xùn)練的過程使用的是深度卷積生成對抗網(wǎng)絡(luò)（Deep Convolutional GAN，DCGAN），使用WGAN算法進(jìn)行訓(xùn)練。

△ DCGAN生成網(wǎng)絡(luò)構(gòu)架

△ DCGAN判別網(wǎng)絡(luò)構(gòu)架

然而，生成結(jié)果并不100%完美

訓(xùn)練后的GAN生成的結(jié)果究竟如何呢？

好壞參半。

有的部分歲月靜好，除了個(gè)別小困難之外，玩家可以輕松通過：

但是，也有下面這種奇葩地形，蜀道之難難于上青天啊！

甚至還會(huì)出現(xiàn)讓人退游的神秘管道：

請問管子君是異次元穿越來的嘛？

沒辦法，GAN一直都是這么皮。所以，研究者們還準(zhǔn)備做進(jìn)一步的優(yōu)化，以期待在未來可以讓GAN生成永遠(yuǎn)玩不完的超級馬里奧。

不完美，一樣拿獎(jiǎng)

雖然馬里奧GAN的生成結(jié)果并不完美，但這并不妨礙它拿獎(jiǎng)啊。

畢竟，在人類用計(jì)算機(jī)生成馬里奧游戲關(guān)卡的歷史上，這可是個(gè)巨大突破呢。

馬里奧AI錦標(biāo)賽（http://www.marioai.org/）是一個(gè)在2009-2012年期間舉辦過幾屆的比賽，專門生成馬里奧關(guān)卡。在這項(xiàng)賽事中，雖然科學(xué)家們一直致力于創(chuàng)造出最好的自動(dòng)生成馬里奧關(guān)卡的算法，但實(shí)際絕大多數(shù)時(shí)候，參賽者依然需要手動(dòng)設(shè)置一些參數(shù)。

而GAN興起后，AI生成馬里奧關(guān)卡再也不需要進(jìn)行任何手動(dòng)了，程序員們可以和手動(dòng)設(shè)置參數(shù)說bye-bye了。

因此，這篇論文也拿到了GECCO 2018的最佳論文。

傳送門全家桶

馬里奧GAN已經(jīng)開源，量子位照例附上arXiv和github地址，歡迎自取~

論文：Evolving Mario Levels in the Latent Space of a Deep Convolutional Generative Adversarial Network
作者：Vanessa Volz, Jacob Schrum, Jialin Liu, Simon M. Lucas, Adam Smith, Sebastian Risi
GECCO 2018 Best Paper Award
arXiv:
https://arxiv.org/abs/1805.00728
data:
https://github.com/TheVGLC/TheVGLC
github:
https://github.com/TheHedgeify/DagstuhlGAN

原文發(fā)布時(shí)間為：2018-07-27
本文來自云棲社區(qū)合作伙伴“量子位”，了解相關(guān)信息可以關(guān)注“量子位”。

總結(jié)

以上是生活随笔為你收集整理的别的AI还在打游戏，这个AI已经当上“超级马里奥”游戏策划了|GECCO最佳论文的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： django redirect传递参数_
下一篇： AI研究的盲点：无解的神经网络内在逻辑