人工智能已經(jīng)能制作游戲，游戲AI，也在走出游戲

2022-12-26 08:28

來源：澎湃新聞·澎湃號·湃客

聽全文

對于游戲AI，有兩極化的認(rèn)知。

一種是智能，即在某款游戲中擊敗人類頂級選手近乎輕而易舉。

另一種則是智障，即在游戲中扮演NPC進(jìn)行互動時，往往變成尬聊。

關(guān)于游戲AI的最終幻想應(yīng)該是啥樣，自然不僅僅是能否輕松擊敗人類，而是如2021年那部電影《失控玩家》里所演繹的那樣，游戲里的NPC出現(xiàn)了智慧，以至于萌生出了游戲版的“莊周夢蝶”感覺。

事實上，互聯(lián)網(wǎng)大廠一直都在夢想這樣的顛覆，以至于用在了一年一度的愚人節(jié)玩笑（往往也是自己遠(yuǎn)景戰(zhàn)略的一個揶揄）。

例如2019年愚人節(jié)，英偉達(dá)開玩笑的發(fā)布了一款名為GeForce RTX R.O.N.的AI智能游戲助手，號稱精通十八門語言，能夠生成全息圖像，生成游戲3D圖形，分析游戲數(shù)據(jù)，制定戰(zhàn)術(shù)，甚至可以幫你和玩家對罵……

而這真的只是個玩笑嗎？

一年后，英偉達(dá)給出了答案。

在經(jīng)典游戲《吃豆人》誕生40周年之際，英偉達(dá)宣布使用5萬局游戲訓(xùn)練出的人工智能模型重建了這個游戲——不用寫代碼、不用構(gòu)建游戲引擎渲染圖像，僅僅通過神經(jīng)網(wǎng)絡(luò)“看”原版《吃豆人》的運行狀況，自行理解游戲規(guī)則，最終完成了游戲制作。

這個游戲真的好嗎？

也許是和英偉達(dá)本身是視覺處理領(lǐng)域的國際大佬這個定位相關(guān)，其創(chuàng)建的人工智能的學(xué)習(xí)方式，也不同于遺忘的AI靠吞噬大數(shù)據(jù)進(jìn)行深度學(xué)習(xí)，反而選擇了用“看”的方式，不斷的在各種《吃豆人》的游戲視頻里學(xué)習(xí)并推斷其游戲規(guī)則，最終達(dá)成“復(fù)刻”一個游戲的模仿效果。

話說這款游戲，“算”起來相當(dāng)智能，但“玩”起來就非常智障了，恰好一肩挑起了兩極化的認(rèn)知。

秘密同樣是英偉達(dá)自己揭開的：

由于短時間生成大量游戲視頻不大現(xiàn)實，因此團(tuán)隊使用計算機來玩《吃豆人》生成畫面。

但是，用于模擬玩游戲的AI在游戲中太出色了，讓看視頻的AI被誤導(dǎo)，難以理解游戲中“死亡”的概念，所以最初產(chǎn)生的《吃豆人》，游戲中幾乎都不會輸。

當(dāng)然，后續(xù)發(fā)現(xiàn)問題并改進(jìn)后，這款《吃豆人》的復(fù)刻，也就算是向AI的最原初誕生，完美致敬了。

學(xué)習(xí)、改進(jìn)、再學(xué)習(xí)，成為了游戲AI和自己在其他領(lǐng)域里AI們共同完善自身智能的必由之路。

但游戲AI還可以做到更多，例如和《失控玩家》一樣從游戲走到現(xiàn)實中來。

真當(dāng)互聯(lián)網(wǎng)大廠和游戲公司們做能擊敗人類頂級玩家的AI，只是一種展示技術(shù)的無聊事嗎？

答案是否定的，不然真的是有錢沒地方燒。

馬化騰就在2021年世界人工智能大會中說，要用游戲AI去激發(fā)青年人對通用AI的研究興趣。

事實上，互聯(lián)網(wǎng)科技領(lǐng)域正是如此去做的，用游戲AI做一款屬于自己的游戲，實現(xiàn)自己少年時的游戲夢。

例如Facebook開發(fā)的可以和玩家團(tuán)隊協(xié)作玩紙牌游戲《Hanabi》的AI，其開發(fā)者就說：“我們對《Hanabi》感興趣的原因并非游戲，而是關(guān)于如何將這些功能構(gòu)建到AI系統(tǒng)中，例如自動駕駛汽車或AI客服，它們需要實際了解其他人通過行為與之交互時的心理狀態(tài)。”

至于索尼為《GT賽車》開發(fā)的AI駕駛者，則可以更進(jìn)一步：

不僅需要在高速多變的條件下，考慮剎車、路線、速度、方向等因素，瞬間決定方向盤的打法和加速方式等多個決定；同時也要學(xué)習(xí)駕駛的“禮儀”，在合乎公平競爭原則下減少非必要碰撞，以及作為慢車時進(jìn)行讓車。