- +1
人工智能已經(jīng)能制作游戲,游戲AI,也在走出游戲
對(duì)于游戲AI,有兩極化的認(rèn)知。
一種是智能,即在某款游戲中擊敗人類頂級(jí)選手近乎輕而易舉。
另一種則是智障,即在游戲中扮演NPC進(jìn)行互動(dòng)時(shí),往往變成尬聊。
關(guān)于游戲AI的最終幻想應(yīng)該是啥樣,自然不僅僅是能否輕松擊敗人類,而是如2021年那部電影《失控玩家》里所演繹的那樣,游戲里的NPC出現(xiàn)了智慧,以至于萌生出了游戲版的“莊周夢(mèng)蝶”感覺(jué)。

事實(shí)上,互聯(lián)網(wǎng)大廠一直都在夢(mèng)想這樣的顛覆,以至于用在了一年一度的愚人節(jié)玩笑(往往也是自己遠(yuǎn)景戰(zhàn)略的一個(gè)揶揄)。
例如2019年愚人節(jié),英偉達(dá)開(kāi)玩笑的發(fā)布了一款名為GeForce RTX R.O.N.的AI智能游戲助手,號(hào)稱精通十八門(mén)語(yǔ)言,能夠生成全息圖像,生成游戲3D圖形,分析游戲數(shù)據(jù),制定戰(zhàn)術(shù),甚至可以幫你和玩家對(duì)罵……
而這真的只是個(gè)玩笑嗎?

一年后,英偉達(dá)給出了答案。
在經(jīng)典游戲《吃豆人》誕生40周年之際,英偉達(dá)宣布使用5萬(wàn)局游戲訓(xùn)練出的人工智能模型重建了這個(gè)游戲——不用寫(xiě)代碼、不用構(gòu)建游戲引擎渲染圖像,僅僅通過(guò)神經(jīng)網(wǎng)絡(luò)“看”原版《吃豆人》的運(yùn)行狀況,自行理解游戲規(guī)則,最終完成了游戲制作。
這個(gè)游戲真的好嗎?

也許是和英偉達(dá)本身是視覺(jué)處理領(lǐng)域的國(guó)際大佬這個(gè)定位相關(guān),其創(chuàng)建的人工智能的學(xué)習(xí)方式,也不同于遺忘的AI靠吞噬大數(shù)據(jù)進(jìn)行深度學(xué)習(xí),反而選擇了用“看”的方式,不斷的在各種《吃豆人》的游戲視頻里學(xué)習(xí)并推斷其游戲規(guī)則,最終達(dá)成“復(fù)刻”一個(gè)游戲的模仿效果。

話說(shuō)這款游戲,“算”起來(lái)相當(dāng)智能,但“玩”起來(lái)就非常智障了,恰好一肩挑起了兩極化的認(rèn)知。
秘密同樣是英偉達(dá)自己揭開(kāi)的:
由于短時(shí)間生成大量游戲視頻不大現(xiàn)實(shí),因此團(tuán)隊(duì)使用計(jì)算機(jī)來(lái)玩《吃豆人》生成畫(huà)面。
但是,用于模擬玩游戲的AI在游戲中太出色了,讓看視頻的AI被誤導(dǎo),難以理解游戲中“死亡”的概念,所以最初產(chǎn)生的《吃豆人》,游戲中幾乎都不會(huì)輸。

當(dāng)然,后續(xù)發(fā)現(xiàn)問(wèn)題并改進(jìn)后,這款《吃豆人》的復(fù)刻,也就算是向AI的最原初誕生,完美致敬了。
學(xué)習(xí)、改進(jìn)、再學(xué)習(xí),成為了游戲AI和自己在其他領(lǐng)域里AI們共同完善自身智能的必由之路。
但游戲AI還可以做到更多,例如和《失控玩家》一樣從游戲走到現(xiàn)實(shí)中來(lái)。

真當(dāng)互聯(lián)網(wǎng)大廠和游戲公司們做能擊敗人類頂級(jí)玩家的AI,只是一種展示技術(shù)的無(wú)聊事嗎?
答案是否定的,不然真的是有錢(qián)沒(méi)地方燒。
馬化騰就在2021年世界人工智能大會(huì)中說(shuō),要用游戲AI去激發(fā)青年人對(duì)通用AI的研究興趣。
事實(shí)上,互聯(lián)網(wǎng)科技領(lǐng)域正是如此去做的,用游戲AI做一款屬于自己的游戲,實(shí)現(xiàn)自己少年時(shí)的游戲夢(mèng)。

例如Facebook開(kāi)發(fā)的可以和玩家團(tuán)隊(duì)協(xié)作玩紙牌游戲《Hanabi》的AI,其開(kāi)發(fā)者就說(shuō):“我們對(duì)《Hanabi》感興趣的原因并非游戲,而是關(guān)于如何將這些功能構(gòu)建到AI系統(tǒng)中,例如自動(dòng)駕駛汽車(chē)或AI客服,它們需要實(shí)際了解其他人通過(guò)行為與之交互時(shí)的心理狀態(tài)?!?/p>
至于索尼為《GT賽車(chē)》開(kāi)發(fā)的AI駕駛者,則可以更進(jìn)一步:
不僅需要在高速多變的條件下,考慮剎車(chē)、路線、速度、方向等因素,瞬間決定方向盤(pán)的打法和加速方式等多個(gè)決定;同時(shí)也要學(xué)習(xí)駕駛的“禮儀”,在合乎公平競(jìng)爭(zhēng)原則下減少非必要碰撞,以及作為慢車(chē)時(shí)進(jìn)行讓車(chē)。

這個(gè)背后,你能想象的空間就更為巨大了。
在實(shí)際的場(chǎng)景測(cè)試?yán)?,自?dòng)駕駛公司很難創(chuàng)造或者遇到極限場(chǎng)景,比如暴雨+冰雹的復(fù)雜路況,或高速公路上闖入的動(dòng)物及行人等突發(fā)事件,這往往會(huì)造成測(cè)試數(shù)據(jù)的局限。
然而在游戲世界,利用AI技術(shù)的測(cè)試數(shù)據(jù)獲取成本就相對(duì)較低,例如無(wú)限撞車(chē)、持續(xù)過(guò)彎,都可以通過(guò)AI在短時(shí)多次測(cè)試中得到一個(gè)相對(duì)可行的解決路徑。

于是,AI成為虛擬風(fēng)洞里的“運(yùn)動(dòng)員”,在跳出游戲的更多場(chǎng)景里發(fā)揮作用的價(jià)值,也就不再只是戰(zhàn)勝人類這個(gè)小目標(biāo)了。
刊載于《人民郵電報(bào)》2022年4月8日《樂(lè)游記》專欄330期
作者 張書(shū)樂(lè),人民網(wǎng)、人民郵電報(bào)專欄作者,中經(jīng)傳媒智庫(kù)專家,資深產(chǎn)業(yè)評(píng)論人
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




