由25個(gè)AI智能體組成的虛擬小鎮(zhèn),會(huì)產(chǎn)生自由意志嗎?|世界熱議

發(fā)布時(shí)間:2023-04-16 22:19:46
編輯:
來(lái)源:網(wǎng)易游戲
字體:

臨近情人節(jié),生活在名為“Smallville”小鎮(zhèn)上的咖啡店長(zhǎng)伊莎貝拉試圖舉辦一場(chǎng)情人節(jié)派對(duì),她邀請(qǐng)了自己的閨蜜瑪利亞一起布置派對(duì),而瑪利亞得知有這么一場(chǎng)派對(duì)后,偷偷邀請(qǐng)了暗戀對(duì)象克勞斯一同前往……

在小鎮(zhèn)的同一時(shí)間線上,年近六旬的湯姆對(duì)小鎮(zhèn)即將舉辦的市長(zhǎng)選舉有著強(qiáng)烈的興趣,作為一名對(duì)政治格外關(guān)心的已婚中年男人,他拒絕了伊莎貝拉的情人節(jié)派對(duì)邀請(qǐng)。


【資料圖】

以上情節(jié)并未發(fā)生在現(xiàn)實(shí)世界,但也不是人類編造的虛構(gòu)劇情,它來(lái)自一個(gè)由25名AI組成的虛擬小鎮(zhèn)。而這個(gè)小鎮(zhèn)上發(fā)生的任何事件,都是AI之間通過(guò)互動(dòng)隨機(jī)生成的結(jié)果,目前這個(gè)小鎮(zhèn)已經(jīng)井井有條地運(yùn)轉(zhuǎn)了兩天。

如果你玩過(guò)諸如GTA、荒野大鏢客這樣的開(kāi)放世界游戲,應(yīng)該知道即使游戲盡力營(yíng)造出了“真實(shí)世界”的感覺(jué),但其中的劇情、事件、NPC的動(dòng)作和語(yǔ)言皆是制作組預(yù)先設(shè)置好的內(nèi)容,它們會(huì)按照既定的邏輯依次觸發(fā),有自己固定的行動(dòng)軌跡,除非出現(xiàn)bug,否則絕不會(huì)有“意料外”的場(chǎng)面。

而最近,來(lái)自斯坦福大學(xué)以及谷歌的人工智能研究團(tuán)隊(duì)創(chuàng)造了一個(gè)完全由AI主導(dǎo)的虛擬世界——“Smallville”,世界存在的25位居民均由AI控制,在設(shè)置好了基礎(chǔ)的建筑設(shè)施,人物性格后,研究人員便不再插手。

在已給出的小鎮(zhèn)Demo中,我們可以通過(guò)上帝視角觀察每一位小鎮(zhèn)居民正在或者試圖進(jìn)行的活動(dòng),比如有人正在廚房里準(zhǔn)備晚餐,有人正在準(zhǔn)備選舉材料,有人則跟朋友針對(duì)“藝術(shù)”話題侃侃而談……

在這個(gè)自帶時(shí)間的虛擬世界里,你會(huì)發(fā)現(xiàn)居民都嚴(yán)格遵循自己的生活習(xí)慣,比如在清晨6點(diǎn)左右,多數(shù)人物都還在睡夢(mèng)中,但咖啡店主伊莎貝拉就必須早起收拾店鋪;而課業(yè)繁重的大學(xué)生舒爾茨則來(lái)到了圖書(shū)館復(fù)習(xí)功課。

你可以查看每名角色的年齡、身份、位置甚至是視野范圍

每名虛擬角色雖然會(huì)遵守最初設(shè)定好的動(dòng)機(jī)和行動(dòng)路線,但在各自的行程里,必然會(huì)和其他角色偶遇,于是奇妙的化學(xué)反應(yīng)就發(fā)生了。

由于遵循“舉辦情人節(jié)派對(duì)”的初始動(dòng)機(jī),伊莎貝拉會(huì)主動(dòng)跟偶遇的角色交談,并邀請(qǐng)他們加入派對(duì),而當(dāng)她邀請(qǐng)好友瑪利亞時(shí),處于暗戀狀態(tài)的瑪利亞立即想到可以邀請(qǐng)暗戀對(duì)象并以此拉近關(guān)系。

但并不是所有角色都會(huì)賣這個(gè)面子,把生活重心放在選舉活動(dòng)上的老湯姆果斷拒絕了派對(duì)邀請(qǐng),并且順便和伊莎貝拉探討了相關(guān)的政治話題。

最終,小鎮(zhèn)上有5名角色出席了這場(chǎng)情人節(jié)派對(duì),其中就包括了瑪利亞的暗戀對(duì)象克勞斯。

派對(duì)上,兩人也非常自然地坐到了一起

在上述的這個(gè)例子中,研究人員只會(huì)給角色提供最基本的性格和人物設(shè)定,比如僅僅給伊莎貝拉加入了“開(kāi)派對(duì)”的想法,至于如何開(kāi)派對(duì)、邀請(qǐng)誰(shuí)參與、怎么跟其他角色互動(dòng),都是由角色自行決定的,所以就算是研究人員,也預(yù)料不到小鎮(zhèn)上的故事將會(huì)如何發(fā)展。

而目前看來(lái),虛擬小人的行為邏輯看上去都很正常。為了評(píng)估AI的還原程度,研究人員還設(shè)置了一個(gè)由25名真人參與的對(duì)照組小鎮(zhèn),結(jié)果不知情的評(píng)估小組多數(shù)認(rèn)為,AI給出的反應(yīng)和行為更像人類。

而這種在現(xiàn)實(shí)里尋常的行動(dòng)邏輯,如果放在一個(gè)完全由AI掌控的虛擬世界中,其實(shí)想要實(shí)現(xiàn)有很大的難度。

根據(jù)斯坦福研究小組發(fā)布的論文,其中存在的一個(gè)要點(diǎn)可以概括為“信息的流動(dòng)”——最初產(chǎn)生“派對(duì)”想法的人只有伊莎貝拉,但到最后,小鎮(zhèn)上多數(shù)居民都獲得了“舉辦派對(duì)”這一信息并采取了相應(yīng)行動(dòng)。

這就代表人物能夠理解信息內(nèi)容,信息也會(huì)干預(yù)人物的行為邏輯,AI對(duì)于信息也會(huì)產(chǎn)生相應(yīng)程度的“記憶”。

為了實(shí)現(xiàn)這些功能,研究小組引入了一個(gè)新的概念叫作Generative Agents(生成式智能體)。

Generative Agents能夠展示類似于人類的記憶儲(chǔ)存和檢索能力,對(duì)動(dòng)機(jī)和目標(biāo)的內(nèi)省能力以及規(guī)劃和應(yīng)對(duì)突發(fā)情況的能力,生活在小鎮(zhèn)上的虛擬人物,正是依照這樣的概念生成的。

這么說(shuō)可能有些抽象,但結(jié)合研究小組給出的示意圖,可以理解為小鎮(zhèn)上人物每天遭遇的各種事件,都會(huì)以“記憶流”的形式保留。

從“辦公桌閑置”這種雞毛蒜皮的小事到“某人正在討論市長(zhǎng)選舉活動(dòng)”這樣更重要的大事都會(huì)形成AI人物的記憶流,而AI在不斷接受信息的同時(shí),也會(huì)檢索出有價(jià)值的部分做出反思和計(jì)劃,而檢索的依據(jù)則是每個(gè)人自身設(shè)定好的性格和職業(yè)特點(diǎn)。

最基礎(chǔ)的檢索反思包括:在發(fā)現(xiàn)衛(wèi)生間被占用時(shí),取消前往當(dāng)前衛(wèi)生間的念頭,而更復(fù)雜的實(shí)現(xiàn)效果則能夠影響角色的想法和長(zhǎng)遠(yuǎn)的行為模式。

比如山姆在“參與當(dāng)?shù)卣位顒?dòng)多年”的設(shè)定下,在得知競(jìng)選市長(zhǎng)的活動(dòng)后,立刻決定加入并將這個(gè)計(jì)劃傳遞給了更多認(rèn)識(shí)的角色。

而作為富有正義感且正在撰寫(xiě)社會(huì)學(xué)論文的大學(xué)生克勞斯,當(dāng)他得知山姆的競(jìng)選計(jì)劃后,在反思過(guò)程中產(chǎn)生了一個(gè)新的想法:應(yīng)該記住與山姆合作并朝著促進(jìn)社區(qū)創(chuàng)造力的目標(biāo)前進(jìn)。

正是通過(guò)這種“根據(jù)已有信息總結(jié)出新觀點(diǎn)”的反思邏輯,讓AI控制的角色產(chǎn)生出了更像人類且更不可預(yù)測(cè)的行為模式,因?yàn)橐陨线@些想法的前提是:剛好偶遇了山姆并與他聊天,但如果克勞斯碰到的是其他角色,則很有可能出現(xiàn)完全不同的想法。

這已經(jīng)很符合現(xiàn)實(shí)的邏輯,至于這項(xiàng)技術(shù)的應(yīng)用,如果放到游戲領(lǐng)域,相信多數(shù)玩家都能想到的一點(diǎn)是:在開(kāi)放世界里,生成更多隨機(jī)事件,或者為NPC賦予更符合邏輯的行為,進(jìn)而提升自由度并塑造出一個(gè)更真實(shí)的世界。

上個(gè)月,其實(shí)已經(jīng)有Mod作者為《輻射4》引入了基于ChatGPT制作的對(duì)話Mod,將游戲原本有限的四個(gè)反應(yīng)“疑問(wèn)、諷刺、贊同、拒絕”進(jìn)行了更細(xì)致的拓寬:

目前為游戲拓展了300多條新對(duì)話

不過(guò)由于只是MOD,這樣的拓寬僅僅只停留于表層,并不能真正增加NPC們的行動(dòng)選項(xiàng),因此也不會(huì)產(chǎn)生大家想象中那種“完全由AI驅(qū)動(dòng)的新劇情事件”,但如果將同樣由ChatGpt驅(qū)動(dòng)的“生成式智能體”引入游戲,就很有可能就會(huì)出現(xiàn)那種“制作組預(yù)料之外”的劇情。

前不久,國(guó)內(nèi)超參數(shù)科技公布的Demo“活的長(zhǎng)安城”,其實(shí)也一定程度上實(shí)現(xiàn)了這種效果。比如在那個(gè)Demo里,NPC同樣是由AI控制,會(huì)依照喜好、人設(shè)以及過(guò)去的經(jīng)歷來(lái)對(duì)突發(fā)的某件事做出反應(yīng)。

在這個(gè)Demo里,能影響NPC做出決策的各項(xiàng)指標(biāo)都很直觀地羅列了出來(lái)

雖然Demo呈現(xiàn)的內(nèi)容依舊處于雛形階段,但已經(jīng)有觀眾在評(píng)論區(qū)里表示“但如果算力上來(lái)了,會(huì)涌現(xiàn)出像西部世界那樣的自我意識(shí)嗎?”

恰巧,“涌現(xiàn)能力”(Emergent)也是像ChatGpt一類大型語(yǔ)言模型中很重要的一部分,指的是從設(shè)定好的條件、數(shù)據(jù)中,誕生出更復(fù)雜、更超出意料的內(nèi)容和特征。

在斯坦福大學(xué)的虛擬小鎮(zhèn)研究中,研究人員提出了三種AI能夠產(chǎn)生的涌現(xiàn)行為,分別為信息傳播(角色互相告知信息,讓信息在城鎮(zhèn)中傳播)、關(guān)系記憶(角色能夠回憶起過(guò)去互動(dòng)的記憶)、協(xié)調(diào)(與其他人計(jì)劃某個(gè)行動(dòng))。

單從呈現(xiàn)效果上看,AI控制的角色確實(shí)能完成這幾個(gè)涌現(xiàn)式行為,不過(guò)放在游戲設(shè)計(jì)上,這幾個(gè)能力依舊屬于最基本的要求,畢竟,玩家想要的或許不是一個(gè)絕對(duì)真實(shí)的游戲世界,而是一個(gè)充滿戲劇性、傳奇、冒險(xiǎn)經(jīng)歷的“真實(shí)世界”,而一個(gè)過(guò)于真實(shí)的AI可能并不像大家期望的那么“有意思”。

而在游戲之外,實(shí)驗(yàn)的研究人員則想得更加長(zhǎng)遠(yuǎn),在倫理方面,他們認(rèn)為這項(xiàng)技術(shù)會(huì)讓人類和所謂的生成式智能體建立準(zhǔn)社會(huì)關(guān)系,即使這種關(guān)系并不合適;另外,程序目前也有可能因?yàn)槠渌麊?wèn)題或bug而操作角色給出錯(cuò)誤的行為模式。

這種問(wèn)題如果出現(xiàn),對(duì)于處在觀測(cè)位置的人類來(lái)說(shuō),可能就很難分辨究竟是AI的靈光一現(xiàn),還是單純的系統(tǒng)故障。

記得在四年前,OpenAI團(tuán)隊(duì)也曾提交過(guò)一篇名為《神經(jīng)MMO:一個(gè)人工智能的大型多人游戲環(huán)境》的論文,同樣構(gòu)建了一個(gè)同時(shí)存在數(shù)個(gè)AI的虛擬環(huán)境,但當(dāng)時(shí)這些AI的目標(biāo)僅停留在“生存”這種生物最基礎(chǔ)的需求上。

而誰(shuí)能想到過(guò)了四年,這些模擬社區(qū)中的小人就已經(jīng)在考慮怎么撰寫(xiě)“中產(chǎn)階級(jí)化對(duì)低收入社區(qū)影響”的論文了。

現(xiàn)在看來(lái),對(duì)于AI來(lái)說(shuō),唯一不變的,只有“它們?cè)跁r(shí)時(shí)刻刻改變”本身。

標(biāo)簽:

   原標(biāo)題:由25個(gè)AI智能體組成的虛擬小鎮(zhèn),會(huì)產(chǎn)生自由意志嗎?|世界熱議

>更多相關(guān)文章
最近更新