NPC有靈魂了嗎?大語(yǔ)言模型與智能體設(shè)計(jì)的新進(jìn)展
游戲帶來(lái)的獨(dú)特體驗(yàn)在于讓人沉浸在一個(gè)引人入勝的世界與故事中,并讓人經(jīng)歷一段與眾不同的旅途。其中的情節(jié)與世界觀又往往通過(guò)玩家與NPC的互動(dòng)一點(diǎn)一點(diǎn)展開(kāi)。然而,無(wú)論NPC有多生動(dòng),程序設(shè)置的本質(zhì)終會(huì)提醒我們:你面前的并非某個(gè)角色,而是游戲制作者。
(資料圖片僅供參考)
因此,許多玩家渴望一個(gè)開(kāi)放世界,到處是與人類無(wú)異的智能NPC,如《西部世界》或《刀劍神域》中那般。在AI技術(shù)跳躍式發(fā)展的2023年,我們似乎能看到一些雛形與嘗試。
《瑞克和莫蒂》中的電池宇宙
斯坦福和Google的研究團(tuán)隊(duì)近期設(shè)計(jì)了一個(gè)實(shí)驗(yàn)并發(fā)表了論文,目的是驗(yàn)證AI是否已經(jīng)達(dá)到可以模擬人類復(fù)雜社交互動(dòng)的程度。
自由聊天?不,是虛擬生活
在實(shí)驗(yàn)中,研究人員創(chuàng)建了25個(gè)AI虛擬角色,每個(gè)角色都設(shè)定了獨(dú)特的個(gè)人信息,包括姓名、職業(yè)、人生目標(biāo)等,這些AI角色被置入一個(gè)小鎮(zhèn)中?;诖笳Z(yǔ)言模型技術(shù),這個(gè)虛擬小鎮(zhèn)上的AI能夠進(jìn)行日常生活對(duì)話,對(duì)環(huán)境進(jìn)行交互。雖然并不完美,但已為其在更真實(shí)場(chǎng)景下模擬人類豐富社交提供了基礎(chǔ)。
它們能自發(fā)產(chǎn)生話題,傳播信息,就公共事務(wù)形成不同觀點(diǎn)。在實(shí)驗(yàn)的虛擬小鎮(zhèn)環(huán)境下,AI角色Sam宣布要競(jìng)選市長(zhǎng),這一信息很快在其他AI角色之間傳播開(kāi)來(lái)。其中,Tom表示支持Sam的決定,因?yàn)镾am一直致力于小區(qū)工作,可以為小區(qū)發(fā)展作出新貢獻(xiàn)。Tom后來(lái)與John討論Sam的選舉勝算,兩人都預(yù)期Sam會(huì)成功當(dāng)選。
Sam要競(jìng)選市長(zhǎng)的消息成為虛擬小鎮(zhèn)的熱門話題,一些AI角色表示支持,一些則持觀望態(tài)度。盡管AI角色的對(duì)話并不總是自然流暢,但能在一定程度上模擬人類社會(huì)關(guān)系的復(fù)雜性,實(shí)現(xiàn)信息的有效傳播和討論,形成不同的立場(chǎng)和態(tài)度。
在虛擬小鎮(zhèn)實(shí)驗(yàn)中,AI角色I(xiàn)sabella的初始設(shè)定是需要在情人節(jié)舉行一個(gè)派對(duì)。Isabella在咖啡館工作,她逢人便邀請(qǐng)其他AI角色參加她的派對(duì)。Isabella的女兒Maria也邀請(qǐng)她暗戀的對(duì)象Klaus來(lái)參加。除Isabella舉辦派對(duì)和Maria暗戀Klaus的初始設(shè)定外,其他行為如傳播派對(duì)信息、布置派對(duì)場(chǎng)地、邀請(qǐng)其他人等完全由AI自主完成。
在NPC的八卦下,最終有12個(gè)AI角色知曉這個(gè)派對(duì)信息,但只有5個(gè)角色實(shí)際出席,包括這對(duì)相互暗戀的角色Maria和Klaus。其他7個(gè)AI角色沒(méi)有出席,研究人員后來(lái)分析了他們的理由,有4個(gè)原本表示有興趣但沒(méi)來(lái),另外3個(gè)找了其他的理由。這里AI展現(xiàn)出一定的觀察力和反思能力,可以在一定程度上解釋角色放鴿子的理由。
NPC是如何有靈魂的?
那么研究團(tuán)隊(duì)具體是如何讓這些NPC看起來(lái)更“人性化”的呢?他們制定了一種智能體架構(gòu)來(lái)檢索記憶,動(dòng)態(tài)地更新他們過(guò)去的經(jīng)驗(yàn),并將其與智能體的上下文和計(jì)劃結(jié)合,這些經(jīng)驗(yàn)、上下文和計(jì)劃可能相互加強(qiáng)或相互矛盾。整個(gè)架構(gòu)有三個(gè)主要的組件:記憶、計(jì)劃和反思。每個(gè)組件負(fù)責(zé)執(zhí)行特定的功能。
在記憶與檢索的方法中,記憶流將智能體當(dāng)前的經(jīng)歷和觀察提供給語(yǔ)言模型,語(yǔ)言模型據(jù)此可以輸出更加符合人類行為的指令與內(nèi)容。檢索功能則會(huì)根據(jù)不同的情況進(jìn)行選擇,如最近訪問(wèn)的事件以及事件的重要性與相關(guān)性。這些方法有助于語(yǔ)言模型選擇與當(dāng)前情況相關(guān)且重要的記憶,讓智能體的反應(yīng)更加連貫和具體。
計(jì)劃描述了智能體未來(lái)的行動(dòng)序列,并幫助智能體的行為隨時(shí)間保持一致。一個(gè)計(jì)劃包括位置、開(kāi)始時(shí)間和持續(xù)時(shí)間。例如,快到截止日期時(shí),Klaus可能選擇把一天時(shí)間花在桌前起草研究論文。
反思則是一種更高級(jí)別的記憶,可以回顧記憶和做出更高層次的推理。當(dāng)智能體對(duì)事件的感知達(dá)到一定閾值時(shí)就會(huì)進(jìn)行反思,根據(jù)智能體近期經(jīng)歷提出的問(wèn)題,然后,語(yǔ)言模型進(jìn)行回答并引用相關(guān)記憶作為證據(jù)。問(wèn)Klaus最想與誰(shuí)在一起,他選擇Maria而不是與他互動(dòng)最頻繁的人,因?yàn)镵laus熱衷學(xué)術(shù)研究,而Maria也總是在做學(xué)術(shù)研究。
最后,研究者還讓25名人類參與者來(lái)評(píng)估不同類型的智能體在人性方面的可信度。結(jié)果顯示,生成式智能體雖然在語(yǔ)言產(chǎn)生方面達(dá)到較高水平,但在理解和生成非語(yǔ)言信息方面,如個(gè)性、情感和社交性等方面,其水平還不及人類。自然語(yǔ)言模型在非語(yǔ)言的理解與生成方面存在局限,而如何解決與克服這一局限也是未來(lái)研究的方向。
大語(yǔ)言模型會(huì)顛覆傳統(tǒng)AI嗎?
在以往的游戲中,虛擬世界中的角色時(shí)有真實(shí)之感,這歸因于游戲創(chuàng)作者在游戲性與故事性之間的完美平衡,以及玩家在游戲中同人物與環(huán)境互動(dòng)的沉浸感。
我們也能實(shí)際體驗(yàn)到游戲中NPC的智能化?!痘囊按箸S客2》里NPC會(huì)記得玩家曾經(jīng)幫他吸出過(guò)蛇毒,再次相遇時(shí)會(huì)給予感恩和回報(bào)?!段讕?》開(kāi)場(chǎng)支線任務(wù)里的NPC會(huì)欺騙并利用并玩家的善良來(lái)達(dá)到自己的目的。但這些游戲一般采用編寫AI行為的方法來(lái)與玩家展開(kāi)互動(dòng)性敘事,如有限狀態(tài)機(jī)和行為樹(shù)等。
當(dāng)人們說(shuō)AI會(huì)取代人類時(shí)網(wǎng)友就會(huì)掏出這張圖
雖然它們可以處理基本的社交互動(dòng),但不可能完全涵蓋開(kāi)放世界中所有可能的互動(dòng)行為范圍??紤]到制作人員的工作量和效率,這些方法通常簡(jiǎn)化了環(huán)境或行為的維度,尚未解決在開(kāi)放世界中可信智能體的問(wèn)題。
較為開(kāi)放的沙盒游戲如《矮人要塞》和《環(huán)世界》是敘事過(guò)程生成技術(shù)的典范。里面每個(gè)NPC都在編寫自己的個(gè)人歷史,細(xì)看卻發(fā)現(xiàn)某些事件之間還是缺乏關(guān)聯(lián)性和邏輯性。
使用機(jī)器算法訓(xùn)練的AI往往出現(xiàn)在那些易于定義獎(jiǎng)勵(lì)的對(duì)抗游戲中,這些獎(jiǎng)勵(lì)可以被學(xué)習(xí)算法優(yōu)化。這種方式設(shè)計(jì)出的AI非常智能,在某些方面甚至超越人類,如星際爭(zhēng)霸戰(zhàn)中的Alpha Star和Dota 2中的Rerun能擊敗職業(yè)選手。
可以看出,傳統(tǒng)的基于狀態(tài)機(jī)、行為樹(shù)的而設(shè)計(jì)的AI和較近的基于深度學(xué)習(xí)設(shè)計(jì)的AI在游戲中都有各自典型的運(yùn)用。斯坦福大學(xué)的這個(gè)研究項(xiàng)目巧妙地向我們展示了如何將GPT-3.5這種基于深度學(xué)習(xí)的大語(yǔ)言模型融入游戲之中。現(xiàn)在,讓游戲中的AI與玩家直接對(duì)話也不是什么新鮮事了。
一款使用大語(yǔ)言模型的游戲《Origins》就曾有玩家上傳了游戲?qū)崣C(jī)體驗(yàn)視頻。就目前的演示來(lái)看,玩家可以直接與游戲內(nèi)NPC對(duì)話,去詢問(wèn)證人找出事件真相。玩家分別與清潔機(jī)器人和人類進(jìn)行了對(duì)話,與機(jī)器人的對(duì)話較為流暢,但人類這邊的語(yǔ)調(diào)和表情就“機(jī)械感”十足,相當(dāng)違和。
《輻射4》近期也出現(xiàn)了一款可以為游戲自動(dòng)生成對(duì)話和全程配音的Mod。目前該Mod為游戲添加300多條全新對(duì)話,在一定程度上解決《輻射4》“對(duì)話輪系統(tǒng)”的限制, “對(duì)話輪系統(tǒng)”只提供了四種選項(xiàng),限制了玩家的自由度。AI生成的聲音已經(jīng)與原聲非常相近,但目前聽(tīng)起來(lái)還是略微“缺乏感情”。
SE免費(fèi)新作《SE AI技術(shù)預(yù)覽:港口鎮(zhèn)連續(xù)殺人事件》一經(jīng)推出就“特別差評(píng)”,好評(píng)率不足10%。據(jù)介紹,這款游戲運(yùn)用多種AI技術(shù),自然語(yǔ)言處理(NLP)、自然語(yǔ)言理解(NLU)、語(yǔ)音轉(zhuǎn)文字(STT)等。實(shí)際體驗(yàn)下來(lái)所謂的自由對(duì)話就是純噱頭,只有在提到某些觸發(fā)詞或關(guān)鍵詞時(shí),NPC才會(huì)生成實(shí)質(zhì)性的、有價(jià)值的對(duì)話。
連自己內(nèi)褲的顏色都不知道?
當(dāng)然運(yùn)用這項(xiàng)技術(shù)的游戲遠(yuǎn)不止這些,在實(shí)際體驗(yàn)中也能夠明顯地感受到這項(xiàng)技術(shù)中瑕疵的、機(jī)械化的一面。
即使是當(dāng)今最強(qiáng)大的語(yǔ)言模型GPT-4,其本質(zhì)更多的是一個(gè)統(tǒng)計(jì)學(xué)原理的概率模型,它的出發(fā)點(diǎn)并不是邏輯和語(yǔ)義?!澳魏伪救藳](méi)文化,一句臥槽行天下?!痹谌粘I钪?,語(yǔ)言與行為活動(dòng)密不可分,只言片語(yǔ)就能表達(dá)豐富的涵義。哲學(xué)家維特根斯坦的“語(yǔ)言游戲”就說(shuō)明了這點(diǎn),深究語(yǔ)言的本質(zhì)只會(huì)走入死胡同,語(yǔ)言的使用比語(yǔ)法更重要,我們需要考慮實(shí)際的應(yīng)用場(chǎng)景。
而到了算力有限,系統(tǒng)交互同樣復(fù)雜的游戲中,目前的AI在游戲上還是有點(diǎn)捉襟見(jiàn)肘了,它們無(wú)法理解語(yǔ)言符號(hào)和非語(yǔ)言符號(hào)的關(guān)聯(lián)。就目前來(lái)看,利用AI技術(shù)縮減游戲開(kāi)發(fā)中的重復(fù)性工作和流程,游戲開(kāi)發(fā)商投入更多成本和資源到游戲內(nèi)容和體驗(yàn)本身的開(kāi)發(fā)上,這可能是一條更加符合實(shí)際需求和發(fā)展趨勢(shì)的道路。至于未來(lái),我們不妨大膽展望,西部世界在有生之年或許能夠?qū)崿F(xiàn)。畢竟世界上第一架飛機(jī)只飛行了36.6米,而短短六十年,人們就可以在云端俯瞰生靈,宣告頭頂并沒(méi)有什么上帝。
標(biāo)簽:
- 信陽(yáng)市中招考試時(shí)間 信陽(yáng)市83929名考生(僅指九年級(jí)考生)報(bào)考 全球觀焦點(diǎn)
- 環(huán)球時(shí)訊:分紅轉(zhuǎn)股對(duì)上市公司有什么影響?分紅轉(zhuǎn)股后自己的股票數(shù)有什么變化?
- 端午假期天津重點(diǎn)商貿(mào)流通企業(yè)銷售超9億元同比增長(zhǎng)38.1%|焦點(diǎn)信息
- 今日觀點(diǎn)!醫(yī)保怎么交費(fèi)?城鄉(xiāng)醫(yī)保怎么交費(fèi)?醫(yī)保忘了交費(fèi)能補(bǔ)交嗎?
- 世界今頭條!無(wú)繩電話輻射大嗎?無(wú)繩電話通話距離是多少米?
- 無(wú)繩電話輻射大嗎?無(wú)繩電話一般在多少米范圍內(nèi)有效?-速看
- 環(huán)球熱消息:突發(fā)!又一名中行高管被查,已退休數(shù)年
- 環(huán)球?qū)崟r(shí):電腦玩dnf沒(méi)有聲音是什么問(wèn)題?dnf進(jìn)游戲沒(méi)聲音怎么辦?
- 股指期貨仿真交易軟件有哪些?股指期貨交易規(guī)則有什么?|焦點(diǎn)熱門
- 基金凈值為什么會(huì)暴跌?基金的巨額贖回會(huì)有什么影響?
- 股票為什么會(huì)跌破發(fā)行價(jià)?LPR機(jī)制改革對(duì)股市有沒(méi)有影響?|最新消息
- 為什么設(shè)立基金定投止盈點(diǎn) 寶盈新銳靈活混A的綜合分析
- 焦點(diǎn)訊息:一般水庫(kù)搬遷賠多少錢?國(guó)有劃撥土地是否有拆遷補(bǔ)償?
- 觀天下!科創(chuàng)板解禁時(shí)間是多久 科創(chuàng)板解禁是利空嗎?
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)品組合縮減策略的優(yōu)點(diǎn)有什么?
- 熱點(diǎn)在線丨個(gè)人所得稅是交百分之多少?勞務(wù)報(bào)酬個(gè)人所得稅稅率是多少?
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶粉是國(guó)產(chǎn)還是進(jìn)口?
- 全球熱文:股東退出的主要方式有哪些?股東退出需要什么手續(xù)?
- 信用卡風(fēng)控是什么意思?信用卡風(fēng)控多久可以恢復(fù)?
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關(guān)閉軟驅(qū)?華碩bios怎么關(guān)閉軟驅(qū)?
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息越來(lái)越低?
- keynote文字怎么添加火花穿過(guò)的動(dòng)畫效果?keynote怎么制作放大動(dòng)畫?
- 股票大單壓盤是什么意思?大單壓盤是要漲還是要跌?|全球快播
- 【全球快播報(bào)】紅色痘痘涂什么藥膏?推薦祛痘效果好的產(chǎn)品2023!
- 基金收益的計(jì)算公式是什么?基金當(dāng)天賣出收益如何算?|世界即時(shí)
- 為什么本科學(xué)校有??????苿?shì)力比較強(qiáng)的大學(xué)有哪些?
- 【新視野】票面利率計(jì)算公式是什么?票面利率怎么算?
- 普通家庭買車什么價(jià)位合適?普通家庭有必要買20萬(wàn)的車嗎?-最新消息
- 【速看料】公司退市之后還能重新上市嗎?股票退市我的持倉(cāng)沒(méi)了?
- 信陽(yáng)市中招考試時(shí)間 信陽(yáng)市83929名考生(
- 環(huán)球時(shí)訊:分紅轉(zhuǎn)股對(duì)上市公司有什么影響?
- 端午假期天津重點(diǎn)商貿(mào)流通企業(yè)銷售超9億元
- 今日觀點(diǎn)!醫(yī)保怎么交費(fèi)?城鄉(xiāng)醫(yī)保怎么交費(fèi)
- 世界今頭條!無(wú)繩電話輻射大嗎?無(wú)繩電話通
- 無(wú)繩電話輻射大嗎?無(wú)繩電話一般在多少米范
- 環(huán)球熱消息:突發(fā)!又一名中行高管被查,已
- 環(huán)球?qū)崟r(shí):電腦玩dnf沒(méi)有聲音是什么問(wèn)題?d
- 股指期貨仿真交易軟件有哪些?股指期貨交易
- 基金凈值為什么會(huì)暴跌?基金的巨額贖回會(huì)有
- 股票為什么會(huì)跌破發(fā)行價(jià)?LPR機(jī)制改革對(duì)股
- 為什么設(shè)立基金定投止盈點(diǎn) 寶盈新銳靈活混
- 焦點(diǎn)訊息:一般水庫(kù)搬遷賠多少錢?國(guó)有劃撥
- 觀天下!科創(chuàng)板解禁時(shí)間是多久
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)
- 熱點(diǎn)在線丨個(gè)人所得稅是交百分之多少?勞務(wù)
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶
- 全球熱文:股東退出的主要方式有哪些?股東
- 信用卡風(fēng)控是什么意思?信用卡風(fēng)控多久可以
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關(guān)閉軟驅(qū)?華碩bios怎么關(guān)閉
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息
- keynote文字怎么添加火花穿過(guò)的動(dòng)畫效果?k
- 股票大單壓盤是什么意思?大單壓盤是要漲還
- 【全球快播報(bào)】紅色痘痘涂什么藥膏?推薦祛
- 基金收益的計(jì)算公式是什么?基金當(dāng)天賣出收
- 為什么本科學(xué)校有??????苿?shì)力比較強(qiáng)的
- 【新視野】票面利率計(jì)算公式是什么?票面利
- 普通家庭買車什么價(jià)位合適?普通家庭有必要
- 【速看料】公司退市之后還能重新上市嗎?股