在外交戰(zhàn)略桌游中,AI學會了談判和欺騙-天天關(guān)注

發(fā)布時間:2022-11-30 16:04:10
編輯:
來源:網(wǎng)易游戲
字體:

距離人們見到真正的康納又近了一步。


(資料圖片僅供參考)

在競技游戲中擊敗人類,一直都是人工智能研究的“試金石”之一。從圍棋到《星際爭霸2》,AI的每次勝利都能引發(fā)人們熱烈的討論——硅片造就的智慧,是否能取代人類思考的存在?

11月22日,F(xiàn)acebook母公司Meta的研究團隊在《科學》雜志上發(fā)表了文章,聲明他們創(chuàng)造了一個在戰(zhàn)略桌游上表現(xiàn)突出的AI。這個名為Cicero的AI,在過去一段時間內(nèi),同人類進行了40局游戲,期間通過不斷發(fā)言來為自己謀取利益,甚至像是和人一起玩上了“狼人殺”。

不像先前戰(zhàn)勝人類的AI前輩們,Cicero依靠的不是頂尖的算力,而是利用話語去交涉、誘導乃至欺騙,讓人類玩家不知不覺成為了它勝利的墊腳石,而與AI對局的玩家也沒有意識到,自己正在被AI用話語操控。

1

這次人類與AI博弈的舞臺,是一款強調(diào)談判和溝通的經(jīng)典戰(zhàn)棋桌游:誕生于1959年的《強權(quán)外交》(Diplomacy)。它靠著簡約而不簡單的玩法流行至今,且有許多玩家活躍在游戲的線上對局中。

《強權(quán)外交》模擬的是一戰(zhàn)期間七大強國瓜分歐陸的情形,核心規(guī)則很好理解:在一張將歐洲各地清晰劃分的棋盤上,最多7名玩家們調(diào)派棋子爭奪資源點,率先奪下一半歐洲領(lǐng)土的則為贏家。

星標代表陸軍,船錨代表海軍,黑圓代表資源點

起初每位玩家僅有三個軍隊單位,游戲中不論兵種,所有軍隊單位的戰(zhàn)斗力都是相同的,意味著當兩個單位交戰(zhàn)時,誰也無法戰(zhàn)勝誰,除非有其他軍隊愿意對你提供“支援”。

為了勝利或生存,玩家之間的沖突是不可避免的,為了在戰(zhàn)斗中獲得勝利,獲得其他國家的支援則是關(guān)鍵,而國與國之間要提防的對手往往不止一個,因此這個游戲中單打獨斗的結(jié)局必定是失敗,與其他玩家結(jié)盟、合作以確保自己不會腹背受敵是最基本的玩法。

在所有人都下達指令之前,通過聊天框玩家可以公開協(xié)商,也可以與其他人私下協(xié)商,但你無法保證你的盟友究竟在和你說真話,還是在騙取你的情報來背叛你。

談判,施壓,甚至示弱,總之不交流就是死路一條

在Meta AI官方發(fā)布的對局記錄中,名為Cicero的AI幾乎在每一局都率先發(fā)起了對話,向?qū)Ψ秸故境鲇押玫膽B(tài)度,來先入為主地為自己建立“友善合作者”的形象。

Hey! Hey! Hey!

在一局游戲中,Cicero扮演了占據(jù)一定地理優(yōu)勢的俄羅斯,不同于人類新手玩家往往選擇開局觀望,Cicero表現(xiàn)出了足夠的主動性,大膽地向其他玩家拋出自己的計劃、尋求合作。

Cicero剛開始便拿下了外交主動權(quán),幾乎和每一個人都約定結(jié)盟,同時試探著為他們樹立一個敵人,隨著進一步的交流,奧匈帝國對Cicero共同瓜分土耳其的計劃很感興趣,并且表示愿意長期合作。

也許是經(jīng)驗不足,土耳其在收到Cicero的結(jié)盟邀請后,沒有多想便選擇了同意,也沒有與其他國家進行聯(lián)絡(luò),卻沒想到這場結(jié)盟還沒有開始便已經(jīng)結(jié)束。

當土耳其詢問Cicero和其他國家有沒有進展時,Cicero選擇了說謊,隱瞞了自己和別國結(jié)盟的圍攻計劃。

幾個回合下來,當奧匈帝國與俄羅斯開始共同蠶食土耳其的土地時,土耳其的醒悟已經(jīng)太晚,雙拳難敵四手的土耳其很快被逼到了絕路。

土耳其(黃色)被Cicero(灰色)領(lǐng)導的同盟聯(lián)合圍攻

面對土耳其之后的交涉,Cicero則紳士般地送上了歉意,并表示進攻的意圖不會改變。

但Cicero沒有選擇徹底淘汰土耳其,而是讓其一直存有少量軍隊,甚至給予引導去騷擾奧匈帝國,因為它根據(jù)奧匈帝國的對話和動向,預判出對方會對自己不利。

從后面的對局也能看出,Cicero和奧匈帝國同時背叛了對方。這個人工智能不僅成功減少了一個鄰國威脅,也相當清楚“沒有永遠的朋友”這一外交準則。

“背叛”同樣是勝利的關(guān)鍵

而在局勢不利的情況下,Cicero的對話也頗有趣味。在另一局游戲中,Cicero扮演的意大利與奧匈帝國結(jié)盟,Cicero還建議奧匈帝國對抗俄羅斯,以為自己攻打土耳其爭取空間,這樣雙方可以共享北方資源。

但好景不長,在奧匈帝國占領(lǐng)了兩國劃定的非軍事區(qū),Cicero毅然進攻了對方的領(lǐng)土。

TYR(提洛爾)成為了導火索

兩國很快爆發(fā)了爭吵,面對奧匈帝國投來的質(zhì)問,Cicero反問奧匈帝國為何違反“和平條約”,奧匈帝國狡辯自己是為了北上幫助德國,但這套說辭并沒能得到Cicero的信服,它堅信這對自己是一種威脅。

之后隨著戰(zhàn)局的不斷演變,奧匈帝國徹底和Cicero決裂。但此時局勢對Cicero很不利,奧匈帝國趁著德國全力應(yīng)對法國時,偷襲了對方的數(shù)塊領(lǐng)土,戰(zhàn)力很快超越了Cicero。

為了遏制法國的發(fā)展,奧匈帝國試圖用武力脅迫Cicero與自己合作,而面對奧匈帝國的緊逼,Cicero直接發(fā)起威脅,如果奧匈帝國繼續(xù)進攻自己,它就把自己的資源點全部讓給法國,以此來同歸于盡,讓人甚至感到一種“寧為玉碎,不為瓦全”的氣節(jié)。

AI也會記仇啊

諸如這樣有趣且生動的對話還有很多,例如在一場對局中,當西邊的法國大肆開疆擴土時,Cicero對法國沒有侵略自己表示了感謝,緊接著順勢詢問對方有沒有攻擊自己的意思,在得到相安無事的回答后,還不忘吹捧一手對方剛才的表現(xiàn)。

“haha”

而如果情勢沒有商量的余地,甚至還能看到人工智能放下臉面去懇求對手的幫助。

大AI能屈能伸

流暢自然的對話,態(tài)度鮮明的感情,Cicero的表現(xiàn)似乎讓圖靈測試都顯得有些過時。

2

其實早在2022年初,Meta AI團隊便開始在《強權(quán)外交》這款游戲上實踐AI的研究,那時他們投放的AI代號為Diplodocus,并為此秘密招募了一些資深玩家來與AI進行對戰(zhàn)訓練。

不過那時對局沒有開啟交流功能,更多是在訓練AI對局勢的總體大局觀,而非語言能力。在最初,Meta團隊發(fā)現(xiàn)AI雖然有著高效的思維,但缺乏戰(zhàn)略游戲至關(guān)重要的大局觀,就像我們常說的象棋新手,總是執(zhí)著于“吃子”,結(jié)果最后因為“貪吃”輸棋。

思考與編制語言,兩套系統(tǒng)共同協(xié)作的Cicero

當Cicero正式登場后,它與人類玩家進行的40場對戰(zhàn),得分通常是人類玩家的兩倍多,并且在這次實驗中的眾玩家里排名前10%,但比起勝利,人們更驚訝于它能在交流中隱藏自己的身份,并且施展交流的藝術(shù)。

Cicero當然不是第一個嘗試理解人類自然語言的人工智能,早在2011年,來自IBM的人工智能“沃森”,參加了美國著名的智力問答節(jié)目《危險邊緣》,這檔節(jié)目的問題范圍包羅萬象,難度也很高。

沃森(中)與它的兩位對手

與沃森同臺競技的選手都見多識廣,不過知識的儲備對于AI顯然不算難題,畢竟有著服務(wù)器里海量數(shù)據(jù)的支撐,在這方面AI沒有理由會輸給人類。

這聽起來這對人類選手來說很不公平,但智力問答節(jié)目不是算數(shù)學題,除去一般的知識性提問,有許多問題的描述可能涉及一些雙關(guān)語、謎語甚至是梗,能否理解這種程度的人類語言才是關(guān)鍵。

那場比賽沃森最終贏得了第一名,但在這個過程中,它還是出現(xiàn)了一些錯得離譜的情況。例如當主持人提問一位美國第一夫人的名字時,沃森沒能意識到“第一夫人”這條關(guān)鍵線索的引申義,也就是答案很明顯是一位女性,而沃森僅僅是將“第一夫人”作為了一個普通的篩選條件,最后得出了自認為最符合條件的錯誤答案。

不妨回想一下你和朋友打撲克牌、玩游戲時的對話,在非正式場合下,人類的對話習慣可以說是無拘無束,基本可以忽視語法,但互相總是能聽懂,如果你在一個日常生活中遇到講話總是講求“主謂賓”齊全的人,十有八九會感到渾身不自在。

但正是這類自然的日常語言,卻很難被程序所理解。如今許多智能設(shè)備上的語音助手,基于網(wǎng)絡(luò)與數(shù)據(jù)庫、詞庫進行連接,它們可以識別一些常規(guī)命令,但想要與它們進行日常的自然對話還是不太現(xiàn)實,也正因為存在明顯的局限,尋找它們的理解邊界也成為了人們找樂子的方法之一。

例如讓AI互相交流

作為一款講求策略與話術(shù)的游戲,《強權(quán)外交》間的術(shù)語對話依然有一定的固定框架,但已經(jīng)可以視作人類日常交流環(huán)境的一種,生活口語化的交流方式?jīng)]有難住Cicero,確實是令人振奮的進步。

耍寶的人類手下與一絲不茍的AI戰(zhàn)略家

3

科技并不能總是停留在概念,Cicero的應(yīng)用價值又是什么?Meta公司指出,Cicero對于人類自然語言的掌握會是AI研究的一個里程碑,對于政治家和商人來說,AI或許將會成為談判的顧問,而對于玩家來說,AI將會提供更加身臨其境的社交與娛樂氛圍。

AI對于情感與意圖的預測,讓人不由得想起《底特律:化身為人》中的仿生人,例如其中的康納就非常像Cicero的最終形態(tài),利用各種信息分析局勢,根據(jù)對話分析對方的情緒來進行談判,這種強大的仿生人正是AI充分掌握人類自然語言的預想。

當然,現(xiàn)在的Cicero想要做到這種地步還太過遙遠。

在許多影視或游戲作品中,經(jīng)常會見到一些AI對于人類語言一知半解,而導致一些有趣的發(fā)言或誤會,也算是人工智能一種獨特的萌點。雖然Cicero確實騙過了諸多玩家,但它的一些行為還是招致了人們的懷疑,例如它在發(fā)言上幾乎講求完全正確的語法,不論是大小寫,還是標點符號,它都表現(xiàn)出一絲不茍的風格,這確實不太像是一個普通人的行為。

“哪有正經(jīng)人類會打那么長的句子”

AI向前邁進的腳步不會停止,或許終有一天AI能夠完全理解人類的語言,它們能像人類一樣理解我們說的雙關(guān)語,講諧音笑話,接上時下流行的梗,用話里有話的句子諷刺和威脅……

但我們也務(wù)必不要忘記,即使有像Cicero這樣強大的”戰(zhàn)略顧問”,它們判斷的基準仍舊出于數(shù)字與概率。而面對談判和交涉的場面,支持我們做出重要決策的,還有內(nèi)心的直覺與感受——無論是玩游戲還是現(xiàn)實,這都是人類與機械最大的區(qū)別。

標簽: 奧匈帝國 人工智能 自然語言

   原標題:在外交戰(zhàn)略桌游中,AI學會了談判和欺騙-天天關(guān)注

>更多相關(guān)文章
最近更新