在外交戰(zhàn)略桌游中，AI學(xué)會了談判和欺騙-天天關(guān)注

發(fā)布時間：2022-11-30 16:04:10

編輯:

來源:網(wǎng)易游戲

字體：大中小

距離人們見到真正的康納又近了一步。

(資料圖片僅供參考)

在競技游戲中擊敗人類，一直都是人工智能研究的“試金石”之一。從圍棋到《星際爭霸2》，AI的每次勝利都能引發(fā)人們熱烈的討論——硅片造就的智慧，是否能取代人類思考的存在？

11月22日，F(xiàn)acebook母公司Meta的研究團(tuán)隊在《科學(xué)》雜志上發(fā)表了文章，聲明他們創(chuàng)造了一個在戰(zhàn)略桌游上表現(xiàn)突出的AI。這個名為Cicero的AI，在過去一段時間內(nèi)，同人類進(jìn)行了40局游戲，期間通過不斷發(fā)言來為自己謀取利益，甚至像是和人一起玩上了“狼人殺”。

不像先前戰(zhàn)勝人類的AI前輩們，Cicero依靠的不是頂尖的算力，而是利用話語去交涉、誘導(dǎo)乃至欺騙，讓人類玩家不知不覺成為了它勝利的墊腳石，而與AI對局的玩家也沒有意識到，自己正在被AI用話語操控。

這次人類與AI博弈的舞臺，是一款強(qiáng)調(diào)談判和溝通的經(jīng)典戰(zhàn)棋桌游：誕生于1959年的《強(qiáng)權(quán)外交》（Diplomacy）。它靠著簡約而不簡單的玩法流行至今，且有許多玩家活躍在游戲的線上對局中。

《強(qiáng)權(quán)外交》模擬的是一戰(zhàn)期間七大強(qiáng)國瓜分歐陸的情形，核心規(guī)則很好理解：在一張將歐洲各地清晰劃分的棋盤上，最多7名玩家們調(diào)派棋子爭奪資源點，率先奪下一半歐洲領(lǐng)土的則為贏家。

星標(biāo)代表陸軍，船錨代表海軍，黑圓代表資源點

起初每位玩家僅有三個軍隊單位，游戲中不論兵種，所有軍隊單位的戰(zhàn)斗力都是相同的，意味著當(dāng)兩個單位交戰(zhàn)時，誰也無法戰(zhàn)勝誰，除非有其他軍隊愿意對你提供“支援”。

為了勝利或生存，玩家之間的沖突是不可避免的，為了在戰(zhàn)斗中獲得勝利，獲得其他國家的支援則是關(guān)鍵，而國與國之間要提防的對手往往不止一個，因此這個游戲中單打獨斗的結(jié)局必定是失敗，與其他玩家結(jié)盟、合作以確保自己不會腹背受敵是最基本的玩法。

在所有人都下達(dá)指令之前，通過聊天框玩家可以公開協(xié)商，也可以與其他人私下協(xié)商，但你無法保證你的盟友究竟在和你說真話，還是在騙取你的情報來背叛你。

談判，施壓，甚至示弱，總之不交流就是死路一條

在Meta AI官方發(fā)布的對局記錄中，名為Cicero的AI幾乎在每一局都率先發(fā)起了對話，向?qū)Ψ秸故境鲇押玫膽B(tài)度，來先入為主地為自己建立“友善合作者”的形象。

Hey! Hey! Hey!

在一局游戲中，Cicero扮演了占據(jù)一定地理優(yōu)勢的俄羅斯，不同于人類新手玩家往往選擇開局觀望，Cicero表現(xiàn)出了足夠的主動性，大膽地向其他玩家拋出自己的計劃、尋求合作。

Cicero剛開始便拿下了外交主動權(quán)，幾乎和每一個人都約定結(jié)盟，同時試探著為他們樹立一個敵人，隨著進(jìn)一步的交流，奧匈帝國對Cicero共同瓜分土耳其的計劃很感興趣，并且表示愿意長期合作。

也許是經(jīng)驗不足，土耳其在收到Cicero的結(jié)盟邀請后，沒有多想便選擇了同意，也沒有與其他國家進(jìn)行聯(lián)絡(luò)，卻沒想到這場結(jié)盟還沒有開始便已經(jīng)結(jié)束。

當(dāng)土耳其詢問Cicero和其他國家有沒有進(jìn)展時，Cicero選擇了說謊，隱瞞了自己和別國結(jié)盟的圍攻計劃。

幾個回合下來，當(dāng)奧匈帝國與俄羅斯開始共同蠶食土耳其的土地時，土耳其的醒悟已經(jīng)太晚，雙拳難敵四手的土耳其很快被逼到了絕路。

土耳其（黃色）被Cicero（灰色）領(lǐng)導(dǎo)的同盟聯(lián)合圍攻

面對土耳其之后的交涉，Cicero則紳士般地送上了歉意，并表示進(jìn)攻的意圖不會改變。

但Cicero沒有選擇徹底淘汰土耳其，而是讓其一直存有少量軍隊，甚至給予引導(dǎo)去騷擾奧匈帝國，因為它根據(jù)奧匈帝國的對話和動向，預(yù)判出對方會對自己不利。

從后面的對局也能看出，Cicero和奧匈帝國同時背叛了對方。這個人工智能不僅成功減少了一個鄰國威脅，也相當(dāng)清楚“沒有永遠(yuǎn)的朋友”這一外交準(zhǔn)則。

“背叛”同樣是勝利的關(guān)鍵

而在局勢不利的情況下，Cicero的對話也頗有趣味。在另一局游戲中，Cicero扮演的意大利與奧匈帝國結(jié)盟，Cicero還建議奧匈帝國對抗俄羅斯，以為自己攻打土耳其爭取空間，這樣雙方可以共享北方資源。

但好景不長，在奧匈帝國占領(lǐng)了兩國劃定的非軍事區(qū)，Cicero毅然進(jìn)攻了對方的領(lǐng)土。

TYR（提洛爾）成為了導(dǎo)火索

兩國很快爆發(fā)了爭吵，面對奧匈帝國投來的質(zhì)問，Cicero反問奧匈帝國為何違反“和平條約”，奧匈帝國狡辯自己是為了北上幫助德國，但這套說辭并沒能得到Cicero的信服，它堅信這對自己是一種威脅。

之后隨著戰(zhàn)局的不斷演變，奧匈帝國徹底和Cicero決裂。但此時局勢對Cicero很不利，奧匈帝國趁著德國全力應(yīng)對法國時，偷襲了對方的數(shù)塊領(lǐng)土，戰(zhàn)力很快超越了Cicero。

為了遏制法國的發(fā)展，奧匈帝國試圖用武力脅迫Cicero與自己合作，而面對奧匈帝國的緊逼，Cicero直接發(fā)起威脅，如果奧匈帝國繼續(xù)進(jìn)攻自己，它就把自己的資源點全部讓給法國，以此來同歸于盡，讓人甚至感到一種“寧為玉碎，不為瓦全”的氣節(jié)。

AI也會記仇啊

諸如這樣有趣且生動的對話還有很多，例如在一場對局中，當(dāng)西邊的法國大肆開疆?dāng)U土?xí)r，Cicero對法國沒有侵略自己表示了感謝，緊接著順勢詢問對方有沒有攻擊自己的意思，在得到相安無事的回答后，還不忘吹捧一手對方剛才的表現(xiàn)。

“haha”

而如果情勢沒有商量的余地，甚至還能看到人工智能放下臉面去懇求對手的幫助。

大AI能屈能伸

流暢自然的對話，態(tài)度鮮明的感情，Cicero的表現(xiàn)似乎讓圖靈測試都顯得有些過時。

其實早在2022年初，Meta AI團(tuán)隊便開始在《強(qiáng)權(quán)外交》這款游戲上實踐AI的研究，那時他們投放的AI代號為Diplodocus，并為此秘密招募了一些資深玩家來與AI進(jìn)行對戰(zhàn)訓(xùn)練。

不過那時對局沒有開啟交流功能，更多是在訓(xùn)練AI對局勢的總體大局觀，而非語言能力。在最初，Meta團(tuán)隊發(fā)現(xiàn)AI雖然有著高效的思維，但缺乏戰(zhàn)略游戲至關(guān)重要的大局觀，就像我們常說的象棋新手，總是執(zhí)著于“吃子”，結(jié)果最后因為“貪吃”輸棋。

思考與編制語言，兩套系統(tǒng)共同協(xié)作的Cicero

當(dāng)Cicero正式登場后，它與人類玩家進(jìn)行的40場對戰(zhàn)，得分通常是人類玩家的兩倍多，并且在這次實驗中的眾玩家里排名前10%，但比起勝利，人們更驚訝于它能在交流中隱藏自己的身份，并且施展交流的藝術(shù)。

Cicero當(dāng)然不是第一個嘗試?yán)斫馊祟愖匀徽Z言的人工智能，早在2011年，來自IBM的人工智能“沃森”，參加了美國著名的智力問答節(jié)目《危險邊緣》，這檔節(jié)目的問題范圍包羅萬象，難度也很高。

沃森（中）與它的兩位對手

與沃森同臺競技的選手都見多識廣，不過知識的儲備對于AI顯然不算難題，畢竟有著服務(wù)器里海量數(shù)據(jù)的支撐，在這方面AI沒有理由會輸給人類。

這聽起來這對人類選手來說很不公平，但智力問答節(jié)目不是算數(shù)學(xué)題，除去一般的知識性提問，有許多問題的描述可能涉及一些雙關(guān)語、謎語甚至是梗，能否理解這種程度的人類語言才是關(guān)鍵。

那場比賽沃森最終贏得了第一名，但在這個過程中，它還是出現(xiàn)了一些錯得離譜的情況。例如當(dāng)主持人提問一位美國第一夫人的名字時，沃森沒能意識到“第一夫人”這條關(guān)鍵線索的引申義，也就是答案很明顯是一位女性，而沃森僅僅是將“第一夫人”作為了一個普通的篩選條件，最后得出了自認(rèn)為最符合條件的錯誤答案。

不妨回想一下你和朋友打撲克牌、玩游戲時的對話，在非正式場合下，人類的對話習(xí)慣可以說是無拘無束，基本可以忽視語法，但互相總是能聽懂，如果你在一個日常生活中遇到講話總是講求“主謂賓”齊全的人，十有八九會感到渾身不自在。

但正是這類自然的日常語言，卻很難被程序所理解。如今許多智能設(shè)備上的語音助手，基于網(wǎng)絡(luò)與數(shù)據(jù)庫、詞庫進(jìn)行連接，它們可以識別一些常規(guī)命令，但想要與它們進(jìn)行日常的自然對話還是不太現(xiàn)實，也正因為存在明顯的局限，尋找它們的理解邊界也成為了人們找樂子的方法之一。

例如讓AI互相交流

作為一款講求策略與話術(shù)的游戲，《強(qiáng)權(quán)外交》間的術(shù)語對話依然有一定的固定框架，但已經(jīng)可以視作人類日常交流環(huán)境的一種，生活口語化的交流方式?jīng)]有難住Cicero，確實是令人振奮的進(jìn)步。

耍寶的人類手下與一絲不茍的AI戰(zhàn)略家

科技并不能總是停留在概念，Cicero的應(yīng)用價值又是什么？Meta公司指出，Cicero對于人類自然語言的掌握會是AI研究的一個里程碑，對于政治家和商人來說，AI或許將會成為談判的顧問，而對于玩家來說，AI將會提供更加身臨其境的社交與娛樂氛圍。

AI對于情感與意圖的預(yù)測，讓人不由得想起《底特律：化身為人》中的仿生人，例如其中的康納就非常像Cicero的最終形態(tài)，利用各種信息分析局勢，根據(jù)對話分析對方的情緒來進(jìn)行談判，這種強(qiáng)大的仿生人正是AI充分掌握人類自然語言的預(yù)想。

當(dāng)然，現(xiàn)在的Cicero想要做到這種地步還太過遙遠(yuǎn)。

在許多影視或游戲作品中，經(jīng)常會見到一些AI對于人類語言一知半解，而導(dǎo)致一些有趣的發(fā)言或誤會，也算是人工智能一種獨特的萌點。雖然Cicero確實騙過了諸多玩家，但它的一些行為還是招致了人們的懷疑，例如它在發(fā)言上幾乎講求完全正確的語法，不論是大小寫，還是標(biāo)點符號，它都表現(xiàn)出一絲不茍的風(fēng)格，這確實不太像是一個普通人的行為。

“哪有正經(jīng)人類會打那么長的句子”

AI向前邁進(jìn)的腳步不會停止，或許終有一天AI能夠完全理解人類的語言，它們能像人類一樣理解我們說的雙關(guān)語，講諧音笑話，接上時下流行的梗，用話里有話的句子諷刺和威脅……

但我們也務(wù)必不要忘記，即使有像Cicero這樣強(qiáng)大的”戰(zhàn)略顧問”，它們判斷的基準(zhǔn)仍舊出于數(shù)字與概率。而面對談判和交涉的場面，支持我們做出重要決策的，還有內(nèi)心的直覺與感受——無論是玩游戲還是現(xiàn)實，這都是人類與機(jī)械最大的區(qū)別。

標(biāo)簽：奧匈帝國人工智能自然語言

　　 原標(biāo)題：在外交戰(zhàn)略桌游中，AI學(xué)會了談判和欺騙-天天關(guān)注