在外交戰(zhàn)略桌游中,AI學會了談判和欺騙-天天關(guān)注
距離人們見到真正的康納又近了一步。
(資料圖片僅供參考)
在競技游戲中擊敗人類,一直都是人工智能研究的“試金石”之一。從圍棋到《星際爭霸2》,AI的每次勝利都能引發(fā)人們熱烈的討論——硅片造就的智慧,是否能取代人類思考的存在?
11月22日,F(xiàn)acebook母公司Meta的研究團隊在《科學》雜志上發(fā)表了文章,聲明他們創(chuàng)造了一個在戰(zhàn)略桌游上表現(xiàn)突出的AI。這個名為Cicero的AI,在過去一段時間內(nèi),同人類進行了40局游戲,期間通過不斷發(fā)言來為自己謀取利益,甚至像是和人一起玩上了“狼人殺”。
不像先前戰(zhàn)勝人類的AI前輩們,Cicero依靠的不是頂尖的算力,而是利用話語去交涉、誘導乃至欺騙,讓人類玩家不知不覺成為了它勝利的墊腳石,而與AI對局的玩家也沒有意識到,自己正在被AI用話語操控。
1
這次人類與AI博弈的舞臺,是一款強調(diào)談判和溝通的經(jīng)典戰(zhàn)棋桌游:誕生于1959年的《強權(quán)外交》(Diplomacy)。它靠著簡約而不簡單的玩法流行至今,且有許多玩家活躍在游戲的線上對局中。
《強權(quán)外交》模擬的是一戰(zhàn)期間七大強國瓜分歐陸的情形,核心規(guī)則很好理解:在一張將歐洲各地清晰劃分的棋盤上,最多7名玩家們調(diào)派棋子爭奪資源點,率先奪下一半歐洲領(lǐng)土的則為贏家。
星標代表陸軍,船錨代表海軍,黑圓代表資源點
起初每位玩家僅有三個軍隊單位,游戲中不論兵種,所有軍隊單位的戰(zhàn)斗力都是相同的,意味著當兩個單位交戰(zhàn)時,誰也無法戰(zhàn)勝誰,除非有其他軍隊愿意對你提供“支援”。
為了勝利或生存,玩家之間的沖突是不可避免的,為了在戰(zhàn)斗中獲得勝利,獲得其他國家的支援則是關(guān)鍵,而國與國之間要提防的對手往往不止一個,因此這個游戲中單打獨斗的結(jié)局必定是失敗,與其他玩家結(jié)盟、合作以確保自己不會腹背受敵是最基本的玩法。
在所有人都下達指令之前,通過聊天框玩家可以公開協(xié)商,也可以與其他人私下協(xié)商,但你無法保證你的盟友究竟在和你說真話,還是在騙取你的情報來背叛你。
談判,施壓,甚至示弱,總之不交流就是死路一條
在Meta AI官方發(fā)布的對局記錄中,名為Cicero的AI幾乎在每一局都率先發(fā)起了對話,向?qū)Ψ秸故境鲇押玫膽B(tài)度,來先入為主地為自己建立“友善合作者”的形象。
Hey! Hey! Hey!
在一局游戲中,Cicero扮演了占據(jù)一定地理優(yōu)勢的俄羅斯,不同于人類新手玩家往往選擇開局觀望,Cicero表現(xiàn)出了足夠的主動性,大膽地向其他玩家拋出自己的計劃、尋求合作。
Cicero剛開始便拿下了外交主動權(quán),幾乎和每一個人都約定結(jié)盟,同時試探著為他們樹立一個敵人,隨著進一步的交流,奧匈帝國對Cicero共同瓜分土耳其的計劃很感興趣,并且表示愿意長期合作。
也許是經(jīng)驗不足,土耳其在收到Cicero的結(jié)盟邀請后,沒有多想便選擇了同意,也沒有與其他國家進行聯(lián)絡(luò),卻沒想到這場結(jié)盟還沒有開始便已經(jīng)結(jié)束。
當土耳其詢問Cicero和其他國家有沒有進展時,Cicero選擇了說謊,隱瞞了自己和別國結(jié)盟的圍攻計劃。
幾個回合下來,當奧匈帝國與俄羅斯開始共同蠶食土耳其的土地時,土耳其的醒悟已經(jīng)太晚,雙拳難敵四手的土耳其很快被逼到了絕路。
土耳其(黃色)被Cicero(灰色)領(lǐng)導的同盟聯(lián)合圍攻
面對土耳其之后的交涉,Cicero則紳士般地送上了歉意,并表示進攻的意圖不會改變。
但Cicero沒有選擇徹底淘汰土耳其,而是讓其一直存有少量軍隊,甚至給予引導去騷擾奧匈帝國,因為它根據(jù)奧匈帝國的對話和動向,預判出對方會對自己不利。
從后面的對局也能看出,Cicero和奧匈帝國同時背叛了對方。這個人工智能不僅成功減少了一個鄰國威脅,也相當清楚“沒有永遠的朋友”這一外交準則。
“背叛”同樣是勝利的關(guān)鍵
而在局勢不利的情況下,Cicero的對話也頗有趣味。在另一局游戲中,Cicero扮演的意大利與奧匈帝國結(jié)盟,Cicero還建議奧匈帝國對抗俄羅斯,以為自己攻打土耳其爭取空間,這樣雙方可以共享北方資源。
但好景不長,在奧匈帝國占領(lǐng)了兩國劃定的非軍事區(qū),Cicero毅然進攻了對方的領(lǐng)土。
TYR(提洛爾)成為了導火索
兩國很快爆發(fā)了爭吵,面對奧匈帝國投來的質(zhì)問,Cicero反問奧匈帝國為何違反“和平條約”,奧匈帝國狡辯自己是為了北上幫助德國,但這套說辭并沒能得到Cicero的信服,它堅信這對自己是一種威脅。
之后隨著戰(zhàn)局的不斷演變,奧匈帝國徹底和Cicero決裂。但此時局勢對Cicero很不利,奧匈帝國趁著德國全力應(yīng)對法國時,偷襲了對方的數(shù)塊領(lǐng)土,戰(zhàn)力很快超越了Cicero。
為了遏制法國的發(fā)展,奧匈帝國試圖用武力脅迫Cicero與自己合作,而面對奧匈帝國的緊逼,Cicero直接發(fā)起威脅,如果奧匈帝國繼續(xù)進攻自己,它就把自己的資源點全部讓給法國,以此來同歸于盡,讓人甚至感到一種“寧為玉碎,不為瓦全”的氣節(jié)。
AI也會記仇啊
諸如這樣有趣且生動的對話還有很多,例如在一場對局中,當西邊的法國大肆開疆擴土時,Cicero對法國沒有侵略自己表示了感謝,緊接著順勢詢問對方有沒有攻擊自己的意思,在得到相安無事的回答后,還不忘吹捧一手對方剛才的表現(xiàn)。
“haha”
而如果情勢沒有商量的余地,甚至還能看到人工智能放下臉面去懇求對手的幫助。
大AI能屈能伸
流暢自然的對話,態(tài)度鮮明的感情,Cicero的表現(xiàn)似乎讓圖靈測試都顯得有些過時。
2
其實早在2022年初,Meta AI團隊便開始在《強權(quán)外交》這款游戲上實踐AI的研究,那時他們投放的AI代號為Diplodocus,并為此秘密招募了一些資深玩家來與AI進行對戰(zhàn)訓練。
不過那時對局沒有開啟交流功能,更多是在訓練AI對局勢的總體大局觀,而非語言能力。在最初,Meta團隊發(fā)現(xiàn)AI雖然有著高效的思維,但缺乏戰(zhàn)略游戲至關(guān)重要的大局觀,就像我們常說的象棋新手,總是執(zhí)著于“吃子”,結(jié)果最后因為“貪吃”輸棋。
思考與編制語言,兩套系統(tǒng)共同協(xié)作的Cicero
當Cicero正式登場后,它與人類玩家進行的40場對戰(zhàn),得分通常是人類玩家的兩倍多,并且在這次實驗中的眾玩家里排名前10%,但比起勝利,人們更驚訝于它能在交流中隱藏自己的身份,并且施展交流的藝術(shù)。
Cicero當然不是第一個嘗試理解人類自然語言的人工智能,早在2011年,來自IBM的人工智能“沃森”,參加了美國著名的智力問答節(jié)目《危險邊緣》,這檔節(jié)目的問題范圍包羅萬象,難度也很高。
沃森(中)與它的兩位對手
與沃森同臺競技的選手都見多識廣,不過知識的儲備對于AI顯然不算難題,畢竟有著服務(wù)器里海量數(shù)據(jù)的支撐,在這方面AI沒有理由會輸給人類。
這聽起來這對人類選手來說很不公平,但智力問答節(jié)目不是算數(shù)學題,除去一般的知識性提問,有許多問題的描述可能涉及一些雙關(guān)語、謎語甚至是梗,能否理解這種程度的人類語言才是關(guān)鍵。
那場比賽沃森最終贏得了第一名,但在這個過程中,它還是出現(xiàn)了一些錯得離譜的情況。例如當主持人提問一位美國第一夫人的名字時,沃森沒能意識到“第一夫人”這條關(guān)鍵線索的引申義,也就是答案很明顯是一位女性,而沃森僅僅是將“第一夫人”作為了一個普通的篩選條件,最后得出了自認為最符合條件的錯誤答案。
不妨回想一下你和朋友打撲克牌、玩游戲時的對話,在非正式場合下,人類的對話習慣可以說是無拘無束,基本可以忽視語法,但互相總是能聽懂,如果你在一個日常生活中遇到講話總是講求“主謂賓”齊全的人,十有八九會感到渾身不自在。
但正是這類自然的日常語言,卻很難被程序所理解。如今許多智能設(shè)備上的語音助手,基于網(wǎng)絡(luò)與數(shù)據(jù)庫、詞庫進行連接,它們可以識別一些常規(guī)命令,但想要與它們進行日常的自然對話還是不太現(xiàn)實,也正因為存在明顯的局限,尋找它們的理解邊界也成為了人們找樂子的方法之一。
例如讓AI互相交流
作為一款講求策略與話術(shù)的游戲,《強權(quán)外交》間的術(shù)語對話依然有一定的固定框架,但已經(jīng)可以視作人類日常交流環(huán)境的一種,生活口語化的交流方式?jīng)]有難住Cicero,確實是令人振奮的進步。
耍寶的人類手下與一絲不茍的AI戰(zhàn)略家
3
科技并不能總是停留在概念,Cicero的應(yīng)用價值又是什么?Meta公司指出,Cicero對于人類自然語言的掌握會是AI研究的一個里程碑,對于政治家和商人來說,AI或許將會成為談判的顧問,而對于玩家來說,AI將會提供更加身臨其境的社交與娛樂氛圍。
AI對于情感與意圖的預測,讓人不由得想起《底特律:化身為人》中的仿生人,例如其中的康納就非常像Cicero的最終形態(tài),利用各種信息分析局勢,根據(jù)對話分析對方的情緒來進行談判,這種強大的仿生人正是AI充分掌握人類自然語言的預想。
當然,現(xiàn)在的Cicero想要做到這種地步還太過遙遠。
在許多影視或游戲作品中,經(jīng)常會見到一些AI對于人類語言一知半解,而導致一些有趣的發(fā)言或誤會,也算是人工智能一種獨特的萌點。雖然Cicero確實騙過了諸多玩家,但它的一些行為還是招致了人們的懷疑,例如它在發(fā)言上幾乎講求完全正確的語法,不論是大小寫,還是標點符號,它都表現(xiàn)出一絲不茍的風格,這確實不太像是一個普通人的行為。
“哪有正經(jīng)人類會打那么長的句子”
AI向前邁進的腳步不會停止,或許終有一天AI能夠完全理解人類的語言,它們能像人類一樣理解我們說的雙關(guān)語,講諧音笑話,接上時下流行的梗,用話里有話的句子諷刺和威脅……
但我們也務(wù)必不要忘記,即使有像Cicero這樣強大的”戰(zhàn)略顧問”,它們判斷的基準仍舊出于數(shù)字與概率。而面對談判和交涉的場面,支持我們做出重要決策的,還有內(nèi)心的直覺與感受——無論是玩游戲還是現(xiàn)實,這都是人類與機械最大的區(qū)別。
- 股票為什么會跌破發(fā)行價?LPR機制改革對股市有沒有影響?|最新消息
- 為什么設(shè)立基金定投止盈點 寶盈新銳靈活混A的綜合分析
- 焦點訊息:一般水庫搬遷賠多少錢?國有劃撥土地是否有拆遷補償?
- 觀天下!科創(chuàng)板解禁時間是多久 科創(chuàng)板解禁是利空嗎?
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)品組合縮減策略的優(yōu)點有什么?
- 熱點在線丨個人所得稅是交百分之多少?勞務(wù)報酬個人所得稅稅率是多少?
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶粉是國產(chǎn)還是進口?
- 全球熱文:股東退出的主要方式有哪些?股東退出需要什么手續(xù)?
- 信用卡風控是什么意思?信用卡風控多久可以恢復?
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關(guān)閉軟驅(qū)?華碩bios怎么關(guān)閉軟驅(qū)?
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息越來越低?
- keynote文字怎么添加火花穿過的動畫效果?keynote怎么制作放大動畫?
- 股票大單壓盤是什么意思?大單壓盤是要漲還是要跌?|全球快播
- 【全球快播報】紅色痘痘涂什么藥膏?推薦祛痘效果好的產(chǎn)品2023!
- 基金收益的計算公式是什么?基金當天賣出收益如何算?|世界即時
- 為什么本科學校有專科???苿萘Ρ容^強的大學有哪些?
- 【新視野】票面利率計算公式是什么?票面利率怎么算?
- 普通家庭買車什么價位合適?普通家庭有必要買20萬的車嗎?-最新消息
- 【速看料】公司退市之后還能重新上市嗎?股票退市我的持倉沒了?
- 家用經(jīng)濟轎車有哪些?家用經(jīng)濟轎車一般多少錢?
- 天天微動態(tài)丨電腦小鍵盤被鎖住了怎么辦?電腦鍵盤鎖住了怎么辦?
- 什么是債券基金?債券基金的優(yōu)缺點?-微動態(tài)
- 全球訊息:手機錄音文件儲存在哪里?怎么壓縮手機錄音文件?
- 空頭市場三個階段分別是什么?通俗解釋空頭陷阱的含義 每日頭條
- 每日信息:嬰幼兒重疾險有必要買嗎?嬰幼兒買什么保險合適?
- IPO退出的局限性有什么?IPO退出方式的利好有哪些?|關(guān)注
- 交強險墊付搶救費用的情況有哪些?輕生的人救回來怎么處理?|環(huán)球熱聞
- 涪陵榨菜pei還是fu?涪陵榨菜是哪里的特產(chǎn)?
- 手機拍攝技巧有哪些?手機拍攝構(gòu)圖三要素
- 股票為什么會跌破發(fā)行價?LPR機制改革對股
- 為什么設(shè)立基金定投止盈點 寶盈新銳靈活混
- 焦點訊息:一般水庫搬遷賠多少錢?國有劃撥
- 觀天下!科創(chuàng)板解禁時間是多久
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)
- 熱點在線丨個人所得稅是交百分之多少?勞務(wù)
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶
- 全球熱文:股東退出的主要方式有哪些?股東
- 信用卡風控是什么意思?信用卡風控多久可以
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關(guān)閉軟驅(qū)?華碩bios怎么關(guān)閉
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息
- keynote文字怎么添加火花穿過的動畫效果?k
- 股票大單壓盤是什么意思?大單壓盤是要漲還
- 【全球快播報】紅色痘痘涂什么藥膏?推薦祛
- 基金收益的計算公式是什么?基金當天賣出收
- 【新視野】票面利率計算公式是什么?票面利
- 普通家庭買車什么價位合適?普通家庭有必要
- 【速看料】公司退市之后還能重新上市嗎?股
- 家用經(jīng)濟轎車有哪些?家用經(jīng)濟轎車一般多少
- 天天微動態(tài)丨電腦小鍵盤被鎖住了怎么辦?電
- 什么是債券基金?債券基金的優(yōu)缺點?-微動
- 全球訊息:手機錄音文件儲存在哪里?怎么壓
- 空頭市場三個階段分別是什么?通俗解釋空頭
- 每日信息:嬰幼兒重疾險有必要買嗎?嬰幼兒
- IPO退出的局限性有什么?IPO退出方式的利好
- 交強險墊付搶救費用的情況有哪些?輕生的人
- 涪陵榨菜pei還是fu?涪陵榨菜是哪里的特產(chǎn)?
- 手機拍攝技巧有哪些?手機拍攝構(gòu)圖三要素