頂尖 AI 模型在一場策略遊戲中進行權謀對戰,為了取勝不惜說謊背叛,觀察到許多值得玩味的現象。
(前情提要:韓國新任總統李在明,對 Crypto 與 AI 有何競選承諾? )
(背景補充:網路女王 Mary Meeker 340 頁 AI 深度報告(上):人工智慧如何以前所未有速度俘獲用戶 )
想像一下,AI 如果不再只用於算數學或寫文章,而是搖身一變成國家的戰略顧問,誰會成為最強軍師?最近,AI 實驗公司 Every 一項名為「AI Diplomacy」的實驗遊戲引發討論。
在這場改編自經典策略遊戲的對決中,七個頂尖大型語言模型(LLM)化身歐洲列強,為爭奪霸權而相互較勁。有興趣的讀者,還可以到 Twitch 頻道 twitch.tv/ai_diplomacy 觀看直播,親眼目睹 AI 們的「勾心鬥角」。
為何需要新的 AI 評估方式?
AI 技術發展一日千里,傳統的評估標準顯然已力不從心,AI Diplomacy 希望提供一種全新的評估途徑。
他們將 LLM 扔進一個複雜的線上策略遊戲(改編自經典桌遊 Diplomacy),讓七個不同的 LLM 各自扮演一個歐洲強權,目標是爭奪歐洲大陸的控制權。讓我們能觀察 AI 在接近真實世界情境下,如何進行談判、制定策略,以及與其他 AI 互動。
AI 們的「宮鬥劇」
每一場遊戲都會產生大量數據,這些數據可用於訓練 AI 學習誠實、邏輯思考或同理心等特質。關鍵的是,這個遊戲平台本身也會「進化」,隨著 AI 能力增強,遊戲的挑戰性也會隨之提升,避免 AI 輕易「玩透」整個遊戲。
開發團隊 Every 總共進行了 15 輪遊戲,每輪時長從 1 小時到 36 小時不等,觀察到許多值得玩味的現象。Every 公司執行長在 X 發文,形容了各家模型的個性:
- DeepSeek 表現得像個急躁冒進的「戰爭狂人」
- 向來老實的 Claude,因為不懂說謊,反而成了其他 AI 無情利用的「傻白甜」
- Google 的 Gemini 2.5 Pro 則展現了相當不錯的戰術執行力
- 最讓人跌破眼鏡的是 OpenAI 的 o3 模型,它不僅巧妙地策劃了一場秘密結盟,更在關鍵時刻背叛了所有盟友,最終獨吞勝利果實,堪稱「心機大魔王」
🚨 NEW:
We made Claude, Gemini, o3 battle each other for world domination.
We taught them Diplomacy—the strategy game where winning requires alliances, negotiation, and betrayal.
Here's what happened:
DeepSeek turned warmongering tyrant. Claude couldn't lie—everyone… pic.twitter.com/34142gD2Ti
— Dan Shipper 📧 (@danshipper) June 5, 2025
面對有心機的 AI,人類準備好了嗎?
every 公司這次的「外交」實驗,不單是一場測試 AI 遊戲技巧的競賽,更像是對 AI 未來能力敲響的一記警鐘。它清楚地告訴我們,AI 正在學習更為複雜的策略互動,其中就包括了如何進行協商,乃至於欺騙。隨著 AI 技術的飛速發展,它們的能力將會越來越強大,並深入到我們日常生活的各個角落,尤其是在分秒必爭的財經和投資等領域,我們與 AI 的互動也將越來越頻繁。
因此,我們需要更加重視 AI 的安全、信任問題以及道德規範的制定。如何開發更有效的欺騙偵測方法,並確保 AI 的發展方向與人類的價值觀保持一致,是我們未來必須共同面對的重大挑戰。