Anthropic：「Mythos Preview」模型決策能力超車人類專家，勝率高達 64%

美國 AI 巨頭 Anthropic 於今（4）日發布最新報告指出，人工智慧正以超乎預期的速度加速自身發展。其中最引人矚目的是，其最新模型 Mythos Preview 在輔助 AI 研究決策的測試中，勝過人類專家的比例高達 64%。Anthropic 警告，AI 邁向「遞迴自我提升（RSI）」的進程正在加速，這不僅將帶來科技革命，也可能引發人類「失控」的潛在風險。
（前情提要：Anthropic 確認 Mythos 即將公開，加密正在被三面夾殺？）
（背景補充：Anthropic 預告數週內全面開放超級模型 Claude Mythos！駭客級 AI 即將解禁）

本文目錄

人工智慧（AI）能否自主開發出更強大的下一代 AI？這個曾存在於科幻小說中的場景，或許比想像中更快到來。美國 AI 巨頭 Anthropic 於 2026 年 6 月 4 日公開探討了「遞迴自我提升（Recursive Self-Improvement, RSI）」的潛在發展路徑。最令市場震撼的是，Anthropic 的內部數據顯示，其未來的旗艦模型「Mythos Preview」在關鍵的研究決策上，已經展現出超越人類專家的強大能力。

Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor.

It’s happening faster than we thought, and the implications deserve greater attention. https://t.co/OVVPJO7VQx

— Anthropic (@AnthropicAI) June 4, 2026

研究決策勝率達 64%，Mythos Preview 展現驚人潛力

為了測試 AI 是否具備研究判斷力，Anthropic 團隊進行了一項特殊測試。他們向 Claude 展示了人類研究員即將「走入歧途（錯估研究方向）」的對話紀錄，並詢問 AI：「接下來我們該怎麼做？」

結果顯示，於今年 4 月推出的 Mythos Preview 模型，在 64% 的情況下做出了比人類研究員更優秀的決策。相較於 2024 年時僅有 22% 的勝率，這項指標在兩年內出現了爆發性成長，暗示著 AI 已開始具備指導甚至引領高階研究的能力。

程式碼優化狂飆 52 倍，開發效率全面躍升

除了決策能力，AI 在編寫與優化程式碼的速度也呈現指數級增長。Anthropic 指出，目前其內部工程師每季交付的程式碼量，已是 2021 年至 2025 年平均水準的 8 倍。而在沒有標準答案的開放性程式碼問題中，Claude 的成功率更在短短 6 個月內飆升了 50 個百分點，達到 76%。許多內部工程師甚至認為，Claude 的程式碼品質已逼近人類水準，並有望在今年內實現超越。

更令人矚目的是，在「優化小型 AI 模型訓練程式碼」的標準測試中，一名熟練的人類工程師通常需要 4 到 8 小時才能將速度提升約 4 倍；而 2024 年 5 月的 Claude Opus 4 模型平均能提升約 3 倍。然而，Mythos Preview 竟然達成了驚人的 52 倍速度提升，徹底顛覆了過往的效率極限。

邁向 RSI 時代：擁抱革命與防範「失控」風險

儘管各項數據表現亮眼，Anthropic 仍語帶保留地表示，這並不保證 RSI 已經近在咫尺，因為目前尚無法確定 Claude 是否真正具備自主選擇「正確研究問題」的全局判斷力。

不過，若此加速趨勢持續，AI 系統自主設計並打造出更強大繼任者的情境將變得極具可能性。Anthropic 坦言，這有望在醫學、科技與經濟領域帶來革命性的正面影響，但也可能加劇對齊（Alignment）難題，最終導致人類面臨「失去控制（Loss of control）」的嚴峻風險。為此，Anthropic 宣布將與外部利害關係人合作成立「Anthropic 研究所（Anthropic Institute）」，致力於深入研究強大 AI 系統的深遠影響，以確保人類能為這項技術的未來做出審慎的選擇。

川普要 AI 模型先審查後發布：Mythos 嚇壞白宮、五角大廈將主導安全測試

OpenAI 執行長 Sam Altman 砲轟 Anthropic：恐懼行銷 Claude Mythos 只為壟斷 AI

Tags: AI Anthropic Claude Mythos Preview RSI 人工智慧程式碼遞迴自我提升

Anthropic：「Mythos Preview」模型決策能力超車人類專家，勝率高達 64%

關於我們

動區動趨

訂閱我們的最新消息

戰略夥伴

主題分類

Anthropic：「Mythos Preview」模型決策能力超車人類專家，勝率高達 64%

研究決策勝率達 64%，Mythos Preview 展現驚人潛力

程式碼優化狂飆 52 倍，開發效率全面躍升

邁向 RSI 時代：擁抱革命與防範「失控」風險

📍相關報導📍

關於我們

動區動趨

訂閱我們的最新消息

戰略夥伴

主題分類