美國 AI 巨頭 Anthropic 於今(4)日發布最新報告指出,人工智慧正以超乎預期的速度加速自身發展。其中最引人矚目的是,其最新模型 Mythos Preview 在輔助 AI 研究決策的測試中,勝過人類專家的比例高達 64%。Anthropic 警告,AI 邁向「遞迴自我提升(RSI)」的進程正在加速,這不僅將帶來科技革命,也可能引發人類「失控」的潛在風險。
(前情提要:Anthropic 確認 Mythos 即將公開,加密正在被三面夾殺?)
(背景補充:Anthropic 預告數週內全面開放超級模型 Claude Mythos!駭客級 AI 即將解禁)
人工智慧(AI)能否自主開發出更強大的下一代 AI?這個曾存在於科幻小說中的場景,或許比想像中更快到來。美國 AI 巨頭 Anthropic 於 2026 年 6 月 4 日公開探討了「遞迴自我提升(Recursive Self-Improvement, RSI)」的潛在發展路徑。最令市場震撼的是,Anthropic 的內部數據顯示,其未來的旗艦模型「Mythos Preview」在關鍵的研究決策上,已經展現出超越人類專家的強大能力。
Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor.
It’s happening faster than we thought, and the implications deserve greater attention. https://t.co/OVVPJO7VQx
— Anthropic (@AnthropicAI) June 4, 2026
研究決策勝率達 64%,Mythos Preview 展現驚人潛力
為了測試 AI 是否具備研究判斷力,Anthropic 團隊進行了一項特殊測試。他們向 Claude 展示了人類研究員即將「走入歧途(錯估研究方向)」的對話紀錄,並詢問 AI:「接下來我們該怎麼做?」
結果顯示,於今年 4 月推出的 Mythos Preview 模型,在 64% 的情況下做出了比人類研究員更優秀的決策。相較於 2024 年時僅有 22% 的勝率,這項指標在兩年內出現了爆發性成長,暗示著 AI 已開始具備指導甚至引領高階研究的能力。
程式碼優化狂飆 52 倍,開發效率全面躍升
除了決策能力,AI 在編寫與優化程式碼的速度也呈現指數級增長。Anthropic 指出,目前其內部工程師每季交付的程式碼量,已是 2021 年至 2025 年平均水準的 8 倍。而在沒有標準答案的開放性程式碼問題中,Claude 的成功率更在短短 6 個月內飆升了 50 個百分點,達到 76%。許多內部工程師甚至認為,Claude 的程式碼品質已逼近人類水準,並有望在今年內實現超越。
更令人矚目的是,在「優化小型 AI 模型訓練程式碼」的標準測試中,一名熟練的人類工程師通常需要 4 到 8 小時才能將速度提升約 4 倍;而 2024 年 5 月的 Claude Opus 4 模型平均能提升約 3 倍。然而,Mythos Preview 竟然達成了驚人的 52 倍速度提升,徹底顛覆了過往的效率極限。
邁向 RSI 時代:擁抱革命與防範「失控」風險
儘管各項數據表現亮眼,Anthropic 仍語帶保留地表示,這並不保證 RSI 已經近在咫尺,因為目前尚無法確定 Claude 是否真正具備自主選擇「正確研究問題」的全局判斷力。
不過,若此加速趨勢持續,AI 系統自主設計並打造出更強大繼任者的情境將變得極具可能性。Anthropic 坦言,這有望在醫學、科技與經濟領域帶來革命性的正面影響,但也可能加劇對齊(Alignment)難題,最終導致人類面臨「失去控制(Loss of control)」的嚴峻風險。為此,Anthropic 宣布將與外部利害關係人合作成立「Anthropic 研究所(Anthropic Institute)」,致力於深入研究強大 AI 系統的深遠影響,以確保人類能為這項技術的未來做出審慎的選擇。

📍相關報導📍
AI 安全新創 Depthfirst 宣布擊敗 Anthropic 模型 Mythos!揪出 NGINX 潛伏 18 年史詩漏洞、抓漏成本僅 1/10
川普要 AI 模型先審查後發布:Mythos 嚇壞白宮、五角大廈將主導安全測試
OpenAI 執行長 Sam Altman 砲轟 Anthropic:恐懼行銷 Claude Mythos 只為壟斷 AI
