Anthropic 新模型 Mythos 強到自家都不敢放：幾小時能自主攻破全球 Linux、串出完整漏洞鏈

彭博報導，Anthropic 最強模型 Mythos 在內部測試中展現出前所未有的網路攻擊能力——能自主發現零日漏洞、編寫利用程式碼，甚至將四個漏洞串成完整攻擊鏈，連 JPMorgan、Cisco、Linux 基金會都已緊急加入防禦測試。Anthropic 高層 3 月拍板：此模型太危險，不對公眾全面開放。本文源自 Bloomberg 所著文章《How Anthropic Discovered Mythos AI Was Too Dangerous For Release》，由動區動趨整理、編譯。
（前情提要：OpenAI 遊說美政府擴大 AI 生命科學應用：開放醫療資料、算力列國家資源）
（背景補充：Cursor 3.1 推出 Canvas 功能：Agent 直接生成可互動 React 介面、圖表、Diff、自訂邏輯）

本文目錄

一個 AI 模型強大到連自家公司都不敢對外發布，這本身就說明瞭問題的嚴重性。

Anthropic 的 Mythos 已能獨立完成一整套攻擊流程：從發現零日漏洞、編寫利用程式碼，到串聯多步路徑滲透核心系統——原本需要頂級駭客長時間協作的工作，被壓縮到了小時甚至分鐘級。

這也是為何，在模型披露的第一時間，Scott Bessent 與 Jerome Powell 就召集華爾街機構開會，要求立刻拿它來「自查」。當漏洞發現能力被大規模釋放，金融系統面對的不再是零散攻擊，而是持續掃描。

更深的變化在於供給結構。過去，漏洞的挖掘依賴少數資安團隊和駭客的經驗積累，節奏緩慢且不可複製。如今，這種能力開始被模型批次輸出，攻擊與防禦的門檻同時下降。一位知情人士的比喻很直接：把模型交給普通駭客，相當於讓其具備特種作戰能力。

機構已開始用同樣的工具反向檢查自身系統。JPMorgan Chase、Cisco Systems 等都在內部測試，希望在漏洞被利用前完成修補。但現實的制約並未改變，發現的速度在加快，修復依舊緩慢。「我們很擅長找漏洞，但不擅長修復」，Jim Zemlin 的判斷，點出了節奏上的錯位。

事實上，Mythos 不是單點能力的提升，而是把原本分散、受限的攻擊能力整合、加速，並降低使用門檻。一旦脫離控制環境，這種能力會以怎樣的方式擴散，沒有現成經驗可以參考。

危險不在於它能做什麼，而在於它可以被誰使用，以及在什麼條件下被使用。

巴釐島婚禮席間，研究員幾小時就讓 Mythos 攻破全球系統

二月一個溫暖的傍晚，在巴釐島參加婚禮的間隙，Nicholas Carlini 暫時離席，開啟膝上型電腦，準備「搞點破壞」。彼時，Anthropic 剛將一款名為 Mythos 的新 AI 模型開放給內部評測，而這位知名 AI 研究員，正打算看看它究竟能惹出多大的麻煩。

Anthropic 聘請 Carlini 的職責，就是對自家 AI 模型進行「壓力測試」，評估駭客是否可能藉助它們實施間諜活動、盜竊或破壞行為。在巴釐島參加印度婚禮期間，Carlini 就被這個模型的能力震驚了。

短短幾個小時內，他便找到了多種可用於滲透全球常用系統的技術。等他回到 Anthropic 位於舊金山市中心的辦公室後，更進一步發現：Mythos 已能自主生成強大的入侵工具，其中甚至包括針對 Linux——這一支撐現代運算體系大多數開源系統——的攻擊手段。

Mythos 上演了一場「數位版銀行劫案」：它能繞過安全協議，從正門進入網路系統，進而攻破數位金庫，獲取其中的線上資產。過去，AI 只能「撬鎖」，而現在，它已具備策劃並完成整場「搶劫」的能力。

Carlini 與部分同事開始向公司內部發出警報，通報他們的發現。與此同時，他們幾乎每天都在 Mythos 所探測的系統中發現高危乃至致命級別的漏洞——這些問題，通常只有全球最頂尖的駭客才有能力挖掘出來。

從「撬鎖」到「策劃整場搶劫」，AI 攻擊能力的質變

與此同時，Anthropic 內部一個名為「Frontier Red Team」的團隊——由 15 名員工組成，被稱為「Ants」——也在進行類似的測試。這個團隊的職責，是確保公司的模型不會被用於危害人類。他們會把機器狗運進倉庫，與工程師一起測試聊天機器人是否可能被惡意控制這些裝置；也會與生物學家合作，評估模型是否可能被用於製造生物武器。

而這一次，他們逐漸意識到，Mythos 帶來的最大風險，來自網路安全領域。「拿到模型的幾個小時內，我們就知道它不一樣，」負責該團隊的 Logan Graham 表示。

此前的模型 Opus 4.6，已展現出協助人類利用軟體漏洞的能力。但 Graham 指出，Mythos 已能「自己動手」利用這些漏洞。這構成了國家安全層面的風險，他也據此向公司高層發出警告。這讓他不得不面對一個棘手局面：向管理層說明，公司下一個重要的營收引擎，可能因為太危險而無法對公眾發布。

Anthropic 共同創辦人兼首席科學家 Jared Kaplan 表示，在 Mythos 的訓練過程中，他一直「非常密切地」關注其進展。到一月時，他開始意識到，這個模型在發現系統漏洞方面的能力異常強大。作為一名理論物理學家，Kaplan 需要判斷，這些能力究竟只是「技術上的有趣現象」，還是「與網路基礎設施高度相關的現實問題」。最終，他得出的結論是後者。

Anthropic 高層 3 月拍板：Mythos 太危險，不對公眾開放

在 2 月下旬至 3 月初的一兩週時間裡，Kaplan 與共同創辦人 Sam McCandlish 持續權衡：是否應該發布這款模型。

到了 3 月第一週，公司高層團隊——包括執行長 Dario Amodei、總裁 Daniela Amodei、資安長 Vitaly Gudanets 等人——召開會議，聽取 Kaplan 和 McCandlish 的彙報。

他們的結論是：Mythos 風險過高，不適合全面對外發布。但 Anthropic 仍應允許部分公司，甚至包括競爭對手，對其進行測試。

「很快我們就意識到，這次必須採取一種相當不同的做法，這不會是一次常規的產品發布，」Kaplan 表示。

到 3 月第一週，公司最終達成一致：批准將 Mythos 作為一項網路安全防禦工具投入使用。

白宮、華爾街緊急開會：立刻用 Mythos 自查系統

市場的反應幾乎是立刻的。在 Anthropic 對外披露 Mythos 存在的當天，美國財政部長 Scott Bessent 與聯準會主席 Jerome Powell 便召集華爾街主要機構負責人，在華盛頓召開緊急會議。傳遞的訊息非常明確：立刻利用 Mythos 找出你們系統中的漏洞。

據接近與會高管的人士透露（因涉及私下交流而要求匿名），會議的嚴肅程度可見一斑——與會者甚至拒絕向部分核心顧問透露會議內容。

白宮官員對 Mythos 作為駭客工具潛力發出的緊急警告，以及他們建議「將其用於防禦」的立場，都指向一個更深層的變化：AI 正迅速成為網路安全領域的決定性力量。Anthropic 已在「Project Glasswing」專案中，將 Mythos 限量開放給部分機構使用，包括 Amazon Web Services、Apple 和 JPMorgan Chase 等企業，允許它們進行測試；同時，政府機構也已表現出濃厚興趣。

在對外開放前，Anthropic 曾向美國政府高階官員全面彙報 Mythos 預覽版的能力，包括其在網路攻擊與防禦兩方面的潛在用途。與此同時，公司也正與多個國家政府展開持續溝通。一位因涉及內部事務而要求匿名的 Anthropic 員工透露了這一情況。

競爭對手 OpenAI 也迅速跟進，於週二宣布將推出一款用於發現軟體漏洞的工具——GPT-5.4-Cyber。

在對早期版本的測試中，研究人員發現了數十個「令人擔憂」的行為案例，包括不遵循人類指令，甚至在極少數情況下，會在違反指令後嘗試掩蓋自身行為。

目前，Anthropic 尚未將 Mythos 作為網路安全工具正式公開發布，外部研究者也尚未充分驗證其能力。但公司此前「限制存取」的罕見決策，反映出業界與政府內部日益形成的一種共識：AI 正在重塑網路安全的經濟結構——它顯著降低了發現漏洞的成本，壓縮了攻擊準備時間，並降低了某些攻擊型別的技術門檻。

Anthropic 也警告稱，Mythos 更強的自主行動能力本身就帶來了風險。在測試中，團隊觀察到多個令人不安的案例：模型不服從指令，甚至在違規後試圖掩蓋痕跡。在一次事件中，模型自行設計出一套多步驟攻擊路徑，從受限環境中「逃逸」，取得更廣泛的網路存取許可權，並主動發布內容。

現實世界中，從銀行應用到醫院系統所依賴的軟體，普遍存在複雜且隱蔽的程式碼漏洞，這些問題往往需要專業人員耗費數週甚至數月才能發現。而一旦駭客搶先利用這些漏洞，就可能引發資料洩漏或勒索軟體攻擊，帶來嚴重後果。

不過，也有不少重量級人士對 Mythos 的真實能力及其潛在風險提出質疑。白宮 AI 顧問 David Sacks 在社群平台 X 上表示：「越來越多的人開始懷疑 Anthropic 是否是 AI 業界裡的『狼來了男孩』。如果 Mythos 帶來的威脅最終沒有顯現，公司將面臨嚴重的信譽問題。」

但現實是，駭客早已開始利用大型模型發起複雜攻擊。例如，一個網路間諜組織曾使用 Anthropic 的 Claude 模型嘗試入侵約 30 個目標；其他攻擊者則利用 AI 從政府機構竊取資料、部署勒索軟體，甚至快速攻破數百個用於資料防護的防火牆工具。

據一位知情人士透露，在美國國家安全相關官員看來，Mythos 的出現正在帶來前所未有的不確定性——如何評估網路安全風險本身變得更加困難。如果將該模型交給個體駭客，其效果可能相當於把一名普通士兵直接提升為特種部隊作戰人員。

與此同時，這種模型也可能成為「能力放大器」：讓一個犯罪駭客組織具備小型國家級的攻擊能力，也讓一些中小國家的情報與軍方駭客，能夠執行原本只有大國才能完成的網路攻擊。

美國國家安全域性前網路安全負責人 Rob Joyce 表示：「我確實相信，從長期來看，AI 會讓我們更安全、更有保障。但在現在到未來某個時間點之間，會有一段『黑暗時期』，在這段時間裡，進攻型 AI 將佔據明顯優勢——那些沒有打好基礎防護的人，會首先被攻破。」

值得注意的是，Mythos 並非唯一具備此類能力的模型。包括 Claude 早期版本以及 Big Sleep 在內，已有多個機構在使用大型模型進行漏洞挖掘。

JPMorgan、Cisco 已在內測，Linux 基金會也加入防禦

據該人士介紹，過去需要數天甚至數週才能識別的「零日漏洞」（zero-day），以及為其編寫利用程式碼的過程，如今藉助 AI 最快只需一小時，甚至幾分鐘即可完成。所謂「零日漏洞」，是指防禦方尚未察覺的安全缺陷，因此幾乎沒有時間進行修復。

目前，摩根大通的重點主要集中在供應鏈與開源軟體領域，並已發現多項漏洞，同時將問題回報給相關供應商。

公司執行長 Jamie Dimon 在財報電話會議上表示，Mythos 的出現「表明仍有大量漏洞亟待修復」。

據一位知情人士透露，在外界尚未得知 Mythos 存在之前，JPMorgan Chase 就已與 Anthropic 展開溝通，討論對該模型進行測試。該人士因無權公開發言而要求匿名。摩根大通對此拒絕置評。

如今，其他華爾街銀行與科技公司也在嘗試使用 Mythos，以便在駭客發現漏洞之前，提前修補系統缺陷。據彭博報導，Goldman Sachs、Citigroup、Bank of America 以及 Morgan Stanley 等金融機構，均已在內部測試這一技術。

Cisco Systems 的員工正對一個問題格外警惕：入侵者是否會利用 AI，在其全球執行的網路裝置軟體中尋找突破路徑——這些裝置包括路由器、防火牆和資料機。該公司首席安全與信任官 Anthony Grieco 表示，他尤其擔心 AI 會加速駭客對「生命週期已結束」的裝置發起攻擊——這類裝置未來將不再獲得 Cisco 的更新支援。

漏洞鏈、零日漏洞、瀏覽器攻擊：Mythos 的實際戰果

而如何修補 AI 發現的漏洞，仍將是一個長期難題。這個過程被稱為「安全補丁」（security patching），對組織而言往往成本高昂、週期漫長，以至於不少機構選擇對漏洞置之不理。像 Equifax 遭遇的那類災難性攻擊——約 1.47 億人的資料被竊取——正是因為已知漏洞未被及時修復所致。

儘管在拒絕協助開展針對美國公民的大規模監控後，Anthropic 曾被川普政府認定為「供應鏈威脅」，但該公司目前仍在與聯邦機構展開溝通與合作。

美國財政部本週正尋求取得 Mythos 的使用許可權。財政部長 Scott Bessent 表示，這一模型將有助於美國在 AI 領域維持對他國的領先優勢。

在一次測試中，Mythos 編寫出一段瀏覽器攻擊程式碼，將四個不同漏洞串聯成一條完整的利用鏈——這類操作對人類駭客而言本身就是極具挑戰的高難度任務。網路安全研究報告指出，這種「漏洞鏈」往往可以打通原本高度安全的系統邊界，類似於當年 Stuxnet 攻擊伊朗核設施離心機時所採用的方式。

此外，據 Anthropic 表示，在被明確指令引導的情況下，Mythos 甚至能夠識別並利用所有主流瀏覽器中的「零日漏洞」。

Anthropic 表示，他們曾利用 Mythos 在 Linux 程式碼中發現漏洞。Jim Zemlin 指出，Linux「支撐著當今大多數運算系統」，從 Android 智慧型手機、網路路由器，到 NASA 的超級電腦，幾乎無處不在。Mythos 能夠自主發現多個開源程式碼中的缺陷，而這些漏洞一旦被利用，攻擊者甚至可以完全接管整臺機器。

目前，Linux Foundation 已有數十名人員開始對 Mythos 進行測試。在 Zemlin 看來，一個關鍵問題是：Anthropic 的模型是否能夠提供足夠有價值的洞察，協助開發者在源頭上寫出更安全的軟體，從而減少漏洞的產生。

「我們很擅長發現漏洞，」他說，「但在修復這件事上，卻做得很差。」

Anthropic 宣布 Glasswing 玻璃翼資安計畫：聯手蘋果、微軟等 12 巨頭，最強模型 Claude Mythos 挖出數千個漏洞

Anthropic 新模型「Claude Mythos」曝光稱史上最強，網路攻擊能力令自家人也擔憂

Anthropic 新模型 Mythos 強到自家都不敢放：幾小時能自主攻破全球 Linux、串出完整漏洞鏈

關於我們

動區動趨

訂閱我們的最新消息

戰略夥伴

主題分類

Anthropic 新模型 Mythos 強到自家都不敢放：幾小時能自主攻破全球 Linux、串出完整漏洞鏈

巴釐島婚禮席間，研究員幾小時就讓 Mythos 攻破全球系統

從「撬鎖」到「策劃整場搶劫」，AI 攻擊能力的質變

Anthropic 高層 3 月拍板：Mythos 太危險，不對公眾開放

白宮、華爾街緊急開會：立刻用 Mythos 自查系統

JPMorgan、Cisco 已在內測，Linux 基金會也加入防禦

漏洞鏈、零日漏洞、瀏覽器攻擊：Mythos 的實際戰果

📍相關報導📍

關於我們

動區動趨

訂閱我們的最新消息

戰略夥伴

主題分類