Anthropic 把 Claude Mythos Preview 這個被內部稱為「能力前所未有」的模型關進了玻璃翼計畫的實驗室裡,只發給大約 40 家精選企業。同一個星期 HuggingFace 上的中文開發者社群又多了幾款 abliterated 版本的 Qwen 與 DeepSeek。西方最強的 AI 正在考慮上鎖,東方的開源模型卻往無限制的方向走,反轉正在發生。
(前情提要:Anthropic Mythos 太強嚇出緊急會議:貝森特、鮑爾召集五大銀行)
(背景補充:Anthropic 宣布 Glasswing 玻璃翼資安計畫:最強模型 Claude Mythos 挖出數千個漏洞)
我們一直有個想法,西方的 AI 開放、透明、擁抱社群,東方的 AI 謹慎、審查、層層過濾。當然我們說的是以美國和中國為主軸的競爭,而這個敘事在今年四月,安靜的翻了 180 度。
Anthropic 的 Logan Graham 接受 NBC News 訪問時說了一句很罕見的話:「We are not confident that everybody should have access right now.」這句話翻譯成中文只需要九個字:「我們還不敢給所有人。」
他說的是 Claude Mythos Preview ,就是那個引出 Glasswing 玻璃翼計畫,能在每個主流作業系統與瀏覽器裡挖出漏洞、能在 83.1% 的案例裡一次就寫出可用 PoC 的模型。
Anthropic 投入約 1 億美元算力、找了蘋果、微軟、亞馬遜、Cisco、Broadcom、CrowdStrike、Palo Alto 與 Linux 基金會等大約 40 家組織當合作廠商,只為了在這個模型被公開發布之前,把它能挖出來的所有漏洞,先補完。
這是一個歷史性的時刻,但不是因為模型多強,而是因為一家曾經以「開放研究」自居的公司,第一次公開承認有一個模型「太危險,還不能給所有人」。
上次是 2019 年的 GPT-2
熟悉 AI 史的人會認得這個劇本,在2019 年,OpenAI 宣布 GPT-2「太危險不能發布」,當時被全世界嘲笑為過度戲劇化或是吸引流量。幾個月後他們分批發布,事後證明那個「太危險」的模型,放在今天連寫封廣告信都會被嫌很笨。
從 GPT-2 到 Mythos Preview,這句「too dangerous to release」過了整整七年才再次被說出口,差別是這次沒有人笑。因為挖 8 萬個零日漏洞這件事,的確嚇人。連美國財政部長到 Fed 主席都要親自把五大銀行 CEO 叫到桌前開緊急會議的嚇人。
華盛頓怕的不是 Mythos 本身,是「Mythos 會在另一個地方,不受控地被發布」。
中國的開源社群正在做完全相反的事
就在 Anthropic 把 Mythos 鎖在實驗室的時候,Hugging Face 的開源 LLM 排行榜第一名是阿里巴巴 Qwen 的一個社群修改版。
然後開源的前幾名幾乎被中國模型包辦,Qwen 3.5 在 GPQA Diamond 拿下 88.4% 的開源最高分、Chatbot Arena ELO 站上 1450,追平或超越 GPT-4o;智譜 GLM-5 的 SWE-bench 寫到 77.8%,
是實戰軟體工程任務上最強的開源模型;Kimi K2.5、DeepSeek V3.2、MiniMax、Step 3.5 一個接一個,幾乎把排行榜分了個乾淨。(雖然MiniMax最新釋出的版本註明了不能商用,讓人疑惑)
這些模型都是開源的,包括權重、程式碼、訓練細節,全部攤在 GitHub 與 Hugging Face 上,任何人都能下載、本地跑、再發行。
更關鍵的是下一步,一位叫 huihui-ai 的帳號,過去一年把 DeepSeek-R1-Distill-Qwen 7B、14B、32B 依序做了 abliterated 版本。這個中國社群叫做「消融」的技術,直接改動模型權重裡的「拒絕向量」,把「我無法協助您」那條神經迴路神經外科式地切掉。整個 HuggingFace 上,這類已經發布的 abliterated 模型超過 4,900 個,還在增加。
換句話說,當西方世界還在為「要不要放行」辯論的時候,東方的開源生態已經發展出一整套把原廠審查徹底移除的技術路徑,而且是完全公開、完全免費、只需要本地算力(或是你去租雲端跑也行)。
審查反轉了
2026 年之後,AI 的全球場景會變成這樣嗎?
- 西方的頂級模型越強,對外發布的限制越嚴,最後被鎖在合作企業的內網裡
- 東方的頂級模型越強,越急著開源上傳,讓社群把限制機制全都關掉
這無關誰贏誰,這是兩種社會做出了完全相反的風險判斷。美國選擇了先把門鎖起來,中國選擇了多送幾把火出去,管它星火燎原。但兩邊都不是因為喜歡這個選擇,都是因為沒有別的選擇。Anthropic 必須應對美國財政部和市值最大的幾間公司(和他們的用戶)。
中國則是需要便宜的民用 AI,在從大至小的組織裡「自我迭代」,讓中國的用戶的 AI 普及度慢慢疊上去。直到成就從鄉村包圍城鎮的 AI 大躍進。
審查也會看主題的。
現在好多在玩 AI 的人都在幻想,Mythos 到底有多強?以後的 AI 到底有多強?
用一個例子來類比,如果時光機被發明了,成本變低了,在超市裡上架給一般民眾用,會不會出問題?
Anthropic 自己也承認,Mythos Preview 不會永遠留在玻璃翼計畫裡,官方說「下一代 Claude Opus 上線時會加上新的防護機制」,意思是民用版本遲早會出現,只是要先把最致命的能力用安全機制包好。
社群開始流傳一個猜測:那個民用版本會是史上審查最重的 Claude,可能連「寫一段包含駭客的歌詞」都會被拒絕。
*本文僅為想法交流,因為 AI 模型的發布政策牽涉多方考量。並不是審查就是錯誤的。

📍相關報導📍
Anthropic 宣布 Glasswing 玻璃翼資安計畫:聯手蘋果、微軟等 12 巨頭,最強模型 Claude Mythos 挖出數千個漏洞
Anthropic Mythos 太強嚇出緊急會議:貝森特、鮑爾召集花旗、高盛、美銀、大小摩
