微軟 AI(MAI)在 2026 年 Build 大會一次發布 7 個自研模型,橫跨推理、編碼、影像、轉錄、語音五大領域,旗艦推理模型 MAI-Thinking-1 擁有 350 億引數,微軟官方自評盲測成績「追平 Claude Sonnet 4.6」。
(前情提要:微軟高管警告:大多白領勞工將在「未來 12-18 月內」被自動化取代)
(背景補充:彭博:中國「限制 AI 頂尖人才出境」,阿里、DeepSeek 高管被迫上繳護照)
微軟過去多年把超過百億美元押注在 OpenAI 身上,換來的是 Azure 算力合約與 GPT 系列的獨家授權。不過在 2026 年 Build 大會上,微軟一口氣發布自研的 7 款 MAI 模型家族。
包括:旗艦推理模型 MAI-Thinking-1、高效編碼模型 MAI-Code-1-Flash、文生圖模型 MAI-Image-2.5 及其 Flash 版、轉錄模型 MAI-Transcribe-1.5、語音生成模型 MAI-Voice-2 與即將推出的 MAI-Voice-2-Flash。
跑分戰場上的自家裁判
MAI-Thinking-1 是這次發布的核心。微軟官方自評,在盲測人工評測中其成績「追平 Anthropic Claude Sonnet 4.6」,編碼基準「追平 Claude Opus 4.6」;AIME 數學測驗官方公布達 97%,SWE Bench Pro 官方公布 53%。
不過要強調的是,這些都是微軟自己公布的資料,第三方獨立評測尚未出爐。
這些模型除了進入 Azure Foundry 與微軟自家產品線,也將上架 OpenRouter、Fireworks、Baseten 等第三方平台。
真正的佈局在企業端:Frontier Tuning 與梅約模式
如果跑分是入場券,那麼微軟這次真正想賣的是 Frontier Tuning(前沿微調)。
簡單來說就是,Frontier Tuning 讓企業用「自己工作流程的真實操作紀錄」來訓練一個專屬版本的 MAI 模型,訓練資料與最終模型權重都歸客戶自己所有,不迴流給微軟。
強化學習環境(RLE)是這套機制的核心技術,白話說就是給 AI 一個模擬「練功場」,讓它在企業的真實任務情境中反覆試錯、最佳化。
微軟給出兩組官方資料作為例證:為 Excel 工作流微調後,MAI 模型「效能追平 GPT 5.4、效率最高提升 10 倍」;為 McKinsey 企業標準微調後,「盲測勝率最高、成本約低 10 倍」。這些同樣是官方自評數字,但傳遞的商業邏輯相當清晰:讓大型企業用自己的資料,打造只屬於自己的 AI,並且真正擁有它。
梅約診所(Mayo Clinic)的合作案把這個邏輯推到了醫療場景。微軟與梅約共創醫療前沿 AI 模型,結合梅約的臨床專業與去識別化臨床資料,但模型所有權完整歸屬梅約,先在梅約內部部署驗證,之後才經由 Azure Foundry 開放給其他醫療機構。
這個架構把微軟定位成基礎設施提供者,把客戶(梅約)定位成真正的 AI 所有人,從根本上改變了傳統雲端 AI 的權力結構。
「零蒸餾」的兩種讀法
整場發布最反覆被強調的主張是:所有 MAI 模型從零訓練,不蒸餾任何第三方模型,不使用未授權或來源不透明的資料,資料「乾淨且授權合法」。
蒸餾,簡單來說就是讓一個小模型向大模型學「思考方式」,繞過高昂算力直接繼承大模型的能力。近兩年 DeepSeek 等中國實驗室大量採用此路線,以極低成本複製出接近頂級模型的效能,讓整個產業陷入算力投資是否有意義的焦慮。Suleyman 此前公開指出「中國式蒸餾開源模型有其極限」,零蒸餾宣示是對這條路線的直接切割。
媒體分析同時指出另一層讀法:「乾淨授權資料」與「不蒸餾第三方模型」,對那些擔心著作權訴訟、監管合規風險的企業客戶而言,是比跑分更有說服力的法務賣點。是技術宣言,也是一份合規聲明書。
微軟這次真正下注的,或許不是在跑分排行榜上超越 OpenAI 與 Anthropic,而是在 Frontier Tuning 加上梅約模式這條路上,用「客戶擁有自己的 AI」這個命題,重新定義企業 AI 市場的遊戲規則。
不過前提是,那些「官方自評」的數字,最終要能透過外部驗證。
📍相關報導📍
OpenAI 發布 AGI 五大憲法:AI 不能被少數人壟斷,犧牲可換來更多韌性

