馬斯克宣布 xAI 將在下週開源 Grok 2 的代碼,我們來拆解 Grok 最近的升級亮點,加上它與 GPT-4o、Gemini 的差異,以及為何馬斯克堅持要開源?
(前情提要:馬斯克嚴峻提問:量子電腦能否破解比特幣? )
(背景補充:Grok4智力比分贏了OpenAI o3和Gemini 2.5 Pro!多元競爭轉戰政治面? )
全球 AI 大型語言模型競賽沒有停歇過,馬斯克今天宣布,下周就是開源 Grok 2 的時候。他旗下 xAI 第四代語言模型 Grok 4 先前在7 月 9 日發表,主打更大的多模態輸入與增強推理。
我們將依照倒金字塔結構,把 Grok 發表時程與技術突破描繪出來,再比較 Grok 與 GPT-4o、Gemini,最後來解析馬斯克為何保持著「開源哲學」。
It’s high time we open sourced Grok 2. Will make it happen next week.
We’ve just been fighting fires and burning the 4am oil nonstop for a while now.
— Elon Musk (@elonmusk) August 6, 2025
Grok 4 倒數:時間表與核心升級
Grok 系列迭代的步驟很明快,Grok 2 在 2024 年 8 月上線,提供 128,000 tokens 上下文與圖像生成。
2025 年初問世的 Grok 3 進一步提升推理。根據公開資料,Grok 4 將在 7 月 9 日亮相,預期加入更完整的多模態輸入並強化長文本推理,試圖擴大應用場景。依照馬斯克「新版發表、前版開源」的慣例,Grok 2 準備在下週開源,開發者可取用源代碼自由試驗。
與 GPT-4o、Gemini 的差異
目前三大模型各有擅長領域:
- Grok 4:透過與 X (Twitter) 深度串接,能即時讀取社群動態,對於市場情緒或話題監測特別快速,月費約 16 美元 (X Premium+)。
- GPT-4 /4o:以自然對話、程式碼工具與多語言支援為長項,企業版本提供客製化,訂閱價 20–25 美元。
- Gemini 2.5 Pro/Advanced:擁有高達 1,000,000 tokens 的超大上下文納入量,並完全支援文本、圖像、音訊、影片,與 Google Workspace 深度整合,月費約 20 美元。
在用戶對話風格上,Grok 以幽默、前衛且「反傳統」的語氣切入年輕受眾。GPT-4o 則注重流暢與人性化;Gemini 偏向正式與任務導向。
多模態能力方面,Grok 4 已發表 Grok Imagine 補齊影片與音訊生產功能,但追趕 Gemini 的完整度有待發展。
延伸閱讀:Grok Imagine登陸App Store下載,「色色模式」能產出半裸擦邊影音圖
馬斯克偏好開源的背後
馬斯克強調 AI 必須保持透明與可驗證。他曾將 Grok 定位為「最大限度地尋求真相」且「反覺醒」的工具,並以行動落實開源。他曾經說過:
我們希望任何人都能檢視模型,找出偏誤,再一起修正。
開源策略打破封閉模型壟斷,拉低進入門檻,也引發爭議。開源讓更多研究者審視演算法,但 Grok 不迴避敏感話題,曾被指出產生冒犯內容。xAI 因此增設提示範例與內容過濾選項,以平衡自由與責任。
在市場預估的未來,Grok 的即時情報優勢可能延伸至馬斯克旗下事業,例如 Tesla 自動駕駛與 SpaceX 無線衛星網路。開源是否成為主流仍待時間驗證,但透明度與問責正在成為 AI 產業的新競爭門檻。
當 Grok 系列開源往前迭代,也許需要 2 年以上時間,市場才能回顧「快速迭代、即時數據與開源精神」,是不是領導 AI 商業化的一種強力手段?