多名使用者發現 Grok 網頁版正在測試 Imagine Agent Mode(beta),互動介面從傳統聊天框換成無限畫布,用一句話就能生出整套短片、漫畫或產品圖文包。Grok Imagine 今年 2 月推出以來,30 天內已生成超過 12.45 億支影片。當前 xAI 尚未發布官方公告。
(前情提要:馬斯克悄悄幹掉 Starlink 客服中心:Grok Voice 接管電話、20% 來電直接成交)
(背景補充:Altman 在 Stripe 年會攤牌:OpenAI 要當「永遠薄利」的智慧基建,切換成本低到「跟 agent 說一句就搬了」)
多名使用者近日在 X 上發現,Grok 網頁版正在暗地測試一個叫做 Imagine Agent Mode 的新功能。xAI 尚未發布任何官方公告,但從使用者截圖來看,這不是一般的功能更新。整個互動介面從傳統聊天框換成了「無限畫布」,agent 可以一步步把圖片和影片全部生成出來。

一句話生出一整套素材包
使用者截圖顯示,Grok 側邊欄新增了「Imagine」入口,點進去是一塊開放畫布,右側列出預設工作流模板:Create Worlds(世界觀建構)、Short Film(短片)、UGC Product Stories(產品圖文包)、Brand Identity(品牌識別)。用一句話描述需求,agent 在畫布上依序生成所有素材。
被「試玩」出來的具體能力包括同時生成和編輯多張圖片、把靜態圖轉成影片後自動拼接、影片裁剪和淡入淡出、匯出成品。
TestingCatalog 指出 Imagine Agent 可以處理複雜的多步指令,例如「生成一部 1 分鐘短片」「生成一整套漫畫」「生成 UGC 產品圖文包」。另一名使用者展示了 agent 先批次生成 3 組產品圖和 3 組模特照片,再自動組合成社群媒體素材包的完整流程。
Grok Imagine 在今年 2 月推出 1.0 版本時,30 天內就生成了超過 12.45 億支影片,採用的是 Aurora 引擎,支援 720p 解析度、10 秒影片和原生音效。
Agent Mode 在這個基礎上加入的是工作流編排能力,不只是讓模型「生成更好的東西」,而是讓它自己決定要生成什麼、按什麼順序、怎麼組合。
這是 xAI 在 Grok Build 推出平行 agent 之後,第一次把 agent 架構延伸到創意生成領域。雖然官方目前尚未正式發佈,有可能是區域性測試,或是先行測試,不一定最後實裝功能。
📍相關報導📍
馬斯克悄悄幹掉 Starlink 客服中心:Grok Voice 接管電話、20% 來電直接成交
馬斯克曾要求 51.2% 股份、拿 SpaceX 當薪水付 — OpenAI 創立郵件法庭全曝光
Altman 在 Stripe 年會攤牌:OpenAI 要當「永遠薄利」的智慧基建,切換成本低到「跟 agent 說一句就搬了」

