OpenAI 在 7 月 17 日晚間正式推出了其 ChatGPT Agent 人工智慧代理功能,融合了此前的 Operator 網頁互動能力與 Deep Research 資訊蒐集技巧,讓 ChatGPT 不僅能夠進行「思考」,還具備了一次產生簡報、下訂早餐食材、更新行事曆的能力。
(前情提要:ChatGPT 胡說八道,竟逼這家公司連夜開發新功能!AI 幻覺的荒謬現實與機會)
(背景補充:怕 ChatGPT 搶飯碗?富比士公開 AI 時代 10 大生存法則)
OpenAI 在 7 月 17 日晚間正式推出了其 ChatGPT Agent 人工智慧代理功能,融合了此前的 Operator 網頁互動能力與 Deep Research 資訊蒐集技巧,讓 ChatGPT 不僅能夠進行「思考」,還具備了一次產生簡報、操作網頁如下訂早餐食材、更新行事曆的能力。
ChatGPT Agent 亮點
- 跨界能力整合:具備網頁瀏覽、點擊、填寫表單等網頁互動能力(源自 Operator),並能進行深層資訊檢索與整合(繼承自 Deep Research)。
- 虛擬計算環境:ChatGPT 會在「虛擬電腦」中執行任務,例如自動整理行程、撰寫簡報、運行程式碼等。
- 自主與控制並重:在執行關鍵動作(如發送電子郵件、線上購買)前,會先徵得用戶授權,你也可以隨時中斷或接管操作。
- 適用用戶群:自今日起,Pro、Plus 和 Team 訂閱用戶可在對話框中的 Tools 下拉選單啟用「Agent Mode」功能。Enterprise 與 Education 版用戶預計將於夏季稍後階段獲得訪問權限。
使用方式:
- 開啟 ChatGPT 對話介面。
- 在工具(Tools)選單中選擇「Agent Mode」,或直接輸入「/agent」命令切換。
- 以自然語言描述你希望 ChatGPT 完成的任務,例如「幫我查看下週行程並預訂餐廳」。
- ChatGPT 會在後台開始執行任務,並透過螢幕頂部敘述其進度,你可隨時中斷或接手。
場景示範:辦公室停車位到市場報告
對於這一最新功能,OpenAI 產品負責人 Yash Kumar 分享了其使用心得:
「我用它來自動化所有我可以自動化的東西,因為我太忙了。例如,它現在會自動幫我申請公司指定的辦公室停車位。」
研究負責人 Isa Fulford 進一步說明,這項服務不只能夠點擊網頁表單,還能串接 Gmail、Google Calendar、GitHub 與 OpenTable,真正融入使用者日常。操作流程採「先詢問、再執行」設計,像發信或預訂前會彈窗確認,兼顧便利與安全。
速度、安全與限制
效率提升最直觀。今年 2 月,金融科技公司 Klarna 在報告指出,AI 代理人已處理三分之二客戶服務對談,相當於 700 名全職人力。即便官方展示中動作不算飛快,一次完成的自動化仍省下大量工時。不過,運行速度與高昂算力消耗仍是推廣痛點。
安全面,OpenAI 針對「高生物和化學能力」設定防護,並參考 Anthropic 去年 10 月的作法,降低潛在濫用風險。
金融操作目前被鎖定,當用戶離開 ChatGPT Agent 分頁瀏覽金融網站,系統就切入「監控模式」暫停行動,防堵誤觸交易鍵。
資本與人才的下一步
AI 代理人概念於 2023 年起熱遍華爾街。Amazon、Meta、Google 在財報會議輪番提到相關布局;Google 近來大舉招募相關人才,顯示投資規模迅速升溫。重複性低價值工作將率先被自動化,人力焦點轉向決策與創新。隨著產品逐步開放 Pro、Plus 與 Team 用戶,政府對資料隱私、倫理與反壟斷的規範勢必跟進。若未來解除金融限制,AI 代理人可望進一步重塑 DeFi 與傳統市場的自動化策略,成為資本流向觀察重點。
📍相關報導📍
OpenAI怒斥Robinhood「代幣化股票」沒授權!碰到誰的利益了?
OpenAI 傳將推 AI 版 Office 辦公軟體,與微軟、Google 正面交鋒
GPT-5 今夏登場!Sam Altman 親揭 OpenAI 下一代模型藍圖、Stargate 星際之門野心、會有廣告嗎?