OpenAI 今(8)晨正式發表 GPT-5 模型,具備自主深度思考能力,不僅幻覺更少、可靠性更高,API 調用成本也便宜,本文帶您深度解析。
(前情提要:OpenAI 最強 GPT-5 發布會全整理:免費開放、功能亮點、gpt-5、gpt-5-mini 和 gpt-5-nano API 價格 )
(背景補充:OpenAI 開源權重模型 GPT-OSS:Apache 2.0如何為開發者加冕?CoT思考鏈解鎖安全主權 )
今(8)天清晨,OpenAI 正式推出最新模型 GPT-5,我知道你對官方羅列枯燥的技術指標感到無感,本文我們就直接用白話文,來聊聊 GPT-5 與前幾版模型究竟有何不同?它所揭示的「關鍵變化」是什麼?
關鍵變化一:AI 不再需要你「切換大腦」,它學會自己深度思考
過去我們使用 AI,就像在管理一個由不同等級專家組成的團隊。你需要告訴它:「現在請用數據分析模式」、「現在切換到創意寫作模式」,GPT-4o 雖然強大,但仍依循這個邏輯,GPT-5 則改變了這個遊戲規則。
它最核心的升級是內建了一個即時路由器 (real-time router),你可以把它想像成一位極其聰明的專案總監。當你拋出一個問題,這位「總監」會立刻判斷:這是個簡單的問候,需要快速回應?還是一個需要動用數學、程式、邏輯推理的複雜任務?
如果是後者,GPT-5 會自動啟動「思考模式 (thinking mode)」,進行更深層次的推理,然後給出答案。你不再需要手動選擇模型,AI 自己知道何時該「淺嚐輒止」,何時該「深思熟慮」。
這個轉變的意義是什麼?想像一下,過去的 AI 是個知識淵博的圖書館員,你問什麼,他找什麼。現在的 GPT-5,則是一位能陪你一起解決問題的資深合夥人。
這點從評測數據就能看出端倪。在考驗高階程式能力的 SWE-bench 測試中,GPT-5 開啟「思考模式」後的答對率高達 74.9%,超越 gpt-o3(69.1%)。在博士級的科學問題(GPQA Diamond)和競賽級數學題(AIME 2025)上,也取得了更好的成績。
一句話點評:從「反應式工具」進化為「自主推理夥伴」。
關鍵變化二:不只寫得更好,還更「誠實」且「聽話」
對於任何仰賴資訊做決策的人來說,最怕的不是數據不足,而是那些看似正確卻暗藏謬誤的資訊,也就是 AI 的「幻覺」問題。
GPT-5 在這方面下了重手,官方稱帶思考功能的 GPT-5 在 ChatGPT 提示測試中的虛構回應僅 4.8%,遠低于此前模型 o3(22%)與 GPT-4o(20.6%)。
此外,它也更「聽話」了。在「指令遵循測試」中,尤其是在需要處理多個複雜指令的任務上,GPT-5 的準確率達到 70%,遠超前代。當你在處理長篇報告或合約,需要 AI 執行「找出 A 條件,比對 B 部份,然後總結 C 重點」這類多步驟指令時,GPT-5 的可靠度將更勝以往。
四種不同個性人格
另外一個特色是,ChatGPT 新增了個人化的人格選項,包括四種不同個性主題:諷刺家(Cynic)、機器人(Robot)、傾聽者(Listener)和書呆子(Nerd),並即將推出不同聊天個性設定,讓 AI 回應風格更貼近使用者需求。
一句話點評: GPT-5 從一個天馬行空的「創意家」,變得更像一個嚴謹可靠的「執行者」。這對金融、法律、學術等要求精確性的專業領域,是個重大衡量因素。
關鍵變化三:更便宜的「入場券」
另外一個大量用戶關注的重點是:成本呢?畢竟資本的流動,終究會反映在價格上。OpenAI 這次的定價策略,釋放了一個清晰的訊號:高階 AI 的使用門檻正在持續降低。
讓我們直接看 API 價格:
模型 | 輸入 (每百萬 tokens) | 輸出 (每百萬 tokens) |
gpt-5 | $1.25 | $10.00 |
gpt-4o | $2.50 | $10.00 |
gpt-5-mini | $0.25 | $2.00 |
gpt-5-nano | $0.05 | $0.40 |
看懂了嗎?GPT-5 的性能遠超 GPT-4o,但其輸入成本直接砍半,更值得注意的是 gpt-5 mini 和 nano 版本的推出。它們以極低的價格,提供了超越前代旗艦模型的性能。這是在為所有需要大量處理文本的企業提供強大誘因,讓小開發者和新創公司也都能用上頂尖的 AI 能力。
一句話點評: OpenAI 正在用價格戰推動市場普及,勢必會影響所有競爭對手的價格策略。

GPT-5 時代,我們該關注什麼?
總的來說,筆者認為 GPT-5 正從「與 AI 對話」的時代,加速邁向與「 AI 協作解決問題」的時代。下一次,當你面對複雜的財報、難解的程式碼或需要精妙措辭的信件時,你的 AI 夥伴,將不再只是一個搜尋引擎或文字處理器,而是更有人性、更能依照你的要求行事。
另外 Altman 表態所有人都能用 GPT-5,包括免費用戶( 每 5 小時最多可發送 10 則 GPT-5 訊息,超過限制後,自動切換到 GPT-5 mini ),而 Plus 用戶可使用更久(每 3 小時最多可發送 80 則 GPT-5 訊息)。
備註:不過目前依照社群回饋,還不是所有人都可以使用 GPT-5 模型,預設還是會啟用 GPT-4o 模型,預計要再等一點時間後才能夠全面導入。且《麻省理工科技評論》指出,GPT-5 確實有加強,但仍非革命性的技術突破。
比較維度 | GPT-4o (過去式) | GPT-5 (現在與未來) |
核心架構 | 需手動切換模式的多模態模型 | 整合性系統,自動判斷深淺思考 |
智慧水平 | 知識廣博,但推理較淺 | 頂尖推理能力,尤其在程式、數學、科學領域 |
可靠性 | 幻覺較多,複雜指令易出錯 | 幻覺大幅降低,指令遵循更精準 |
寫作風格 | 功能性、結構化 | 更具情感、文采與人性化 |
使用成本 | 價格較高 | 輸入成本減半,並提供極具性價比的 mini/nano 版 |
用戶體驗 | 你需要引導工具 | 工具主動配合你,成為思考夥伴 |
📍相關報導📍
你的TikTok Shop還安全嗎?AI+假App+釣魚頁,新型詐騙「ClickTok」正鎖定你的加密錢包