• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

OpenAI推出o3模型!推理能力再推高等級,為下一代AI鋪路

DaFi Weaver by DaFi Weaver
2024-12-21
in AI
A A
OpenAI推出o3模型!推理能力再推高等級,為下一代AI鋪路
90
SHARES
分享至Facebook分享至Twitter

OpenAI 推出全新推理模型 o3,以突破性 75.7% 的 ARC-AGI 測試成績刷新紀錄,並引入「審慎對齊」技術,加強模型安全性。該模型目前開放安全測試申請,預計 2025 年初正式發布。
(前情提要:OpenAI 影片生成工具Sora正式上線!5大功能亮點、訂閱方案一次看)
(背景補充:OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? )

本文目錄

  • 模型特點
    • 1) 推理能力創下 SoTA 成績
    • 2) 多版本選擇
    • 3) 安全性強化
  • 命名由來
  • 邀請研究人員參與安全測試

 

ChatGPT 背後開發商 OpenAI 連續 12 天新品發表於昨(20)日迎來尾聲,壓軸登場的是全新的推理模型「o3」和「o3-mini」,這款 AI 模型擁有更強的推理能力,旨在解決需要逐步邏輯推理的複雜任務。

Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD

— OpenAI (@OpenAI) December 20, 2024

模型特點

1) 推理能力創下 SoTA 成績

OpenAI 聲明指出,o3 模型在多項基準測試中表現優異,包括複雜的編程、數學和科學問題,顯示出其強大的邏輯推理能力。

在由 Alignment Research Center (ARC) 開發,用於測試 AI 系統通用人工智慧(AGI)能力的「ARC-AGI」評估中,o3 在部分非公開測試中取得了 75.7% 的突破性成績,創下技術新高度(State of the Art, SoTA)。

此外,一個高計算資源版本(high-compute configuration)的 o3 在相同測試中達成了更高的 87.5% 成績,但可能由於該版本資源要求超出標準,未能符合 ARC-AGI-Pub(公開可驗證 ARC-AGI 測試結果)的資格。

New verified ARC-AGI-Pub SoTA!@OpenAI o3 has scored a breakthrough 75.7% on the ARC-AGI Semi-Private Evaluation.

And a high-compute o3 configuration (not eligible for ARC-AGI-Pub) scored 87.5% on the Semi-Private Eval.

1/4 pic.twitter.com/uQA47JWkl6

— ARC Prize (@arcprize) December 20, 2024

2) 多版本選擇

OpenAI 提供了 o3 和 o3-mini 兩個版本,後者預計於 2025 年 1 月底推出,完整版 o3 將隨後發布(並未公布具體時間)。

這款新模型採用了 OpenAI 最近推出的自適應思考時間(Adaptive Thinking Time)API,提供低、中、高三種不同的推理模式。該功能允許使用者根據需求調整模型在回答問題前的「思考」時間長度。從下圖可以看出,o3-mini 在推理結果上能與目前的 o1 模型 相媲美,但在運算成本方面則顯著降低。

3) 安全性強化

OpenAI 採用了新的「審慎對齊(Deliberative alignment)」訓練方法,直接教導大型語言模型(LLMs)理解人類撰寫的、可解釋的安全規範,並在回答問題之前確保遵守這些規範進行推理。OpenAI 在聲明中表示:

通過這種方法,我們成功對 OpenAI 的 o 系列模型進行了優化,使其能使用「思維鏈」(Chain-of-Thought, CoT)推理技術,反思使用者的提問,找出 OpenAI 內部政策中相關的規範文本,從而生成更安全的回應。

命名由來

值得一提的是,OpenAI 跳過了「o2」的命名,直接使用了「o3」。執行長 Sam Altman 解釋,這是為了避免與英國電信供應商 O2 產生混淆,同時展現了 OpenAI 獨特的幽默感。他在直播中表示:

「出於對 Telefónica(O2 的母公司)的尊重,以及延續 OpenAI 極度不擅長取名的優良傳統,我們將它命名為 o3。」

邀請研究人員參與安全測試

目前,o3 和 o3-mini 正處於內部安全測試階段,OpenAI 已開放申請,邀請外部研究人員參與安全測試。 申請將於 2025 年 1 月 10 日截止。

對於該模型的推出,Sam Altman 毫不謙虛地表示,這標誌著 AI 發展正式進入「下一階段」。

回顧今年中彭博爆料 OpenAI 的 AI 分級表,在聊天機器人和推理模型後的下一階段便是 Agents —— 能代表使用者採取行動的先進 AI 系統。這正是當前無論是加密貨幣市場還是 Web2 領域,都在全力探索與開發的重點方向。

OpenAI 的 AI 分級系統劃分。圖源:彭博

📍相關報導📍

OpenAI發表Day2》逆天「強化學習微調」新功能,增強AI專業領域學習準確度

OpenAI 宣布將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏?

OpenAI政治博弈失利,Sam Altman將難敵馬斯克與川普的「AI同盟」?

 

Tags: o3o3-miniOpenAI推理模型


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.