• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

AI模型文心5.1正式上線:引數砍至5.0三分之一,預訓練成本只花6%

Mickey帽鼠 by Mickey帽鼠
2026-05-09
in AI
A A
36
SHARES
分享至Facebook分享至Twitter

百度文心大模型 5.1 正式上線,使用者可在文心一言官網體驗,企業與開發者可透過千帆平台呼叫 API。文心 5.1 基於今年 1 月發布的文心 5.0 訓練而來,總引數量壓縮至 5.0 的約三分之一,啟用引數約為一半,預訓練算力成本僅為同規模模型的 6%。核心技術是百度提出的 Once-for-All 彈性訓練框架。
(前情提要:DeepSeek 首輪融 73.5 億鎂甩開阿里:梁文鋒自掏四成,只要「條件最少」的錢)
(背景補充:Anthropic 五年砸 2,000 億鎂給 Google Cloud,兩家 AI 新創吃掉四大雲巨頭一半訂單)

本文目錄

Toggle
  • 重點摘要
  • Once-for-All 框架:一次預訓練,產出整個子模型矩陣
  • 6% 的含義
  • 常見問題

 

重點摘要

  • 百度文心 5.1 正式上線,總引數壓至 5.0 的三分之一,啟用引數約為一半
  • 預訓練算力成本僅為同規模模型的 6%,核心技術為 Once-for-All 彈性訓練框架
  • 文心 5.0 一次預訓練產出子模型矩陣,5.1 從中提取最優結構直接繼承知識

百度文心大模型 5.1 正式上線。使用者可在文心一言官網直接體驗,企業與開發者則可透過千帆平台呼叫 API。文心 5.1 基於今年 1 月發布的文心 5.0 訓練而來,核心賣點是大幅壓縮模型體積和訓練開銷。

5.1 版本在 Arena 搜索榜上登上第四位。

Once-for-All 框架:一次預訓練,產出整個子模型矩陣

成本壓縮的核心來自百度提出的 Once-for-All 彈性訓練框架。傳統做法需要為不同規模的模型分別跑預訓練,每個模型尺寸都是一次獨立的算力投入,規模版本越多,重複訓練的浪費越大。

文心 5.0 的做法不同:它只做一次預訓練,透過動態取樣技術同時最佳化大量不同大小的子模型,形成一個「子模型矩陣」。

文心 5.1 就是從這個矩陣中提取的最優結構。它直接繼承了 5.0 在預訓練階段累積的全部知識,省掉了從頭訓練所需的算力。

6% 的含義

「預訓練成本 6%」這個數字需要解釋的是,百度不是在同等規模上找到了更便宜的訓練方法,而是文心 5.1 根本跳過了從零開始的預訓練流程。它的訓練成本主要花在從 5.0 的子模型矩陣中篩選最優結構、以及後續的微調與對齊階段。與同行為每個模型規模獨立訓練的做法相比,這種「訓練一次、產出多個」的架構在邊際成本上具有結構性優勢。

這個邏輯與 DeepSeek 年初公布的低成本訓練路線不同。DeepSeek V3 強調的是在單次訓練中用更少的 GPU 和更高效的工程實現壓低成本;百度的 Once-for-All 則是把一次訓練的產出從「一個模型」擴充套件到「一整個模型家族」。

常見問題

文心 5.1 和文心 5.0 有什麼差別?

文心 5.1 基於 5.0 訓練而來,總引數壓縮至 5.0 的三分之一,啟用引數約一半。它從 5.0 的 Once-for-All 子模型矩陣中提取最優結構,繼承全部知識但推理更快、成本更低。

什麼是 Once-for-All 彈性訓練框架?

百度提出的訓練方法。只做一次預訓練,透過動態取樣同時最佳化不同大小的子模型,形成模型矩陣。新模型從矩陣中提取,省去從頭訓練的算力,邊際成本大幅降低。

加入動區 Telegram 頻道

📍相關報導📍

Cerebras 5/14 掛牌叫板輝達:IPO 超額 20 倍定價上修,單晶片吃掉整張晶圓

拿掉 AI 美國 GDP 只剩 0.66%:科技投資 Q1 砸破 1999 年紀錄,吃下經濟六成七

黃仁勳:Blackwell 和 Rubin 都不該讓中國取得,NVIDIA 中國市佔歸零仍不讓步

Tags: ERNIEOnce-for-All千帆平台文心大模型百度


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.