• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

DeepSeek V4 四月下旬發布,梁文鋒內部證實:百萬 token 視窗、完全跑在華為昇騰 950 PR 晶片

Token 形上學 by Token 形上學
2026-04-10
in AI, 中國
A A
DeepSeek V4 四月下旬發布,梁文鋒內部證實:百萬 token 視窗、完全跑在華為昇騰 950 PR 晶片
97
SHARES
分享至Facebook分享至Twitter

DeepSeek 創辦人梁文鋒在內部溝通中親口確認,新一代旗艦模型 V4 將於 4 月下旬正式發布。洩露規格顯示總引數量逼近 1 兆、支援 100 萬 tokens 上下文,更將完全執行於華為昇騰晶片,被視為中國 AI 突破輝達依賴的關鍵一步。
(前情提要:DeepSeek V4 拒絕輝達 找華為!阿里、位元組跳動、騰訊搶買昇騰950PR晶片)
(背景補充:DeepSeek 上線「專家模式」和「視覺模式」,V4 正式推出前最後暖身?)

 

據《新浪財經》引述知情人士消息,DeepSeek 創辦人梁文鋒已透露新一代旗艦大模型 DeepSeek V4 將於 4 月下旬正式亮相。官方雖尚未公布確切日期,但開發者社群已率先感受到暖身訊號:V4-Lite 變體正在 API 節點測試中,推理速度較上一代提升 30%,128K tokens 的上下文召回率達到 94%。

千億引數、百萬 token 視窗

根據目前流出的未官方確認資訊,V4 架構沿用 Mixture-of-Experts(MoE)設計,總引數量約 1 兆,但每個 token 實際啟用的引數僅約 370 億,在算力效率上維持 DeepSeek 一貫的「精算師」風格。

上下文視窗部分:V4 透過全新的 Engram 模組,有望支援 100 萬 tokens 的超長上下文,與當前頂尖模型較勁。Engram 的核心概念是條件記憶查詢,讓模型能以 O(1) 的複雜度存取知識,而非隨序列長度線性膨脹。

在能力面,洩露的基準測試顯示 HumanEval 達 90%、SWE-bench Verified 超過 80%,若資料屬實,也直逼現有主流旗艦模型。模態方面,V4 原生支援文字、圖片與影片輸入,定價則約 $0.30/MTok(輸入),延續 DeepSeek 低價策略。

完全跑在華為晶片上:最大的地緣政治訊號

技術規格之外,V4 最受外界關注的一點是硬體策略的徹底轉向:官方稱整個模型將完全執行於華為昇騰 950 PR 晶片,不依賴任何輝達 GPU。

這個決定的影響遠超 DeepSeek 本身。阿里巴巴、位元組跳動、騰訊已陸續大量採購華為次世代晶片,若 V4 成功驗證昇騰可以撐起頂級旗艦模型的訓練與推理需求,將是中國 AI 產業鏈在晶片自主化上迄今最具說服力的實戰案例。

美國對輝達出口的管制措施在這個脈絡下,反而可能成為加速中國自主生態系成熟的催化劑。

加入動區 Telegram 頻道

📍相關報導📍

DeepSeek V4 拒絕輝達 找華為!阿里、位元組跳動、騰訊搶買昇騰950PR晶片

DeepSeek 上線「專家模式」和「視覺模式」,V4 正式推出前最後暖身?

樂天高調發布「日本最大 AI 模型」,社群發現核心是 DeepSeek V3

Nvidia 黃仁勳提出「AI 五層蛋糕論」:以第一性原理理解 AI 發展架構

Cursor 用 Kimi K2.5 訓練模型被抓包!刪推、官方表態急轉彎

Tags: DeepSeek昇騰950PR梁文鋒華為

關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.