• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

Cloudflare接入Kimi K2.5後每天跑70億 token,安全審計成本省下77%

Mickey帽鼠 by Mickey帽鼠
2026-03-24
in AI
A A
285
SHARES
分享至Facebook分享至Twitter

Cloudflare 的 Workers AI 平台正式接入月之暗面(Moonshot AI)的 Kimi K2.5,支援 256K 上下文、多輪工具呼叫與視覺輸入。Cloudflare 內部安全審計 Agent 每天處理超過 70 億 token,切換後成本較中檔商業模型降低 77%。
(前情提要:Cursor 用 Kimi K2.5 訓模型卻沒說,開發者抓包、刪推、官方急轉彎全紀錄)
(背景補充:幫你擋爬蟲的 Cloudflare 推出「一鍵全站爬蟲 API」,完美支援 RAG、增量更新與模型訓練)

本文目錄

Toggle
  • 一天跑 70 億 token 的安全 Agent
  • Cloudflare 推出三個改進
  • 底層推理引擎:Infire 加持,不是硬套現成框架

 

Cloudflare 的 Workers AI 平台悄悄做了一件大事,據 Cloudflare 官方部落格 ,把月之暗面的 Kimi K2.5 設為 Agents SDK starter 的預設模型。Cloudflare 工程師自己也在用它跑真實的安全審計任務,而且省了很多經費。

Kimi K2.5 是目前開源陣營裡少數做到「前沿規格」的模型之一,支援 256K 上下文視窗、多輪工具呼叫(multi-turn tool calling)、視覺輸入與結構化輸出。對於需要長文推理的 Agent 任務來說,這幾個數字已經相當實用。

一天跑 70 億 token 的安全 Agent

Cloudflare 工程師在 OpenCode 環境中直接把 Kimi K2.5 拿來當程式設計 Agent 的主力,還部署了一個名為「Bonk」的公開程式碼審查 Agent,接入自動化管線。

更亮眼的是內部安全審計場景。這個 Agent 每天處理超過 70 億 token。如果用標準等級商業模型跑同樣的工作量,一年下來成本大概是 240 萬美元,換成 Kimi K2.5 之後,成本直接砍掉 77%,省下將近 185 萬美元。

這個數字不是在做廣告,而是 Cloudflare 工程師在官方部落格直接攤出來的帳。

Cloudflare 推出三個改進

光是換模型還不夠,Cloudflare 同步推出三項平台層面的改進,專門針對 Agent 長對話場景的成本和效率問題:

  • 字首快取折扣(Prefix Caching): 多輪對話中已處理過的輸入 token 不再重複計費,快取命中的 token 享受折扣價。長任務跑下來,這塊省的錢相當可觀。
  • Session Affinity Header: 新增 x-session-affinity 請求頭標,將同一會話路由到同一模型,讓快取命中率更高,OpenCode 與 Agents SDK starter 已內建支援。
  • 非同步批次推理 API:超出同步速率限制的請求可以非同步排隊執行,內部測試通常在 5 分鐘內完成。適合程式碼掃描、研究類不需要即時回應的 Agent 任務。

底層推理引擎:Infire 加持,不是硬套現成框架

Cloudflare 沒有用現成的推理框架,而是用自家的 Infire 推理引擎做了客製化核心,採用資料並行、張量並行與專家並行化,搭配分離式字首處理架構。

目前 Kimi K2.5 是 Workers AI 上線大模型推理的第一個案例,也說明了 Cloudflare 在 AI 基礎設施這塊的野心,可以配合網路平台,而且夠便宜。

加入動區 Telegram 頻道

📍相關報導📍

Cursor 用 Kimi K2.5 訓模型卻沒說,開發者抓包、刪推、官方急轉彎全紀錄

幫你擋爬蟲的 Cloudflare 推出「一鍵全站爬蟲 API」,完美支援 RAG、增量更新與模型訓練

深度分析》Cloudflare 推出穩定幣「NET Dollar」背後在下一盤什麼大棋?

Tags: CloudflareKimi K2.5Moonshot AIWorkers AI月之暗面


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.