• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

為什麼 AI 應用公司都開始自己訓練模型?你的用戶數據,就是你的護城河

Token 形上學 by Token 形上學
2026-05-15
in AI
A A
為什麼 AI 應用公司都開始自己訓練模型?你的用戶數據,就是你的護城河
36
SHARES
分享至Facebook分享至Twitter

凡是以長週期代理迴圈為核心產品的公司,正系統性地離開大型實驗室模型、轉向自訓專屬模型。本文源自 Baseten 共同創辦人 Charlie O’Neill 文章,由動區編譯、整理。
(前情提要:Cursor 用 Kimi K2.5 訓練模型被抓包!刪推、官方表態急轉彎)
(背景補充:Cursor 估值翻倍衝 500 億美元,迎接新一輪 20 億鎂融資)

 

過去五年,我每天做的事就是拿一個通用 LLM,教它做特定的事。最初是教 GPT-2 做模組化加法;現在則是教兆參數以上的模型執行有時需要數小時才能完成的任務。

2024 年:「Wrapper」元年

2024 年是「包裝層」之年。Cursor 是最典型的例子:它包裝大型實驗室的模型,超越 GitHub Copilot,成為 AI 輔助編程的首選。

2025 年,Cursor 推出了 Composer。底層基礎是開源的 Kimi,但魔法來自一個完全在內部進行後訓練(post-training)的模型。他們這麼做不是為了省 API 費用,而是因為他們想清楚了一件市場尚未完全定價的事:

在 Cursor 裡做好程式碼的 reward signal,只存在於 Cursor 內部,別無他處。

整個 App 層的共同戰略

Cursor 只是最顯眼的例子,這件事已成為整個 App 層越來越一致的策略:貼近用戶,理解模型在何時真正有效,然後訓練出更好的模型與產品,讓飛輪轉起來。

這個模式一再出現,已不可能只是巧合。任何產品是長流程 agentic loop 的公司,都在離開大型實驗室,轉向用自己互動數據訓練出來的模型。

Decagon、Abridge、OpenEvidence、Hippocratic、Intercom、Chroma、Pinterest、Cognition、Lovable、Notion、Harvey、Gamma、World Labs 等前沿公司,全都在開源權重之上訓練自己的模型。在 Baseten,我們協助這一波公司訓練核心 agent,讓他們從前沿 API 轉移到專業化模型。

Sutton 的「苦澀教訓」救不了大型實驗室

常見的反駁是:「一般化終將勝過專業化,也就是說預訓練規模會贏,等下一個基礎模型就好。」

這個論點在你用算力對抗固定目標時成立。但大多數目標並不固定。

「在這個用戶的 repo 裡做好程式碼補全」或「為這位醫生的病患群撰寫好的臨床記錄」,這些都是移動的目標。正確性是透過產品迭代才被發現的。

對靜態語料庫做再多的 next-token prediction,也產生不了它。只有針對結果做 RL(被接受 vs. 被拒絕的補全,在真實工作流程中成功 vs. 失敗的 agent 軌跡)才能產生它。而那些結果只存在於產品運行的地方。

這是專業化勝過一般化的軸線,也是前沿仍有剩餘空間的軸線。

實證案例已無可否認

過去一年,在相同能力預算下,專業化開源模型已能穩定匹配甚至超越前沿模型在 in-distribution agentic 任務上的表現;任務的流程越長、越依賴工具使用,這個差距就越大。

方向與前沿一致,但機制不同。我們正在獲得接近一個數量級更好的單位經濟效益。

為什麼大型實驗室無法跟進

原因是組織結構。

前沿實驗室的組織方式是「用一個模型服務多個客戶」。專業化要求的是相反:「為細分客戶建構多個模型,與推論堆疊和客戶的數據迴路共同設計。」

讓實驗室擅長預訓練的特質(集中式訓練運行、單一模型服務經濟、研究室型組織架構),與讓專業化業務成功所需的特質,存在積極的張力。Fine-tuning API 只是附帶業務,因為它必須是附帶業務。

佐證:OpenAI 剛剛棄用了他們的 fine-tuning API。

把專業化視為一級業務,意味著承認預訓練規模不是現實世界價值的關鍵限制,而這正是他們整個資本結構所立基的論題。他們可以雇用領域專家,但無濟於事,因為讓 OpenEvidence 或 Abridge 優秀的 98%,不是醫學知識,而是他們建立在產品中的反饋迴路。

飛輪只在產品迴路內轉

這一波公司都已想清楚:在軟體成本崩潰之後,唯一能存活的護城河,是擁有一個用任何人都看不到的信號訓練出來的模型。

  • 每個用戶 session 都在產生訓練數據
  • 每次訓練運行都能產出更好的模型
  • 更好的模型吸引更多用戶與更多數據

飛輪在產品迴路內轉動,而大型實驗室,無論規模多大,都在這個迴路的外面。

每個產品都有一個極其細緻的「什麼是好」的標準。公司現在關心的是模型 UX——這是在訓練時決定的,無法透過 prompt 消除(例如,工具調用或搜尋深度的程度、工具調用的並行性等)。

結語

App 層公司現在問的問題已不再是「我們如何使用 AI?」

而是:「我們如何抵抗商品化,為客戶提供更好的結果?」

答案是:基於你每天服務對象的獨特理解,訓練出專業化模型。大型實驗室做不到,但你可以。

加入動區 Telegram 頻道

📍相關報導📍

馬斯克 SpaceX 取得 Cursor 收購選擇權:$600 億買下 AI 開發神器或 $100 億分手費

Notion 推出開發者平台:自訂程式碼、跨資料庫同步、整合 Claude Code,Codex,Cursor

Y Combinator 創業指南解讀:AI Agent 在未來有哪些發展趨勢?

加州大學研究「AI 腦霧」現象:14% 上班族被Agent、自動化搞瘋,離職意願高四成

完全指南:AI+NFT能碰撞出怎樣的火花?演算法整理、生成方式教學..

Tags: BasetenCursorKimiOpenAI大型語言模型


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.