• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

Claude Code 新推 /goals 指令:分離執行與評估,避免 AI 代理偷懶說謊

Joe by Joe
2026-05-15
in AI, 技術
A A
Claude Code 新推 /goals 指令:分離執行與評估,避免 AI 代理偷懶說謊
36
SHARES
分享至Facebook分享至Twitter

Anthropic 為 Claude Code 推出 /goals 指令,將任務執行與完成判斷分拆給兩個獨立模型,因為讓同一個 AI 評判自己的功課,在架構上就是有缺陷的設計。
(前情提要:Claude Code 宣布每週 Token 使用上限增加 50%!為期兩個月 Anthropic 搶佔開發者生態)
(背景補充:Claude Code 自動執行功能 Routines 上線:排程、API、GitHub 事件三種觸發全支援)

 

你可能有碰到過這種狀況:AI 完成了程式碼設計,它回應你任務完成。但幾天後你才發現,幾個模組根本沒被編譯。這不是模型能力不足,而是模型自己決定它「已經做完了」,但實際上它沒有。

為了改善這種狀況,Anthropic 本週為 Claude Code 新推出 /goals 指令。邏輯很直接:執行任務的模型,和判斷任務是否完成的模型,必須是兩個不同的角色。同一個模型不能同時扮演這兩者,因為它永遠是評判自己功課最糟糕的評審。

How do you keep Claude working until the job is done? Claude Code helps with this in a few ways, including one we shipped recently: /goal. pic.twitter.com/QtVPmwoKct

— ClaudeDevs (@ClaudeDevs) May 13, 2026

AI 代理為何會「提早收工」

AI 編碼代理的工作是一個迴圈:讀取檔案、執行命令、修改程式碼,然後判斷任務是否完成。問題就在最後這一步。

執行過程中積累的上下文:已完成的步驟、嘗試過的方法、走過的錯誤…讓模型對自身進度產生偏差。它傾向把「我做了很多」等同於「我做完了」。這個問題在企業環境中代價昂貴:程式碼遷移或測試修復若在終態前停止,往往要幾天後才被發現。

目前產業也有一些方案。OpenAI 讓代理模型自行決定何時停止,允許開發者自行接入外部評估器。Google ADK 支援透過 LoopAgent 實現獨立評估,LangGraph 也支援類似模式,但這些方案有共同點:批評節點(critic node)和終止邏輯需要開發者自己設計,平台不提供預設。

一個指令、兩個模型

/goals 的核心設計是把「執行」和「評估」正式拆成兩個角色。開發者輸入目標條件,例如:

/goal test/auth 目錄下的所有測試都通過,並且 lint 檢查結果為乾淨

每當代理嘗試結束工作,評估模型就接手核查。評估模型預設使用 Claude Haiku(Anthropic 旗下較輕量的模型)。選擇小模型的原因很簡單:評估者只需要做一個二元判斷,條件滿足或條件未滿足,不需要大模型的推理能力。

當條件未滿足,代理繼續執行;當條件滿足,評估模型將結果記錄到對話記錄並清除目標。整個流程在 Claude Code 內部完成,不需要額外的第三方可觀察性平台或自訂日誌系統。

Anthropic 檔案指出,有效的目標條件通常需要三個要素:可衡量的終態(測試結果、建置退出碼、特定檔案數量);明確的驗證方式(例如「npm test 退出碼為 0」);以及過程中不得變動的限制(例如「不得修改其他測試檔案」)。

加入動區 Telegram 頻道

📍相關報導📍

Claude Code 桌面版大更新:多工並行、拖拉布局、三種顯示模式+新快捷鍵,為開發者而生

Anthropic 訂閱 Claude Code 封殺龍蝦 OpenClaw!往後第三方工具僅能付費額度

鞭打 Claude code 加速的 badclaude 開源專案,被 Anthropic 寄侵權通知信了

Anthropic AI 經濟指數萬字報告:自動化交易工作流頻率翻倍,Claude 正從工具變生活助理

頂級 AI 模型走向分化:ChatGPT to C,Claude to B

Tags: AnthropicClaude CodeGoogle ADKOpenAISean Brownell


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.