2025 年開始,很多人或許逐漸開始習慣一種新的互動方式:對 GPT 或 Gemini 說一句「幫我規劃下週去香港的行程。
(前情提要:探討 AI 代理應用:垂直型 Agent 能打破賽道疲態的僵局嗎?)
(背景補充:Solana AI 駭客松上線:一覽 12 個 AI Agent 新專案)
2025 年開始,很多人或許逐漸開始習慣一種新的互動方式:對 GPT 或 Gemini 說一句「幫我規劃下週去香港的行程,並推薦合適的機票酒店」,它就會在後臺默默完成資訊搜尋、條件篩選、路線選擇、價格比較等一連串步驟,最後只把結果交給你確認。
只不過,把同樣的期待帶到鏈上,故事卻完全變了。
譬如你對一個 DeFi Agent 下達指令:「把錢包裡的 ETH 換成 USDC,跨到 Base 鏈,再全額存進 Aave」,客觀而言,從「理解需求」和「規劃路徑」來看,今天的 Agent 並不一定做不到,真正的斷層出現在執行環節:
你依然很可能要逐步完成簽名、授權、兌換、跨鏈與存款等操作,,而且每一步都暴露在滑點變化、Gas 波動、橋接延遲和鏈上狀態變化的風險之下,這也意味著只要中間有一環偏離預期,前面的動作未必能撤回,後面的動作又可能接不上,最後留在鏈上的,往往只是一段沒做完的半成品流程。
問題不在於 AI 不夠聰明,而在於鏈上執行層至今還缺少一種真正適配 Agent 的表達方式。
也正因為如此,2026 年 4 月初,Biconomy 與以太坊基金會共同發布的 ERC-8211,旨在解決當前智慧合約執行中的「靜態限制」問題,為 AI 代理及複雜 DeFi 工作流提供更具表現力的執行層,試圖補上這塊缺失的拼圖。
一、AI Agent 接入鏈上的「最後一道斷層」
過去一到兩年裡,加密產業的注意力焦點正在從 L2 擴容、RWA 流動性,明顯轉向 AI Agent 如何真正接管鏈上操作這個頗具顛覆性的選題。
客觀而言,從「用自然語言下達多步 DeFi 策略」到「讓自主 Agent 託管一整條跨鏈投資組合」,近期我們也見到了諸多實踐,且大部分構想在 demo 層面已經成熟,無論是自然語言生成多步 DeFi 策略、自主執行再平衡、自動收益遷移、跨鏈倉位調整,甚至是更復雜的組合管理。
從推理和編排的角度看,AI 的能力已經跑得相當快了,只不過當真正把它放進生產環境,執行層的短板卻越來越明顯。
真要落到生產環境,這一短板可以概括成一句話:DeFi 是動態的,但今天的大多數 batch(批處理) 仍然是靜態的。
ERC-8211 官網和討論帖都把這個問題說得很清楚,即現有的 ERC-4337 與 EIP-5792,確實已經把「一次簽名對應一筆呼叫」的舊模式,推進到了「一次簽名可打包多筆呼叫」的新階段,但這些呼叫中的引數,本質上仍然大多是在簽名那一刻被凍結的。
也就是說,使用者在簽名時填進去的金額、目標值、預期輸出,到了真正執行時,並不會因為鏈上狀態變化而自動調整。
可 DeFi 本身恰恰是充滿不確定性的。一次 Swap 的實際輸出,取決於執行那個區塊裡的滑點和流動性;一次 Bridge 的到賬時間和最終到賬金額,取決於橋本身的機制和費用;借貸協議或 Vault 的 share-to-asset 比率,也會在不斷變化。
畢竟使用者或 Agent 在簽名時看到的數值,很多時候只是一個當下的預估,而不是執行時的真實結果。
要理解 ERC-8211 解決了什麼,先看一個最典型的例子,就是假設 Agent 想做一件看起來很普通的事——把帳戶裡的 ETH 換成 USDC,然後全額存入 Spark 賺取利息。
在現有靜態 batch 處理模型下,Agent 必須在簽名前預估 Swap 之後會拿到多少 USDC,往往迫使你在簽名時提前寫死第二步的輸入金額,且估得太高,真實到賬數字不夠,整個批次直接回滾;估得太低,又會留下一部分資金閒置在錢包裡做不了事。
換言之,基本就陷入了所謂的兩難處境,要麼承擔失敗風險,要麼承擔機會成本。這就是為什麼,很多看起來並不複雜的鏈上流程,一旦步驟拉長到 5 步、8 步,甚至跨兩條鏈,就會迅速變得脆弱,這不是因為策略本身複雜到無法描述,而是現有執行正規化太依賴預先寫死的引數。
簡言之,靜態 batch 的能力上限,事實上決定了 Agent 能真正安全執行的策略上限。
從這個角度看,ERC-8211 想解決的,並不是 AI Agent 怎麼做決策,而是當 Agent 已經做出決策之後,鏈上有沒有一種更自然、更穩定、更安全的方式來執行它。從而讓鏈上執行第一次擁有一種為 AI Agent 原生設計的表達形式。
二、ERC-8211 到底改了什麼?
ERC-8211 的核心突破,不在於把更多步驟塞進一次簽名,而是把 batch 處理從一段引數寫死的交易序列,升級成一段「引數在執行現場動態求值的程式」。
聽起來確實很抽象,但並不難理解,官方用了一句話來描述它:From transactions to programs。
這意味著 ERC-8211 不再把 batch 看作一份按順序執行的動作清單,而是把它視為一段執行時求值、並帶安全條件的執行程式,具體拆解的話,它透過三種可組合的原語實現這一點:
- Fetchers(取值器):定義了這個引數從哪裡取值,它可以是一次對某個地址當前餘額的查詢,使得引數不再是簽名時的快照,而是執行瞬間從鏈上狀態中抓取的即時讀數;
- Constraints(約束器):引數被解出來之後,還要透過內聯約束檢查——例如「換得的 USDC 至少要 ≥ 2500」,或「滑點不能超過 0.5%」,這些約束在值被路由進下一筆呼叫之前完成校驗,任何一項不透過,整個批次立即回滾;
- Predicates(觸發條件):可以理解為介於步驟之間的守門人,不負責產生值,而是負責判斷是否繼續執行,比如跨鏈場景裡,以太坊這一側的 batch 可以透過 predicate 守在「跨鏈過來的 WETH 已經到賬」這個條件上,到賬之前一直不提交;
在這套設計裡,每一個引數都要回答兩個問題:第一,這個值執行時該從哪裡來;第二,它被真正用進呼叫之前,需要滿足什麼條件,這樣三者組合後,一個批次不再只是交易序列,而是一段內嵌安全檢查的程式。
說到底,靜態 batch 處理的心智模型是一份清單——按順序執行 A、B、C 三步;而 ERC-8211 的心智模型則是一份帶條件的程式——A 執行後,取 A 的真實輸出作為 B 的輸入;B 滿足約束才進入 C;任何一步不達預期,整批迴滾。
我們其實可以把它簡單理解為一個專門為 AI Agent 和複雜 DeFi 操作設計的「智慧批處理」機制,因為在傳統的鏈上操作中,完成一筆複雜的 DeFi 策略往往需要多個獨立交易:從借貸協議提取資金、兌換代幣、再存入另一個協議(延伸閱讀《加密 AI 協議全景:從以太坊的主戰場出發,如何為 AI Agent 搭建新作業系統?》)。
每一步都需要單獨簽名和確認,這對人類使用者來說已經繁瑣,對需要高頻自主操作的 AI Agent 來說更是瓶頸,而 ERC-8211 的解決方案是允許多個區塊鏈操作在一筆交易中組合執行,每一步在執行時動態解析實際數值,且必須滿足預定義條件後才能繼續下一步。
例如一個 Agent 可以在一筆簽名交易中完成:從 Aave 提取資金 → 將實際收到的金額在 Uniswap 上兌換 → 將兌換結果存入 Compound——全部原子化執行,無需編寫新的智慧合約。
三、為什麼說它和錢包、尤其是智慧錢包關係更大
ERC-8211 之所以值得錢包產業關注,不只是因為它適合 Agent,更因為它會重新定義錢包在互動鏈路中的位置。
過去的錢包,更像是一個安全簽名器,它的職責是保管私鑰、展示交易、讓使用者確認,再把簽名發出去,這個角色在 EOA 時代已經足夠重要,在帳戶抽象時代也繼續成立,但如果未來越來越多的鏈上操作由 Agent 來代為完成,那麼錢包的角色就會更加居中與吃重。
原因很簡單,當使用者不再逐筆操控鏈上動作,而是開始授權一個 Agent 去執行一整套目標時,錢包必須有能力承接這種更高層的互動物件,它要展示的不再只是某個合約地址和一段 calldata,而是一整段「意圖—取值邏輯—條件判斷—最終結果」的執行程式。
因此,未來的錢包需要理解的,不再只是交易,而是程式。ERC-8211 正是在這一層給錢包提供了一個更清晰的抓手,因為它把這些執行語義都顯式寫進了編碼結構中,包含引數從哪裡來、必須滿足什麼條件、什麼時候繼續、什麼時候回滾,都不是隱藏在後端邏輯裡的黑箱,而是可被錢包解釋、模擬和展示的物件。
從錢包視角看,這一整套機制最終指向的是同一件事,即使用者不再是在籤一串自己很難完全讀懂的底層呼叫,而是在籤一份結果導向、邊界清晰、條件可驗證的執行程式:
- AI Agent 可以負責理解使用者意圖、生成路徑;
- 錢包負責把這條路徑用更清楚的方式展示給使用者稽核;
- 而 relayer 只負責在條件成立時提交,不擁有篡改結果的許可權;
這正是非託管執行之所以會被視為 Agentic DeFi 前提的原因,因為智慧體可以參與,但主權、約束和最終結算仍然留在鏈上,這也是 ERC-8211 與智慧錢包真正契合的地方,就是它把「安全表達複雜意圖」這件事,寫進了協議層標準裡。
值得一提的是,ERC-8211 與 ERC-4337、EIP-7702、ERC-7579 等帳戶抽象框架完全相容,它不替代帳戶抽象,而是在帳戶抽象之上,為 Agent 新增了一層程式化執行語義。
如果說 ERC-4337 解決了「誰能代表我發起交易」,EIP-7702 解決了「EOA 如何臨時擁有智慧合約能力」,那麼 ERC-8211 解決的就是一旦 Agent 開始替我操作,它能不能在一次簽名裡完成一整條決策鏈。
回看以太坊過去 10 年鏈上互動正規化的演化:
- 第一階段:一次簽名 = 一次函式呼叫(EOA 時代)
- 第二階段:一次簽名 = 一組靜態打包呼叫(ERC-4337、EIP-5792 時代)
- 第三階段:一次簽名 = 一段動態求值的意圖程式(ERC-8211 時代)
每一次躍遷,都意味著使用者(或代表使用者的 Agent)能用更少的摩擦,表達更復雜的目標。
雖然 ERC-8211 目前仍處於草案階段,技術討論仍在進行,大規模的協議接入也還需要時間,但它指向的方向已經足夠清晰,當 AI Agent 真正開始替人做鏈上決策,鏈上就需要一種與之匹配的、原生的執行語法。
📍相關報導📍
AI Agent 火爆,能成為下一個 DeFi Summer 嗎?

