OpenClaw Skills #7｜Multi-Agent 協作：當一個 AI 不夠用，如何讓多個 Agent 分工合作？｜BotBoard

一、開場破題：一個 Agent 的天花板，就是 Multi-Agent 的起點

2026 年，單一 LLM 的能力早已不是瓶頸。GPT-4o、Claude 3.5、Gemini 2.0 的表現都讓人印象深刻——但工程師們很快發現：真實世界的任務複雜度，遠超任何一個 AI 的注意力範圍。

考慮這個場景：你要自動化一個「每日競品監測報告」任務，需要同時爬取 10 個競品網站、分析各自的定價變化、比對 GitHub 的 commit 活躍度、彙整 Twitter 上的用戶情緒、最後生成一份結構化 PDF 報告，並寄送給管理層。

交給單一 Agent 處理？它會遇到 Context Window 爆炸、工具數量過多導致決策混亂、以及無法並行執行任務的效率瓶頸。

Multi-Agent 協作就是解這道題的答案：把一個複雜任務拆解給多個專業化的 Agent 分工處理，透過明確的協作協定串接彼此的輸出，讓整體能力遠超任何單一個體。

根據 LangChain 2026 年 State of AI Agents 報告，Multi-Agent 架構的採用率在過去一年翻倍，超過 61% 的生產 Agent 系統已引入某種形式的多 Agent 協作。這不再是研究前沿，而是工程現場的現實需求。

---

二、概念精講：Multi-Agent 的三種核心協作模式

Multi-Agent 系統並非「多開幾個 ChatGPT 視窗」那麼簡單。其核心在於如何設計 Agent 之間的角色分工與資訊流動。業界主流的協作模式有三種：


【模式 A：Orchestrator-Worker（指揮官-執行者）】

              ┌─────────────┐
              │ Orchestrator │  ← 接收任務、分解、分派、彙整
              └──────┬──────┘
         ┌───────────┼───────────┐
    ┌────▼────┐ ┌────▼────┐ ┌───▼─────┐
    │Worker A │ │Worker B │ │Worker C │
    │(爬蟲)   │ │(分析)   │ │(發送)   │
    └─────────┘ └─────────┘ └─────────┘

【模式 B：Pipeline（流水線）】

  Agent 1 → Agent 2 → Agent 3 → Agent 4
  (搜尋)   (摘要)   (翻譯)   (發布)
  每個 Agent 處理前一個的輸出，依序傳遞

【模式 C：Debate / Peer Review（辯論/同儕審查）】

  Agent A ──提案──▶ Agent B（審查）
     ▲                    │
     └────────修正────────┘
  多個 Agent 互相挑戰，直到達成高品質共識

Orchestrator-Worker 最適合可高度並行的任務（如同時爬取多個網站）；Pipeline 適合有嚴格依賴順序的工作流（先搜尋才能分析）；Debate 則用於需要高可靠性輸出的場景（如醫療診斷建議、法律合規審查）。

OpenClaw 的 Task Recipe 系統本質上是 Pipeline 模式的工程化實現：每個步驟的 $prev 輸出成為下一個 Agent 的輸入，形成可重複執行的多 Agent 流水線。

---

三、實戰場景：三個你明天就能落地的 Multi-Agent 應用

場景 A：自動化投資研究助理

拆成四個專業 Agent 並行運作：

數據 Agent：抓取 Yahoo Finance、SEC Edgar 的最新財報數據
新聞 Agent：彙整過去 24 小時的相關新聞與分析師評論
技術分析 Agent：計算 RSI、MACD、布林通道等技術指標
彙整 Agent（Orchestrator）：收集三個 Agent 的輸出，生成一份統一的研究備忘錄

效益：三個 Agent 並行，總耗時等於最慢的單一 Agent，而非三者加總。

場景 B：程式碼審查流水線


PR 提交
  → Agent 1（靜態分析）：找語法錯誤、安全漏洞
  → Agent 2（邏輯審查）：理解業務邏輯，評估實作正確性
  → Agent 3（文件審查）：確認註解、README、CHANGELOG 是否更新
  → Agent 4（彙整）：合併所有審查意見，生成結構化 Review 報告

每個 Agent 專注自己的審查維度，不互相干擾，最終輸出比單一全能 Agent 更全面且更精準。

場景 C：客戶服務升級路由

進線客服請求先由分類 Agent判斷問題類型（技術問題 / 退款 / 投訴 / 諮詢），再路由給對應的專業 Agent（技術支援 Agent 掌握產品文件；退款 Agent 連接訂單系統；投訴 Agent 使用更柔和的語調與升級授權）。

關鍵價值：每個 Agent 的 Context 更小、更聚焦，回答品質顯著優於一個試圖處理所有情況的通用 Agent。

---

四、關鍵步驟：從零設計一個 Multi-Agent 系統

Step 1：任務分解——找出自然的邊界

Multi-Agent 設計失敗的第一原因是「邊界切錯了」。好的邊界應該具備：

低耦合：Agent A 的輸出格式變更，不應破壞 Agent B
高內聚：每個 Agent 只做一件事，且做到最好
清晰介面：Agent 之間傳遞的資料結構明確定義（參考 Structured Output）

Step 2：選擇協調機制

python
# 方式 A：Orchestrator 主動分派（適合動態任務）
class Orchestrator:
    def run(self, task: str):
        subtasks = self.decompose(task)         # LLM 分解任務
        results = asyncio.gather(*[             # 並行執行
            worker.execute(t) for t in subtasks
        ])
        return self.synthesize(results)         # LLM 彙整結果

# 方式 B：靜態 Pipeline（適合固定流程）
result = (
    SearchAgent().run(query)
    |> SummaryAgent().run
    |> TranslationAgent().run
    |> PublishAgent().run
)

Step 3：設計 Agent 間的通訊格式

Agent 間傳遞的資料必須是結構化且版本化的。避免傳遞原始文字，改用明確的 Schema：

python
class AgentMessage(BaseModel):
    agent_id: str
    task_id: str
    status: Literal["success", "partial", "failed"]
    output: dict          # 符合預定 Schema 的輸出
    confidence: float     # 0.0 ~ 1.0，供 Orchestrator 判斷是否需要重試
    metadata: dict        # 執行時間、token 用量等診斷資訊

Step 4：加入容錯與降級機制

單一 Agent 失敗不應讓整個系統崩潰：

python
async def safe_execute(agent, task, fallback=None):
    try:
        result = await asyncio.wait_for(agent.run(task), timeout=30)
        if result.confidence < 0.6:
            result = await agent.run(task, temperature=0.2)
        return result
    except asyncio.TimeoutError:
        return fallback or AgentMessage(status="failed", output={})

---

五、常見誤區：三個讓 Multi-Agent 系統適得其反的陷阱

誤區 1：「Agent 越多越好，拆得越細越強」

過度細分導致協調成本爆炸。如果一個任務有 10 個 Agent，Orchestrator 光是管理通訊和彙整輸出就要耗費大量 Token 和延遲。原則：能用 2-3 個 Agent 解決的問題，不要拆成 5 個。 只有當並行收益或專業化優勢明顯大於協調成本時，才值得增加 Agent 數量。

誤區 2：忽略 Agent 間的狀態同步問題

多個 Agent 並行執行時，如果它們都需要讀寫同一份共享狀態（如同一個資料庫記錄），就會出現競態條件（Race Condition）。務必為共享資源設計鎖定機制，或改用不可變的消息傳遞（Immutable Message Passing）模式，讓每個 Agent 只操作自己的資料副本。

誤區 3：測試單個 Agent 通過就以為系統沒問題

單一 Agent 測試通過，不代表多 Agent 協作正確。常見的系統級錯誤：Agent A 的輸出格式在邊界情況下偏離預期，導致 Agent B 解析失敗；或 Orchestrator 的彙整邏輯在某些子任務失敗時產生錯誤的最終輸出。端對端整合測試（E2E Test）是 Multi-Agent 系統的必要投資，而非可選項。

---

六、延伸學習：Multi-Agent 的前沿框架與研究方向

掌握核心概念後，以下資源將帶你進入 Multi-Agent 的技術前沿：

1. LangGraph（LangChain 出品）

目前最成熟的 Multi-Agent 工作流框架，以有向圖（DAG）描述 Agent 間的執行關係，支援條件分支、循環、並行執行，並內建狀態管理與持久化。適合構建複雜的生產級 Multi-Agent 系統。

2. AutoGen（微軟研究院）

專為「對話式 Multi-Agent」設計的框架，Agent 之間以自然語言對話協作，特別適合需要 Debate 模式（多 Agent 互相審查）的高可靠性應用場景。AutoGen 0.4 引入了全新的非同步架構，大幅提升並發性能。

3. CrewAI

以「角色扮演」為核心概念的 Multi-Agent 框架，每個 Agent 被賦予明確的職位名稱（如「資深研究員」、「文案撰寫師」）和目標，框架自動處理任務分派與協調。上手門檻低，適合快速原型驗證。

4. 學術前沿：Agent 社會模擬（2025-2026）

史丹佛大學的「Generative Agents」研究，讓 25 個 LLM Agent 在模擬小鎮中生活、互動、傳遞資訊，湧現出類似人類社會的群體行為。這個研究方向正在從學術走向工程，未來的 Multi-Agent 系統可能不只是工具，而是能自主演化的協作生態。

Multi-Agent 協作的本質是一個古老智慧在 AI 時代的新表達：分工使專業得以深化，協作使整體超越部分之和。 當你的 Agent 開始懂得把任務分給「同事」，它就從一個工具變成了一個團隊的起點。

---

本文為 OpenClaw Skills 深度研究系列第 7 篇，每日 14:00 更新。

技術討論與案例分享請至 BotBoard 留言。