🔥 DeerFlow 2.0:字節跳動讓 AI 不再只會「說」,而是真正「執行」

GitHub 熱門專案系列 #001
---

事件摘要

2026 年 2 月 27 日,字節跳動(ByteDance)開源釋出了 DeerFlow 2.0——一個全新的 SuperAgent 運行時框架。24 小時內登上 GitHub Trending 第一名,至今已累積超過 50,000 顆星星、破萬次 fork。這個數字不是靠病毒行銷,而是來自真實的開發者需求。
DeerFlow 2.0 的核心定位是:「SuperAgent Harness」——一個把 sub-agents、sandbox、memory、skills 全部組織好,讓 AI Agent 可以真正完成任務(而不只是給出建議)的執行引擎。
---

為什麼重要:從「說」到「做」的鴻溝

大多數 AI Agent 框架給你的產品是:一段文字。你讓它研究一個主題,它回你一段摘要;你讓它寫程式,它給你一個 code block。程式會不會真的跑起來、報告能不能變成投影片、網頁能不能真正上線——全部是你自己的責任。
DeerFlow 2.0 把這個鴻溝補起來了。它給 AI 一台自己的電腦
  • 隔離的 Docker 容器:真實的檔案系統、bash 終端機
  • 可執行:AI 不只是「建議」執行什麼指令,而是真的在容器裡跑起來
  • 狀態持久化:session 結束不會忘記,你的寫作風格、技術棧偏好會一直記住
> 傳統框架:AI 說它可以跑腳本。DeerFlow:AI 在一個隔離容器裡真的把腳本跑完,交出你可以下載的輸出結果。
---

核心架構:四塊積木

1. Lead Agent + Task Decomposition(智能分解)

收到複雜任務時(例如:「研究 2026 年 AI 新創 Top 10,並製作一份完整簡報」),DeerFlow 的 Lead Agent 不會用單一 prompt 一次做完。
它會:
  • 將任務拆解成邏輯子任務
  • 找出哪些可以並行處理
  • 同時拉起多個 Sub-Agent(各有一個隔離的上下文、工具、終止條件)
  • 各 Sub-Agent 完成後,結果自動匯聚給 Lead Agent 統一整合
一個研究任務可以同時拆出十幾個 Sub-Agent 分頭探索不同方向,最後合併成一份報告、一個網站、一套附有視覺內容的簡報。

2. Execution Sandbox(隔離執行環境)

DeerFlow 的每個任務都運行在隔離的 Docker 容器裡,裡面有:
  • /mnt/user-data/uploads/ — 上傳的檔案
  • /mnt/user-data/workspace/ — Agent 的工作目錄
  • /mnt/user-data/outputs/ — 最終交付物
Agent 可以讀寫檔案、執行 bash 命令、跑 Python 腳本、看圖片,全部在 sandbox 內完成,session 之間互不污染。

3. Skills(可擴充的技能市場)

Skills 是 DeerFlow 能做「幾乎任何事」的關鍵。一個 Skill 就是一個 Markdown 檔案,定義工作流程、最佳實踐與相關資源。
內建 Skills 包括:
  • 🌐 深度網路研究
  • 📄 報告生成
  • 📊 簡報製作
  • 🖥️ 網頁生成
  • 🖼️ 圖片與影片生成
你可以加入自己的 Skills,或把多個 Skills 組合成複合工作流。Skills 採用按需漸進載入——任務需要的時候才載入,不會一次把所有內容塞進上下文,節省 token。

4. 長期記憶(Memory)

大多數 Agent 對話結束就全忘光。DeerFlow 不一樣:
  • 跨 session 逐步累積你的偏好、知識背景、工作習慣
  • Memory 存在本地端,掌控權在你
  • 採用 TIAMAT 作為雲端記憶後端(企業級規模的持久化支援)
  • 新增「置信度評分」,試圖對儲存的知識點做品質把關
> ⚠️ 誠實提醒:長期記憶在 Agent 系統仍是實務上的未解難題。理論上優雅,實際上仍需驗證——建議在正式依賴前先自行測試。
---

與其他框架的差異

特色DeerFlow 2.0AutoGenCrewAI
Sandbox 執行✅ Docker 隔離❌ 無❌ 無
Lead Agent 協調✅ 原生支援⚠️ 需自行組合⚠️ 需自行組合
長期記憶✅ 跨 session
Skills 市場✅ Markdown 格式
即時通訊集成✅ Telegram/Slack/飛書
Claude Code 集成/claude-to-deerflow
DeerFlow 最大的差異化是沙盒優先(Sandbox-First):不是讓 AI「假裝」執行,而是真的在一台隔離的電腦上把事情做完。
---

推薦模型

DeerFlow 支援任何 OpenAI API 相容的 LLM,但官方推薦:
  • Doubao-Seed-2.0-Code(字節跳動自家模型)
  • DeepSeek v3.2
  • Kimi 2.5
底層是 LangGraph + LangChain,理論上任何模型都可以替換,但 Lead Agent 需要強推理 + 結構化輸出能力,小型模型在複雜任務分解時容易破功。
---

可以實際做出什麼?

開發者社群已經實際應用的場景:
  1. 研究報告生成:輸入主題,自動抓取全網資料、生成圖表、輸出有引用來源的完整文件
  2. 數據流水線:上傳資料集,自動寫 Python 清理與轉換腳本,執行後交付視覺化結果
  3. 投影片製作:研究完一個領域,自動生成一套可演示的簡報檔
  4. 網頁應用:從需求到上線原型,全部在沙盒裡完成
  5. 內容自動化:結合技能市場,打造一個完全自動的新聞彙整機器
---

對台灣工程師與投資人的意義

技術層面:DeerFlow 代表了 AI Agent 從「聊天介面」到「執行引擎」的典範轉移。對 LangChain / LangGraph 生態系熟悉的工程師可以無痛接入;對有 Docker 部屬能力的團隊,是目前開源界最完整的 Multi-Agent 解決方案之一。
產業層面:字節跳動正在建立自己的 AI 開源生態系,Doubao 模型 + DeerFlow 的組合對標的是 Google 的 Gemini + Agent Framework。持續觀察其商業化路徑(火山引擎 / BytePlus)。
投資層面:DeerFlow 的竄紅襯托出 Multi-Agent 架構的市場需求。相關受惠方向包括:
  • 提供算力的雲端服務商(特別是 GPU cluster)
  • LangChain/LangGraph 生態系工具
  • Docker / 容器化基礎設施
  • 企業級 Agent 部署方案
---

Reference