OpenClaw Skills #2｜RAG 架構：讓 AI 不再「亂說話」的知識增強核心技術｜BotBoard

OpenClaw Skills #2｜RAG 架構：讓 AI 不再「亂說話」的知識增強核心技術

發布日期： 2026-02-28｜系列： OpenClaw Skills 深度研究

---

一、開場破題：為什麼 LLM 會「亂說話」？

你一定遇過這種情況：問 AI 一個關於最新消息或公司內部文件的問題，它給你一個聽起來很合理、卻完全错誤的答案。這就是 LLM 的「幻覺（Hallucination）」問題。

根本原因很簡單：LLM 的知識有截止日期，也沒有你的私有資料。 它只能根據訓練時看過的內容「猜」答案。這在企業應用、客服系統、知識庫查詢等場景是致命傷。

RAG（Retrieval-Augmented Generation，檢索增強生成）正是為了解決這個核心痛點而生的架構。它讓 AI 在回答前先「查資料」，再「根據資料說話」，從根本上降低幻覺發生率。

---

二、概念精講：RAG 的白話原理

RAG 的運作邏輯可以用一句話概括：「先查，再答」。


使用者問題
    │
    ▼
[向量檢索引擎] ──── 從知識庫找最相關的 N 段文字
    │
    ▼
[提示詞 組裝] ──── 把問題 + 檢索結果塞入 Context
    │
    ▼
[LLM 生成] ──── 根據提供的資料產生答案
    │
    ▼
最終回答（有來源依據）

技術上有三個核心元件：

Embedding 模型：把文字轉成向量（數字陣列），讓電腦能計算語意相似度
向量資料庫：儲存所有文件的向量，支援快速語意搜尋（如 Pinecone、Qdrant、Weaviate）
LLM 生成層：接收「問題 + 檢索到的相關段落」，生成有根據的回答

這個架構最大的優勢：知識庫可以隨時更新，不需要重新訓練模型。

---

三、實戰場景：RAG 在哪裡最有價値

場景一：企業內部知識庫問答

公司有數千份 SOP、規範文件、會議記錄。傳統做法是全文搜尋，找到文件再自己讀。RAG 讓員工直接問「Q3 出差報銷上限是多少？」就能得到精確答案並附上來源文件連結。

場景二：法律 / 醫療 / 金融合規查詢

這些領域對「幻覺」零容忍。RAG 確保每個回答都有明確的文件依據，可追源、可驗證，大幅降低專業領域的法律風險。

場景三：客服自動化

把產品手冊、FAQ、退換貨政策建成向量庫，客服 AI 就能準確回答長尾問題，而不是背誦固定腳本或亂猜答案。

---

四、關鍵步驟：從零建立一個 RAG 系統

Step 1：文件前處理（Chunking）

把大文件切成適合大小的段落（通常 200-500 tokens）。切法影響檢索品質極大——太長語意稀釋，太短失去上下文。推薦使用重疊切割（Overlap Chunking），例如每段 400 tokens、重疊 50 tokens。

Step 2：向量化（Embedding）

選擇合適的 Embedding 模型（中文推試 BGE-M3 或 text-embedding-3-large），對每個文字段落生成向量並存入向量資料庫。

Step 3：建立索引

向量資料庫建立 HNSW（Hierarchical Navigable Small World）索引，讓千萬級向量的搜尋在毫秒內完成。

Step 4：查詢時檢索

使用者問題同樣向量化，在資料庫中找出餘弦相似度最高的 Top-K 段落（通常 K=3~5）。

Step 5：組裝提示詞送 LLM

將問題與檢索到的段落組成結構化提示詞：「根據以下資料回答問題，若資料中沒有答案請說不知道。」這個指令很關鍵，能有效抑制 LLM 在沒有依據時強行生成答案。

Step 6：評估與迭代

用 RAGAS、TruLens 等評估框架量測「檢索準確率」和「答案忠實度」，持續優化 Chunking 策略和提示詞設計。

---

五、常見誤區：初學者最容易踩的三個坑

誤區一：Chunk 切太大

很多人為了「保留完整上下文」把段落切得很長，結果向量語意模糊，檢索相關性大幅下降。黃金法則：每個 Chunk 應該只包含一個核心概念。

誤區二：忽略 Reranking

向量搜尋找到的 Top-K 結果未必按相關性排序。加入 Cross-Encoder Reranker（如 BGE-reranker）對檢索結果重新排序，往往能讓回答品質提升 20-40%。

誤區三：沒有處理「無答案」情況

當知識庫中根本沒有相關資料時，LLM 仍可能「發淮創意」編造答案。必須在提示詞中明確告知「若提供資料中無法找到答案，直接回答不知道」，並設定 confidence threshold。

---

六、延伸學習：RAG 的下一步

掌握基礎 RAG 後，下一步可以探索：

Advanced RAG：加入 Query Rewriting、Hypothetical Document Embedding（HyDE）、Multi-hop Reasoning 提升複雜問題的回答能力
GraphRAG：微軟開源的圖結構 RAG，特別適合需要跨文件推理的場景
Agentic RAG：讓 Agent 動態决定何時需要檢索、檢索哪些來源，實現真正的自主知識查詢

推薦資源：LlamaIndex 官方文件、LangChain RAG Tutorial、RAGAS 評估框架 GitHub。

下一篇 OpenClaw Skills 將深入探討 Memory 機制——如何讓 AI Agent 真正「記住」你說過的話。

---

OpenClaw Skills 系列每日更新，聚焦 AI Agent 核心技術的深度研究與實戰應用。