Claude官方釋出《Agent構建指南》，附PDF下載

簡單才是王道，Anthropic 的智慧體開發的“反直覺”法則

Anthropic 最新發布了一篇關於 Agent 的部落格文章，得出了一個引人深思的結論：

AI 開發的未來，在於“Less is More”。

在公眾號後臺傳送口令“1222”即可獲取完整 PDF。

接下來小鹿和大家一起看看智慧體開發的“大道至簡”之道。

Agent 的定義

提到 Agent，很多人以為它是 LLM 的產物，但其實不是。

Agent 的現代定義，是在 20 世紀 50 年代伴隨著 AI 發展逐漸形成的，究其根源，可以追溯到更早的哲學思考和科學探索。

在 1950 年，阿蘭·圖靈在其論文《計算機器與智慧》中提出了“高度智慧有機體”的概念，並引入了著名的圖靈測試。

1972 年，美國學者 Marvin Minsky 在麻省理工學院建立了人工智慧實驗室，並正式提出了“代理”（Agent）的概念，認為 AI Agent 應該具備感知世界、進行推理和執行動作的能力。

Anthropic 將 Agent 系統分為兩大類：工作流 (Workflows) 和 智慧體 (Agents)。

工作流：指的是透過預定義的程式碼路徑來編排 LLM 和工具的系統。它更像是一個精心設計的流程，每一步都清晰可控。
智慧體：則是由 LLM 動態地指導自身流程和工具使用的系統。它更像是一個自主的決策者，能夠根據環境反饋靈活調整行動。

關鍵區別在於 LLM 是否能夠動態控制自身流程和工具使用。

框架的迷思：迴歸 LLM API 本質

在構建 LLM 應用時，應遵循“簡單至上”的原則：能簡單就簡單，只有在必要的時候才增加複雜度。

只有當簡單的方案無法滿足需求時，才考慮引入更復雜的 Agent 系統。因為 Agent 系統往往以更高的延遲和成本為代價，換取更好的任務效能。

那如果一定要用呢？

什麼時候用“工作流”？ 當任務非常明確，而且可以分解成一系列固定的步驟時，就像流水線上的工作一樣，用“工作流程”就足夠了。
什麼時候用“智慧體”？ 當任務需要很大的靈活性，而且需要模型自己做決策時，就像一個需要隨機應變的指揮官，這時候“智慧體”就更適合。

但其實，對於大多數應用來說，最佳化一下單大語言模型的呼叫，再結合一些檢索和上下文的例子，通常就足夠了。

就像人類平時解決問題一樣，先用最簡單的方法試試，不一定非要用複雜的工具。

市面上湧現出各種 Agent 框架，比如：

LangGraph（LangChain 的工具）：就像一套功能強大的樂高套件，可以用來搭建各種複雜的 Agent 系統。
Amazon Bedrock 的 AI Agent 框架：就像一個專業的工具箱，提供了各種構建 Agent 系統的工具和元件。
Rivet（拖放式 GUI LLM 工作流構建器）：就像一個視覺化編輯器，可以透過拖拽的方式來構建 LLM 的工作流程，非常方便。
Vellum（複雜工作流的構建和測試工具）：就像一個高階的實驗室，可以用來構建和測試複雜的工作流程。

這些框架確實簡化了 LLM 呼叫、工具定義等基礎任務，氮素，同時也引入額外的抽象層，這可能會模糊底層的提示和響應，從而使除錯更加困難。

Anthropic 的建議開發者，從直接呼叫大語言模型的 API 開始：

“許多模式可以用幾行程式碼實現。如果你確實要使用框架，請確保你理解底層的程式碼。對底層原理的錯誤假設是客戶錯誤的常見來源”。

大道至簡，Less is More

Anthropic 特別強調了 "簡單性" 這一核心理念，總結了構建有效智慧體的由簡至繁的開發路線，

優先使用基礎構建塊：增強型 LLM（具備檢索、工具使用、記憶等能力），其次是工作流模式：提示鏈（Prompt Chaining）、路由（Routing）、並行化（Parallelization）、編排者-執行者（Orchestrator-workers）、評估者-最佳化者（Evaluator-optimizer），最後是自主 Agent，能夠獨立規劃和執行復雜任務。

Agent 系統的基礎是增強型 LLM，它具備檢索、工具和記憶等能力。

從最基礎的構建模組增強型 LLM 入手，逐步增加複雜性，從簡單的組合式工作流程過渡到自主智慧體群。