GoogleADK，好玩、愛玩、多玩！

OSCHINA

↑點選藍字關注我們

如果用一個詞去概括 2025 上半年的人工智慧領域，筆者認為是 “Agent”（智慧體）。

從市場研究機構預測 AI Agent 應用市場將達數百億美元規模，再到眾多科技巨頭如微軟、谷歌、OpenAI 、Anthropic 等紛紛釋出 AI Agents 相關產品，直至 AI Agents 從單一智慧體發展到 “群體協作” 模式，多個 Agent 可以扮演不同角色合作完成任務，進一步改變了人們的工作、生活。

如果說模型和基建是 “骨架”，那麼 AI Agent 則是讓企業 AI “動起來” 的 “神經末梢”。在 Agent 生態爆發的技術場域中，谷歌推出的 AgentSpace ，正成為企業構建智慧系統的 “樂高平臺”，更關鍵的是，谷歌透過開源智慧體開發工具包（ ADK ）和 Agent-to-Agent（ A2A ）協議，解決了多 Agent 協作和安全驗證的難題。

這種 “開箱即用 + 自定義開發” 的模式，讓企業無需從頭開發，就能快速搭建複雜的 Agents 系統。本文將帶你深入瞭解 Google ADK的奧秘，揭開它的核心功能和無限潛力，一起解鎖這場 AI 技術的新玩法！

什麼是 Google ADK ？

Google 的 Agent Development Kit（ ADK ）是一款靈活且模組化的開發框架，專為設計、構建和部署 AI Agent 而打造。筆者看重兩點，模組化：允許開發者透過整合多個專業化的小型元件，構建複雜的多 Agent 系統；Agent 協調：協調 Agent 將任務分配給專業化子 Agent ，形成複雜的協作網路。

打個比方，銷售 Agent 做銷售的事，運營 Agent 做運營的事，ADK 則構建出一個層次化的業務中臺，針對使用者的具體需求，分別去調配各個 Agent ，並且根據需求的複雜程度，開發者還可以靈活建立定製化工具。例如官網文件的演示 demo ，僅需十幾行程式碼，就可以搓一個多 Agent 系統。

那麼，ADK 是如何委派工作的呢？這就不得不提到 ADK 的自動委派機制。在接收到使用者訊息時，LLM 會首先對使用者訊息進行分析，同時結合當前 Agent 自身的描述資訊以及其他相關 Agent 的描述資訊。如果 ADK 發現另一個 Agent 更能勝任，任務就開始轉移。

總而言之，ADK 協調系統裡的每個 Agent 專注於做好一件事，而不是試圖去處理每一種可能的互動。在 ADK 中，Agent 框架中，Agent 被定義為一個獨立的執行單元，旨在自主執行以實現特定目標，而 ADK 的架構設計與實際能力整體統籌下來，可以搞定：

執行任務：獨立完成預定義的目標，如回答問題或生成報告，展現出高效的自動化能力；
與使用者互動：透過自然語言對話或介面操作，與人類使用者無縫溝通，模擬真實對話體驗；
利用外部工具：呼叫 API 、資料庫或第三方服務，擴充套件功能邊界，解決複雜問題；
與其他 Agent 協作：利用多 Agent 編排，共同完成複雜的業務流程，如統計分析或多語言翻譯任務。

這些 Agents 的靈活性與協作性，使 ADK 成為構建智慧工作流的核心元件，特別是在需要高度自動化和協同的場景中表現卓越。想象它們像一個 “高效團隊”，每個成員各司其職，又能緊密合作，共同完成從簡單到複雜的 “智慧使命”。

Google ADK 具有哪些核心特性？

接下來，和大家聊聊 ADK 的核心特性，並結合其技術優勢和應用場景，為大家呈現一個全面的概述。

一、模組化架構

上文也簡單提到了，ADK 採用的模組化架構就像是將一個複雜的系統分解成一個個獨立的、具有特定功能的小模組，每個模組都可以被看作是一個 “樂高積木”。這些模組有著明確的功能和介面，它們可以對開發、測試和維護，當我們將這些專業化的 Agent 組合在一起，就能構建出一個複雜的、能夠完成多種任務的多 Agent 系統。

並且，由於每個模組都相對獨立，開發者可以專注於單個模組的開發和最佳化，而無需擔心這個模組的變化對其他模組產生難以預測的影響，這就好比搭建樂高積木，我們可以一塊一塊地拼接，如果某一塊積木出現問題，也不會影響整個積木結構。

二、程式碼優先開發效能

ADK 以程式碼為驅動，開發者可以使用 Python 語言精準定義 Agent 行為，賦予其完全的程式化控制權。這種方法消除了傳統配置的繁瑣性，讓大家能夠透過指令碼靈活調整邏輯、最佳化效能，並快速迭代。

三、豐富的工具鏈生態

ADK 本身包含了多種預先構建好的工具集合。這些工具涵蓋了不同的功能領域，例如 API 呼叫方面，能夠方便地與其他外部系統進行互動，實現資料的獲取和傳送等功能。開發者在開發的過程中可以直接使用這些預建工具來完成特定任務，無需從頭開始編寫複雜的程式碼。

並且，ADK 特別優化了與 Google Cloud 生態系統的整合，例如與 Gemini 2.5 Pro Experimental 模型和 Vertex AI平臺無縫銜接。透過這些整合，開發者可以充分利用 Gemini 模型的增強推理能力，並直接將智慧體部署到企業級執行時環境中。

Google Search （透過工具呼叫）

Gmail （透過工具呼叫）

Google Calendar （透過工具呼叫）

Google Cloud API （與各種雲服務無縫整合）

各種企業內部系統（透過 Extensions / Function Calling 等機制連線）

四、多模型支援

此外，ADK 也支援多種大語言模型的整合，包括剛剛提到的 Gemini 系列，以及 OpenAI 的 GPT 系列、Anthropic Claude 等。這一特性使得開發者能夠根據任務需求選擇最優模型，同時也減少了一些非必要的資源消耗。

得益於以上四點，即便是初學者也能搭建出自己想要的 Agent ，讓開發工作更多回歸於靈感聚焦，減少繁瑣的基礎程式碼編寫工作。

ADK 與 MCP 之間如何串聯？

最近很火的 MCP 如何與 Google ADK 串聯起來呢？方法也很簡單。ADK 提供了三種主要的 Agent 型別：

LLM Agents ：Agents 利用大語言模型作為其核心引擎，以理解自然語言、進行推理、規劃任務、生成響應，並動態決定如何推進任務或使用哪些工具。
Workflow Agents （順序 Agent ，迴圈 Agent ，並行 Agent ）：以預定義的確定性模式（序列、迴圈或並行）控制 Agents ，非常適合需要可預測執行的結構化流程。
Custom Agents ：透過擴充套件 BaseAgent 來構建滿足特定需求的 Agent 。

而 MCP 的核心任務是接收來自客戶端的請求，然後依據這些請求排程和執行相應的工具與功能，ADK 中的執行 Agent（ Execution Agent ）所具備的任務執行和排程，恰好能契合 MCP 這一需求。

這裡，筆者參考 @QuantML 的方法，基於 ADK + MCP + Gemini AI 來實現搭建，架構如下圖：

先決條件

安裝 Python 3.8 或更高版本
透過 API 金鑰訪問 Google Gemini 生成式 AI
一個有效的 SerpAPI 金鑰（用於獲取即時航班資料）

步驟 1：設定虛擬環境

使用一下命令安裝依賴項：

步驟 2：理解 ADK 作為 MCP 客戶端

LlmAgent 是 ADK 中的一個核心元件，它利用大模型語言的能力；
Runner 負責在 Agent 的生命週期內協調各個元件站之間的互動；
InMemorySessionService 是 ADK 的 SessionService 介面的實現，它儲存所有會話資料；
當用戶與 AI Agent 互動時，會建立一個 Session 物件來跟蹤對話；
StdioServerParameters 是一個配置類，用於指定 Agent 應如何透過標準輸入 / 輸出連線到 MCP 伺服器。

當結合使用時，MCPToolset 和 StdioServerParameters 允許 ADK 協調：

建立連線：使用 StdioServerParameters，定義啟動 MCP 伺服器程序所需的命令和引數。
發現可用工具：MCPToolset 連線到 MCP 伺服器並檢索 Agent 可以使用的可用工具列表。
將工具整合到 Agent 中：將發現的工具適配為與 ADK 相容的格式，從而實現無縫整合。
管理連線生命週期：MCPToolset 處理與 MCP 伺服器的連線設定和拆除，確保資源得到正確管理。

步驟 3：連線到 MCP 伺服器，並使用 ADK 建立 Agent

StdioServerParameters 定義了使用 MCPToolSet 進行非同步列表和監聽的 MCP 配置。

再將 Agent 建立、會話管理和編排與 Runner 整合並進行全面測試，驗證 Agent 在業務場景下與 MCP 伺服器互動的穩定性和準確性。建議根據測試結果，最佳化 Agent 的引數配置、非同步操作邏輯，以降低延遲，最後再部署到生產環境。

ADK 的衍生思考

技術初步落成，如果大家也想手搓一個多 Agent 系統，筆者這裡分享幾個比較實用的開發方向。

最近不是快 6・18 了嗎？本著能省就是賺的原則，搓一個 AI 購物助手豈不是很香？專攻不同平臺之間的優惠搭配和產品比價，一個 Agent 抓取平臺優惠政策及產品資訊，一個 Agent 學習商品推薦，第三個 Agent 負責處理購買流程，分模組拼湊起來，就能提供一個不錯的薅羊毛體驗。

其次，7、8 月份也是一個畢業季，構建一個輔導畢業生擇業選擇 Agent 系統。一個 Agent 可以專注於資料清洗和準備，另一個執行統計分析，第三個生成視覺化報告。透過將複雜的企業資料、招聘需求分解為由專門 Agent 處理的分析報告，最終賦能於緊張的簡歷投遞場景。

當然，三兩句肯定是不能完整支援技術實現的，其間的細節解決、技術挑戰，或許還需要接入到更多的工具才能完成。而 Google ADK 真正讓人興奮的，其實是它是一個開源框架，它是 Agent 技術民主化運動中的重要一步。

都說 2025 年是 Agent 應用爆發的一年，但真正好用的、並且滿足你需求的 Agent 應用，又有幾個呢？無非都是在堆功能、堆體量、博使用者規模，賭使用者剛好需要我這款（且賭使用者沒有看到競品的廣告）。ADK 所做的，是透過輕量化的開發路徑，讓更多開發者可以發散自己的靈感，從而手搓一個屬於自己的 AI Agent 。就像羅胖的那句，天下沒有嚴格意義上的好產品，只有滿足一部分人需求的產品。

總結，ADK 消除了許多傳統開發 Agent 過程中的一些阻礙，透過有效協作的模組化，以及專業 Agent 能力為各行各業的 AI 應用開闢了新的可能。隨著 AI 格局繼續向多 Agent 系統發展，像 ADK 這樣的開源框架也將在 Agent 民主化方面發揮關鍵作用。

最後，Google ADK 的地址附上↓

程式碼地址: https://github.com/google/adk-python

文件地址: https://google.github.io/adk-docs/

END

熱門文章

Visual Studio Code 1.100釋出

DeepGitee計劃：深度挖掘Gitee開源寶藏，開啟專案高光之旅

Redis再次開源，正式釋出8.0版本

軟體工廠驅動DevSecOps：高效整合釋出的演進實踐

“仿macOS神仙功能”的Windows檔案預覽工具——QuickLook正式釋出4.0