


作者:Lai、bryan、haozhen
編輯:penny

2025 年以來,Agent 開發量和使用量都有明顯提高。Agent 的爆發帶來了 Agent Infra 需求的爆發。在過去 1-2 年,Agent 開發大多依賴開發者手動使用傳統 Infra 搭建,開發工程量大、流程複雜,但隨著越來越多 Agent-native Infra 湧現,Agent 開發的難度和週期都在縮小,開發的正規化正在重構和收斂。
我們之前已經研究了 Browserbase、E2B 等公司,本文是我們對於 Agent Infra 領域圖景更全面的 Mapping。我們劃分出了 Environment、Context、Tools、Agent Security 這四大賽道,逐步分析每個環節的價值和值得關注的初創公司:
• Environment 的作用是給 Agent 執行任務提供容器,是一個 Agent-native computer;
• Context 層是在 Agent 工作中賦予記憶 Memory 和領域知識的重要中間層;
• Tools 由於 MCP 協議的統一而百花齊放,同時目前 Tools 的核心使用者還是開發者,普通使用者的使用門檻太高;
• Agent Security 是在 Agent 產品正規化固定之後會湧現的大機會,需要同時確保避免 Agent 受攻擊和發起攻擊。
目前 Agent Infra 是模型公司、雲廠商、初創公司都在積極拓展的領域,我們認為創業公司的機會在於:1)在已有 Infra 中尋找真正 Agent-native 的需求,使 Agent 開發者開發出效果更好的產品,比如 Browserbase 對傳統 headless browser 做了這樣的迭代;2)抓住 Agent 開發中的新痛點,例如 MCP 領域現在缺乏一個好的 marketplace 和 selector,幫助 Agent 去選擇對的工具。

💡 目錄 💡
01 Overview
02 投資主題 1:Environment
03 投資主題 2:Context
04 投資主題 3:Tools
05 投資主題 4:Agent Security
06 附錄:雲廠商在 Agent Infra 的佈局
01.
Overview
Agent Infra 是 Agent 落地的關鍵,涵蓋了 Agent 從開發到部署的完整生命週期。我們對這個領域進行了初步掃描後,按重要性劃分出了四大賽道,分別是 Environment、Context、Tools 和 Security,並進一步拆解了我們看好的細分領域的 thesis 和初創公司。
Environment 指的是 Agent 可操作的容器,相當於給了 Agent 一臺可自行操作的計算機,Agent 可以在其中端到端地完成任務,這個賽道包括 Sandbox、Browser Infra、Agent 作業系統等不同的細分領域,我們看好其中的 Sandbox 和 Browser Infra。
Context 為 Agent 有效執行提供所需的資訊,這個資訊既包括任務相關的背景知識,也包含各類工具的使用方法。有了這些資訊,Agent 才能在特定任務場景中,合理判斷應以哪種順序呼叫哪些工具,才能更有效地完成任務。我們將主要分析這個賽道中的 RAG、MCP 和 Memory。
Tools 相關的 Infra 使 Agent 能夠便捷呼叫各類工具,實現搜尋、UI 設計、資料訪問、支付等多樣化的任務。隨著 Agent 互動複雜度的持續上升,工具層正迅速擴充套件。搜尋(Search & Scraping)、金融(Finance & Payment)、後端工作流(Backend Workflow)這三類工具,尤為值得重點關注。
Security Infra 以 Agent-native 的方式保障 Agent 的行為與資料在執行過程中的安全與合規。隨著 Agent 能力邊界的不斷拓展,市場對 Agent 安全性的要求也在同步提高。然而,這一環節的 AI-native Infra 機會需要在 Agent 生態更為完善後才能出現更清晰的格局。

除了上述賽道和公司之外,Agent Infra 領域還在不斷湧現更為成熟的解決方案。Infra 是模型公司、雲廠商、初創公司都在積極拓展的領域,我們認為創業公司的機會主要有兩類:
1. 在已有 Infra 中尋找有 AI-native 需求的環節。這種需求可以是 Agent 開發對該環節的某些效能提出了更高的要求,例如 Sandbox 需要更快冷啟動速度、更強的隔離性;這種需求也可以是需要和 AI workflow 結合的更好,有更多 AI-native 的功能點,例如增加 RAG 功能,或者和某些 AI 開發者常用的語言或 SDK 有更好的結合。
2. 抓住 Agent 開發中的新痛點。Agent 開發要追求 R&D 和時間投入的 ROI,對降低開發門檻和工程量的 Infra 產品有較大需求,因此一套易用性高且價格合理的 Infra 就有機會被廣泛採用。而且 Agent 生態是一個強調共建的生態系統,而 Infra 的持續創新,正在大力推動這種生態的構建。
02.
投資主題 1:Environment
Environment 提供 Agent 開發和行動的容器,相當於給了 Agent 一臺可自行操作的計算機,Agent 可以在虛擬環境中端到端地完成任務,訓練並探索新能力。我們將主要分析這個賽道中的沙盒(Sandbox)和 Browser Infra。

Sandbox:
為 Agent 創造理想的虛擬機器環境
Sandbox 是一種安全機制,為執行中的程式提供隔離環境,即為 Agent 提供了一個可以隔離執行的虛擬機器環境,開發者可以在這個環境中實現 Agent 的開發、部署、執行。但隨著 Agent 的不斷發展,傳統的虛擬機器並不能很好地滿足 Agent 需求,原因在於:
1. Agent 對虛擬機器的效能提出了更高的要求,比如需要更高的隔離性、更快的啟動速度、更強的穩定性;
2. Agent 的虛擬機器還要求具備一定的 AI 效能,例如需要具備程式碼直譯器(code interpretor)的功能,或需要整合開發者常用的 AI 架構,如 Vercel AI SDK。
因此我們判斷 Sandbox 存在初創公司的機會,比如 E2B 提供了更 AI-native、更快啟動的 microVM ,獲得了 Perplexity、Hugging Face 等頭部 AI 企業的認可;Modal 則提供了更 Cloud-native、更可規模化的虛擬機器,可以更好地滿足 Agent 開發需求。

注:🌟 代表值得重點關注的公司
Browser Infra:
使 Agent 更好地適應瀏覽器環境
在如今的人類社會中,大部分的資訊都存在於網際網路瀏覽器中,大部分的生產力工作也都能在瀏覽器環境中完成。因此,我們判斷瀏覽器環境將是 Agent 最重要的工作環境之一,瀏覽並操縱網頁的能力也將成為 Agent 的核心能力之一,而 Browser Infra 正賦予了 Agent 這種能力。
具體來看,Browser Infra 大致可以分為兩類:
1. 第一類 Infra 讓 Agent 可以大規模瀏覽網頁,比如 Agent 能在雲端同時瀏覽不同網頁來獲取所需資訊;
2. 第二類 Infra 使得 Agent 可以操縱網頁,比如 Agent 能靈活地進行載入、選擇、點選等網頁端的操作。
對於第一類 Infra 而言,傳統的解決方案是利用 Puppeteer、Playwright 等 browser 庫進行開發,優勢是能獲得更高的定製化程度,對產品的控制力更強,價格也更便宜,但是劣勢在於需要強大的工程團隊和大量開發時間,且構建出的產品比較臃腫。
因此當下的 Agent 開發正在逐步採用更 AI-native 的 Browser Infra,希望能用易用性更高的產品來實現 Agent 的快速搭建和釋出,這一領域的代表公司是 Browserbase。在訪談中,我們發現開發者看重 Browser Infra 的因素包括頻寬、價格、速度等,而 Browserbase 正是在這幾個維度達到了一個高效能的平衡,因此獲得了開發者青睞。
第二類 Infra 能夠賦予 Agent 更強的理解瀏覽器內容的能力,相比直接簡單呼叫 API,Agent 能夠像人一樣更深入的進行網頁操作。我們認為這是一塊更新興、更 Agent-native 的 Infra 機會,Browser Use 這家公司尤其值得關注,這也是 Manus 在使用的 Browser Infra,在 Manus 問世之後進一步走紅。

注:🌟 代表值得重點關注的公司
03.
投資主題 2:Context
豐富的上下文資訊是 Agent 有效規劃和行動的基礎。基於文字 Context,Agent 可以更好地理解任務的背景,實現更具體的特定任務;基於工具 Context,Agent 也能夠更好地理解工具的用法和用途,從而決定使用哪些工具,以哪種順序呼叫工具,如何將工具整合在一起來完成任務。我們將主要分析這個賽道中的 RAG、MCP 和 Memory。

RAG: 為 Agent 提供具體的 Context
RAG(Retrieval-Augmented Generation),即檢索增強生成,這是一種結合了資訊檢索與生成式 AI 的技術架構,廣泛用於提升 LLM 在問答、文件摘要等任務中的準確性與時效性。如今 Agentic RAG 系統能夠持續分析 Context 和使用者意圖,自主從多種來源(包括即時資料流和外部 API)檢索並整合相關資訊,使得 Agent 可以更好完成任務。
RAG 的提出時間較早,目前基本已成為一種共識性的技術,並在各類應用場景廣泛使用,相關的頭部創業公司也發展得較成熟,比如專注企業內部資料 RAG 搜尋的 Glean 已經獲得了包括 Reddit、Duolingo、Bookings 在內的一眾企業的認可,最新估值已接近 70 億美元。

注:🌟 代表值得重點關注的公司
MCP: 提供標準化的工具和資料介面
MCP 是 Anthropic 在去年 11 月釋出的一個開放式協議,重新定義了 Agent 呼叫外部工具、獲取資料以及與各類服務互動的方式。如今 MCP 已成為 Context 的一大標準化解決方案,相關生態也在不斷發展。
目前 MCP 相關的 Infra 創業機會還處在相對早期的階段,在一些業務邏輯互通的細分賽道,已有公司在原先業務基礎上拓展至 MCP 相關的產品。例如:
• Mintlify 可以用客戶已有的 Documentation 或 OpenAPI spec 直接做出 MCP Server,不需要額外的程式碼;
• Stainless 可以在 SDK 生成的基礎上增加了 MCP Server generator,同樣簡化了 MCP server 的構建過程;
• Composio 也在整合主流 Agent 工具的基礎上新增了 MCP connector 產品,託管了 100 多個的 MCP Server,內建身份驗證,讓 Agent 可以簡化繁瑣的逐一設定並連線 MCP 的過程。
此外,還有一類做 MCP marketplace 的公司,集合各細分領域的 MCP Server 供 Agent 開發者進行選擇和使用。自從 MCP 釋出以來,MCP Server 數量在快速增長,MCP.so 裡的 MCP Server 數量已經高達 1.3w+。
但是我們認為單純做 marketplace 的價值較薄,最重要的價值是為 Agent 評估和編排 MCP server 的使用,這類工作和價值量可能會整合在 Agent 開發端。

注:🌟 代表值得重點關注的公司
Memory: 賦予 Agent 特定的記憶力
Memory 是構建複雜 Agent 的關鍵基礎。如果僅依賴 LLM 自帶的有限上下文視窗作為短期記憶,Agent 將在跨會話中處於 stateless 的狀態,難以維持連貫性。同時,缺乏長期記憶機制也限制了 Agent 自主管理和執行持續性任務的能力。引入額外的 Memory 可以讓 Agent 做到儲存、檢索,並利用歷史互動與經驗,從而實現更智慧和持續的行為。
Agent 的 Memory 包括短期記憶(STM,儲存單次互動資訊)、長期記憶(LTM,可以橫跨多次互動資訊以實現個性化)和程式記憶(指導 Agent 行為的規則)等。Memory 給 Agent 賦予了特定的記憶力,本質一種提升 Agent 智慧性的方式,Agent 能憑此有更高的個性化程度和一致性表現,也能在多步驟或長週期的複雜任務中提升準確性。

一些創業公司透過提供外部資料庫的方案為 Agent 構建 Memory,例如 Mem0 採用混合資料庫系統從互動中提取並存儲關鍵資訊,Zep 則運用時序知識圖譜追蹤動態變化的使用者資料、提升個性化能力。
與此同時,模型公司也在不斷最佳化模型本身的 Memory layer,比如一些開源模型透過引入額外的、可訓練的“記憶槽”,使模型具備一定的記憶儲存能力。相比其他領域,創業公司在 Memory 的機會邊界相對沒有那麼清晰。

注:🌟 代表值得重點關注的公司
• Case study – Letta
Letta 成立於 2024 年,專注於構建具備長期記憶能力的 stateful AI Agent 平臺,由伯克利實驗室孵化而來,團隊研究背景非常強。Letta 整合了視覺化開發環境(ADE)、生產級 API 及伺服器執行時系統,ADE 可即時檢視 Agent 記憶生成、管理的軌跡,Letta 還可以透過 context 管理,來實現 Agent 狀態持久化,使 Agent 具備持續學習進化的能力。

近期,Letta 團隊釋出了一個關於 “Sleep time compute”的有趣研究,進一步說明了 Memory 在提升 Agent 效能上具有重要作用。該研究的主要想法是讓 AI 充分利用不與使用者互動的時間(即 sleep-time),來預先處理 Context 資訊,並提前完成推理,將 raw context 處理為 learned context,這樣可以在實際應答時,減少即時推理的計算負擔,最終達到提高推理質量的效果。

Agent 有大量的 Sleep-time

AI 可以在 Sleep-time 完成對 Context 預處理
04.
投資主題 3:Tools
在完成搜尋、資料提取、支付等各種任務的時候,Agent 需要呼叫各種工具,這個領域的玩家價值在於給開發者提供了可直接呼叫、無需自建的 Infra。隨著 Agent 互動複雜度的不斷提升,工具層正在快速擴張,OpenAI 判斷 Agent 可呼叫的工具數量將會在幾個月內從目前的 10 個量級 Scale 到 100 個量級。我們將主要介紹搜尋(Search & Scraping)、金融(Finance & Payment)、後端工作流(Backend Workflow)這三個方面的工具。

Search & Scraping:
賦予 Agent 搜尋能力
搜尋是 Agent 獲取外部資訊的重要途徑,我們認為 Agent 搜尋領域的機會非常大,原因在於:
1. 相比人類,Agent 會進行更頻繁、更復雜的搜尋,Agent 在完成單一任務的時候往往就需進行數十次搜尋,隨著多步驟任務的推進以及 multi Agent 的發展,未來 Agent 的搜尋量將遠超人類。
2. 傳統搜尋引擎無法滿足 Agent 的搜尋需求,Agent 需要更 AI-native 的搜尋工具。傳統的搜尋引擎基於關鍵詞進行檢索,常返回“SEO 垃圾”,而 Agent 搜尋更側重理解而非匹配,因此 Agent 搜尋在 context 的理解、搜尋的全面性和準確性上都提出了更高的要求。
由於 Google 等搜尋巨頭不願完全開放 API,再加上當今的搜尋引擎構建成本已從數億美元降至數千萬美元,我們判斷 Agent 搜尋領域存在以下三個創業公司的機會:
1. 為海量 Agent 搜尋提供足夠快速且廉價的解決方案,如 Serper 和博查提供了價格遠低於 Bing 的搜尋 API,獲得了希望自行處理海量原始資訊的 Agent 開發者的青睞;
2. 給 Agent 提供更智慧的搜尋,如 Exa 實現了更復雜的語義搜尋,能提供更優質的檢索結果;
3. 為 Agent 提供智慧的爬蟲架構,如 Firecrawl 提供了開源的資料抓取框架,增強了 Agent 獲取網頁資訊的能力。
目前看來,第一類創業機會的價值點最清晰,許多開發者非常看重搜尋資訊的全面性和 API 價格,希望自己能夠在 Agent 產品中完成資訊篩選,從這個角度來看 Search API 有 commoditize 的趨勢。

注:🌟 代表值得重點關注的公司
Finance & Payment:
讓 Agent 能交易和貨幣化
Agent 在金融領域的應用也值得關注,我們判斷隨著 Agent 能力的發展,Agent 會成為金融領域重要的主體,雖然當前 timing 還相對偏早,但這一領域可能會有 Visa 或 Stripe 級別的大機會。
我們認為 Agent 需要專屬支付工具與交易網路。在當下,完成一個複雜任務通常會涉及到呼叫付費內容或工具,因此 Agent 需要具備支付能力。而當 Agent 被呼叫並完成任務時,也應當能像人一樣“賺取”報酬。比如 Skyfire 就在利用區塊鏈技術為 Agent 提供身份認證、交易和變現服務,使得 Agent 能夠真正成為經濟社會的生產主體。

Skyfire 讓 Agent 具備支付和收款能力

例子:AI Agent 使用 Skyfire 進行自動化支付
Agent 經濟也會出現新的商業模式與變現方式。當前大多數 Agent 是按 seat 或是任務次數收費,未充分將 Agent 工作的價值變現。我們判斷 Agent 的計費方式會逐步變為按照任務過程和結果付費。複雜的 Agent 網路也可能共同完成任務,未來可能需要構建一套適用於 Agent 的智慧合約,為 Agent 自動化分配經濟利益。
例如,Sequoia 近期投資的 Paid 這家公司就是根據每個 Agent 的實際產出來定價、最大化 Agent 收益,並能夠管理 Agent 的毛利、為客戶量化 Agent 的 ROI 等,希望重構一套 Agent 時代的貨幣化機制。

注:🌟 代表值得重點關注的公司
Backend Workflow:
簡化 Agent 後端開發
除了上述工具之外,還有一類工具的作用在於簡化 Agent 後端開發,目的是在資料庫搭建、任務自動化、工作流編排等方面降低 Agent 開發難度。這類解決方案往往是在服務大企業開發場景的基礎上,憑藉易用性或 LLM-native 的特性吸引到新一代的 AI 開發者。例如:
Inngest 則提供了工作流編排平臺,提供 "Zero-Infra" 和 AgentKit,將原先時間長、步驟複雜的 Agent 開發與編排進行了簡化。

注:🌟 代表值得重點關注的公司
05.
投資主題 4:
Agent Security
Security 也是我們認為較關鍵的 Infra。隨著 Agent 能力邊界拓展,Agent 安全性上的要求也在同步提升。

當 Agent 代表使用者進行各類行動時,我們不僅需要對 Agent 進行身份驗證,還需保證 Agent 的每個意圖、每個行動都是安全的。隨著 Agent 智慧性增強,Agent 的安全框架需要從靜態的許可權控制轉變為動態的意圖分析。此外,Agent 每次資料互動都需要動態校驗,這也對資料安全提出了更高的要求。
目前,Agent 使用的 Security 相關的 Infra 產品以相對老牌的玩家為主。相對老牌的玩家本身在服務大企業的資料和執行安全時就已經積累了完善的 Infra 能力,能夠較好地將功能外溢並服務好當前的 Agent。例如 Chainguard 為 Agent 在開發階段提供安全的基礎映象,Haize Labs 對 AI system 進行壓力測試、增強穩健性,Oligo 則為 Agent 提供執行即時監控與異常檢測。
我們認為 Security 這一領域遵循“需求驅動”的邏輯,即先有成熟的下游產品設計,再有對應的安全問題與解決方案。因此,這一環節的 AI-native Infra 機會需要在 Agent 生態更為完善後才能出現更清晰的格局,當前階段還是偏早。

06.
附錄:雲廠商在 Agent Infra 的佈局
Agent Infra 領域還有一類不容忽視的玩家就是雲廠商,雲廠商可以提供 Agent 所需的算力資源、部署環境等。為了更好看清 Agent Infra 領域的玩家格局,我們彙總了 AWS、Azure、GCP 這三大雲廠商在該領域的佈局。
• Environment
三大雲廠商都陸續推出了自己在 Enviroment 上的產品,但我們認為,目前沒有出現 Agent-native 的產品。
在 Sandbox 上:
1. AWS 在 2014 年推出 Amazon S3 Buckets,提供了儲存桶和訪問控制列表等機制;2020 年又推出了 Amazon EC2 Nitro Enclaves,可以執行敏感程式碼,確保資料與主系統完全隔離,適用於高安全需求場景。
2. Azure 釋出過一個開源專案 Azure Sandbox,2022 年推出了 Azure Container Apps Sandbox Mode,可以在 Hyper-V 隔離的沙盒中執行不受信任的程式碼(如 LLM 生成的程式碼),支援動態會話和程式碼直譯器。
3. GCP 早在 2008 年就釋出了 Google Compute Engine,提供高效能的虛擬機器例項,支援多種作業系統和配置;2017 年推出無伺服器計算平臺 Google Cloud Functions,使用者可編寫和部署函式程式碼,無需管理伺服器基礎設施。
在 Browser Infra 上:
1. AWS 在 2014 年釋出了開源框架 Lambda Serverless Chrome,開發者可以部署無頭瀏覽器,實現網頁截圖、PDF 生成、自動化測試等功能。
2. Azure 在 2019 年推出了一個無頭瀏覽器控制庫 Azure Playwright ,支援的瀏覽器涵蓋 Chrome、Firefox、Safari、Edge 等。
3. GCP 在 2018 年釋出 Google Puppeteer 庫,也是一個無頭瀏覽器控制庫,可直接控制無頭 Chrome,支援網頁自動化測試、爬蟲等任務。
• Context
2023-2024 年,公有云廠商紛紛推出 RAG 相關解決方案,推動了一波尚未上雲的企業加速上雲。2025 年,公有云廠商開始積極擁抱 MCP,他們不僅有數量龐大的 API 體系,還配備了對應的 CLI 工具,簡化了與 MCP 的整合流程。
在 RAG 上:
1. AWS 先後在 2020 年和 2023 年推出了企業級智慧搜尋 Amazon Kendra 和端到端的 RAG 解決方案 Amazon Bedrock Knowledge Bases。前者為 RAG 應用提供文件檢索能力,能夠處理大量不同格式的文件,快速找到與使用者問題相關的準確答案;後者支援自定義聯結器、流式資料攝取,增加了結構化資料檢索和知識圖譜的功能。
2. Azure 早在 2014 年就釋出了開源資料管道和轉換套件 GraphRAG,目的是利用 LLM,從非結構化文字中提取結構化資料;2018 年又推出了 Azure Cognitive Search,可以智慧搜尋,並與 Azure AI 整合。
3. GCP 分別於 2023 年和 2025 年推出了 Vertex AI Search 和 Vertex AI RAG Engine。前者是一款完全託管的搜尋 API,簡化了企業資料來源的連線,支援跨資料來源搜尋,適用於對開箱即用的質量、可擴充套件性以及細粒度訪問控制要求較高的企業場景;後者則是一項託管的編排服務,簡化了資訊檢索、LLM 整合的流程。
在 MCP 上:
1. AWS 推出了 AWS MCP Server,透過一系列模組化伺服器套件,給開發人員提供 AWS 文件、知識庫等資源直接訪問的能力。
2. Azure 釋出了 Azure MCP Server 和 Playwright-MCP,前者支援訪問多種 Azure 服務,包括 Azure Cosmos DB、Azure Storage 和 Azure Monitor 等,功能包括資料庫查詢、儲存管理和日誌分析等;後者是一個開源框架,允許 LLMs 透過結構化資料,來與網頁互動,實現自動化測試等功能。
3. GCP 推出了開源 Agent 互動標準 Agent-to-Agent Protocol 和開發套件 Agent Development Kit,前者支援不同框架的 Agent 直接協作,考慮到 MCP 的使用場景是 Agent 與工具互動,A2A 的使用場景是 Agent 之間的通訊,A2A 會與 MCP 形成互補格局;後者支援 MCP 工具整合。
• Tools
在 Tools 領域,除了 Azure 和 GCP 各自推出了 Search API 之外,三大雲廠商也在 Backend Workflow 賽道早早推出了各自的產品,但我們認為,Tools 領域和 Enviroment 領域類似,目前並沒有看見 Agent-native 的產品。
在 Backend Workflow 上:
1. AWS 在 2016 年就推出了 AWS Step Functions,透過視覺化方式編排多個 AWS 服務,支援以狀態機的形式定義執行步驟和狀態轉換,簡化了分散式系統的開發與運維管理。
2. Azure 在 2016 年推出 Azure Logic Apps 和 Azure Functions。前者提供視覺化設計器和預構建聯結器,用於構建和管理自動化工作流;後者則支援多種程式語言的事件驅動計算,可與 Azure 生態中的其他服務無縫協作,適合用於構建無伺服器架構的應用程式。
3. GCP 於 2017 年推出了 Google Cloud Functions,這是一個支援多種程式語言的事件驅動型無伺服器計算平臺,能夠響應包括 HTTP 請求、Pub/Sub 訊息、Cloud Storage 變更等多種事件型別;2020 年推出了 Google Cloud Workflows,用於編排各類 Google Cloud 服務的自動執行與整合。

排版:楊樂樂
延伸閱讀









