從概念到生產級部署：AWS如何破解AgenticAI落地難題？

作者 | 王一鵬、Luna

紅杉美國合夥人 Konstantine Buhler 預測 2025 年將成為 AI agent 的“群體協作”時代，標誌著 Agent 元年的到來。但實際上，直到昨天，7 月 16 日，面向生產環境的 AI Agent 搭建仍然只停留在工具、平臺、產品的層面，遠遠稱不上端到端服務。

形成這種局面的本質原因是，Agentic AI 落地生產環境，不僅需要完善的功能，更需要一個完善的執行時環境，包括最基本的身份驗證、資料隔離，以及對不同模型、框架的相容性要好。從業務的角度看，該套系統要了解業務上下文，要有基本的業務壓力承載能力，不能只做成“玩具”。從使用者體驗上來看，這些需求，需要在一個統一的平臺上被完整實現，避免大量的第三方工具被以不同的邏輯整合，導致企業的研發標準淪為空談。

因此，當年初 Manus 引起“套殼”爭議時，圍繞該產品技術含量的社群討論，並未呈現一邊倒的狀態——實在是因為 Agentic AI 在平臺、工程層面的工作量也很大，要做好並不容易。

當然，以上一切圍繞 Agentic AI 的討論，從現在起，都成了過去式。

AWS 一口氣完成了從 Amazon S3 Vector Buckets 到 Amazon Marketplace 等一系列產品的釋出，尤其是 Amazon Bedrock AgentCore ，作為交付企業級 AI Agents 的核心，引起了廣泛關注。又劃掉一項重要待辦的 AWS Agentic AI 副總裁 Swami ，在 AWS 紐約峰會的 Keynote 分享中，笑得非常開心。

AaaS （Agent as a Service）或者 MAaaS（Muti-Agent as a Service） 2024 年開始被研究機構廣泛提出；2025 年初，剛剛由信通院牽頭，發起評估計劃；到了年中，就幾乎被 AWS 給完整實現了。

一場考試剛剛開始就有人交卷，不得不讓人感嘆，雲計算行業的迭代速度，絲毫不輸基礎模型領域。

1看懂 Amazon Bedrock AgentCore，也就看懂了亞馬遜的“野心”

在這次圍繞 Agentic AI 規模宏大的升級中，Amazon Bedrock AgentCore 是絕對“C 位”。

官方的介紹是，Amazon Bedrock AgentCore 是一套完整的企業級服務解決方案，能夠幫助開發者快速、安全地規模化部署和執行 AI Agent，支援任意開發框架，可對接 Amazon Bedrock 託管或第三方平臺部署的各類 AI 模型，加速 Agent 從 POC（概念驗證）走向生產部署。

有接近 AWS 的人士稱，Amazon Bedrock AgentCore 的野心很大，更像是要重塑軟體開發架構——傳統軟體開發依賴傳統雲原生開發環境，比如 Docker、K8s、CI/CD 等。如果企業繼續使用這種方案，那 Agentic AI 的採用將會繼續處於初期，無法從 POC 落到真正的生產中間。

因此，在 Agent 時代的開發架構，會依賴像 Amazon Bedrock AgentCore 這樣的解決方案，該方案共包括 7 個模組：AgentCore Runtime（執行時環境）、AgentCore Memory（記憶系統）、AgentCore Observability（可觀測性）、AgentCore Identity（身份管理）、AgentCore Gateway（閘道器服務）、AgentCore Browser（瀏覽器功能）和 AgentCore Code Interpreter（程式碼直譯器）。

如果將這些服務的定義進一步簡化，在筆者看來，Amazon Bedrock AgentCore 可以簡單理解為 AWS 版的“AI Agent 超級工廠”。

Amazon Bedrock 最早以“大模型貨架”的形態出現在 AWS 的客戶面前，其核心理念是“Choice Matters”（選擇大於一切），為不同業務提供最契合的基礎模型。所以，主流模型會以最快的速度上架 Amazon Bedrock 供客戶選用，且整體“供貨”數量是市面競品的兩倍以上。

將 AgentCore 歸入 Amazon Bedrock 服務簇，等同於緊鄰原材料商超，搭建了一座加工工廠，就地取材，加工成 Agent 服務，輸送給客戶。

這種構想的基礎，在於實現一套合規的企業級 Agent 構建環境。於 Amazon Bedrock AgentCore 而言，主要由以下幾項服務構成：

AgentCore Runtime（執行時環境）：提供具備會話隔離機制的沙盒化低延遲無伺服器環境，支援包括主流開源框架、工具和模型在內的任意 Agent 架構，並能處理多模態工作負載及長時執行 Agent。
AgentCore Identity（身份管理）：支援 AI Agents 安全訪問 AWS 服務及 GitHub、Salesforce、Slack 等第三方工具，既可代表使用者操作，也可在獲得預先授權後自主執行。
AgentCore Gateway（閘道器服務）：將現有 API 和 Amazon Lambda 函式轉化為 Agent 工具，提供跨協議統一訪問能力（含 MCP 協議），並支援執行時自動發現功能。
AgentCore Code Interpreter（程式碼直譯器）：提供隔離式程式碼執行環境，保障生成程式碼的安全執行。
AgentCore Observability（可觀測性）：提供 Agent 執行過程視覺化追溯，支援元資料標記、自定義評分、軌跡檢查及故障診斷 / 除錯過濾器。

當 Agentic AI 有了自己的執行時，可以進行身份管理，相容老程式碼、API 和其他工具，可以在沙箱中載入 Python 程式碼，具備可觀測能力方便故障排查與恢復，它已經邁過了落地生產環境的基本門檻。

Amazon Bedrock AgentCore 是為了構建 Agentic AI 專門打造的，支援 MCP 和 A2A，Amazon Bedrock AgentCore Runtime 是唯一支援長達 8 小時長時間執行工作負載的無伺服器按使用量計費產品。

8 小時長時間執行工作負載的無伺服器產品，某種程度上是雲原生對 AI 工作負載的妥協和進化。K8s 的 Pod 設計哲學是“短生命週期、不可變基礎設施”；AI 訓練 / 推理偏偏是“長駐、有狀態”。

此前，行業內普遍預設“無伺服器（Serverless）架構僅適用於短任務場景”。具體來看，主流無伺服器計算服務的執行時長限制如下：

Amazon Lambda：預設情況下，單次任務最長執行時間為 15 分鐘；
Amazon Fargate：容器化無伺服器任務支援最長 2 小時的持續執行；
Amazon Step Functions：雖支援最長 1 年的流程編排，但需開發者自行管理狀態機邏輯與儲存。

在此背景下，Amazon Bedrock AgentCore Runtime 突破了傳統限制，將單任務最長執行時間直接擴充套件至 8 小時，同時保持毫秒級計費模式。這一設計等於在“冷啟動快”與“長駐省錢”之間新切出一條新路。

以前需要拆分和預留的 Serverless 服務，今天可以一次性跑完，成本模型從“長租大巴”，變成了“滴滴打表”。但未來雲審計報告會把“長時 Serverless”列為頭號影子預算來源嗎？這也需要引起注意。

AgentCore Memory（記憶系統）、AgentCore Browser（瀏覽器功能），在筆者看來，屬於“彩蛋服務”，前者統一管理會話記憶與長期記憶，為模型提供關聯上下文，同時支援 Agent 基於歷史互動的持續學習，後者提供託管式瀏覽器例項，支援自動化網頁操作流程擴充套件。

AgentCore Browser 乍一看，與 2025 年上半年熱門的 Agent 操作瀏覽器填表、操作 APP 點外賣並無太大不同，但本次在 To B 場景一併推出，就有些耐人尋味了。

當前行業資料價值難以充分顯露，其部分根因在於：移動網際網路在資料共享維度是相對封閉的，不同 APP 的資料幾乎不太可能共享，平臺方只能一家一家聊資料合作。而 Web 端資料相對開放，現已成為 AI 時代門檻最低的“資料集散中心”。

StatCounter 最新（2025-07）資料顯示，Chrome 仍以 68.35% 的市場份額穩居第一。但帶有 AI 能力的新瀏覽器（OpenAI 瀏覽器、Perplexity Comet、Brave Leo 等）正在不斷增長，開始搶佔市場份額。

這是為什麼作為 Agent 時代的“AI 超級工廠”，Amazon Bedrock AgentCore 一定要提供 AgentCore Browser 服務。

AWS 甚至為此在 4 月單獨釋出了一個模型： Amazon Nova Act。由 Amazon AGI Lab 推出，是 Amazon 自研 Nova 系列 LLM 的微調版，專門訓練如何在網頁上“動手”，讓 AI 像人一樣直接開啟瀏覽器、點網頁、填表單、跑流程，目前已經公佈了開源 SDK。

Amazon Nova Act 在 Amazon 內部基準 ScreenSpot Web Text 的測試中，端到端任務完成率達到 94%，高於 OpenAI CUA 在 WebVoyager 測試平臺上的成績： 87%。

對比 2023-2024 年，今天的 Amazon Bedrock 從形態到價值，已經發生了很大變化。AWS 正努力將自己變成“構建和部署 Agents 的最佳平臺”（The Best Place To Build And Deploy Agents），而 Amazon Bedrock 在其中起到了承上啟下的作用——上方承接的是生態市場以及開發者工具，下方承接的是相容向量型別資料的儲存產品。

2 從儲存到市場，AWS 的一次“狂奔”

隨著企業加大對知識型 Agent 投入，向量資料規模將從數百萬升至數十億甚至更高。這些海量 AI 資料整合為需長期儲存的戰略資產，用於持續學習、保留歷史上下文、支援模型重訓練與微調。而在更新嵌入模型時，企業既要用新模型建立向量集，又要歸檔舊版本以滿足合規、審計和效能測試需求。但現有向量儲存方案多針對剛性資料和高頻查詢最佳化，與 Agent 長期低頻訪問向量集的需求不匹配，且向量索引膨脹，規模可能遠超原始資料，加劇了這一矛盾。

為了解決這一問題，在 Keynote 上，Swami 宣佈推出 Amazon S3 Vectors，首次在雲物件儲存中實現了向量的原生儲存、訪問、搜尋和查詢功能，成為首個內建向量支援能力的雲物件儲存服務。他將向量稱為“AI 的語言”，表示 Agent 依靠向量實現兩大關鍵功能：從歷史互動中構建上下文；在海量資料集中發現相似性。

實際上，Amazon Aurora 早在 2023 年就支援向量儲存，內建 PGVector 外掛，可以實現極致的效能。但能負擔 Amazon Aurora 成本的初創企業畢竟還是少數。

此外，Amazon S3 Vectors 的地位實在太特殊，這款釋出時間比 EC2 還早，至今已有 19 歲的儲存產品，儼然已經是大資料行業的“通用標準”——“先放到 S3 再說”，這句話並非玩笑。

Amazon S3 Vectors 支援向量儲存，意味著對於眾多對成本敏感的企業來說，可以以非常低廉的價格，儲存向量資料，價格遠低於 Amazon Aurora。

此外，向量儲存的成本，在整個 AI 管線裡往往佔到大頭，“一份原始資料 + N 份向量資料” 是儲存的常態。而 Amazon S3 Vectors 可以做到在資料倍增的情況下，成本相對可控。尤其是本次專為向量設計的儲存桶型別，官方公佈上傳 / 儲存 / 查詢總成本最多降 90%。

降低價格後，AWS 圍繞企業級開發者的釋出動作也很密集，近幾日先後釋出了 Amazon Strands Agents SDK 和 Amazon Kiro。

Strands Agents 是一款由 AWS 主導的開源 SDK，採用模型驅動的方法，僅需幾行程式碼即可構建和執行 AI Agent，是所謂“極簡主義 AI 代理框架”，不寫 DAG、不畫節點，只靠 LLM 的規劃 + 工具呼叫就能完成複雜任務。

而 Kiro 是 AWS 釋出的「Agentic IDE」預覽版，目標是把“氛圍程式設計”升級為“規格驅動開發”的 AI 整合開發環境。它不僅要幫你寫程式碼，更要先把需求、設計、測試、文件全部對齊，再自動生成可上線的工程產物。

Amazon Q Developer 、Amazon CLI 雖然也主要應用於“氛圍程式設計”，但主要以外掛形式在現有 IDE 上提供服務，偏 Copilot 模式。而 Kiro 有獨立的 UI，與 Cursor 的定位接近，主打 Spec-Driven Development（規範驅動開發），更適合希望在全新視窗下程式設計的開發者。

Kiro 具有智慧代理鉤子（intelligent agent hooks），可以自動處理重要但耗時的任務，如生成文件、編寫測試和最佳化效能。這些鉤子在後臺工作，由儲存檔案或提交程式碼等事件觸發。對於“拖延症”比較嚴重的開發者很友好，另外也為未來進一步融入 Muti-agent 工作體系打下了基礎。

二者分別服務不同場景，倒也形成了互補。

至於 AWS Marketplace ，則在 2025 紐約峰會上一口氣完成了“工具化、生態化、入口化”的三連跳，把原本只賣 SaaS 和 AMI 的“應用商店”升級為 “生成式 AI 時代的企業級能力超市”。核心變化可用一句話概括：使用者能像裝 App 一樣，把 AI Agent 裝進自己的賬戶。

AWS 紐約峰會當天推出了全新的 “AI Agents and Tools” 商品類別，該類別下的商品形態豐富多樣，具體包括：

即插即用的 Agent 映象（容器 / AMI / Lambda Layer）
符合 MCP 協議的工具外掛（如 CrowdStrike Falcon-MCP、Scale AI GenAI 平臺）
一鍵式 CloudFormation / CDK 模板，面向無伺服器部署

在搜尋體驗上，使用者用自然語言或行業標籤（金融、醫療、製造）即可過濾，搜尋結果直接給出預估成本與合規認證標識。

AWS Marketplace 也和 Amazon Bedrock AgentCore 形成了閉環。Amazon Bedrock AgentCore 剛釋出 7 大核心服務（Runtime、Memory、Identity 等），Marketplace 立即把“經過認證的第三方 Agent 模板”上架：使用者先在 AgentCore 裡選好模型，再到 Marketplace 裡挑“合規客服 Agent”“日誌審計 Agent”，一鍵部署到 Bedrock Runtime，省去 80% 整合工作量。

峰會期間，AWS 還宣佈向生成式 AI 創新中心再注資 1 億美元，受資助的 30 家初創企業，需將其研發的 Agent 產品率先上架至 Marketplace 平臺。

可以預見，未來企業構建 Agentic AI 的進展會非常快。但是，要真正實現 Agentic AI 的價值創造，企業需雙管齊下、協同發力。一方面，企業需要有明確的策略並快速高效地執行，另一方面企業還要選擇合適的合作伙伴和技術棧，在選擇時，企業不應只關注技術指標，而應選擇主流、開放、安全、可持續且深刻理解企業業務，能長期陪伴的合作伙伴。

從 AWS 今年以來的多次重大升級舉措來看，其在技術實力、服務能力以及生態建設等方面展現出顯著優勢，或許不失為企業構建 Agentic AI 的選擇之一。