從概念到生產級部署:AWS如何破解AgenticAI落地難題?

作者 | 王一鵬、Luna
紅杉美國合夥人 Konstantine Buhler 預測 2025 年將成為 AI agent 的“群體協作”時代,標誌著 Agent 元年的到來。但實際上,直到昨天,7 月 16 日,面向生產環境的 AI Agent 搭建仍然只停留在工具、平臺、產品的層面,遠遠稱不上端到端服務。
形成這種局面的本質原因是,Agentic AI 落地生產環境,不僅需要完善的功能,更需要一個完善的執行時環境,包括最基本的身份驗證、資料隔離,以及對不同模型、框架的相容性要好。從業務的角度看,該套系統要了解業務上下文,要有基本的業務壓力承載能力,不能只做成“玩具”。從使用者體驗上來看,這些需求,需要在一個統一的平臺上被完整實現,避免大量的第三方工具被以不同的邏輯整合,導致企業的研發標準淪為空談。
因此,當年初 Manus 引起“套殼”爭議時,圍繞該產品技術含量的社群討論,並未呈現一邊倒的狀態——實在是因為 Agentic AI 在平臺、工程層面的工作量也很大,要做好並不容易。
當然,以上一切圍繞 Agentic AI 的討論,從現在起,都成了過去式。
AWS 一口氣完成了從 Amazon S3 Vector Buckets 到 Amazon Marketplace 等一系列產品的釋出,尤其是 Amazon Bedrock AgentCore ,作為交付企業級 AI Agents 的核心,引起了廣泛關注。又劃掉一項重要待辦的 AWS Agentic AI 副總裁 Swami ,在 AWS 紐約峰會的 Keynote 分享中,笑得非常開心。

AaaS (Agent as a Service)或者 MAaaS(Muti-Agent as a Service) 2024 年開始被研究機構廣泛提出;2025 年初,剛剛由信通院牽頭,發起評估計劃;到了年中,就幾乎被 AWS 給完整實現了。
一場考試剛剛開始就有人交卷,不得不讓人感嘆,雲計算行業的迭代速度,絲毫不輸基礎模型領域。
1看懂 Amazon Bedrock AgentCore,也就看懂了亞馬遜的“野心”
在這次圍繞 Agentic AI 規模宏大的升級中,Amazon Bedrock AgentCore 是絕對“C 位”。
官方的介紹是,Amazon Bedrock AgentCore 是一套完整的企業級服務解決方案,能夠幫助開發者快速、安全地規模化部署和執行 AI Agent,支援任意開發框架,可對接 Amazon Bedrock 託管或第三方平臺部署的各類 AI 模型,加速 Agent 從 POC(概念驗證)走向生產部署。

有接近 AWS 的人士稱,Amazon Bedrock AgentCore 的野心很大,更像是要重塑軟體開發架構——傳統軟體開發依賴傳統雲原生開發環境,比如 Docker、K8s、CI/CD 等。如果企業繼續使用這種方案,那 Agentic AI 的採用將會繼續處於初期,無法從 POC 落到真正的生產中間。
因此,在 Agent 時代的開發架構,會依賴像 Amazon Bedrock AgentCore 這樣的解決方案,該方案共包括 7 個模組:AgentCore Runtime(執行時環境)、AgentCore Memory(記憶系統)、AgentCore Observability(可觀測性)、AgentCore Identity(身份管理)、AgentCore Gateway(閘道器服務)、AgentCore Browser(瀏覽器功能)和 AgentCore Code Interpreter(程式碼直譯器)。
如果將這些服務的定義進一步簡化,在筆者看來,Amazon Bedrock AgentCore 可以簡單理解為 AWS 版的“AI Agent 超級工廠”。

Amazon Bedrock 最早以“大模型貨架”的形態出現在 AWS 的客戶面前,其核心理念是“Choice Matters”(選擇大於一切),為不同業務提供最契合的基礎模型。所以,主流模型會以最快的速度上架 Amazon Bedrock 供客戶選用,且整體“供貨”數量是市面競品的兩倍以上。
將 AgentCore 歸入 Amazon Bedrock 服務簇,等同於緊鄰原材料商超,搭建了一座加工工廠,就地取材,加工成 Agent 服務,輸送給客戶。
這種構想的基礎,在於實現一套合規的企業級 Agent 構建環境。於 Amazon Bedrock AgentCore 而言,主要由以下幾項服務構成:
  • AgentCore Runtime(執行時環境):提供具備會話隔離機制的沙盒化低延遲無伺服器環境,支援包括主流開源框架、工具和模型在內的任意 Agent 架構,並能處理多模態工作負載及長時執行 Agent。
  • AgentCore Identity(身份管理):支援 AI Agents 安全訪問 AWS 服務及 GitHub、Salesforce、Slack 等第三方工具,既可代表使用者操作,也可在獲得預先授權後自主執行。
  • AgentCore Gateway(閘道器服務):將現有 API 和 Amazon Lambda 函式轉化為 Agent 工具,提供跨協議統一訪問能力(含 MCP 協議),並支援執行時自動發現功能。
  • AgentCore Code Interpreter(程式碼直譯器):提供隔離式程式碼執行環境,保障生成程式碼的安全執行。
  • AgentCore Observability(可觀測性):提供 Agent 執行過程視覺化追溯,支援元資料標記、自定義評分、軌跡檢查及故障診斷 / 除錯過濾器。
當 Agentic AI 有了自己的執行時,可以進行身份管理,相容老程式碼、API 和其他工具,可以在沙箱中載入 Python 程式碼,具備可觀測能力方便故障排查與恢復,它已經邁過了落地生產環境的基本門檻。
Amazon Bedrock AgentCore 是為了構建 Agentic AI 專門打造的,支援 MCP 和 A2A,Amazon Bedrock AgentCore Runtime 是唯一支援長達 8 小時長時間執行工作負載的無伺服器按使用量計費產品。
8 小時長時間執行工作負載的無伺服器產品,某種程度上是雲原生對 AI 工作負載的妥協和進化。K8s 的 Pod 設計哲學是“短生命週期、不可變基礎設施”;AI 訓練 / 推理偏偏是“長駐、有狀態”。
此前,行業內普遍預設“無伺服器(Serverless)架構僅適用於短任務場景”。具體來看,主流無伺服器計算服務的執行時長限制如下:
  • Amazon Lambda:預設情況下,單次任務最長執行時間為 15 分鐘;
  • Amazon Fargate:容器化無伺服器任務支援最長 2 小時的持續執行;
  • Amazon Step Functions:雖支援最長 1 年的流程編排,但需開發者自行管理狀態機邏輯與儲存。
在此背景下,Amazon Bedrock AgentCore Runtime 突破了傳統限制,將單任務最長執行時間直接擴充套件至 8 小時,同時保持毫秒級計費模式。這一設計等於在“冷啟動快”與“長駐省錢”之間新切出一條新路。
以前需要拆分和預留的 Serverless 服務,今天可以一次性跑完,成本模型從“長租大巴”,變成了“滴滴打表”。但未來雲審計報告會把“長時 Serverless”列為頭號影子預算來源嗎?這也需要引起注意。

AgentCore Memory(記憶系統)、AgentCore Browser(瀏覽器功能),在筆者看來,屬於“彩蛋服務”,前者統一管理會話記憶與長期記憶,為模型提供關聯上下文,同時支援 Agent 基於歷史互動的持續學習,後者提供託管式瀏覽器例項,支援自動化網頁操作流程擴充套件。
AgentCore Browser 乍一看,與 2025 年上半年熱門的 Agent 操作瀏覽器填表、操作 APP 點外賣並無太大不同,但本次在 To B 場景一併推出,就有些耐人尋味了。
當前行業資料價值難以充分顯露,其部分根因在於:移動網際網路在資料共享維度是相對封閉的,不同 APP 的資料幾乎不太可能共享,平臺方只能一家一家聊資料合作。而 Web 端資料相對開放,現已成為 AI 時代門檻最低的“資料集散中心”。
StatCounter 最新(2025-07)資料顯示,Chrome 仍以 68.35% 的市場份額穩居第一。但帶有 AI 能力的新瀏覽器(OpenAI 瀏覽器、Perplexity Comet、Brave Leo 等)正在不斷增長,開始搶佔市場份額。

這是為什麼作為 Agent 時代的“AI 超級工廠”,Amazon Bedrock AgentCore 一定要提供 AgentCore Browser 服務。
AWS 甚至為此在 4 月單獨釋出了一個模型 : Amazon Nova Act。由 Amazon AGI Lab 推出,是 Amazon 自研 Nova 系列 LLM 的微調版,專門訓練如何在網頁上“動手”,讓 AI 像人一樣直接開啟瀏覽器、點網頁、填表單、跑流程,目前已經公佈了開源 SDK。
Amazon Nova Act 在 Amazon 內部基準 ScreenSpot Web Text 的測試中,端到端任務完成率達到 94%,高於 OpenAI CUA 在 WebVoyager 測試平臺上的成績: 87%。
對比 2023-2024 年,今天的 Amazon Bedrock 從形態到價值,已經發生了很大變化。AWS 正努力將自己變成“構建和部署 Agents 的最佳平臺”(The Best Place To Build And Deploy Agents),而 Amazon Bedrock 在其中起到了承上啟下的作用——上方承接的是生態市場以及開發者工具,下方承接的是相容向量型別資料的儲存產品。
2 從儲存到市場,AWS 的一次“狂奔”
隨著企業加大對知識型 Agent 投入,向量資料規模將從數百萬升至數十億甚至更高。這些海量 AI 資料整合為需長期儲存的戰略資產,用於持續學習、保留歷史上下文、支援模型重訓練與微調。而在更新嵌入模型時,企業既要用新模型建立向量集,又要歸檔舊版本以滿足合規、審計和效能測試需求。但現有向量儲存方案多針對剛性資料和高頻查詢最佳化,與 Agent 長期低頻訪問向量集的需求不匹配,且向量索引膨脹,規模可能遠超原始資料,加劇了這一矛盾。
為了解決這一問題,在 Keynote 上,Swami 宣佈推出 Amazon S3 Vectors,首次在雲物件儲存中實現了向量的原生儲存、訪問、搜尋和查詢功能,成為首個內建向量支援能力的雲物件儲存服務。 他將向量稱為“AI 的語言”,表示 Agent 依靠向量實現兩大關鍵功能:從歷史互動中構建上下文;在海量資料集中發現相似性。
實際上,Amazon Aurora 早在 2023 年就支援向量儲存,內建 PGVector 外掛,可以實現極致的效能。但能負擔 Amazon Aurora 成本的初創企業畢竟還是少數。
此外,Amazon S3 Vectors 的地位實在太特殊,這款釋出時間比 EC2 還早,至今已有 19 歲的儲存產品,儼然已經是大資料行業的“通用標準”——“先放到 S3 再說”,這句話並非玩笑。
Amazon S3 Vectors 支援向量儲存,意味著對於眾多對成本敏感的企業來說,可以以非常低廉的價格,儲存向量資料,價格遠低於 Amazon Aurora。

此外,向量儲存的成本,在整個 AI 管線裡往往佔到大頭,“一份原始資料 + N 份向量資料” 是儲存的常態。而 Amazon S3 Vectors 可以做到在資料倍增的情況下,成本相對可控。尤其是本次專為向量設計的儲存桶型別,官方公佈上傳 / 儲存 / 查詢總成本最多降 90%。
降低價格後,AWS 圍繞企業級開發者的釋出動作也很密集,近幾日先後釋出了 Amazon Strands Agents SDK 和 Amazon Kiro。
Strands Agents 是一款由 AWS 主導的開源 SDK,採用模型驅動的方法,僅需幾行程式碼即可構建和執行 AI Agent,是所謂“極簡主義 AI 代理框架”,不寫 DAG、不畫節點,只靠 LLM 的規劃 + 工具呼叫就能完成複雜任務。
而 Kiro 是 AWS 釋出的「Agentic IDE」預覽版,目標是把“氛圍程式設計”升級為“規格驅動開發”的 AI 整合開發環境。它不僅要幫你寫程式碼,更要先把需求、設計、測試、文件全部對齊,再自動生成可上線的工程產物。
Amazon Q Developer 、Amazon CLI 雖然也主要應用於“氛圍程式設計”,但主要以外掛形式在現有 IDE 上提供服務,偏 Copilot 模式。而 Kiro 有獨立的 UI,與 Cursor 的定位接近,主打 Spec-Driven Development(規範驅動開發),更適合希望在全新視窗下程式設計的開發者。
Kiro 具有智慧代理鉤子(intelligent agent hooks),可以自動處理重要但耗時的任務,如生成文件、編寫測試和最佳化效能。這些鉤子在後臺工作,由儲存檔案或提交程式碼等事件觸發。對於“拖延症”比較嚴重的開發者很友好,另外也為未來進一步融入 Muti-agent 工作體系打下了基礎。
二者分別服務不同場景,倒也形成了互補。
至於 AWS Marketplace ,則在 2025 紐約峰會上一口氣完成了“工具化、生態化、入口化”的三連跳,把原本只賣 SaaS 和 AMI 的“應用商店”升級為 “生成式 AI 時代的企業級能力超市”。核心變化可用一句話概括:使用者能像裝 App 一樣,把 AI Agent 裝進自己的賬戶。
AWS 紐約峰會當天推出了全新的 “AI Agents and Tools” 商品類別,該類別下的商品形態豐富多樣,具體包括:
  • 即插即用的 Agent 映象(容器 / AMI / Lambda Layer)
  • 符合 MCP 協議的 工具外掛(如 CrowdStrike Falcon-MCP、Scale AI GenAI 平臺)
  • 一鍵式 CloudFormation / CDK 模板,面向無伺服器部署

在搜尋體驗上,使用者用自然語言或行業標籤(金融、醫療、製造)即可過濾,搜尋結果直接給出預估成本與合規認證標識。
AWS Marketplace 也和 Amazon Bedrock AgentCore 形成了閉環。Amazon Bedrock AgentCore 剛釋出 7 大核心服務(Runtime、Memory、Identity 等),Marketplace 立即把“經過認證的第三方 Agent 模板”上架:使用者先在 AgentCore 裡選好模型,再到 Marketplace 裡挑“合規客服 Agent”“日誌審計 Agent”,一鍵部署到 Bedrock Runtime,省去 80% 整合工作量。
峰會期間,AWS 還宣佈向生成式 AI 創新中心再注資 1 億美元,受資助的 30 家初創企業,需將其研發的 Agent 產品率先上架至 Marketplace 平臺。
可以預見,未來企業構建 Agentic AI 的進展會非常快。但是,要真正實現 Agentic AI 的價值創造,企業需雙管齊下、協同發力。一方面,企業需要有明確的策略並快速高效地執行,另一方面企業還要選擇合適的合作伙伴和技術棧,在選擇時,企業不應只關注技術指標,而應選擇主流、開放、安全、可持續且深刻理解企業業務,能長期陪伴的合作伙伴。
從 AWS 今年以來的多次重大升級舉措來看,其在技術實力、服務能力以及生態建設等方面展現出顯著優勢,或許不失為企業構建 Agentic AI 的選擇之一。
把 AI 的想象力變成業務的增長力,亞馬遜雲科技城市巡演期待與您相見!


相關文章