雲計算一哥,剛剛重新定義了AIAgent的玩法

金磊 假裝發自 紐約量子位 | 公眾號 QbitAI
80分鐘的一場活動,Agent的“出鏡次數”竟能高達217次。
解鎖平均20多秒就提一次Agent的,正是雲計算一哥,亞馬遜雲科技
為何會如此?
因為就在剛剛的紐約峰會上,亞馬遜雲科技可以說是重新定義了部署AI Agent到生產環境中的方式——
正式釋出Amazon Bedrock AgentCore,一個企業級的AI Agent搭建工具包。
如果說以往的AI Agent要部署到實際生產中,其結果更像是一個“毛坯房”,其間有太多問題亟需解決。
比如你想開發一個智慧客服、個人助手或者業務流程自動化工具,這個過程都需要整合大語言模型、連線資料庫、呼叫各種API,並讓系統能夠智慧決策。
AgentCore就像是為這些應用提供的“智慧大腦”,可以幫你統一管理和協調所有元件,讓複雜的AI應用開發變得簡單高效。
之前的Amazon Bedrock提供的能力更加聚焦在基礎大模型本身,比如呼叫Claude、Meta、Nova、Mistral等大模型,有點類似於“租用大腦”。
而AgentCore則是在這個基礎上提供一個“智慧體搭建工具包”,讓你能把這些大腦組合起來完成具體任務。
具體而言,它是涵蓋7大核心服務的一套組合拳,把部署AI Agent到生產過程中的各種細節內容都照顧到位了,有一種直接“拎包入住精裝房”的感覺:
  • AgentCore Runtime:
提供低延遲的無伺服器環境,支援會話隔離,相容任何代理框架(包括開源框架),能夠處理多模態工作負載和長期執行的Agent。透過AgentCore SDK在程式碼中新增幾行程式碼,指定入口點函式,即可將代理部署到雲端。
  • AgentCore Memory:
管理會話和長期記憶,為模型提供上下文資訊,幫助Agent從過去的互動中學習。對於短期記憶,透過create_event儲存Agent互動,透過list_events載入最近的對話內容;對於長期記憶,支援語義記憶策略(如使用者偏好、總結和事實捕獲),資料以加密形式儲存,並支援基於名稱空間的資料分割。
  • AgentCore Observability:
提供代理執行的逐步視覺化,包括元資料標記、自定義評分、軌跡檢查和故障排除/除錯過濾器。可以幫助開發者除錯、審計和監控Agent效能,內建儀表板用於跟蹤關鍵操作指標(如會話數、延遲、錯誤率等),支援OpenTelemetry以整合現有可觀測性平臺。
  • AgentCore Identity:
使AI Agent能夠安全地訪問亞馬遜雲科技服務和第三方工具(如GitHub、Salesforce、Slack),支援基於使用者身份或預授權使用者同意的操作。透過建立工作負載身份和憑證提供者(如OAuth2、API金鑰),Agent可以使用這些憑證安全地訪問資源。
  • AgentCore Gateway:
將現有的API和Lambda函式轉換為可用於代理的工具,提供跨協議(包括MCP)的統一訪問和執行時發現,提供雙重身份驗證模型以確保安全。
  • AgentCore Browser:
提供託管的網頁瀏覽器例項,擴充套件Agent的Web自動化工作流。可以用於訪問沒有程式化API的系統或需要透過Web介面訪問的資源。
  • AgentCore Code Interpreter:
提供隔離環境以執行代理生成的程式碼。用於執行需要計算的任務,例如客戶支援Agent需要進行的計算。
這些服務既可以單獨使用,也經過最佳化能夠無縫協作,開發者不用再花時間去拼湊各種元件了。
AgentCore是首個提供完全開發靈活性的企業級無伺服器AI代理執行時平臺,支援任何框架、模型和協議,具備8小時工作負載支援、嚴格安全邊界和按需付費的可組合服務架構。
一言蔽之,再大規模的AI Agent,現在AgentCore這裡,都可以安全操作和部署。
由此作為最為關鍵的釋出,亞馬遜雲科技在今天的活動中,不論是在基礎設施、模型架構,亦或是應用上,均圍繞著Agent來展開。
之所以如此,亞馬遜雲科技Agentic AI副總裁Swami Sivasubramanian的話來說就是:
未來的關鍵在於讓所有Agents和工具協同工作。

不僅要方便,還要夠靠譜

為了更方便操作,基於AgentCore,亞馬遜雲科技還推出了Marketplace中的AI Agents和工具,只需要透過自然語言搜尋,客戶就可以輕鬆描述使用場景並找到相關解決方案(目前已經有數百種)。
除此之外,亞馬遜雲科技在Amazon SageMaker AI中還推出了Amazon Nova定製化的功能。
客戶現在可以在模型訓練生命週期中對Nova Micro、Nova Lite和Nova Pro進行定製,包括預訓練、監督微調和對齊。
據瞭解,這些技術作為現成的Amazon SageMaker配方提供,並支援無縫部署到Amazon Bedrock,滿足按需和預置吞吐量推理的需求。
針對AI Agent許多功能過分依賴API的問題,亞馬遜雲科技還推出了Amazon Nova Act來打破這一侷限——
建立能夠在網頁瀏覽器中執行任務的AI Agent。
與此同時,亞馬遜雲科技一道還發布了Amazon Nova Act SDK的研究預覽版,用這個SDK,開發者就可以很方便地建立能夠自動執行網頁任務的AI Agent。
為了進一步提高準確性,SDK支援透過Playwright進行瀏覽器操作、API呼叫、Python整合以及並行執行緒處理,以克服網頁載入延遲。
在內部評估中,Amazon Nova Act針對特定能力取得了超過90%的高分,例如在ScreenSpot Web文字基準測試中得分0.939。
由此可見,亞馬遜雲科技在打造AI Agent這件事上,不僅追求可用度,更加註重可靠性。

資料庫也很AI Agent

亞馬遜雲科技針對AI Agent這個主旋律,還在資料層上下足了功夫。
眾所周知,向量(Vectors)可以說是AI的語言,它可以把文字、影像等內容轉成大模型能理解的數字格式。
對於現代企業來說,AI Agent將向量用於兩個關鍵功能,一個是用於從過去的互動中構建上下文,另一個是發現海量資料集中的相似性內容。
但現在面臨的一個問題是,目前的知識、資料規模變得越來越大,它們不再僅僅是臨時資源,更是必須長期儲存的戰略資源。
為此,亞馬遜雲科技推出了Amazon S3 Vectors——首個原生支援儲存大規模向量資料集、並提供亞秒級查詢效能的雲物件儲存服務。
它最大的亮點,就是直接把上傳、儲存和查詢向量的總成本降低多達90%!
從技術角度來看,S3 Vectors推出了一種叫“向量桶”(vector buckets)的新儲存型別,它有專門的API介面,讓我們可以儲存、訪問和查詢向量資料,而且不需要自己搭建任何基礎設施。
當建立一個S3向量桶時,我們的向量資料會被組織在“向量索引”(vector index)中,這樣就能很簡單地對資料集進行相似性搜尋。
據瞭解,每個向量桶最多可以有10000個向量索引,每個向量索引可以儲存數千萬個向量。
在建立向量索引後,當我們往索引裡新增向量資料時,還可以給每個向量附加一些元資料(以鍵值對的形式),這樣一來查詢時就能根據特定條件進行過濾,比如按日期、類別或使用者偏好來篩選。
隨著時間推移,當你對向量進行寫入、更新和刪除操作時,S3 Vectors會自動最佳化這些向量資料,確保在向量儲存方面達到最佳的價效比,即使資料集規模不斷擴大和變化也是如此。
S3 Vectors還與Amazon Bedrock Knowledge Bases(包括Amazon SageMaker Unified Studio)原生整合,用於構建成本效益高的檢索增強生成(RAG)應用。
透過與Amazon OpenSearch Service的整合,我們可以把不常查詢的向量放在S3 Vectors中來降低儲存成本,然後在需求增加時快速將它們轉移到OpenSearch,或者用於支援即時、低延遲的搜尋操作。

亞馬遜雲科技的AI Agent之道,已經改變了AI程式設計

除了基礎設施和模型層面之外,亞馬遜雲科技在應用上還拿出了一款全新的免費AI程式設計工具,Kiro
若是用一句話概括Kiro的亮點,那就是隻要你有想法,它就能幫你把這個想法變成實際可用的軟體,而且是從專案啟動、設計、程式設計到最終維護,全程都有專業級的Agent深度參與。
例如我們要給電商網站新增一個評論系統,現在就只需要三步即可。
第一步,把一句話需求變成詳細計劃:
為產品新增評論系統。
可以看到,Kiro秒懂了你的意圖,馬上把這句簡單的話,分解成一個個具體的使用者場景和需求。
比如,它會想到“使用者要能看評論”、“使用者要能寫評論”、“使用者可以篩選評論”、“使用者可以給評論打分”等等。
並且,Kiro會把每個需求的驗收標準都寫得清清楚楚,就像一份詳細的需求文件,避免了後續理解上的偏差。
第二步,根據計劃自動生成“施工圖紙”。
在咱們確認了第一步的需求計劃後,Kiro就會自己去研究現有的專案程式碼;然後,它會自動生成一份技術“施工圖紙”。
這份圖紙非常專業,包括資料怎麼流動、需要哪些新的資料介面和資料庫設計等等。
比如,它會設計好“評論”這個東西具體應該包含哪些資訊(如評論內容、評分、使用者ID等)。
第三步,把“圖紙”變成一個個具體的“施工任務”。
在這個步驟中,Kiro會根據上一步的“施工圖紙”,把整個開發工作拆分成一個個小任務,並且按照“先做什麼後做什麼”的依賴關係排好順序。
每個小任務都寫得非常具體,比如“寫單元測試”、“做整合測試”、“考慮載入時的頁面狀態”、“適配手機版”、“保證無障礙使用”等等。
或許此時你就要問了,Kiro和其它的程式設計AI有什麼區別?
其實從剛才的展示過程中應該也能或多或少地感受到,在亞馬遜雲科技開闢的AI Agent新生產正規化之下,正如網友所說:
Kiro規範化了AI程式設計的工作流程。
以上便是此次釋出的主要內容了,整體來看,亞馬遜雲科技再一次從基礎設施、模型框架以及應用三個層面來了個“大煥新”,而這一次的主角,毫無疑問就是AI Agent。
而這一切,所影射的實則是雲計算一哥下的一盤大棋。

Why AI Agent?Why 亞馬遜雲科技?

對於第一個問題,若是用Swami Sivasubramanian在現場所陳述的願景來解釋,那就是:
讓亞馬遜雲科技成為構建世界上最有用的AI Agents的最佳場所。
在亞馬遜雲科技看來,AI Agent的意義不僅僅是一個技術概念,更是企業組織效率的躍遷工具。
藉助Agentic AI,企業可以將重複性強、邏輯明確的任務交由智慧體完成,讓員工專注於更具創造力與戰略性的事務。
透過AI Agent,亞馬遜雲科技可以幫助客戶簡化流程、提升響應速度,並釋放團隊潛能,從而改變業務運作方式。
而縱觀今天所有的新發布,雖然它們的細分功能各有側重,但小目標均是劍指於此。
例如為了讓更多企業快速找到、試用並部署Agent,亞馬遜雲科技在其Marketplace市場中新增了“AI Agents & Tools”分類。
再如為了解決許多AI Agent只能停留在原型驗證階段,缺乏可擴充套件性與安全保障的問題,亞馬遜雲科技推出的Amazon Bedrock AgentCore就專門為生產級AI Agent而設計。
以及面向開發者,諸如Kiro這樣的AI程式設計應用,更是重新規範了AI Agent在程式設計任務中的流程,目標依舊是能夠保障“生產級”。
如此考量的背後,也有市場發展的預期所支撐。根據最新調查資料,AI Agents正迅速成為企業主流應用。
LangChain調查顯示,超過50%的公司已在生產環境中部署agent,近80%正在開發中。Gartner預測到2028年,33%的企業軟體將包含Agentic AI(相比2024年不到1%),15%的日常工作決策將由其自主完成,並將取代20%的人類店面互動。
企業更青睞能查詢多個任務特定模型的Agentic AI功能而非單一基礎模型,這種多語言模型方法具有更強的跨領域擴充套件性。目前,軟體開發、客戶服務、理賠處理和IT流程自動化是Agentic AI的主要早期應用場景。
並且從技術發展的角度來看,目前幾乎所有的生成式AI產品或應用,均離不開AI Agent這個關鍵詞。
由此,就不難理解為什麼亞馬遜雲科技如此關注AI Agent了,正如CEO Matt Garman所說:
AI Agent將改變我們所有人的工作和生活方式,其影響力堪比網際網路的誕生。
大趨勢已經指向AI Agent,科技巨頭又以“all in”之勢發力於此,雙重認證之下已然證明了AI Agent的重要性;但更重要的一點是,雲計算一哥已然給業界交付了“快好省”投入生產的新正規化。
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
—  —
🌟 點亮星標 🌟
科技前沿進展每日見

相關文章