AgenticAI時刻!多智慧體驅動,「一人公司」這就要來了

機器之心報道
作者:澤南、陳陳
Code is cheap, show me the talk.
最近,很多 AI 大佬一反常態,對未來做出了超出預期的樂觀預測。
諾貝爾獎獲得者、AI 先驅 Geoffrey Hinton 表示,人工智慧將在多個領域「取代所有人」,只有頂尖技能人才能夠找到 AI 無法處理的工作。
特斯拉前負責人 Andrej Karpathy 在演講中也認為,我們正在進入「軟體 3.0」時代,自然語言在成為新的程式設計介面,大模型會完成剩下的工作。
正在讓 AI 能力大幅提升的技術被稱為智慧體(Agentic AI),它能夠長時間獨立執行、感知環境,自主使用各種工具來完成複雜任務。最近有研究甚至證明,智慧體也遵循大語言模型的測試時擴充套件(Test-Time Scaling)規律,能夠透過強推理不斷提升解題能力。
事實上,智慧化發展的過程比我們想象得還要快。正在上海舉行的亞馬遜雲科技中國峰會上,我們看到了一系列基於大模型、Agentic AI 的創新和案例,讓我們眼花繚亂。
「通俗說來,Agentic AI 就是讓基於大模型的 AI 從『我問 AI 答』、『我說 AI 寫』發展到『我說 AI 做』。AI 驅動的數字員工能將像人一樣在各行各業,為企業帶來新的生產力,」亞馬遜雲科技大中華區總裁儲瑞松說道。
手搓 Agentic AI 應用
僅需不到 30 行程式碼
如今想用 AI Coding 來開發一個抽獎的小應用,到底有多簡單?
在 Amazon Q Developer 上,你只需要先與 AI 進行聊天互動,瞭解需求,AI 會自動生成一份有關後端程式碼的技術文件,進而生成執行計劃。在讀取執行計劃後,Q 能夠自動生成一系列提示詞,幫助我們生成程式碼,生成的程式碼可以一鍵修正錯誤。
前端程式碼就更簡單了,直接輸入一個截圖,Q 就可以把介面轉換成程式碼。生成內容出錯的地方,只需要用自然語言指出並一鍵修復即可。在程式完成之後,我們也可以用 Q 進行部署、測試,並在上線之前解決安全問題。最後在這個專案中,有 90% 的程式碼是由 Q 生成的。
AI 也可以幫助架構師改造專案適用的環境版本。比如想把 Windows 的應用轉換成 Linux 的,使用 Amazon Transform,不到一分鐘,5000 多行程式碼就修改了 4800 多行,還立即在 GitHub 上自動提交了分支。
圍繞 Bedrock Agents,人們可以圍繞大量內部資料快速構建,轉換不同工具執行任務。我們可以呼叫 Lambda 檢視遊戲發行生成的內容,也可以呼叫非結構化資料進行相關內容的生成。
在一些簡單任務上,我們可以使用開源的 Strand Agents,由它幫助構建的 AI 採購助手使用亞馬遜雲科技託管的 Claude 3.7 Sonnet 大模型作為大腦,使用者使用自然語言在前端提問,Agent 就能理解使用者需求,調出相應的 MCP 工具進行具體操作,瀏覽網頁、篩選、進行推薦並以自然語言的形式返回結果。
這樣的智慧體工具,我們可以在一天之內完成原型開發驗證,程式碼不超過 30 行。
多 Agent 之間也可以進行互動。中央協調器的大模型(Claude 4)在獲取需求後自動指定相應的不同 Agent 進行編排,搜尋並呼叫 MCP 服務形成報告,自動解析 PDF 和形成報告生成行程推薦。
以上的實現都基於亞馬遜雲科技提供的工具,它們分別針對特定場景、軟體開發全流程,以及多智慧體輕量級開發。
亞馬遜雲科技大中華區解決方案架構總經理代聞表示,由於智慧體能力的提升,多模型混合使用的應用將成為常態;如今大家對於 AI 的關注點已經從模型效能的跑分,轉變成為 AI 的應用;另外,大模型帶來的 Text to Action 正在重新定義互動內容和能力邊界。
基於此種能力,已有不少企業跨越了實驗階段,將生成式 AI 的解決方案應用於實際運營,並在三個關鍵領域取得了切實的效益 —— 提高生產力、降低成本和加快創新週期。
作為一家 AI 公司,合合資訊從成立以來一直專注於文字影像領域的 AI 演算法和應用研究,它基於亞馬遜雲科技實現業務出海,構建了支撐掃描全能王、名片識別等核心產品,為全球 200 多個國家的使用者提供高可用、低延時、安全合規的服務。
為了更好地利用企業文件資料資源,基於 Amazon Bedrock 和 OCR 大模型,合合資訊還構建了一個文件處理 Agent:DocFlow。只需要分鐘級的時間就能從雲端儲存中快速地讀取各類文件,並且自動完成最佳化、分類、資訊抽取和稽核,從而大大提升資料處理效率。
Agentic AI 在知識資訊密集的領域也發揮了巨大的作用。舉例來說,在醫學撰寫方面,一個典型的創新藥專案需要以 10 萬份文獻資料以及數千的患者臨床記錄為輸入,需要輸出多達 200 多份的文件,總體的頁數超過了 5000 頁。這個工作量佔據了研發工作量的 30~50%。
針對這一挑戰,復星醫藥和亞馬遜雲科技展開了合作,將整個醫學寫作的場景進行了解構。藉助生成式 AI 的能力,一鍵式完成實驗報告檢查,把長達一週的工作縮短到 5 分鐘。另外,在醫學翻譯領域,藉助亞馬遜雲科技技術,復星醫藥用 6 個月的時間已經完成了 1.6 個億字的翻譯,直接降本超過了 30%。
還有很多國內外公司,都在亞馬遜雲科技的這套 Agentic AI 體系上提升了效率,開啟了前所未有的業務。這不由得讓我們想起今年初人們喊出「AI 智慧體爆發元年」的預測:從 AI 輔助到 AI 協作,再到數字同事,智慧體最終可以構建成軟體公司,幫助我們完成絕大多數任務。「一人公司」距離我們其實並不遙遠。
Agentic AI 最令人興奮的或許將是商業模式的創新 —— 就像 Uber、 Airbnb 創造了共享經濟模式,Netflix 開創了訂閱制內容消費模式那樣,隨著 AI 的快速發展,現在處於正在進行時的,是深度整合 AI 的程式碼工具 Cursor、AI 即時搜尋引擎 Perplexity……
我們身處在 AI 時代,恰似置身於 30 米高的巨浪之中。AI 的發展已經來到了一個拐點。現在是時候行動了,」亞馬遜雲科技全球技術總經理 Shaown Nandi 表示。「堅信未來一年所做的事會為新的時代打下基礎。」
打造 Agentic AI
亞馬遜雲科技擁有一套完整技術棧
但另一方面,生成式 AI 的落地並不是件容易的事。
今年 1 月,DeepSeek R1 成為了全球爆款應用,很多人在向它提問後遭遇了系統頻頻回覆的「伺服器繁忙,請稍後再試」;3 月份,ChatGPT 在提供原生影像生成功能後不到 72 小時就宣告臨時下架,OpenAI CEO 山姆・奧特曼不得不宣佈進行限流,並表示「GPU 在融化」。
不少爆款 AI 應用在走出陡峭增長曲線之後,面臨著伺服器容量飽和、安全合規、技術迭代困難等一系列挑戰。為了能夠跟上 AI 發展的加速度,企業需要正確的技術和全棧的工具。
此前,Amazon Bedrock 平臺上提供的 Amazon Bedrock Agent 框架作為一款快速部署工具在業內已獲得了人們的認可。它是一個全託管式的服務,支援整合 Bedrock 內建的安全、可用性機制、RAG 等能力,也整合亞馬遜雲科技各種服務,新增的 Multi-Agent 協作則可以應對複雜工作流程編排需要。
它大大簡化了標準低階任務流程複雜性,如呼叫 LLM、定義和解析工具以及連結呼叫,從而簡化了工作流程。
其實,在能力層、基礎設施、編排層、體驗層等應用生命的全流程裡,亞馬遜雲科技都提供了大量實操性的策略和實用工具,能夠幫助你快速構建 Agentic AI。
首先是多種先進模型的選擇。現在的 AI 發展速度驚人,而且我們知道不可能有一個模型可以適用於所有任務。Amazon Bedrock 不但集成了 DeepSeek R1、Anthropic Claude、Meta Llama、AI21 Labs、Cohere 等頂尖模型,亞馬遜雲科技自主研發的 Amazon Nova 系列基礎模型也包含在內,在速度和成本方面提供更多不同選擇,涵蓋理解、影像、語音、影片等工作,新款 Amazon Nova Act 模型也即將上線 Amazon Bedrock 平臺。
第二點是模型定製能力。將自己的資料引入模型,是釋放 AI 價值其中最重要的一步。現在 Amazon Bedrock 支援端到端的全託管 RAG 功能。該功能允許企業直接將模型與內部資料來源(如資料庫、文件庫)安全連線,無需自行搭建複雜的檢索管道,即可生成基於企業私有資料的精準回答。
第三點是信任與安全。這是所有生成式 AI 應用的核心。Amazon Bedrock 提供的 Guardrails(安全護欄) 功能,可以幫助使用者遮蔽有害或不合規的輸入與輸出,並且這些 Guardrails 是可以繼承的。
此外,為了解決大模型幻覺現象,Bedrock Guardrails 率先推出了自動化推理(Automated Reasoning)功能,其中 Reasoning Checks(推理校驗)能基於邏輯驗證和可證明的依據,有效防止生成式 AI 出現事實性錯誤和幻覺內容。目前,只有亞馬遜雲科技提供這一功能。
自動化推理驗證原理。
第四點是成本效益。亞馬遜雲科技一直致力於幫助客戶最佳化成本,同時不犧牲結果質量。為了達到此目的,他們在 Amazon Bedrock 中引入了模型蒸餾,蒸餾後的模型最多可提升 500% 的響應速度,成本降低 75%。
針對更廣泛的應用場景,Amazon Bedrock 還提供了智慧提示詞路由功能。使用者可以為一個應用配置多個模型,Amazon Bedrock 會根據請求內容自動選擇最適合的模型來響應,從而在保證準確率的前提下,將成本降低高達 30%。
可以看出,從靈活的模型選擇,到節省資源的最佳化策略,Amazon Bedrock 已內建了生成式 AI 應用所需的完整能力,為企業帶來效能與成本的雙重優勢。
為了讓更多開發者能夠靈活地探索 Agent 能力,亞馬遜雲科技也提供了更加開放、自主的方式。
  • 圍繞特定場景,圍繞 Amazon Q Agents 的開箱即用工具可以涵蓋程式碼開發、IT 運維、應用現代化等步驟,覆蓋生命全週期;
  • 在基礎模型之上,Amazon Bedrock Agents 可以實現強大的工作流程編排能力;
  • 對於輕量級任務,Strands Agents 開源框架可以構建出靈活的多智慧體應用。
對於那些傾向於自己動手、深入定製的開發者來說,你不妨試試 Strands Agents—— 一款開源 Python SDK,只需寥寥數行程式碼就能構建智慧 Agent。Strands Agents 透過整合最先進的模型,為開發者省去了複雜的 Agent 編排工作。
如何賦能開發者,如何為應用奠定在 Amazon Bedrock 上成功執行生成式 AI 的基礎?那麼接下來的關鍵問題是 —— 怎樣真正把生成式 AI 應用構建出來? 
這就需要藉助亞馬遜雲科技的一款生成式 AI 助手 Q Developer,其擁有較高的程式碼接受率。一般而言,大多數開發者平均每天真正寫程式碼的時間只有 1 小時,其餘時間都花在團隊協作、撰寫文件、專案規劃等各類任務上。
與其他 AI 助手不同,Q Developer 能在整個軟體開發生命週期中為你賦能。你可以與 Q Developer 對話,瞭解其能力、架構解決方案,你也可以在 IDE 內直接與 Q Developer 聊天,共同生成程式碼、拆分任務、整合 API ,還能點選一下進行測試,掃描那些難以發現的安全漏洞。可以說,Q Developer 是一位全天候的 AI 助手。
另外,很多開發者更喜歡透過命令列工作,因此亞馬遜雲科技釋出了全新的 Q Developer CLI Agent。它能結合 Q Developer CLI 環境中的資訊,執行讀寫檔案、編寫程式碼、自動除錯等任務。
Q Developer 可以幫助你自動化日常開發任務,但開發者的大量時間其實並不在構建新應用上,而在於維護舊系統 —— 包括管理、現代化改造、打補丁等。
利用 Amazon Q 能力 ,亞馬遜雲科技找了五人團隊在兩天內將 1000 個 Java 應用程式從 Java 8 升級到 Java 17。平均每個應用耗時約 10 分鐘,而傳統方式可能需要兩天。
現在,亞馬遜雲科技已經成功遷移數萬個生產應用,年度開發工時節省 4500+,實現了 2.6 億美元的年化成本節約。
這也給我們帶來了思考,生成式 AI 如何變革整個 IT 系統?據估計,目前有 70% 的工作負載仍在本地執行,而 70% 的傳統 IT 系統已有近 20 年曆史。對於財富 500 強公司來說,應用遷移是一項長期工程。
Amazon Transform —— 首個為加速 .NET、大型機和 VMware 工作負載的企業現代化而開發的代理式人工智慧服務。Amazon Transform 可以幫助各個組織同時對數百個應用程式進行現代化改造,並保持高質量和控制力。
比如湯森路透利用 Amazon Transform,現代化升級速度比原計劃快了 4 倍。
亞馬遜雲科技認為,Agentic AI 能夠在三個方面帶來組織方式的變革:1、統一的 AI 就緒的基礎設施;2、聚合並治理過的 AI 就緒的資料;3、明確的策略和高效率的執行。
目前已經有超過 10 萬客戶在亞馬遜雲科技上進行機器學習工作,在中國的生成式人工智慧創新中心,也有超過 1000 個深度合作客戶。
宏觀來看,亞馬遜雲科技已經把智慧體放在了極其重要的位置,其 CEO Matt Garman 最近表示,Agentic AI 有機會成為亞馬遜雲科技下一個數十億美元的規模業務。對此亞馬遜雲科技 3 月份已經成立了專門的智慧體團隊,直接向 CEO 報告,很快就會有重磅釋出。
在 AI 時代,我們不止要創新,還要加速創新。亞馬遜雲科技正在成為加速創新可信賴的合作伙伴。
生成式 AI
實踐出真知
在中國峰會主論壇上,亞馬遜雲科技正式釋出了 Agentic AI 應用實踐指南。其中包括智慧體開發的基本正規化、實踐方案的示例,以及對於智慧化轉型的展望。基於該指導,任何人都可以在亞馬遜雲科技的平臺上構建 AI 應用。
預計到 2028 年,15% 的日常工作決策將由 Agentic AI 自主完成,而這一比例在 2024 年幾乎為零。這不僅僅是技術的迭代,更是軟體應用本質的重新定義。
最近,OpenAI CEO 山姆・奧特曼在接受訪談時說道,通用人工智慧(AGI)是一個動態的目標,或許更有意義的里程碑會是 ASI,即 AI 能夠實現自主的科學發現。如果 AI 可以基於可靠的資料,理解複雜的需求,進行長期推理和規劃,可靠地使用工具並及時糾正錯誤,那麼我們就可以在更加重要的任務上,實現前所未有的自動化。
亞馬遜雲科技的能力,正在讓我們距離這個願景更進一步。
© THE END 
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]


相關文章