↑點選藍字 關注我們
在第二章《TOP 101-2024 大模型觀點》中,廣東智用人工智慧應用研究院擔任工業 & 社群 CTO 張善友認為,AI Agent 逐漸成為 AI 應用的核心架構,透過自主感知、決策和執行能力,實現對現有軟體的智慧化改造和升級,從而改變業務流程和使用者互動方式。

全文如下:
AI Agent 逐漸成為 AI 應用的核心架構
文 / 張善友
隨著人工智慧技術的迅猛發展,大模型應用已經成為了 2024 年的熱點話題,大模型應用已逐漸從初期的 Chatbot 邁向 RAG、Copilot 及 Agent 等更為高階的階段。這些大模型具備強大的資料處理能力和深度學習能力,為各種應用場景提供了前所未有的便利。
單一的大模型在處理所有任務時往往存在侷限性,因此需要藉助外部工具或函式來增強其處理能力。
2023 年 6 月 13 日 OpenAI 釋出的 GPT 模型的 Function Calling 功能,成為大模型與現實世界互動的橋樑。Function Calling 機制在很大程度上推動了 Agent 技術的發展。Agent 技術以其獨特的自主性和智慧性,正逐漸成為大模型應用的重要組成部分,引領著新的發展趨勢。
在智慧化方面,Agent 的學習能力得到了極大的增強。傳統的機器學習技術為 Agent 提供了初步的學習框架,使得 Agent 能夠透過資料驅動的方式學習並最佳化自身行為。
然而,隨著神經網路模型的廣泛應用,Agent 的學習能力得到了質的飛躍。深度學習技術使得 Agent 能夠處理更加複雜、高維的資料,從而更精確地感知環境資訊並做出相應決策。此外,強化學習技術的不斷發展也為 Agent 提供了持續學習和自我最佳化的能力,使得 Agent 能夠在與環境的互動中不斷改進自身策略,實現更高級別的智慧化。
早期的 Agent 系統往往依賴於預設的規則和策略進行決策和行動,自主性和靈活性相對有限。然而,隨著大模型推理能力的發展,Agent 已經具備了更高的自主性。這種自主性不僅體現在 Agent 能夠根據環境變化和任務需求自主調整行為策略上,更表現在 Agent 能夠在一定程度上進行自我管理和自我修復,以應對各種複雜和不確定的情況。
AI Agent 的發展趨勢是其逐漸成為 AI 應用的核心架構,透過自主感知、決策和執行能力,實現對現有軟體的智慧化改造和升級,從而改變業務流程和使用者互動方式。
2024 年,開源社群中出現了一些著名的多智慧體框架,如 MetaGPT、LangGraph 和 AutoGen,這些框架透過不同的技術手段來解決多智慧體系統中的資訊冗餘和任務複雜性問題。
這些框架的出現表明,未來多智慧體系統將更加註重靈活性和可定製性。多智慧體框架逐漸成為主流,有效解決了單智慧體視角侷限的問題,實現了多工作流的並行處理,使得推理過程更加可靠,並具備了對多模態資料的相容性。這種趨勢表明,未來的 AI Agent 將不再侷限於單一任務,而是能夠處理複雜的多工環境,提高整體效率和可靠性。
AI Agent 的發展還依賴於大模型的持續最佳化和創新。大模型的發展方向包括最佳化效能、利用龐大的訓練資料集模擬人類行為以及增強模型固有的通用能力。
這些最佳化和創新將推動 AI Agent 在推理、規劃、記憶和工具使用等方面的能力提升,2024 年的 OpenAI 的 o1 模型是這方面的典型代表,不僅是 OpenAI 所代表的閉源的大模型是這樣,開源的大模型也是在不斷提升智慧化能力,例如 2024 年 9 月阿里釋出的 Qwen 2.5 72B 模型成為全球最強開源大模型。此外,Qwen 2.5 的整體效能相比前一代提升了超過 18%,並且在多模態能力、長文字處理和指令遵循等方面也有所增強。
大模型應用從 Chatbot 到 RAG、Copilot 和 Agent 的發展歷程充滿了挑戰與機遇。隨著技術的不斷進步和創新,我們有理由相信,大模型應用將在未來展現出更加廣闊的應用前景和巨大的社會價值。

張善友
從事.NET 技術開發二十三年,認證 CKAD 專家,曾在騰訊工作 12 年,目前在廣東智用人工智慧應用研究院擔任工業 & 社群 CTO。業餘積極參與運營.NET 技術社群、Dapr 中文社群、Semantic Kernel 中文社群,.NET 黃埔論壇以及相關開源專案,運營微信公眾號“dotNET跨平臺”和“新一代智慧應用”。榮獲連任 19 次微軟最有價值專家 MVP,6 屆華為雲 HCDE,6 屆騰訊雲最有價值專家 TVP。
閱讀完整報告:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf


↓分享、在看與點贊~Orz