

作者|路世明
編輯|大 風
Manus的出現,激起了科技與資本市場的雙重震盪,一時間AI Agent相關概念股集體大漲,阿里、谷歌、微軟等科技巨頭密集釋出智慧體研發計劃……
而在這場熱潮的背後,是AI技術從“被動應答”向“主動執行”的正規化躍遷。
儘管市場的評價褒貶不一,但不能否認,Manus的突破性在於,它首次驗證了通用型AI Agent在複雜場景下的商業化可行性。
傳統的大語言模型雖能生成文字,卻難以閉環執行任務,而Manus透過“規劃-驗證-執行”的架構,將AI大模型的認知能力轉化為生產力工具。
根據麥肯錫等多份權威報告,在多元化需求驅動下,AI Agent市場呈爆發式增長態勢,2024年全球AI Agent市場規模約為51億美元,預計2030年將飆升至471億美元,複合年增長率高達44.8%。
然而,這場“智慧體浪潮”並非坦途。技術瓶頸與商業野心的碰撞,讓AI Agent的競爭既充滿想象力,又暗藏風險。

破壁之戰
本質上,AI Agent的是具備人類思維正規化的數字勞動力。
如果說聊天機器人還停留在“對話”階段,那麼Agent則已經開始“行動”。簡單來說,可以理解為一種更智慧、更自主的AI應用,它不僅能回答問題,還能執行任務、完成交易。
它們可以被應用於各種場景,如客戶服務、金融分析、軟體開發等,極大地提高了生產力和效率。
以大語言模型為“大腦”,AI Agent不僅能理解指令表層語義,更能捕捉隱含需求。例如使用者說“找價效比高的酒店”,Manus會結合季節、當地活動等上下文推理出“預算敏感型”或“體驗優先型”需求。
而可以期待的是,隨著大模型在多模態能力上的持續突破,特別是多模態融合技術的迭代升級,AI Agent將能夠更精準地解析並反饋使用者需求,逐步實現類人類的視聽感知與互動能力。
這將使得AI Agent可以應用於更廣泛的領域,如醫療診斷、自動駕駛、智慧安防等。

在單體智慧持續最佳化的同時,還可以想象的是,未來的AI Agent或許也能夠突破單機運作模式,透過協同機制重構複雜任務處理與決策鏈條。
這種多智慧體系統(MAS)透過角色定位機制,能夠使每個智慧體如同專業化分工的人類團隊。
舉例來說,在軟體開發的場景下,每個AI Agent都有自己的特長,有的擅長程式設計,有的擅長設計,還有的專門檢查質量,只要它們能很好的協作,就能一起完成一個高質量的軟體專案。
此外,MAS系統還能模擬人類的決策過程,就像人遇到問題時會找人商量一樣,多智慧體也可以模擬集體決策的行為,這樣就能為使用者提供更好的資訊支援,特別是在一些複雜的情況下。
比如遇到緊急情況,這些AI智慧體就能幫使用者模擬所有可能的情形,及時提供有用的資訊,讓使用者能更快更好的作出決定。
可以說,這種“類人”的智慧正規化,正在重構生活、工作的成本結構。而從Manus開始,似乎AI Agent已從概念驗證階段,邁入規模化落地的臨界點。

巨頭競速
AI Agent的熱潮並非偶然,而是技術演進的必然產物。
早在2024年紅杉AI峰會上,吳恩達教授便預言“AI Agent是AI發展的下一個關鍵階段”。事實上,2024年期間,便有不少科技巨頭佈局AI Agent。
如谷歌在2024年12月釋出了其最新版大模型Gemini2.0系列,並介紹了多個智慧體應用,如ProjectAstra。微軟也在2024年10月和11月分別釋出了多個面向銷售、運營等場景的AI智慧體,並推出CopilotStudio平臺支援使用者構建自主智慧體。
進入2025年,Manus的火熱,徹底帶動了市場的情緒。
海外,OpenAI近期公佈的商業化計劃進一步印證AI Agent的B端潛力。其“博士水平”Agent針對科研與軟體開發場景,每月服務費高達2萬美元,覆蓋從基礎分析到複雜任務的全鏈條需求。
國內方面,阿里千問QwQ-32B模型中也集成了與智慧體Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境反饋調整推理過程。
另一方面,開源社群已出現OpenManus、OWL等新產品,基於Manus進行復刻和創新,有望推動Agent產品百花齊放。
資本市場的狂熱更加印證了這一趨勢。
Manus釋出當天,A股超150只AI智慧體概念股漲停,立方控股、酷特智慧等漲幅超20%。

來源:東方財富
此外,Manus釋出後,券商PPT、分析師路演火速上線,不完全統計顯示,中金、華泰、招商、中泰等數十家券商研究所進行了路演,其中有分析師上線了多場路演,路演內容從技術原理、AI應用、受益方向到落地場景、產業圈推演,內容豐富。
當然,在熱潮的背後,也有不同的聲音。不少業內人士認為,Manus屬於AI Agent初級的應用,市場的反應過大了。
事實也的確如此,AI會進一步拉平資訊差,大量收集資訊、整理資料的工作可以交給AI,但真正距離生成投資決策,無疑還有很長的路要走。
其中,最大的挑戰在於:AI幻覺的幽靈始終縈繞不去。

技術瓶頸
AI Agent的競爭,入口為王。
當掌握更多使用者流量的廠商,有望實現“流量-資料-使用體驗”的正向迴圈,且隨著開源模型能力升級彌補大廠及中小廠技術代差,AI產品工程化能力,或拉開產品使用體驗差距。
可儘管展現出巨大的潛力,但AI Agent的爆發仍面臨多重障礙。從商業模式到技術瓶頸,從法規缺失到使用者認知,每個環節都在考驗著行業的耐心。
首當其衝的原因就在於,現有技術還無法有效地解決AI幻覺的問題。
以當紅的Manus來說,雖然在GAIA基準測試中取得了優異成績,但在實際應用中,仍存在一些不穩定的情況。

GAIA基準測試排名來源:ManusAIX平臺
有實測使用者反饋,在處理複雜任務時,Manus偶爾會出現任務執行失敗或結果不準確的問題。在進行股票資料分析時,Manus可能會因為資料介面的臨時故障或資料格式的細微變化,導致分析結果出現偏差。
再以OpenAI的GPT4.5來說,毫無疑問,這是目前最強的大語言模型。但在SimpleQA基準測試中,GPT-4.5的準確率為62.5%,幻覺率為7.1%,儘管這一成績要遠優於GPT-4o、OpenAIo1和o3-mini等模型,但是依然存在著相當高的幻覺率。
而這種幻覺,在金融、醫療等高風險領域,任何一點誤差,都可能引發系統性風險。
假設某醫療診斷Agent,其誤判罕見病案例的機率為3%,客若應用於千萬級使用者群體,那麼潛在誤診人數將高達30萬。
除了幻覺,緊接著的是資料孤島與通用能力的矛盾。
AI Agent的效能高度依賴場景資料,例如金融風控需要即時交易資料,而醫療診斷依賴患者病史庫,資料割裂會導致通用型Agent難以跨領域遷移。
最後是倫理與監管的滯後性。AI Agent的自主決策涉及隱私洩露、責任歸屬等倫理問題,比如呼叫使用者健康資料、自動駕駛事故等等,而全球監管框架尚未成熟。
由此可見,AI Agent的破局路徑需從技術、生態與監管三端協同推進。而未來,誰能率先突破技術瓶頸並構建合規生態,毫無疑問,誰就將主導這場智慧體時代的“諾曼底登陸”。
