2025.03.08

本文字數:2393,閱讀時長大約4分鐘
導讀:透過大模型或Agent去做工具的使用,已經不是很新奇的事情了。
作者 | 第一財經 呂倩
凌晨三點敲完程式碼,次日早上八點新增三十多個好友申請,在開源社群GitHub上迅速收穫7000多顆星星——Manus爆紅不足三日,隸屬於國內AI Agent初創公司DeepWisdom(深度賦智)的MetaGPT 團隊,就進行了產品復刻,並將產品Open Manus上傳至開源社群。
第一財經記者對話MetaGPT 團隊,試圖理清此次技術復刻的底層邏輯,以及行業喧囂背後的意義。這一過程既反映出產品功能復刻離不開DeepWisdom公司具備的技術沉澱,也透過MetaGPT 團隊的視角肯定了Manus團隊在規劃、後訓練、互動方式等方面的投入。

在復刻過程中理解差異
早在2023年,MetaGPT 團隊開始研究多智慧體框架,並在 GitHub 上開源相關程式碼,獲得了社群的廣泛關注。2024年10月,團隊開始探索 Agent 的規劃能力和工具使用能力,提出Data Interpreter等工作。
Manus火了之後,MetaGPTAI演算法研究員向勁宇與MetaGPT演算法研究員梁新兵討論:是否可以直接做一個開源版本。
在具體產品屬性上,OpenManus 是類Manus的多智慧體框架,為開發者提供了快速上手和定製化開發的平臺,但向勁宇也不忘提醒:目前OpenManus是demo級(演示版本),暫時還沒有GALA benchmark評測結果,效果可能一般。後續團隊會進一步投入DeepResearch方向與SWE(軟體工程)程式碼方向。
此前Manus披露在GALA Benchmark 評測中達到當前最優水平(SOTA),超越OpenAI 的 Deep Research 等競品。
向勁宇推測,Manus團隊本身實現了非常複雜的規劃與後訓練,才能夠如同其demo提供良好的產品互動。Manus面臨效果不理想時的問題也是行業性問題,OpenManus暫時也沒有達到非常強的效果。
對於三小時便能夠復刻“爆品”Manus,梁新兵對第一財經記者表示,本質在於團隊已儲備的技術積澱,且前兩個月前團隊已經在思考如何透過簡單的、優雅的形式,去呈現一個Agent形態。
從Manus與OpenManus對外披露的演示影片來看,兩者均屬於AI Agent 產品,採用Multi-Agent(多智慧體)架構,能夠將複雜任務拆解為多個子任務,並分配給不同的Agent(智慧體)執行。另外,兩者均具備工具鏈整合屬性,整合多種工具,如網路搜尋、程式碼執行、檔案處理等,以增強智慧體的功能。
相較而言,兩者最大差異在於OpenManus的開源屬性。與Manus的技術架構主要依靠使用者猜測不同,OpenManus產品團隊直接在專案致謝中提及Claude廠商Anthropic去年上線的computer-use,YC投資的專案browser-use等。OpenManus作者張佳釔公開總結產品成果結合了computer-use、基本的Agents,以及規劃能力。


多智慧體將普及
與其關注Manus剛剛出圈時的諸多噱頭,不如將目光聚焦在Manus模式給行業發展帶來的啟示。
梁新兵認為,Manus讓更多普通人瞭解到智慧體為何物,放大了Multi-Agent這條路徑。
從發展歷史來看,Multi-Agent概念雛形最早可以追溯至20世紀80年代,分散式人工智慧理念興起。2017年以後,隨著大型語言模型成熟,AI Agent應用開始從理論走向實際,例如AutoGPT 的出現標誌著AI Agent的雛形誕生。
2024年,微軟、谷歌、蘋果、OpenAI等廠商紛紛佈局AI Agent市場。2025年1月,OpenAI釋出首款AI Agent產品Operator,能夠執行復雜操作,如編寫程式碼、預訂旅行等,但目前僅提供給購買每月200美元 ChatGPT Pro 服務方案的消費者。直到國內AI廠商Monica透過Manus,讓普通群眾第一次意識到Multi-Agent概念,MetaGPT的開源產品進一步揭開其神秘面紗。
AIGCLINK發起人、行行AI合夥人佔冰強對記者表示,Manus此類產品型別,之前MetaGPT團隊已經實現過,也算是國內首批投入智慧體研發的團隊之一。
MetaGPT NLP/Agent方向研究員洪思睿在交流中表示,目前的行業發展狀態中,透過大模型或Agent去做工具的使用,已經不再新奇。隨著大家對具體產品與技術的關注越來越多,行業的技術難點在於:當很多相似的工具可解決同樣的問題,如何讓Agent把決策做得更好。另外,如果使用過程中接入的不是比較標準的工具介面,工具引數也可能出錯,進而導致工具的執行效果不理想。
這樣的背景下,透過動態路由技術最佳化工具選擇與使用,透過知識增強與幻覺抑制提升決策可靠性,採用ReAct、Chain-of-Thought(CoT)或 Tree-of-Thoughts(ToT)等推理框架幫助 Agent 更清晰地展示決策過程,成為可選擇的解決措施。
MCP協議(Model Context Protocol,模型上下文協議)目前成為了業內的主流選項。所謂MCP,是由Anthropic於2024年11月底推出的一種開放標準協議,旨在統一大型語言模型(LLM)與外部資料來源和工具之間的通訊。它透過標準化介面,使LLM能夠安全、高效地訪問外部資源,從而擴充套件其功能。
佔冰強對記者表示,MCP本身完全可相容,主要看技術廠商是否願意支援。目前海外主流廠商已逐步接入,尤其是在AI工具和開發平臺領域,相信國內廠商也會陸續跟進。
微信編輯 | 生產隊的驢(智慧人工版)
推薦閱讀
個稅起徵點可適度提高,但不宜過高!

