
作者 | 華衛
昨天,一款由中國團隊釋出的 Agent 產品 Manus 在 AI 圈迅速走紅,並登上熱搜,許多人稱其為真“打工人救星”。一段長達 4 分 17 秒的演示 demo 裡,官方介紹,與傳統 AI 助手不同,這款產品是一個真正自主的 AI Agent,不僅能提供各行業領域的建議或答案,還能直接交付完整的任務成果,寫週報、做 PPT、簡歷篩選、甚至炒股票都不在話下。
在 Manus 官網,還能看到其一口氣放出的 60 多個場景案例。此外,在 GAIA 基準測試(專門評估通用 AI 助手解決真實世界問題能力的權威測試)中,Manus 在所有三個難度級別上都取得新的最先進 (SOTA) 表現,成績超越了 OpenAI 的 Deep Search。
爆火後,Manus 官網頁面一度崩潰。由於 Manus 目前還沒有公開上線,但對外開放了免費申請體驗連結,AI 圈裡掀起一波“全網求邀請碼”的風潮。就邀請碼一事,Manus 官方回應稱,“伺服器資源完全是按照行業裡發一個 demo 的水平來準備的,根本不成想到會引起如此大的波瀾。目前採取邀請碼機制,是因為此刻伺服器容量確實有限,不得已而為之,團隊也熬夜搞了一整天了。”
國內某二手物品出售平臺上,Manus 的邀請碼標價最高至數十萬級別。據瞭解,Manus 的邀請碼不會繫結到單個賬號,拿到邀請碼後所生成的專案也不會與邀請碼繫結,但設定了每日使用上限。也就是說,在使用上限內,一個邀請碼可以被多人同時使用、異地使用、輪流使用。

3 月 6 日下午,Manus AI 合夥人張濤在社交平臺澄清道,他們從未開設任何付費獲取邀請碼的渠道,也從未投入任何市場推廣預算。內測期間系統容量有限,將優先保障現有使用者的核心體驗,並逐步有序釋放邀請碼。
值得注意的是,與此前 DeepSeek 先在海外“出圈”的狀況不同,目前在海外各社交平臺上,還較少看到 AI 行業從業者們對 Manus 發表的公開評價。面壁智慧聯合創始人、首席科學家、清華大學計算機系副教授劉知遠昨日在清華大學的大模型公開課上表示,DeepSeek 的熱度當時是醞釀了一週才擴散開,而他不太理解為什麼 Manus 會如此迅速地爆火,表示“讓子彈飛一會再看”。
對於 Manus 迅速攀升的熱度,數勢科技 AI 負責人李飛向 InfoQ 表示,這背後主要由兩層市場趨勢推動。
首先,Deepseek 在國內大模型市場“燒”起來的火,讓大家對於國內去做大模型及其應用更有信心了,目光也會關注到其衍生品上。所以在 Deepseek 之後的這一波,只要是和大模型相關的應用、做得還不錯的,其實都會能夠獲得大量的關注。
其次,“天下苦 AI 應用久矣”,從去年開始到今年,大家一直在關注和期待大模型的應用前景。AI Agent 將迎來大規模爆發,在落地場景方面將重點會在資料分析、智慧客服等企業辦公、業務領域。
而近期,熱門的 Agent 產品不止 Manus 這一個。前不久,號稱能頂一整個開發團隊的多智慧體開發平臺 MGX (MetaGPT X),也在程式設計師圈子裡小火了一把。就在剛剛,該團隊又在 GitHub 上釋出了一個開源版的 Manus,名為 OpenManus,支援網頁瀏覽、檔案操作、寫程式碼等任務。據稱,這一專案是幾個 00 後工程師在三個小時內手搓完成的。緊隨其後,CAMEL-AI 今天一早也釋出了一個用於多智慧體協作的開源框架 OWL。
OpenAI 昨日也宣佈了一項關於 Agent 的通知,表示將對達到博士水平的 AI Agent 每月收費 2 萬美元(約合 14.5 萬元人民幣),主要面向企業使用者的高階需求,尤其是在金融、醫療、製造等資料密集型行業。
似乎現在幾乎所有 AI 賽道的公司都在“盯著”Agent,那麼這些智慧體產品的效果和應用真有那麼“神”嗎?
與此前爆火的 ChatGPT 或 DeepSeek 不同,Manus 目前並未對外披露技術細節。據 Manus 團隊的 Hyan 在 Superlinear Academy 社群平臺上發帖介紹,Manus 是全球第一款通用 Agent 產品,可以解決各類複雜多變的任務。其奉行這樣的技術理念:“我們堅信並踐行 less structure more intelligence 的哲學:當你的資料足夠優質、模型足夠強大、架構足夠靈活、工程足夠紮實,那麼 computer use、deep research、coding agent 等概念就從產品特性變為了自然湧現的能力。”
從公開資訊已知的是,Manus 採用多智慧體(Multiple Agent)架構,執行方式與此前 Anthropic 釋出的 Computer Use 類似,完全執行在獨立虛擬機器中,同時可以在虛擬環境中呼叫各類工具。在這個架構中,每個智慧體基於獨立的語言模型或強化學習模型,但 Manus 本身並未自研大模型。
李飛對 InfoQ 表示,Manus 跟 OpenAI 的 Operator 有異曲同工之處,但是它可以在虛擬環境裡執行程式碼。換言之,Manus 的任務覆蓋範圍更多了,不僅可以在瀏覽器裡執行任務,也可以去到雲端虛擬機器裡去執行任務。
在技術層面上,李飛指出,目前從演示影片來看,儘管 Manus 覆蓋的領域較廣,可操作空間大了,任務的泛化性自然也較高,但整體的架構和理念並不算新。雖然工程實現難度是有的,但可能不是特別大。Agent 本身是一個工程化架構的正規化,Manus 團隊做得更多可能是如何去保證任務之間的連通性,比如任務的連線、串聯和回退等方面,保證系統的容錯性。
邀請碼雖然“難得”,但也有一批業內人士先行體驗了 Manus 的效果,我們也收到了一些使用者反饋。某大廠的 AI 負責人對我們透露,“體驗後感覺並沒有被驚豔到。”
根據網上試用者反饋,Manus 目前能順利執行的任務偏簡單(表現與目前前沿大模型沒有明顯差異),對於稍微複雜的任務就需要耗費較長時間,甚至最後崩潰而無法完成,這也引發了部分人的算力焦慮。而且,由於各平臺的登入制度,Manus 無法完成大家期待的“點外賣”、“訂機票”等任務。
商湯科技高階 AI 產品經理王尚則在試用過 Manus 後給出了比較正向的反饋,對於其技術侷限和可行性,他對 InfoQ 表示,最大的限制除了模型本身的能力邊界外,目前還缺乏一套通用的 Agent 協議或介面,讓 Agent 具備更強的自主實現能力。Manus 依賴於類似虛擬化瀏覽器的環境來執行各類任務,在瀏覽器的環境中模擬人類的操作,使用為人設計的使用者介面。但短期內看不到 Agent 協議出現的可能性,畢竟我們對大模型的能力挖掘程度可能還不到 10%。
至於當前 Manus 是否做到了通用 Agent 的級別,李飛審慎地表示“應該還不能”。具體來說,Agent 底層的工具池越豐富,規劃的能力越豐富,越會往通用去走,就像人一樣懂得越多越容易成為一個通才。Agent 想要達到通用,一定是能夠去完成使用者所提到的所有任務,但是現實事件當中任務又會分為很多種,這裡面有兩個難點:第一是怎麼去根據使用者不同的個性化請求去找到任務執行路徑,第二是 Agent 所具備的工具池是否足夠豐富。
“任務路徑節點越多,複雜度就越高,端到端完成的的成功率就會陡降。”在放出來的場景案例裡,Manus 不管是互動、效能還是準確性都打磨出了不錯的效果,其目前肯定是往通用 Agent 的路線去走的,但做到通用 Agent 的難度是比較大的,因為物理世界的複雜度遠超我們的認知。
總的來看,Manus 在實際應用中或會遇到三方面的核心可行性問題:一是物理世界的高複雜度,二是任務流的連通性,再就是當前缺少通用 Agent 協議或介面。
Manus 團隊也在最新公告中表示:大家目前看到的 Manus 還是一個襁褓中的小嬰兒,像模型幻覺、交付物友好度、執行速度等方面都還有很大的提升空間。
不過,李飛認為 Manus 帶給市場的反應是正向的。他認為,“Manus 的爆火是讓我感到興奮的,因為它讓其實更多的人進一步地去了解什麼是 Agent、 Agent 可以幫助我們做什麼的以及怎麼去做。”同時,李飛指出,目前 Manus 走 To C 是一個比較好的路徑,可以透過 C 端先把市場熱起來,而且 C 端使用者對於工具的寬容度比較高的,但 B 端會更為嚴格,不確定它的能力上限能否滿足企業應用。
但值得注意的是,哪怕作為“通用 Agent”,Manus 在大眾中的使用門檻也是不低的。
據李飛介紹,在使用層面可能出現兩種情況:領域專家不用它,因為當前通用 Agent 還沒有達到能夠解決領域難題的程度;一般使用者不知道該怎麼去用,就像我們在去用搜索的時候,提問是一件很難的一件事情。
對此,李飛提出,當前很多 Agent 還是被動式的,需要使用者以提問形式告訴它怎麼做。但未來 Agent 產品一定會走向主動式,無需使用者提問而是會根據使用者的行為習慣以及歷史消費記錄或出行記錄,主動推薦或者告知使用者怎麼做,這種形態對於使用者更為友好。
相較而言,MGX 則是一個側重於程式設計開發領域的多智慧體產品,與剛剛釋出的開源版 OpenManus 出自同一團隊之手。據稱,其可以模擬人類軟體開發流程,透過多個專業 AI agent 的協作,同時幹團隊領導、產品經理、架構師、工程師和資料分析師等角色的活兒。該團隊是開發了一個多 Agent 系統來處理複雜的問題解決任務,包括問題重現、高效的程式碼生成和驗證以及強大的補丁選擇。這些 Agent 能夠利用高階儲存庫級程式碼理解、搜尋、編輯和除錯功能,處理各種軟體工程子任務。
根據官方介紹,MGX 是以 DeepWisdom 團隊的開源多智慧體程式設計框架 MetaGPT 為基礎,由 GPT-4o 和 Claude 3.5-Sonnet 驅動。利用多 Agent 架構, MetaGPT 在 SWE-Bench Lite 上實現了 46.67% 的解決率。作為多 Agent 框架,MetaGPT 可以為 GPT 分配不同角色,以形成執行復雜任務的協作軟體實體。也就是說,MetaGPT 想提供一支全能團隊,包括 老闆、產品經理、架構師、專案經理、工程師、測試,完整復現一家軟體公司的工作流程和標準操作流程(SOP)。
這比做程式碼補全的 GitHub Copilot 和任務自動化的 Devin 更為全面,因為 MGX 不僅想要獨立完成整個專案的全生命週期管理,還想將“自主創立一家員工 100% 由 AI 組成的公司”變得可能。然而,這一願景面臨極高的技術複雜度,要讓 AI 理解並執行軟體領域複雜的業務邏輯,挑戰不容小覷。
JetBrains 中國 AI 解決方案專家孫濤對 InfoQ 表示,“直白的說,MGX 代替初、中級研發團隊或設計、支援團隊尚不現實,但是對於一個人參與實現和運營的獨立專案或者對於新需求、新概念的驗證,與多智慧體協作的人機互動模式肯定會提升這些場景下的效率。”
此外,孫濤表示,雖然沒有嘗試過在大型專案上使用多智慧體框架,但在簡單專案上堆疊功能,多嘗試幾輪後,能明顯體會到 token 消耗速度飛昇,生成的內容質量不如最初幾輪互動。多智慧體之間相互溝通也容易將錯誤資訊逐步放大,讓最終結果遠遠偏離最初需求;上下文遺忘更是一個很明顯的問題,受限於模型能力,智慧體之間多輪互動後容易出現早期資訊遺忘、消失,影響整體一致性。
在親身體驗 MGX 過後,孫濤還透露道,“我自己感覺還有一個問題,就是生成的專案文件、設計資料缺乏解釋性,往往有很多人類難以理解的內容,更像是‘給機器看的文件’。或許這是 LLM 生成的一個限制。”
總的來說,MGX 現有的產品形態在完成明確定義的小型任務上表現超出預期,但面對大型、複雜、模糊定義或者需求動態變化的任務時,仍有諸多問題。智慧體無法在既定的提示詞內,處理複雜的原子化操作,人類面對複雜業務時的應對和學習能力,目前階段的 LLM 還很難做到。
李飛則指出,“MetaGPT 強調的是協作,但其實又回到那個問題,涵蓋的角色越多,複雜度就會越高。”在他看來, 當前 MetaGPT 有具體企業級應用或者商業化落地其實很難,實際的業務專案開發不僅是程式設計一個專案或遊戲這麼簡單,其實是逐漸在走向業務上層的,智慧體具備業務邏輯的理解挺難的。但他也表示,“這確實是一個應用方向,我們不能因為它當前的落地難度大就否定它。”
另值得一提的是,目前 MGX 在官網展示的案例專案成本幾乎都不超 1 美元。對此孫濤表示,在實際商業化專案開發中不可能做到這樣的低成本。根據他本人的體驗經歷,在多輪操作後,軟體中新增一個細微的需求,如新增一個新列表、修改一些樣式等,多智慧體框架消耗的 token 量會成倍提升。放下 token 用量的問題不談,這些由機器生成的內容,在真正投入生產使用前,也需要人工再次審閱確認。
無論走通用 Agent 路線的 Manus 還是 MGX 等這類領域 Agent,其前提都是依託其他家的大模型作為核心引擎。那如果只是套殼大模型的產物,是否會被其依賴的核心技術“內化”掉?這些 Agent 產品本身還有獨立存在價值嗎?通用 Agent 在 LLM 的演進過程中有多大生存空間?
王尚對此表示,所有開放性的解決方案,最後都有可能被大模型內化,只是一個時間節點的問題。另外,大模型和 Agent 的邊界也在逐漸模糊,Anthropic 據傳也在計劃從模型服務商發展為應用服務商或者方案服務商。隨著大模型不斷內化更多的能力,其對於 Agent 的吞併趨勢也將越發顯著。
“現階段我們應該關注的,是想清楚我們希望 Agent 幫我們解決什麼樣的具體問題,從問題出發,去找答案、找路徑、找空間。”
李飛則指出了一系列大模型內化不掉的 Agent 落地場景:比如資料訪問,大模型可以去連線、收集網際網路的資料,但很難處理企業內部的資料,大模型不可能去適配到每個企業內部資料結構和資料庫;很多工具能力目前來看也是大模型內化不了的,大模型是應用的下限,Agent 才是應用的上限,只有連線足夠多的業務場景才能夠去打造一個可用、好用的產品應用。
他表示,“未來,我們需要考慮的是通用 Agent 的形態問題,即通用 Agent 是一個獨立的產品嗎?使用者需要很多入口嗎、是否會做統一?”對此他認為,未來電腦和現實互動的入口一定會逐漸地收斂和整合,那麼在這種情況下通用 Agent 就不會是一個完全獨立的產品,可能會以 MCP 的整合方式,融入到人機互動當中的某一個節點。
⏰3 月 8 日 20:00|實測「Manus」看看它是不是真如網傳那麼牛👇掃描二維碼,立即預約直播

隨著 Data + AI 時代的到來,資料架構如何演進以支撐即時分析與智慧決策?3 月 10 日晚 20:00 直播,4 位來自阿里、位元組和 StarRocks 的專家,帶你深入解析 Lakehouse 的演進路徑、落地實踐,助力企業釋放資料價值!

今日薦文
