
“ 又一國運級 AI 產品問世 ”“ 中國 AI 科技再一次震撼全世界 ” 。。。

“ 拳打 GPT ,腳踢 DeepSeek” “AI 徹底接管了我的電腦 ” 。。。


就這些恐怖如斯的標題,再加上一堆的爆火、炸裂、驚人。

不是哥們,差評君就睡了個懶覺,難道錯過了什麼世界性 AI 大突破?
麻溜趕到公司一看,各路媒體爭相報道的,原來是國內廠商釋出了一款 Agent :Manus ,這傢伙還自稱全球首款通用型 Agent 。

而且它真在 GAIA 測試裡,吊打了一眾 OpenAI 們。

不過可惜的是,由於目前 Manus 還處於內測階段,系統容量有限,只能透過邀請碼給部分使用者進行體驗。

這也造就了一種,平時只在某些特殊場合下才能看見的整齊隊形。

由於官方給出的邀請碼實在太少,在某魚上,都出現了邀請碼出售生意。
一個 Manus 的邀請碼都標價幾千上萬。。。

甚至在抖音上,有些直播間直接把 “ Manus 測試 ” 當成抖加用了。。。

所以這個讓大家都有些癲狂了的 Manus ,到底是個啥?
差評君今天就從 Manus 官方給的示例帶大家雲評價一下。

至於為什麼不用實測,我怎麼會說是因為差評君第一時間沒搞到邀請碼,好不容易搞定了結果人家伺服器炸了。
所以大家先簡單瞭解一哈子,等後續伺服器恢復了,咱再給大家來詳細評測。

該說不說,就從目前給出的官方演示案例來看, Manus 相當不錯。
因為咱們常用的 GPT 們,基本都只能一個個解決需求,而且大多都還侷限在對話,輸出個程式碼已經是極限了。
而 Manus 則做到了 “ 使用者提需求, AI 全自動、直至完成網頁設計、視覺化資料整理等等複雜流程 ” 得到的結果還能直接輸出,簡單省力。
舉個栗子:
當向 Manus 提問 “ 搜尋 Qwen 系列的歷史,他們看看開源了多少模型,並給我做了一份他們非常漂亮的時間線視覺化方案 ” 後。
Manus 會根據這個簡單的需求,從多個渠道搜尋 Qwen 的開源歷史資訊等資料,收集起來。

然後統一進行時間線視覺化處理,並在這個過程中進行稽核資料、完善時間線。
最終直接給出結果,而且這些結果的輸入檔案,基本都是直接可以下載用的。

而當用戶發現輸出結果有問題時,直接告訴 Manus ,它就會進一步調整修改。

類似的, Manus 還能幫使用者篩選房產,官方的案例就是使用者希望在紐約購買房產,給出的限定條件是希望有安全的社群環境、低犯罪率、以及優質的教育資源和不要超預算等。
Manus 會將該任務分解為一個個代辦事項,然後透過網路搜尋,收集資訊。
最後整合所有資訊,結合使用者需求,寫出一份詳細報告,感覺比樓下的房產小哥專業多了。

是不是已經很牛了?

但你先別高興得太早,也別太擔心下崗的事兒,更別說 Manus 是新一個 DeepSeek 了。
因為 DeepSeek 是做基礎大模型的,可以說整個 AI 發展都得建立在大模型本身能力的地基上;而 Manus 則是套殼產品( 注意這裡說的套殼並不是貶義詞 )。
更準確地說,哪怕是對話式的 GPT 們,也是基於現有的大模型能力做了一個 wrapper ( 包裝 ),來服務於大傢伙。
做個不是很貼切的比方, DeepSeek 是 Android 或者 iOS 這樣的作業系統,那 Manus 就是 App ,兩者就不是一個賽道的,沒啥可比性。

而且,根據今天各大媒體的評測效果來看, Manus 用起來還有幾個問題:

首先,它真的很慢,雖然作為虛擬機器在雲端處理任務,完全可以關在後臺等它任務完成,不影響咱們同時幹其他事。
但它還是太慢了,一個簡單的任務十幾分鍾,複雜一點的幾個小時都可能,萬一需要多次修改,那等待的時間恐怕能讓人徹底瘋狂。

其次, Manus 也太費 token 了。
就這麼說吧,它拆解、解決一次複雜任務需要消耗的 token ,可能是百萬乃至更高的數量,這對於不少人甚至企業來說,都有點遭不住。
差評君和某位有碼大佬的對話

當然了,大模型的通病 AI 幻覺 Manus 也搞不定。
不少內測使用者就發現 Manus 在某些專業場景,例如金融分析時,很難稱得上出色。
例如,它對股票相關性的分析就過於依賴單一資料來源,缺乏交叉驗證機制,導致結論可信度不高。
此外,所謂的 “ 自主規劃 ” 本質上還是套殼,還拿股票分析來說,它其實就是利用大模型理解你的意思,然後呼叫雅虎金融 API 檢索資料,再利用 Python 指令碼生成視覺化圖表。

這些任務執行高度依賴虛擬機器內已經預先設定好的 “ 工具庫 ” 和呼叫邏輯,一旦你的需求在這些之外,它就 GG 了。

最後也是最重要的, “ 全球首款通用型 Agent” 這個說法更是很難喊得響亮,因為它目前並不通用,更不是首款。
因為 Manus 執行在虛擬機器中,沒法實現安裝新軟體或者呼叫本地軟硬體資源等系統級操作。
比如我的需求是把桌面的 3·8 婦女節放假通知檔案,透過微信發給世超,但目前的 Manus 就做不到。

所以它更像是市面上層出不窮的瀏覽器外掛,而非真正意義上的通用 Agent 。
而早在去年 10 月, Claude 大模型的團隊 Anthropic 就已經推出過 “computer use” 。
它和 Manus 本質上都是透過多代理虛擬機器環境完成複雜任務,從而給使用者輸出結果。

隨後,各大 AI 廠商陸續都推出了自家產品,例如谷歌的 Project Astra 、智譜的 AutoGLM 、 OpenAI 的 Operator 等等。
但一碼歸一碼,目前看下來,Manus 還真是目前 Agent 產品裡做得最好的。

而且它的破圈也給讓 Agent 概念成功在國內( 國外目前還真沒啥聲量 )破圈,畢竟這年頭,酒香還怕巷子深呢。
對了,我們還發現了一個有意思的事情, Manus 的開發團隊 Monica.im 的創始人叫肖弘,他此前最成功的創業專案就是壹伴微信公眾號排版工具(我們編輯部之前還用呢 ),一度有百萬使用者量。
等 2022 年大模型浪潮襲來,他又創立了 Monica ,推出了 AI 外掛 Monica ,去年 Monica 使用者超過千萬,一直保持著不錯的盈利,這麼看來 Manus 也算是一種老樹發新芽了。

而 Monica.im 的首席技術官季逸超,早在 2019 年就曾開發過 Magi AI 搜尋引擎。
這傢伙,除了沒用上如今的大模型能力,簡直就是眼下 AI 搜尋引擎的翻版。
是不是有種熟悉的感覺

所以,有這樣的技術團隊,做出一個火爆出圈的 Manus 也挺合理的。
最後差評君想說的是,其實 AI 大模型熱鬧了這麼久,大家也逐漸對對話式的 AI 有了倦怠,都在期待 AI 能夠更進一步地和現實社會發生關聯,比如真正地幫人解決某件事情,而不是簡單地替代搜尋引擎,當個百科小助手。
所以,很多人和團隊紛紛下場,去做各種各樣的 Agent ,希望能夠在應用層面上搞點花活。
而從 Manus 官方給的示例,它無疑是當下各路英雄豪傑中的佼佼者。
希望咱能早點做測試,嘿嘿 @Manus 官方。
撰文:八戒
編輯:江江 & 面線
美編:煥妍
圖片、資料來源:
Manus官網
Anthropic 官網
知乎:如何評價中國團隊釋出的通用型 AI Agent 產品 Manus?會成為下一個爆款嗎?

