這個中國AI產品一夜刷屏!全網都在要邀請碼,可能是DeepSeek後最大驚喜

幾乎在昨晚蘋果釋出新品的同時,整個科技圈卻被一個名為 Manus 的產品刷屏了。
這是全球首款真正意義上的通用 AI Agent,從官網展示的案例可以看到,它能夠獨立思考、規劃並執行復雜任務,直接交付完整成果。
比起  Claude 的 Computer use 等同樣能操作多工,或者能幫你點外賣訂酒店的 Agent, Manus 可以覆蓋更多領域和達成更高的執行質量。
Manus 在權威的 GAIA 基準測試中創下新紀錄, 效能遠超 OpenAI 的同類產品。
而 Manus 這個名字來自拉丁語,Mens et Manus,就是 mind and hand,即手腦並用。這也是麻省理工學院的校訓,以此鼓勵學生將創意落地為實際成果。
創始人肖弘在 Manus 釋出的前幾個小時,在即刻平臺上發文「高潮來臨」,並分享了莎士比亞的一段書摘:
很難現在就判定 Manus 的誕生就是 AGI 的里程碑,但它很有可能將讓 Agent (智慧體)時代真的進入「高潮時刻」。

Manus 體驗申請連結 👇:

https://manus.im/invitation

篩簡歷、選房炒股,Manus 真會「幹活」?
官方宣稱,Manus 不僅僅是一個只會聊天的對話式 AI 工具,而是一個真正的自主智慧體(Agent)。
當其他 AI 可能只停留在生成想法的階段,而 Manus 能夠獨立思考並採取行動。官方將其視為人機協作的新正規化,甚至可能是通向 AGI 的一個視窗。
與 Manus 同步出圈的還有一段長達四分鐘的演示 demo。在這些案例中,Manus 完全自主地完成從規劃到執行的全流程,展示了真正的 Agent 能力,而非簡單的助手功能。
比方說,首先從一個常見的人力資源任務——篩選簡歷開始。
演示一開始就放了個大招,官方向 Manus 傳送了一個包含 10 份簡歷的壓縮檔案,Manus 能像專業招聘人員一樣高效工作。
它會先解壓檔案,然後逐頁瀏覽每份簡歷,並記錄重要資訊。Manus 還能非同步處理檔案,這意味著你可以隨時關閉電腦,等任務完成後,它會通知你。

當然,在這個過程中,你也可以隨時給它新的指令。
接著,繼續向 Manus 上傳 5 份簡歷。在認真閱讀了所有 15 份簡歷後,Manus 給出了排名建議,並提供了候選人資料和評估標準作為參考。
這還沒完,我們還可以讓 Manus 生成電子表格。
由於 Manus 具有知識和記憶能力,所以下次執行類似任務時,它會直接以電子表格的形式交付結果。
另一個演示案例中,結合家庭收入情況和孩子的上學要求,讓 Manus 在紐約篩選一個安全、犯罪率低的社群,併購買符合標準的房產。
面對這類複雜任務,Manus 同樣是有條不紊地將其拆解為多個步驟,並建立詳細的待辦清單。
搜尋並閱讀關於紐約最安全社群的文章。
研究紐約的中學情況。
編寫 Python 程式來計算預算。
基於預算,在房地產網站上篩選合適的房源。
整合所有資訊,撰寫詳細報告並整理相關資料
轉場到第三個案例,Manus 搖身一變成了專業的股票分析師。
讓其分析英偉達、邁威爾科技,以及臺積電在過去 3 年的股票價格之間的相關性,Manus 可以透過 API 訪問權威資料來源。在驗證資料後,它開始編寫用於資料分析和視覺化的程式碼。
在完成資料分析和視覺化後,Manus 也能基於這些資料建立一個網站。經使用者的授權後,還能將網站部署至線上,並提供了一個可供分享的連結。
X 網友 @DavidAIinchina 體驗 Manus 過後,給出了極高的評價——「令人難以置信的用例」。
官方表示,以上展示的內容僅僅是 Manus 能力的冰山一角。
官網(https://manus.im/usecases)還分享了 Manus 更多處理現實世界任務的案例。從個性化旅行規劃、深度股票分析、保險政策比較、供應商採購、財務報告分析到專業資料整理等,Manus 都能應付自如。
儘管 Manus 尚未全面開放,但其熱度已席捲全網。各大平臺上,網友們紛紛深夜湧入評論區詢問邀請碼,其火爆程度可見一斑。
而在用於評估通用 AI 助手在解決現實世界問題方面的能力的 GAIA 基準測試中,Manus 在所有三個難度級別上都達到了 SOTA 水平。
為了確保結果的可重複性,Manus 使用與其正式版本完全一致的配置進行評測。
除了基準測試,Manus 還在 Upwork 和 Fiverr 等平臺上解決真實世界的問題,並在 Kaggle 競賽中證明了自己的實力。
而這一切都離不開優秀的開源社群,因此官方也希望能回饋社群。
Manus 採用多重簽名(multisig)系統,由多個獨立模型驅動。今年晚些時候,官方將計劃開源其中的一些模型,特別是 Manus 的推理(postering)部分。
中國團隊、多款爆品、百萬使用者
那麼這款震撼業界的產品背後是誰?
據悉,Manus AI 背後的創始人肖弘是華中科技大學軟體工程專業 2015 屆校友。
畢業後,他連續創業,2015 年創立夜鶯科技,推出「壹伴助手」和「微伴助手」,服務超 200 萬 B 端使用者,獲騰訊、真格基金等投資。
縈繞在肖弘身上的還有一個更鮮明的 AI 產品——Monica。
這是一款號稱 All-in-One 的 AI 助手,最初以瀏覽器外掛的形式推出。
透過整合主流大模型(如 Claude 3.5、DeepSeek 等),Monica 提供聊天、翻譯、文案處理等功能,使用者可透過自然語言建立定製化工具,並共享至工具廣場。
Monica 同樣是早期以海外市場為主,使用者規模破百萬,成為 AI 外掛領域頭部產品。
今年 2 月份,Monica 的中文版(monica.cn)已開啟內測,目前免費向國內使用者開放。該版本基於DeepSeek R1 和 V3 模型打造,具備深度推理思考能力,並支援記憶功能和即時聯網搜尋。
Manus 的技術哲學:less structure more intelligence
Manus 奉行的技術理念與主流也有些不同,是 「less structure more intelligence.」(更少的結構,更多的智慧)
他們認為,當資料足夠優質、模型足夠強大、架構足夠靈活、工程足夠紮實時,computer use、deep research、coding agent 等能力會自然湧現,無需被設計為特定的產品功能。
作為大力出奇跡的代表之一,GPT-4-Turbo 在 GAIA 公開排行榜上的平均成績不到 7%,即使是使用複雜多智慧體系統的解決方案也僅達到 40%。Manus 的表現可以說是「遙遙領先」。
創始人肖弘在最近在和張小珺的訪談中,他也提前談到了當時還未釋出的 Agent 產品 Manus 。
「看上去它確實應該就是一個 chatbot,這是很符合大家想象的,同時在應用側卻很複雜,和 Monica 不一樣,光用好不同模型就挺複雜。」
肖弘還將目前 AI 應用分為兩類:一是填補主要應用產品的空檔的不足,二是為特定場景提供獨特解決方案的應用。
比如 Perplexity (提供聯網搜尋功能) 和 Monica (瀏覽器外掛形態) 都屬於此類,它們填補了現有產品留下的空白。
而模型驅動的新場景這類應用,主要出現在圖片和影片領域,直接由模型技術的進步驅動。像 Pika 和 Runway 等產品利用模型能力創造了新的應用場景。
有使用者調侃 Manus 是「極致的套殼就是牛逼」,實際上肖弘並不忌諱讓使用者知道自己的產品用的是別人的模型。早在去年,他就把 Monica 比作消費電子產品,並把 ChatGPT 的 Logo 打在官網。
人機互動新時代已來,但別急著把 Manus 捧上 AGI 神壇
APPSO 在 2024 年年初曾作出一個預測:大模型將成為智慧手機新的作業系統,自然使用者介面(Natural user interface, NUI )將逐步替代現有的圖形使用者介面(GUI)。
而實現這種新互動的重要入口,就是 Agent 。
去年我們在很多手機的釋出會上都看到類似的案例。vivo 釋出會展示可以 AI 訂餐的 「Phone GPT」,華為鴻蒙的小藝和意圖框架,還是榮耀的 YOYO 智慧體,以及智譜的 AutoGLM,核心都是一樣的:
讓 AI 模仿人類的 Plan-Do-Check-Act(計劃-執行-檢查-行動)迴圈 ,從而像人類那樣去操作裝置。
智譜 AI CEO 張鵬之前提到,目前的 Agent 能力更像是在使用者和應用之間,增加一個智慧的排程層,連結所有應用甚至是所有裝置。
這可以看做是大模型通用作業系統 LLM-OS的一種雛形,將對人機互動形式產生極大的影響。OpenAI 創始成員、AI 技術大牛 Andrej Karpathy 也曾多次談到大語言模型作業系統(LLM OS)。
他認為大模型某種程度來說就是一種新的計算機和作業系統,它可以連線各種軟體和硬體,以及所有模態資訊組成的外設,並透過函式呼叫執行各種任務。
傳統作業系統中,你需要圍繞 CPU 構建一堆外設,比如滑鼠和鍵盤、磁碟儲存、以及快取空間等。而在 LLM OS 中,大模型本身就是中央處理器。
I/O 外設也不再是滑鼠和鍵盤,因為 LLM 可以相容更多模態的資料輸入和輸出。同時大模型呼叫的外部工具也將從傳統軟體升級為智慧體工具。
其中跨應用的操作是非常關鍵的一環,這意味著 Agent 能實現更加複雜的自主連貫操作,也可能走向真正的商業化落地。至於各家網際網路公司提供的服務能否打通,可能是未來實現這種互動最大的障礙。
不過現在很多 AI 助手實現代操作的方式,實際上是呼叫手機的無障礙功能 (accessibility features) 的許可權,來控制螢幕點選。
Manus 的出現,意味著 Agent 模式下的 AI 能夠理解需求後獨立工作,直到任務完成。這無疑是人機互動領域的一大步,它讓我們看到了 AI 從工具向夥伴轉變的潛力。
但要說我們已經一隻腳邁入了 AGI 大門,也還為時尚早。肖弘自己也提到,早期的 Agent 更像是「功能機」,需要不斷迭代和完善。目前的 Agent 仍需依賴於模型能力的提升,以及更完善的虛擬環境支援,才能真正勝任各種長尾任務。
如果類比智慧駕駛,大概也相當於從 L2 級升級到 L3 級的輔助駕駛。雖然 Manus 在 GAIA 基準測試中表現出色,但這並不意味著它已具備通用人工智慧的全部特徵。通往 AGI 的道路依然漫長,需要解決模型能力、自主學習、任務泛化等多重挑戰。
但因為有了 Manus 在自主性與通用性上的突破,通往 AGI 的大航海中,又多了一顆照亮我們的星。

我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)
更多崗位資訊請點選這裡🔗

相關文章