邀請碼炒到10萬?OpenManus深夜開源打臉!ManusX賬號遭凍結,平替光速上線


新智元報道  

編輯:編輯部 JHNZ
【新智元導讀】離了個大譜,Manus全網邀請碼一票難求?激動人心的是,開源界凌晨來了一場核爆攻擊,用3小時程式碼量開源了平替專案——OpenManus,免費體驗不要邀請碼!同時釋出的還有另一個「Manus同款」OWL,直接幹到GAIA基準測試開源最強!
昨天,所有人都被Manus刷屏了,一個邀請碼已經被炒到了天價。
雖然被Manus強勢刷屏,很多人卻只能眼睜睜地看著,沒法親自上手體驗,只因一碼難求。
最新訊息,就在剛剛,Manus AI的官方X賬號已被平臺凍結。
不過就在此時,開源界以迅雷不及掩耳之勢上演了一波速度與激情——有這樣一個專案,僅憑三小時的程式碼量,就掀翻了AI的高牆。
昨天晚上,GitHub開源了一個無需邀請碼的OpenManus專案,剛剛開源不到一天,Star數就已經破千。
專案地址:https://github.com/mannaandpoem/OpenManus
現在,所有開發者都可以實測了。
其中最亮眼的,莫過於這句「只需修改config.toml即可開玩」,直接對封閉生態公開打臉。
建立環境,克隆專案並CD到目錄,改一下config/config.toml裡的大模型資訊,再輸入一行命令,就可以愉快地在terminal裡體驗了。
conda create -n open_manus python=3.12conda activate open_manusgit clone https://github.com/mannaandpoem/OpenManus.gitcd OpenManuspip install -r requirements.txtcp config/config.example.toml config/config.toml# Global LLM configuration[llm]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."# Replace with your actual API keymax_tokens = 4096temperature = 0.0# Optional configuration for specific LLM models[llm.vision]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."# Replace with your actual API keypython main.py
開源界3小時復刻Manus,跟邀請碼說再見
來自國內的這支團隊宣佈:晚餐後2小時,OpenManus的核心功能直接開源!
沒有邀請碼,沒有壁壘,這支團隊用3小時的程式碼量,就把邀請碼機制掃進歷史垃圾堆,跟飢餓營銷徹底說拜拜!
OpenMunus的作者均為MetaGPT的核心貢獻者。
OpenManus的實現很簡單,使用到了computer use、基本的智慧體和規劃。
就像在Manus中那樣,任何人都可以使用OpenManus,把自己的想法變為現實。
無論在手機上還是OS上,如果想做Deep Research,只要提交你的問題,它就可以幫你實現了。
比如,我們可以給OpenManus這樣一個任務:「對Karpathy的網站(https://karpathy.ai/)進行全面的SEO稽核,並提供詳細的最佳化報告,包括可執行的改進建議。」
OpenManus會展開思考,將自己的任務分解為如下幾步。

首先,檢查網站並收集基本資訊

然後,分析關鍵的SEO要素

第三,檢查技術性SEO方面的問題

最後,整理最佳化建議

明確任務細節後,OpenManus就開啟Karpthy的網站,開始收集資訊、展開詳細分析。
整個思考過程,每一步都清晰可見。
最終,它生成了一份完整、詳實的Karpathy個人網站最佳化報告。
其中,它提出的高優先順序任務如下:Meta標籤最佳化(如最佳化頁面標題,使其包含相關關鍵詞)、技術設定(如建立並提交XML站點地圖)、內容最佳化(如為所有圖片新增alt文字、在個人網站上實施Schema標記等)。
OpenManus的核心,就是一個革命性的模組化Agent系統,由高度智慧的專業團隊,組成了一個協作網路。
  • Manus主代理:專案經理,能理解使用者需求,協調各個專業團隊的工作。
  • PlanningAgent:戰略專家,將複雜的任務分解為清晰可執行的步驟。
  • ToolCallAgent:技術專家,掌握各種強大工具的使用方法。
由此,開發者可以根據自身需要,自由組合不同的功能模組,創造出自己獨有的AI助手。
OpenManus無縫集成了包括Claude 3.5、Qwen VL Plus在內的多個頂級大模型,開發者能充分利用各個模型的優勢。
為何只用短短3小時,團隊就能打破Manus的高牆壟斷?
原因就在於,OpenManus其實源於MetaGPT的開源積累。
我們只是把瀏覽器工具鏈嫁接到過去程式碼上,配合沉澱的Agent工具包,核心系統1小時就完成了。
OpenManus的另一強大功能,就是它的即時反饋機制。
LLM思維鏈的過程,會被視覺化地呈現出來。無論是任務執行進度的即時更新、思考過程日誌、檔案的即時通知等,都隨時可見。
此外,OpenManus還配備了一套強大的工具鏈,能處理各種複雜任務。
  • Python程式碼執行器:即時生成和執行程式碼
  • 網路搜尋工具:自動獲取和分析網路資訊
  • 瀏覽器自動化:模擬人類操作進行網頁互動
  • 檔案處理系統:自動生成和管理各類文件
其中,這些工具都不是簡單的獨立模組,而是被精心設計的協同系統,在處理任務時能默契配合,高效完成任務。
實測生成一份關於Manus的報告
問題來了:OpenManus能成為Manus的平替嗎?
OpenManus的開發者HKUST(GZ)博士生Jiayi Zhang上傳了一段實測影片。
影片中他給出了這樣一段提示:
深度調研和Manus這個Agent有關的資訊,自己整理資訊,然後寫一個新聞html頁面介紹它,你寫的html應該儘可能美觀。
接著OpenManus就開始幹活了。它將這個任務分步進行,首先使用GoogleSearch搜尋Manus Agent的相關資訊。
在這個過程中還不斷打出思考過程:「好的,讓我們繼續深入調研Manus,我會逐步訪問搜尋到的重要連結,收集資訊,然後建立一個精美的HTML網頁。」
它開始不斷呼叫工具「browser_use」,訪問不同的文章來蒐集資訊。
整理完資訊,OpenManus再次輸出:「現在讓我們使用正確的完整路徑來開啟HTML檔案:」渲染完後,它就給出了網頁的連結。
開啟後可以看到完整的報告。然而,OpenManus的能力還不止於此,在影片中,它被人要求繼續完善這個頁面,新增更多具體的技術細節和實際應用案例。
接著它就又開始呼叫起「google_search」以及「browser_use」這些工具,很快就重新給出了一個新的頁面網址。
可以看出,OpenManus給出的這份關於Manus的報告,包括了Manus的誕生與發展、技術架構與創新以及實際應用案例與未來展望等。
雖然這份報告的結構看上去比較完整,但是細節還是有點乏善可陳。

Browser-use:讓智慧體直接操作瀏覽器

在OpenManus專案中,很重要的一項功能就是Browser-use。
Browser-use是一種使AI智慧體能夠操作瀏覽器的簡單方式。它在GitHub上開源,許多專案都使用了它的功能,目前已經獲得有超過35.8k個星星了。
專案地址:https://github.com/browser-use/browser-use
它透過提取網站的互動元素(如按鈕、表單等),使AI能夠自動化執行瀏覽器操作,例如填寫表單、搜尋資訊或導航網頁。這對於開發AI驅動的網路代理非常有用。
比如,它可以將商品新增到你的購物車,並完成結賬。
甚至是閱讀你的簡歷,然後幫你找工作!中途如果有需要,還會遵從你的指示。
作者團隊
OpenManus的一作梁新兵,華東師範碩士。此前就憑MetaGPT受到大量關注。
MetaGPT是一款開源的AI智慧體框架,將多個AI模型整合在一起,模仿現實世界公司的運作,在模擬軟體開發流程方面表現出色。
當時一經開源,MetaGPT就火爆全網,如今在GitHub上已經收穫了49.1k stars。
向勁宇,研究方向為LLM智慧體,強化學習和NLP,曾獲得阿里巴巴數學競賽AI賽道全球第二名。此前,他在西南交通大學獲得學士學位。
於兆洋,研究方向是LLM智慧體及其推理,此前在中國人民大學高瓴人工智慧學院獲得學士學位。
張佳釔,香港科技大學(廣州) 的博士生。研究興趣是LLM智慧體,尤其關注其推理能力以及適應多種環境的智慧體構建正規化。此前,他在中國人民大學資訊學院獲得學士學位。
洪思睿
洪思睿,研究興趣是LLM、NLP和多智慧體系統。此前在暨南大學獲得學士學位,在香港科技大學獲得碩士學位。
One More Thing:0天覆刻Manus,OWL完全開源
不僅如此,另一個來自CAMEL AI團隊的0天覆刻Manus通用智慧體,也被開源了。
這個名為OWL的專案,直接幹到開源界GAIA的效能天花板,達到57.7%,超越Hugging Face提出的Open Deep Research 55.15%的表現。
專案地址:https://github.com/camel-ai/owl
簡單來說,OWL是一個頂尖的多智慧體協作框架,致力於突破任務自動化的界限。
在GAIA基準測試中,OWL取得了58.18的平均分,並在開源框架中排名第一。
在這個任務中,OWL智慧體非常絲滑地完成了任務:調研總結GitHub倉庫裡都有什麼。
另外,它還能自動幫我們查詢今天在倫敦有什麼電影。
在這個過程中,CAMEL AI對Manus的技術路線做了一波逆向工程,啟動了深度復刻計劃。
首先,是把Manus的核心工作流拆成6步。
  1. 啟動一個Ubuntu容器(Agent遠端工位就位)
  2. 知識召回(把之前學過的內容撿起來用)
  3. 連線資料來源(資料庫、網盤、雲端儲存全覆蓋)
  4. 把資料掛載到Ubuntu(Agent的搬磚時刻)
  5. 自動生成todo.md(規劃任務+寫待辦清單)
  6. Ubuntu工具鏈+外接工具組合拳,執行全流程任務
然後,所有Manus裡智慧體用到的操作,團隊都會給OWL配齊。
啟動一個Ubuntu容器,OWL就能隨時隨地遠端辦公了。
在專案描述中, 團隊表達了對AI智慧體的願景:

我們的願景是徹底改變AI智慧體協作解決現實世界任務的方式。
透過利用動態的智慧體互動,OWL能夠在多個領域中實現更自然、高效和穩健的任務自動化。

相信我們還將不斷見證各類復現專案,打破「邀請碼」的壟斷。
參考資料:
https://github.com/mannaandpoem/OpenManus
https://x.com/didiforx/status/1897675038972883408
https://github.com/camel-ai/owl
https://mp.weixin.qq.com/s/0AWaSNynyjjY5TpdtKN-3w

相關文章