
新智元報道
新智元報道
編輯:編輯部 JHNZ
【新智元導讀】離了個大譜,Manus全網邀請碼一票難求?激動人心的是,開源界凌晨來了一場核爆攻擊,用3小時程式碼量開源了平替專案——OpenManus,免費體驗不要邀請碼!同時釋出的還有另一個「Manus同款」OWL,直接幹到GAIA基準測試開源最強!
昨天,所有人都被Manus刷屏了,一個邀請碼已經被炒到了天價。

雖然被Manus強勢刷屏,很多人卻只能眼睜睜地看著,沒法親自上手體驗,只因一碼難求。
最新訊息,就在剛剛,Manus AI的官方X賬號已被平臺凍結。

不過就在此時,開源界以迅雷不及掩耳之勢上演了一波速度與激情——有這樣一個專案,僅憑三小時的程式碼量,就掀翻了AI的高牆。
昨天晚上,GitHub開源了一個無需邀請碼的OpenManus專案,剛剛開源不到一天,Star數就已經破千。

專案地址:https://github.com/mannaandpoem/OpenManus
現在,所有開發者都可以實測了。
其中最亮眼的,莫過於這句「只需修改config.toml即可開玩」,直接對封閉生態公開打臉。
建立環境,克隆專案並CD到目錄,改一下config/config.toml裡的大模型資訊,再輸入一行命令,就可以愉快地在terminal裡體驗了。
conda create -n open_manus python=3.12
conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# Global LLM configuration
[llm]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."# Replace with your actual API key
max_tokens = 4096
temperature = 0.0
# Optional configuration for specific LLM models
[llm.vision]
model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."# Replace with your actual API key
python main.py
開源界3小時復刻Manus,跟邀請碼說再見
來自國內的這支團隊宣佈:晚餐後2小時,OpenManus的核心功能直接開源!
沒有邀請碼,沒有壁壘,這支團隊用3小時的程式碼量,就把邀請碼機制掃進歷史垃圾堆,跟飢餓營銷徹底說拜拜!
OpenMunus的作者均為MetaGPT的核心貢獻者。

OpenManus的實現很簡單,使用到了computer use、基本的智慧體和規劃。
就像在Manus中那樣,任何人都可以使用OpenManus,把自己的想法變為現實。
無論在手機上還是OS上,如果想做Deep Research,只要提交你的問題,它就可以幫你實現了。

比如,我們可以給OpenManus這樣一個任務:「對Karpathy的網站(https://karpathy.ai/)進行全面的SEO稽核,並提供詳細的最佳化報告,包括可執行的改進建議。」
OpenManus會展開思考,將自己的任務分解為如下幾步。
首先,檢查網站並收集基本資訊
然後,分析關鍵的SEO要素
第三,檢查技術性SEO方面的問題
最後,整理最佳化建議
明確任務細節後,OpenManus就開啟Karpthy的網站,開始收集資訊、展開詳細分析。
整個思考過程,每一步都清晰可見。
最終,它生成了一份完整、詳實的Karpathy個人網站最佳化報告。
其中,它提出的高優先順序任務如下:Meta標籤最佳化(如最佳化頁面標題,使其包含相關關鍵詞)、技術設定(如建立並提交XML站點地圖)、內容最佳化(如為所有圖片新增alt文字、在個人網站上實施Schema標記等)。

OpenManus的核心,就是一個革命性的模組化Agent系統,由高度智慧的專業團隊,組成了一個協作網路。
-
Manus主代理:專案經理,能理解使用者需求,協調各個專業團隊的工作。 -
PlanningAgent:戰略專家,將複雜的任務分解為清晰可執行的步驟。 -
ToolCallAgent:技術專家,掌握各種強大工具的使用方法。
由此,開發者可以根據自身需要,自由組合不同的功能模組,創造出自己獨有的AI助手。
OpenManus無縫集成了包括Claude 3.5、Qwen VL Plus在內的多個頂級大模型,開發者能充分利用各個模型的優勢。
為何只用短短3小時,團隊就能打破Manus的高牆壟斷?
原因就在於,OpenManus其實源於MetaGPT的開源積累。
OpenManus的另一強大功能,就是它的即時反饋機制。
LLM思維鏈的過程,會被視覺化地呈現出來。無論是任務執行進度的即時更新、思考過程日誌、檔案的即時通知等,都隨時可見。
此外,OpenManus還配備了一套強大的工具鏈,能處理各種複雜任務。
-
Python程式碼執行器:即時生成和執行程式碼 -
網路搜尋工具:自動獲取和分析網路資訊 -
瀏覽器自動化:模擬人類操作進行網頁互動 -
檔案處理系統:自動生成和管理各類文件
其中,這些工具都不是簡單的獨立模組,而是被精心設計的協同系統,在處理任務時能默契配合,高效完成任務。
實測生成一份關於Manus的報告
問題來了:OpenManus能成為Manus的平替嗎?
OpenManus的開發者HKUST(GZ)博士生Jiayi Zhang上傳了一段實測影片。
影片中他給出了這樣一段提示:
深度調研和Manus這個Agent有關的資訊,自己整理資訊,然後寫一個新聞html頁面介紹它,你寫的html應該儘可能美觀。
接著OpenManus就開始幹活了。它將這個任務分步進行,首先使用GoogleSearch搜尋Manus Agent的相關資訊。
在這個過程中還不斷打出思考過程:「好的,讓我們繼續深入調研Manus,我會逐步訪問搜尋到的重要連結,收集資訊,然後建立一個精美的HTML網頁。」
它開始不斷呼叫工具「browser_use」,訪問不同的文章來蒐集資訊。

整理完資訊,OpenManus再次輸出:「現在讓我們使用正確的完整路徑來開啟HTML檔案:」渲染完後,它就給出了網頁的連結。
開啟後可以看到完整的報告。然而,OpenManus的能力還不止於此,在影片中,它被人要求繼續完善這個頁面,新增更多具體的技術細節和實際應用案例。
接著它就又開始呼叫起「google_search」以及「browser_use」這些工具,很快就重新給出了一個新的頁面網址。
可以看出,OpenManus給出的這份關於Manus的報告,包括了Manus的誕生與發展、技術架構與創新以及實際應用案例與未來展望等。
雖然這份報告的結構看上去比較完整,但是細節還是有點乏善可陳。

Browser-use:讓智慧體直接操作瀏覽器
在OpenManus專案中,很重要的一項功能就是Browser-use。
Browser-use是一種使AI智慧體能夠操作瀏覽器的簡單方式。它在GitHub上開源,許多專案都使用了它的功能,目前已經獲得有超過35.8k個星星了。

專案地址:https://github.com/browser-use/browser-use
它透過提取網站的互動元素(如按鈕、表單等),使AI能夠自動化執行瀏覽器操作,例如填寫表單、搜尋資訊或導航網頁。這對於開發AI驅動的網路代理非常有用。
比如,它可以將商品新增到你的購物車,並完成結賬。

甚至是閱讀你的簡歷,然後幫你找工作!中途如果有需要,還會遵從你的指示。

作者團隊
OpenManus的一作梁新兵,華東師範碩士。此前就憑MetaGPT受到大量關注。
MetaGPT是一款開源的AI智慧體框架,將多個AI模型整合在一起,模仿現實世界公司的運作,在模擬軟體開發流程方面表現出色。
當時一經開源,MetaGPT就火爆全網,如今在GitHub上已經收穫了49.1k stars。
向勁宇,研究方向為LLM智慧體,強化學習和NLP,曾獲得阿里巴巴數學競賽AI賽道全球第二名。此前,他在西南交通大學獲得學士學位。

於兆洋,研究方向是LLM智慧體及其推理,此前在中國人民大學高瓴人工智慧學院獲得學士學位。
張佳釔,香港科技大學(廣州) 的博士生。研究興趣是LLM智慧體,尤其關注其推理能力以及適應多種環境的智慧體構建正規化。此前,他在中國人民大學資訊學院獲得學士學位。
洪思睿

洪思睿,研究興趣是LLM、NLP和多智慧體系統。此前在暨南大學獲得學士學位,在香港科技大學獲得碩士學位。
One More Thing:0天覆刻Manus,OWL完全開源
不僅如此,另一個來自CAMEL AI團隊的0天覆刻Manus通用智慧體,也被開源了。
這個名為OWL的專案,直接幹到開源界GAIA的效能天花板,達到57.7%,超越Hugging Face提出的Open Deep Research 55.15%的表現。

專案地址:https://github.com/camel-ai/owl
簡單來說,OWL是一個頂尖的多智慧體協作框架,致力於突破任務自動化的界限。
在GAIA基準測試中,OWL取得了58.18的平均分,並在開源框架中排名第一。
在這個任務中,OWL智慧體非常絲滑地完成了任務:調研總結GitHub倉庫裡都有什麼。

另外,它還能自動幫我們查詢今天在倫敦有什麼電影。

在這個過程中,CAMEL AI對Manus的技術路線做了一波逆向工程,啟動了深度復刻計劃。
首先,是把Manus的核心工作流拆成6步。
-
啟動一個Ubuntu容器(Agent遠端工位就位)
-
知識召回(把之前學過的內容撿起來用)
-
連線資料來源(資料庫、網盤、雲端儲存全覆蓋)
-
把資料掛載到Ubuntu(Agent的搬磚時刻)
-
自動生成todo.md(規劃任務+寫待辦清單)
-
Ubuntu工具鏈+外接工具組合拳,執行全流程任務
然後,所有Manus裡智慧體用到的操作,團隊都會給OWL配齊。
啟動一個Ubuntu容器,OWL就能隨時隨地遠端辦公了。
在專案描述中, 團隊表達了對AI智慧體的願景:
我們的願景是徹底改變AI智慧體協作解決現實世界任務的方式。
透過利用動態的智慧體互動,OWL能夠在多個領域中實現更自然、高效和穩健的任務自動化。
相信我們還將不斷見證各類復現專案,打破「邀請碼」的壟斷。
參考資料:
https://github.com/mannaandpoem/OpenManus
https://x.com/didiforx/status/1897675038972883408
https://github.com/camel-ai/owl
https://mp.weixin.qq.com/s/0AWaSNynyjjY5TpdtKN-3w

