實測Manus:我用它生成了10個邀請碼……

好玩
但不夠好用
今天凌晨剛剛釋出的 Manus 有多震撼人心,已不需要贅述了:較高程度的獨立思考能力,強大的複雜任務解決能力,以及可靠的交付效果。
和純粹的對話式 AI 產品相比,Manus 話少,不止於思考,還能幹活;和傳統虛擬助手相比,Manus 的分解、規劃和解決問題能力(透過 computer use 和程式設計能力體現)更高。
目前具體細節還很有限,但我們透過公開資料瞭解和猜測,Manus 的背後有不同 agent 各自處理單項任務,agent 的任務進度同步和轉移透過 API 執行。
作為產品的 Manus,是一個多模型、多獨立 Agent 的縫合體——而團隊也透過「套殼」的自黑表述承認了這一點。但這並不能消解 Manus 作為一個成型的,遠高於最小可行水平的產品的意義。
Manus 讓人機互動的正規化,升級為人機協作,比其它同類選手更接近真正意義上的通用 AI Agent。
Manus 目前一「碼」難求,在閒魚的開價一度達到 5 萬元。
APPSO 也用 Manus 進行了實測,但由於任務用時較長,後面又遭遇網站登陸困難的情況,所以只完成了幾個簡單的任務,其它任務恰逢 Manus 系統超負載,沒能進行下去。
與此同時,Manus 專案方也發出了一份官方回應,表示準備伺服器資源不足,導致使用者體驗較差。
APPSO 無疾而終的測試
先來看我們在有限的時間內做的兩個測試。
和很多人一樣,我們經常會對日新月異的 AI 技術和五花八門的 AI 工具感到困惑。於是我向 Manus 提出了這個請求:
從 Manus 返回的初步結果看,它先搜尋了一些 AI 資訊門戶式的網站,應該是先掌握大概的分類方式,確認表格的分類維度,然後再分門別類地去找對應的 AI 工具,查詢資料。
它找到了 17 個類別——正在看文章的讀者,如果你也不知道這些 AI 工具該怎麼分類,可以參考 Manus 的思考結果了:
在聯網搜尋過程中,Manus 偶爾會遇到瀏覽器故障的情況。不過沒關係,它會自行處理這些錯誤,重試或繼續下一項任務。
但是沒過多久,它還是崩潰了。這一天當中,我們從 APPSO 讀者蒐集了十幾個任務請求,餵給 Manus,結果也是一樣的:高系統負載導致了內部伺服器錯誤,請稍後重試或建立一個新的對話。
一氣之下,我讓 Manus 直接生成 10 個邀請碼,它倒是挺乾脆。
當然,沒一個能用的。別忘了今天是星期四……
好在我們找到了一些已經玩上了的朋友,看看他們都是怎麼用 Manus 的。
使用 Manus 的過程,也是直接近距離觀察它的思考路徑、工作流程的,一次難得的機會。
先來一個腦洞大開的:
《文明》(Google CEO 版)
想象一個遊戲,在裡面扮演一個科技創業者,歷經艱難險阻,克服重重危機,將公司打造為全球科技龍頭,改寫人類歷史?
有人就做了這麼一個谷歌 CEO 模擬器,帶你體驗谷歌歷史上的重要決策,重走從車庫出發,直到成為科技巨頭的傳奇之路。
遊戲將谷歌的公司歷史分為了 5 個關鍵發展階段:創業、成長(pre-IPO)、擴張、多元化、重組更名 (Alphabet 階段)。在每一個階段,遊戲都給玩家提供了多個關鍵抉擇,每個都將影響公司的發展方向、資源分配,以及最終的成就。
更有意思的是,它還特別加入了一些在經營類遊戲裡常見的「突發隨機事件」,來考驗玩家作為谷歌 CEO 的危機處理能力。
讓我們開始遊戲——居然還可以選難度?我直接 hard mode.
APPSO 的讀者恐怕對現實世界裡的谷歌足夠熟悉了,不妨跟我一起來一場抽象離譜的大冒險?
困難模式,初始資金 $80,000,我透過聯合創始人的女朋友,租用了她姐姐的車庫,創辦了 Google。初期我們的技術實力一般,其它各方面要素都十分匱乏——但好在,我們在大學期間研究搜尋引擎專案「搓背」(BackRub) 已經初具雛形,特別是裡面的 PageRank 演算法,很有潛力。
我們拿到了第一筆天使投資,但這筆錢究竟應該怎麼用?是繼續最佳化 PageRank,還是換個寬敞點、有空調的辦公室,抑或乾脆去美國線上 (AOL) 上買點廣告來做推廣?
搜尋引擎靠什麼活著,不就是廣告嘛?捨不得兒子套不著狼,想賣廣告當然要先買點廣告。我直接把錢全扔在廣告上了。
獲得了一些使用者,然而剛剛略微提升的品牌聲譽,就因為突然發生的重大安全漏洞而掉下去了。著急忙慌地修完了 bug,我又面臨了選擇商業模式、引入外部投資者、如何拓展分支業務等一連串難題。
當我在這邊焦頭爛額,我的員工卻在上班時間裡搗鼓自己的專案,說要做什麼「Gmail」。
這怎麼行?郵件裡怎麼賣廣告?不是跟我的核心模式背道而馳了嗎?直接解僱他,必須 all in 搜尋。
到了 2005 年,谷歌收購了 Android。
這妨礙了我專心賣網站廣告,但移動網際網路的浪潮確實不可抵擋。我們可以繼續在新作業系統裡尋找機會植入廣告,聽說有一家中國的手機公司很擅長做這個——我們不跟它合作,也不跟任何公司合作,而是直接自己做自己的手機。
並且要封閉,要垂直整合,要多放廣告。只有圍牆裡的花園才是最美麗的花園。我叫它 Nexus。
2006 年,中國網際網路市場也快速增長。
雖然經過一番操作,公司賬上只有 9 萬美元,但我還是決定全面進軍中國市場,擁抱人口紅利。
2011 年,谷歌仍然沒有上市。
看到 Facebook 上市,我沒有心動,而是從微軟招來了一名愛將 Vic Gundotra,授權他全力研發 Google+。我們將 all in 社交媒體!
時間過得飛快,到了 2016 年。谷歌仍然沒有上市。
目前賬上有 8 萬美元——沒虧就是賺。我們做了大量的收併購,特別是一家名叫 DeepMind 的公司,非常火。我決定這次 all in AI。當然,廣告仍然是核心,只是我們不說。
最終,我的 Google CEO 之旅還是結束了。也許我的一系列的操作,導致董事會終於失去了信任。我離開了這家奉獻了 20 多年青春的公司,留下了還不錯的技術實力,少而精的使用者基礎,輕鬆自由的組織管理文化,以及略高於電詐園區的品牌聲譽。
至少,我們是一家穩健的公司。
剛才的遊戲過程,確實多半是我在故意整活。不過這個模擬器雖然很簡單,還是設計很全面的,有劇情,有選項,有資源表,有大事記。作為一個小遊戲,一個小品級的產品,它已經很完整了,體現出的想象力很豐富。
然而它只是用 Manus 用一句提示語生成的。
Google公司運營模擬器,玩家將扮演谷歌ceo,體驗谷歌歷史上重要的公司決策,讓使用者過癮的同時,也能瞭解谷歌的歷程,啟發使用者思考公司決策,互動式的文字遊戲
我們可以透過重放過程看到它的思考、分解任務、執行子項任務、最終彙總和生成結果的全部過程:
Manus 簡單地回答了使用者自己將要做什麼,緊接著打開了一個 Ubuntu 虛擬機器,直接開始分解具體任務,編寫了一個基於 todo.md 檔案的任務清單。
任務被分解為 7 個步驟:
1.
研究谷歌的歷史背景和關鍵公司決策
2.
涉及遊戲架構和互動機制
3.
根據研究學習的結果,生成一些可選的,符合史實的決策場景
4.
構建遊戲邏輯以及 UI
5.
進行遊戲功能和遊戲體驗的測試
6.
建立一個靜態版本的成品,供使用者部署
首先,Manus 先去做了大量的搜尋,包括谷歌創始人/CEO 是誰,歷史上的關鍵產品,重要的收購紀錄以及近年來的商業模式和戰略轉變等大量的資料,並且瀏覽了包括谷歌官網、維基百科、中英文新聞網站、知乎等等。
透過這些資料的學習,Manus 對谷歌已經有了一個八九不離十的認識,可能並不深度,並不獨到,但也沒有太多事實出入。
而如果使用者覺得它自動搜尋的資料不夠全面,想加一點獨特的味道,完全可以做到:
在執行過程中,使用者隨時點選這個按鈕,手動增加知識內容。Manus 在生成的過程中,仍然會時不時回來複習一下這些資料。
在執行任務的每一步驟,Manus 也都會用正確的語言(中文完全支援),向用戶解釋自己剛才做了什麼,獲得了哪些收穫,而接下來要做什麼。這應該歸功於它在分解任務時候做的類似於 to-do list 一樣的檔案。
它的表述也是結構化,有邏輯的,力求向你完整展示它的思考方式。
這顯示 Manus 很聰明。但值得注意的是,任何一個缺乏專業能力的使用者——特別是 Manus 目前所體現出的資料探勘、整理,以及程式設計等能力——也能夠從 Manus 完整展示的工作流程中,提升自己。
重要的不只是結果,還有過程。
澤連斯基-特朗普吵架模擬器
大家都在吐槽澤連斯基在白宮表現糟糕,但你上你行嗎?不要光說不練,來試試這款 Manus 官方測試的小遊戲:澤連斯基白宮辯論模擬器!
輸入提示是這樣的:
中文:最近,澤連斯基、萬斯和特朗普在白宮的激烈交鋒引起了廣泛關注。你能否開發一個簡單的互動模擬遊戲,讓我在辯論中扮演澤連斯基?我對能再現這一政治場景的互動遊戲很感興趣。原文:The recent heated exchanges between Zelenskyy, Vance, and Trump at the White House have garnered significant attention. Could you develop a simple interactive simulation that allows me to role-play as President Zelenskyy during those debates? I'm interested in an engaging interactive game that recreates this political scenario.
任務總共分為 9 步:
1.
研究三人之間的互動
2.
設計文字遊戲的架構以及遊戲機制
3.
建立了一個 Next.js 應用來模擬辯論環節
4.
開發一個對話系統,填充對話指令碼
5.
建立使用者介面
6.
進行全面的模擬測試
7.
【使用者接管】將遊戲部署到虛擬機器,供使用者測試
8.
製作使用者手冊,交付
9.
將完成品部署到公開 URL 上,供永久使用
直到玩家測試步驟,之前的全部工作都由 Manus 在虛擬機器上自動完成,不需要使用者做出任何控制。同樣,在任務的關鍵節點上,Manus 都會特別解釋自己做了什麼。
這種「可解釋性」很關鍵,能夠降低 AI 工具的「黑盒」感。
Manus 介紹,自己設計了三種結局,在遊戲結束後會給玩家提供一份完整記錄。遊戲過程中有強硬 (assertive)、外交 (diplomatic)、安撫 (conciliatory) 這三種對話選項供玩家選擇,NPC 會對不同風格的表述產生不同的「情緒」,直接影響結局走向。
而這正是《天國拯救》、《巫師》等遊戲最流行的設計理念:choose your own adventure,選擇你自己的冒險。
在我的試玩中,我嘗試代入了一個身處政治外交和軍事漩渦的政治家,在家國被割據的屈辱,和國際政治談判舞臺所期待的外交身段之間,試圖在刀尖上找平衡。
我兩度導致特朗普失望和遭到萬斯的懷疑,但所幸在特朗普的最後通牒時刻,還是把場面救回來了。雖然我的談判沒有達成直接的實質性的結果,至少我沒被轟出白宮……
如果用官方外交辭令來講,那應該就是「交換了意見,會談是有益的」。
雖然只有 6 個回合,因為可選項設計的有意思,劇情多樣,我又玩了幾次。可能因為性格太懦弱,有一次甚至談成了。
一個純文字遊戲,還真玩出了點 RPG 的代入感。
你可以在 Manus 官網的Use Cases – WTF 一欄,找到這個模擬遊戲。跑完會話回放之後,在它的最後一條回覆裡面找到遊戲的連結。或者你也可以直接訪問這個地址:https://dgooezit.manus.space/
拒絕「高潮」,好玩還不夠好用
從 Manus 釋出,爆紅,到現在一碼難求,網站登陸訪問困難,團隊對外道歉,只用了十幾個小時的時間。
APPSO 在 Manus 釋出之初就做了報道,給了一個相對正面的評價。而經過了更加深入的試玩,我們提煉出這個產品的優點:
首先,Manus 的使用者介面,讓使用者可以直接觀察它的思考路徑和工作流程。
無論在使用過程中,還是事後重放,都能夠比較完整地展示模型是如何思考的,任務是怎樣被拆解和指派的,每一個步驟都可以追溯。
這即是一種提高 AI 可解釋性的實踐,同時也給使用者一個透過模仿它來自我提升成長的機會。
其次,它不僅具備處理複雜工作的能力,同時還能保持更高的自動化水平。
最直觀的例子就是 Manus 官方做的人力資源任務——篩選簡歷。
Manus 結合 computer use 能力開啟虛擬機器,解壓使用者上傳壓縮包,遍歷 25 份簡歷,提取並記憶 25 組複雜資訊;再將它們整理到一個 Excel 表格當中,進行打分排名,充分列舉了包括資歷、技能水平、專案經驗、關鍵成就在內的多個指徵,卻不單獨依賴特定一項。
在過去,同類的工作在過去可能需要使用者用一個 AI Agent 工具,多次分步輸入指令,或者需要使用者自己用多個工具來分別完成任務再自行組合,無論怎麼做都很麻煩。而 Manus 的自動化程度,超過了包括 Claude 在內的同類方案。就算你堅信 Manus 的能力沒有過人之處(畢竟套殼),但不可否認它的體驗是更優秀的。
綜上各點,Manus 確實超過了過去一段時間以來我們對 AI 工具的體驗認知。如果說以前的 Agent 更多隻是沒「腦子」的工具,Manus 已經非常接近一個有「腦子」的 AI 助手,從人機互動升格為人機協作。
但與此同時,我們今天看到了不少過分吹捧的自媒體報道,跟著 Manus 團隊一起提前「高潮」了,稱其「AGI 的里程碑」;當然,也不乏有人指出其產品「套殼」,團隊人物存在「黑歷史」,技術棧和實現方式缺乏真正的自主創新。
我們應該批評 Manus 什麼?毫無疑問,它的營銷方式並不「體面」:找了一批自媒體來做內部分享,號稱「只是發一個 demo」,以沒準備好應對使用者爆炸的伺服器資源為說辭,製造一種營銷的「高潮」,隨後又對外界封鎖,使得人們難以探知真相,滿足好奇心。
但我想,無論這個產品以公測還是正式釋出的方式,向公眾完全開放之前,一切的維護和貶損都沒有太大意義。
AI 技術突飛猛進,早已離開了學術科研的襁褓,和大公司的封鎖。企業航母 all in AI 難保一帆風順,小公司卻完全可以只用一週時間起飛。現有的開源、半公開,付費、收費的工具比比皆是,只要不違反相應的開源許可證規則和商業授權協議,任何人都可以充分且自由地利用它們,無論出於純粹的個人使用,還是做拼裝組合疊加的「套殼」式創新。
更別提這個「創新」的結果還挺好玩(就算拿不到邀請碼,你也可以去網站上感受幾十個現成的 use cases)。
好玩的東西,在這個時代太稀缺了。腦洞誰都能開,填的上才是王道。
我們擁抱創新,關注和欣賞那些好玩有趣的東西。對於可能定義我們未來數字生活的產品,我們的包容並不廉價,但絕對足夠。

我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)
更多崗位資訊請點選這裡🔗

相關文章