OpenAI史上最慘釋出:ChatGPTAgent遭暴擊,國產AI輪番「公開處刑」 2025-07-20 00:04 APPSO 昨天凌晨,OpenAI 推出了一款新產品,ChatGPT agent。 最興奮的不是廣大使用者(畢竟 200 刀的 Pro 使用者沒那麼多),而是各家 Agent 競品。 Manus 釋出多則推文與 ChatGPT agent 「正面較量」。圖片來自:https://x.com/ManusAI_HQ/status/1945954009547677992 Manus 連發十幾條推文,把自己的 Agent 產品和 OpenAI 的新 Agent 一項項對比,暗示自己才是更早、更快、更好用的那一個。 Genspark 創始人發推文展示 Genspark 和 ChatGPT agent 結果對比。 圖片來自:https://x.com/genspark_ai/status/1946005869533311030 Genspark 也發了個輕描淡寫但意味深長的 demo,說自己在同樣的提示詞下「一次搞定」,並補了一句: 我們不想製造什麼 drama(戲劇性效果),只是為整個 Agent 生態感到興奮。當然,也為我們自己的絲滑體驗小小自豪一下。 這場熱鬧,不像是一家巨頭髮布新品,更像是扔進 Agent 市場的一顆「競品炸彈」。 OpenAI 釋出的這個 ChatGPT agent 到底怎麼樣?能讓同類產品連夜上線 battle 模式? 目前 ChatGPT agent 已經向全部的 Pro 使用者推出。而由於需求高於預期,Plus 和 Team 使用者將於週一開始獲得訪問許可權。 我們蒐集了一些網友們的實測案例分享,試著還原一下 Agent 的基本樣子,也找來了 Kimi、Manus、Minimax 幾個典型的對手,做了一次實測對比。 看看這個遲到幾個月才出現的 ChatGPT Agent,到底是王者歸來,還是落後補作業。 它確實能替你幹活,但是不是「萬能」還得另說 博主 @rowancheung 提前獲得了訪問許可權,他嘗試要 ChatGPT agent 給他生成一份完整的退休計劃 PPT。 他輸入的提示詞是: 為年收入 50 萬美元、希望 30 歲退休並擁有 500 萬美元的人建立一個 FIRE 模型。模型包括極端儲蓄率(80%+)、稅收最佳化、高效複利的投資策略,以及在加拿大溫哥華生活的生活成本。包含不同提款率的情景,並展示與傳統退休計劃相比需要作出的犧牲。然後,建立一個可下載的簡報。 ChatGPT agent 的流程還是很順的,只花了 20 分鐘左右的時間就幫他完成了任務,生成了完整的 PPT。 查詢當地稅法(溫哥華),並分析平均每月支出率 計算 30 歲退休所需的儲蓄,研究最優投資配置 發現全新的稅收最佳化策略,構建多個 FIRE 場景 建立了可下載的簡報,其中包含結果 依舊是在 ChatGPT 的聊天窗口裡面進行,它甚至不需要詢問額外的偏好或者其他資訊,直接啟用虛擬電腦,自動搜尋和總結歸納資訊,過程中完全不需要自己動手點選。 最後 ChatGPT agent 生成了一份 14 頁的 PPT 文件。說實話,我看到這個成品是有點失望的,因為實在是太簡陋了。 上下滑動檢視更多內容,來源: https://x.com/rowancheung/status/1945896543263080736 這位博主說如果他請一位財務顧問來做這件事,他需要花費 5000 多美元,而且要花幾周的時間。 當被其他使用者問到,覺得 ChatGPT agent 怎麼樣,是不是一款令人驚喜的產品,還是僅僅是功能的增強時?他也直接說, 最令人印象深刻的是電子表格和幻燈片生成功能,但結果與我使用 Manus 或 Genspark 獲得的結果類似。鑑於大多數人還沒有嘗試過其他工具,它對大多數人來說都會是令人興奮的。 言外之意大概是,如果你嘗試過其他工具,大概興奮不起來。 還有其他使用者分享透過 ChatGPT agent 來幫助他準備一份購物清單。他說看著 ChatGPT 瀏覽網站、提示他輸入登入詳細資訊、將商品新增到購物車並自主完成整個過程,是令人難以置信。 請幫我為這個週末兩個人的烤肉晚餐,準備一個特易購購物清單,幷包括一道甜點。 來源: https://x.com/thealexbanks/status/1945921363237052589 不過他在評論區也提到如果是自己去做這件事情,可能會更快。 網上的案例分享大多都是在解決一些生成 PPT、表格或者制定計劃清單等任務上。但很明顯,我們的生活裡面遠不止這些問題需要 Deep Research。 同樣的,規劃行程之類的問題還是更偏向於模糊性質的任務,對於我們實際工作生活中要處理的,更嚴肅的,需要更高準確度的任務,ChatGPT agent 輸出的內容想必經不起太多的推敲。 不過,它確實是做到了一個「進化版」的 ChatGPT。 Manus、Kimi、Minimax 表示:我做得更好 我們讓 Kimi、Minimax、和 Manus 也一起來做了「加拿大退休計劃」這個任務,看看 ChatGPT agent 是否比這些先前推出的產品更出色。 首先是 Manus,它的速度是最快的。我把需求傳送給它,十分鐘不到的時間,它就結束了整個任務。 和 ChatGPT agent 一樣,Manus 也會啟用一個「Manus 的電腦」來視覺化模型執行任務的過程。 但是最後的結果,明顯會比使用 ChatGPT agent 生成的 PPT 更「好看」的感覺。至少,Manus 不像 ChatGPT agent 只是單純的黑白。 而在內容上,它給我生成了 10 頁的 PPT,可能是中英文切換的原因,Manus 內容比 ChatGPT 要更寬泛一點,整體上是差不多。 此外,相比 ChatGPT agent,Manus 不會在 PPT 文件裡面標註引用的資訊源。 上下滑動檢視更多內容,訪問連結:https://manus.im/share/kwujwPDSTQe4y8vAKQZR5Q Manus 官方自己也下場,做了多個和 ChatGPT agent 對比的嘗試,正面硬剛。 首先是在新加坡設立企業這個任務,Manus 說,自己能夠提供更優質的研究和簡報。 在加拿大退休計劃任務上,Manus 是實際地完成了這件事情,而 ChatGPT agent 停留在空泛的計劃上。 第三個對比是計劃一次 3 天的棕櫚泉網球之旅,ChatGPT 依舊是白底黑字的 PPT,Manus 則是色彩豐富,使用符合棕櫚泉、網球等特點的圖片背景。 在舊金山城市預算分析與演示這個任務上,Manus 提到自己不僅是給你資料,還完成了一個專案;截圖裡顯示 ChatGPT 生成的 PPT 只是表格,而沒有視覺化的分析…… 多個對比,從電子商務、金融分析、餐廳預訂、航班查詢、行程規劃、和報告分析等不同的任務上,Manus 都表示比 ChatGPT agent 聰明,且生成的內容更全面、更好看。 Manus 還在更新相關的對比情況,目前是已經發布了 10 個與 ChatGPT agent 比較的推文。 第二個我們嘗試了 Minimax,它花的時間很長,大概有將近一個小時。Minimax 也會有一個類似虛擬電腦的「Minimax 視窗」,就像 ChatGPT agent 或者 Manus 一樣,即時的顯示它的思考和行動過程。 讓我感到驚喜的是,Minimax 不僅給我提供了可以下載編輯的 PPT 文件,還有一份純文字的 PDF 報告,同時還給了我一份線上瀏覽的連結。 Minimax 生成的文字報告 上下滑動檢視更多內容,線上瀏覽:https://rd4hl2nxlutu.space.minimax.io/ 對比 Manus,我覺得 Minimax 這份報告又更嚴謹,無論是內容上要更詳盡,還是資料的視覺化效果,都做的比 ChatGPT agent 和 Manus 要好。 最後是花了最長研究時間的 Kimi,大概有超過一個小時。它是目前還沒有被完全叫做 Agent 的一個產品,仍然是以 Deep Research 的形式出現,所以它沒有虛擬電腦即時顯示過程這個頁面。 就像前段時間,Kimi 團隊成員在自己的部落格裡面寫到的一樣,Kimi 做的不只是一個聊天機器人。它可以做的,不再是簡單的返回 Markdown 文字,而是從 chat-first 到 artifact-first(從「以對話為中心」到「以任務成果為中心」),讓 AI 構建互動式前端。 部落格裡面也提到,他對於 Agentic Model 的理解,是一個必須能迴圈性完成任務的模型。一個 Agentic Model,不是你問一句、它答一句的「問答機」,而是一個能自己「觀察、思考、嘗試、糾錯、再嘗試」,最終完成複雜任務的模型。 大概正因為如此,Kimi 也是唯一一個,在獲取到我的任務提示詞之後,會問我現在多大,租房還是買房等等問題的助手。這也讓我覺得,這才像是一個現實生活中真正的「秘書」。 最後,Kimi 深度研究的結果也是最讓我滿意的,它生成的報告非常非常的長,內容也是最詳細的,同樣在 PPT 文件裡面也會有資訊引用的標註。 上下滑動檢視更多內容;此處僅展示全部內容的 50% 左右,預覽連結:https://www.kimi.com/preview/1981ba88-3871-8785-9e20-edd331000509 ChatGPT agent 作為新入局的 Agent 產品,給我的感覺就是像他們直播的時候說的一樣, ChatGPT 智慧體將 Operator 與網站互動的能力、深入研究在整合網路資訊方面的優勢,以及 ChatGPT 的對話能力有機融合,形成一個統一的智慧體系統。 它也就只是把 Deep Research、Operator、ChatGPT 這三樣結合起來了。 所以,它生成的 PPT 會很像是 Deep Research 的文字版,不會像 Kimi、Manus 這些產品,在前端、產品美學上下功夫。 但他們還是有一個共同點,就是這些 Agent 產品已經能完成複雜內容任務,且體驗越來越像是「協作型 AI 工具」而非「問答機器人」了。 我想這次 ChatGPT agent 的出現,可能不是多麼厲害的「革命性升級」,但確實是另一個訊號: 從「回答問題」到「執行任務」,AI 的形態正在變化,而大模型 AI 公司的野心也開始從語言模型本身,擴充套件到「誰來承載未來人機互動的主入口」。 歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取#AI有用功,解鎖更多 AI 新知👇 我們正在招募夥伴 📮 簡歷投遞郵箱[email protected] ✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結) 更多崗位資訊請點選這裡🔗