當深度思考遇上Agent,真全能的AI來了?
智譜AI在OpenDay上釋出了全球首個集深度研究和操作執行於一體的Agent產品——AutoGLM沉思。有別於大多數只會打嘴炮的AI,這款號稱“邊想邊幹”的產品不僅能思考,還能即時操作瀏覽器,像真人一樣開啟網頁、檢索資訊、生成報告。
我們第一時間進行了一手評測,用三個實際工作場景測試後不得不說:這次不是PPT產品,這次是真的能用!
通用Agent一直面臨的最大難題是C端場景過於複雜多變,導致穩定性和準確性難以保證。智譜透過“先思考再執行”的策略解決了一部分準確性的痛點。AutoGLM沉思會先制定完整研究計劃,再一步步執行,最後進行系統總結,大大降低了幻覺率和操作失誤率。
AutoGLM沉思之所以能真能用,關鍵在於其背後的技術棧。它基於智譜自研的推理模型GLM-Z1-Air訓練,這個模型號稱效能比肩DeepSeek-R1,但速度提升最高8倍,價格僅需其1/30。深度推理能力讓它不僅能像OpenAI的Deep Research一樣進行深度思考,AutoGLM框架則賦予了它真實的操作能力,能自動瀏覽和操作網頁,獲取更多高質量信源。
而且對於打工人來說,AutoGLM沉思完全免費且不限次數使用,現場智譜用它演示了“如何賺到100塊錢”以及“14天小紅書起號計劃”,我們實測下來,AutoGLM沉思打破了“通用Agent等於玩具”的刻板印象,不過由於“邊想邊幹”的工作方式,它完成一項複雜任務往往需要5-20分鐘不等,效率確實有待提高。但考慮到它能完成的任務複雜度和準確性,這個時間成本其實已經比人工低得多。
當深度調研與實際操作能力相結合,通用Agent終於要從概念走向實用了?
以下是矽星人針對自媒體常見三個場景:熱點分析、財務分析和計劃制定,對AutoGLM進行了實測。
1
一、熱搜話題評論分析
我讓AutoGLM沉思分析一下微博上關於“胖東來店長月薪近8萬”這個熱門話題的主要觀點、大概佔比和能得出什麼結論,AutoGLM沉思整個運作的過程如下。
本文影片均經過倍速處理
接到任務後,AutoGLM沉思先去了解了胖東來這家公司和這個話題的基本情況,確認了訊息來源和薪資資料。它嘗試直接去微博抓取和分析討論,但好像遇到了點技術困難,可以抓取微博帖子,但沒法直接看大量的評論。

於是,它換了個思路,開始廣泛搜尋相關的新聞報道、創始人於東來的發言、以及其他社交平臺(像知乎、小紅書)上關於這個話題的討論和帖子。透過閱讀這些替代來源的資訊,特別是小紅書上的一些帖子和評論。

最終還是給出了一個資訊量豐富、邏輯清晰的分析報告。值得注意的是不僅回答了我的問題,還深挖了背景資訊和商業邏輯,讓結論更有說服力。

可以上下滾動的圖片
從這個過程來看AutoGLM沉思挺靈活,路子堵了知道換條道走,最後還是把任務完成了。不足是因為沒直接看微博,觀點比例是靠其他平臺的資訊,沒有嚴格遵守使用者的要求,如果能直接處理微博資料,分析會更紮實。
1
二、特斯拉股票分析
我們讓AutoGLM深思做一份全面的特斯拉股票分析報告,要求包含財務、市場情緒、技術面、競品對比等方面。

AutoGLM深思接到任務後,先是蒐集了特斯拉的基本情況和最新動態,瞭解了大概的業績。然後它開始深入挖掘,找詳細的財務資料,雖然嘗試直接讀官方年報沒成功,但還是從其他財經網站把關鍵資料(像營收、利潤、現金流)扒拉出來了。接著,它又去查了分析師們怎麼看這隻股票、市場情緒怎麼樣、股價圖走勢如何,還重點比較了特斯拉和比亞迪等競爭對手的優劣。

最後,它把這些資訊彙總起來,從價值投資的角度分析了潛力和風險,做了個SWOT總結,並針對不同型別的投資者給出了建議,形成了一份詳細的報告。

可以上下滾動的圖片
和上面熱搜評論分析的情況類似,AutoGLM深思能按照給出的框架一步步去搜集和分析資訊,覆蓋面很全。即使遇到資訊獲取的小障礙(比如直接讀年報失敗),也能換個途徑把任務完成。不過整個過程看起來挺繁瑣,搜了很多次,花了些時間。
實際上這個股票分析的任務也是Manus的官方案例之一。
對比兩個產品完成任務的過程來看,Manus像一個自動化分析師 + 開發者。它明確地執行計劃、呼叫工具、獲取特定資料(如股價、財務指標)、進行計算(如DCF估值、技術指標)、生成圖表,並且過程非常透明,使用者能看到它一步步在做什麼。除了生成了詳細報告,還做出了一個互動式的資料看板。AutoGLM沉思在資訊蒐集和總結方面做得不錯,但顯得工具化和分析能力稍弱一些。
1
三、日本七日遊旅行計劃
我們繼續讓AutoGLM沉思和Manus同題“打擂”,讓AutoGLM沉思規劃為一對美國公民規劃一個4月中從西雅圖出發的7天日本行程:預算在2500-5000美元,喜歡歷史文化(特別是劍道、茶道)、想看奈良的鹿,而且打算在這次旅行中求婚,需要推薦個特別地點,最後還要個簡單的網頁版旅行手冊。

接到任務後,AutoGLM沉思先去查了西雅圖到東京的航班大概價格和時間,確認了美國公民去日本不用簽證。然後它研究了在日本幾個城市間怎麼走最方便(主要是新幹線),接著就針對興趣點(歷史、文化體驗)去搜東京、京都、奈良的景點和活動,特別找到了東京可以體驗茶道和劍道的地方(從小紅書上找的資訊)。還查了4月份天氣怎麼樣,並且根據別人的經驗推薦了東京塔下的公園作為求婚地點。

最後,它把這些資訊整合起來,做了一個每天的詳細行程安排,加了些日語短語和旅行提示,還生成了一個簡單的HTML格式的旅行手冊,但視覺化程度有限,基本上是提煉了一些要點。

可以上下滾動的圖片
1
總結
對比來看,AutoGLM沉思強項是資料獲取和資訊收集,但過程有點“黑箱”,不太清楚它怎麼篩選資訊、怎麼做的決策,但遇到問題知道換個法子試試,很喜歡小紅書這類社交平臺,這讓它可能更擅長找到一些普通使用者分享的、非官方的、甚至有點“網紅”性質的地點或體驗。這可能是個優勢,能挖到那種更依賴官方或結構化資料的 AI 找不到的資訊。對於想直接“抄作業”的使用者來說,可能更直接、更省事。
而Manus的過程更透明,用的方法更多樣,最後給的東西(行程、求婚指南、手冊分開)更規整、更專業。
整體來看,經過這次AutoGLM沉思的評測體驗,雖然有一些槽點,但不得不說,AutoGLM沉思給人的印象確實是勤奮得令人印象深刻,而且考慮到其免費特性,它很可能是你能接觸到的最好用的免費AI勞動力了。它就像一位不知疲倦的實習生,默默在後臺為你搜集資訊、整合分析,而且完全免費。這意味著你可以放心嘗試各種不同場景,探索它的能力邊界。免費的最大好處就是極低的試錯成本,使用者可以放心地讓它嘗試各種不同的應用場景和任務。探索它的能力邊界。
當然,它也有明顯的短板。任務處理速度不算快,有時一個分析可能需要半小時以上。不過好在你不必乾等著,完全可以讓它在後臺默默工作,自己去處理其他事情。唯一的小煩惱是,它會不時地自動開啟新網頁,如果你正在Chrome瀏覽器中工作,可能會有些干擾。
這或許是人類與Agent之間的第一次“領地爭奪戰”——誰才是電腦的真正主人?(笑)