
一個月過去,等到 manus 的邀請碼了嗎?
作者|連冉
位元組的 Agent 產品來了。
4 月 18 日晚間,字節跳動釦子空間開啟內測,定位通用 Agent。與其他類似產品如 manus 一樣,釦子空間採用了邀請碼制。
平臺上,使用者可以選擇精通各項技能的「通用實習生」,也可以選擇行業的「領域專家」,透過與 AI 的互動完成工作任務。

就在前一天,火山引擎剛剛面向企業市場推出 OS Agent 解決方案及 AI 雲原生推理套件,要幫企業更快、更省地構建和部署 Agent 應用。
雖然採用了邀請碼制,但釦子顯然不是走飢餓營銷的路線。使用者啟用獲得的邀請碼後,建立並完成一個新任務即可獲得 5 個邀請碼,邀請碼啟用後,還可獲得更多邀請資格,多建立多獲得多邀請。

上線的第一時間,極客公園就上手實測了釦子空間的 Agent 功能。可以看到,在執行的三個任務中,制定旅遊攻略和一週穿搭的任務順利完成,但另一個專家助手的任務,卻出現了 Python 指令碼呼叫失敗、 API 許可權異常等 Bug,一個晚上都沒能執行成功。
位元組邁出了走向 Agent 時代的第一步,但距離完美好用,顯然也還有很長一段距離。
01
釦子有探索和規劃兩種模式,如果想讓它一步到位輸出,可以選擇探索模式;如果想親自把控每個步驟,可以選擇規劃模式。
我試了一下用釦子的探索模式制定一份日本旅行攻略,跟 manus 用例展示裡的提示詞類似,來看看釦子做出的旅行方案怎麼樣:

影片來源:極客公園
做出這份旅行攻略的時間在 10 分鐘以上,可以看到釦子將推理過程的思維鏈與搜尋深度結合,踐行「邊想邊搜」,在「已獲取到日本關西和熊本的小眾景點、海邊景點以及適合三十歲生日慶祝的特別地點資訊」後,釦子儲存了「景點資訊」,開始「邊想邊做」,從景點中篩選出合適的景點並規劃出行程安排,在完成行程安排後,開始生成包含地圖、景點介紹、必備日語短語及旅行提示的 html 旅行手冊:

經過了 15 分鐘以上的執行後,釦子給出了上面影片所示的一份旅行攻略,如上面所示,裡面既有 5 天的行程安排,也給出了預算參考和旅行提示,還根據我的需求配備了個性化的策劃節目,看了一下基本按照這個方案已經可以直接出行。

釦子還支援新增 MCP 擴充套件,AI agent 得能力邊界被進一步擴充套件,接下來應該會有更多外掛接入。


我接入了語音合成的工具,讓它給我把文字攻略轉成語音版本,agent 很快就輸出了語音版本:
https://lf-bot-studio-plugin-resource.coze.cn/obj/bot-studio-platform-plugin-tos/artist/image/4c1277951b564bb194bbcd11894a52ad.mp3
這個聲音聽著很像豆包 app 預設的女聲聲音,雖然把符號那些也連帶著一起讀了,但這個功能是方便好用的。
我繼續試了一個簡單任務,「查一下北京未來一週的天氣,根據天氣推薦一週穿搭,製作相關圖片」,不過第一次輸入沒有註明是穿搭圖片,所以輸出的只是天氣表格,在增加這個需求後,釦子輸出了兩張穿搭圖片,可能因為我沒有告知性別,它乾脆輸出了一男一女的穿搭。

圖片來源:極客公園

圖片來源:極客公園

圖片來源:極客公園

圖片來源:極客公園

圖片來源:極客公園

圖片來源:極客公園
這個輸出的穿搭圖片裡,人很真,穿搭也看著可借鑑。後續還可以繼續讓釦子接著補充完一週的圖片連結。

圖片來源:極客公園
MCP 被認為是未來 AI 生態的「標準 USB 介面」,3 月底,國外,OpenAl、谷歌、微軟和亞馬遜陸續宣佈支援或深度整合 MCP 協議,國內,阿里雲、騰訊雲也陸續支援 MCP 服務部署與呼叫。
此外,除了標準的通用 Agent,釦子空間裡還內建了一些專家 Agent。目前在釦子空間的使用頁面上,有「使用者研究專家」和「華泰 A 股觀察助手」兩個專家 Agent,前者可以提供調研問卷交叉分析、訪談紀要整理以及使用者分析報告撰寫服務,同時可結合產品問題設計新的調研問卷和訪談提綱,後者則是由華泰與釦子團隊共同孵化的專家 Agent,每日跟蹤覆盤自選股和大盤客觀情況,基於專業資料和框架提供觀察思考。
兩位「專家」都已經明碼標價——限時免費,這個標註方式或許為之後收費埋下伏筆?
「使用者研究專家」核心包含四大能力,單任務平均耗時只需 4 分鐘:問卷資料分析;訪談紀要總結;調研問卷生成;訪談提綱生成。
「華泰 A 股觀察助手」的單任務平均耗時要長一些,23 分鐘。該助手稱可以每天為使用者傳送專屬的股票早報,也可以與使用者 1 對 1 探討股票觀察:
更高質量的資料來源:華泰 A 股觀察助手專家 Agent 在獲取公開搜尋資訊的基礎上,直接查詢股票資料,綜合完成分析,從而儘可能地減少因低質量資料來源帶來的幻覺。 更準確的資料計算:對於複雜的資料分析和技術指標分析,華泰 A 股觀察助手專家 Agent 會使用 Python 來完成資料計算,儘可能地減少因心算帶來的幻覺。 更復雜的研究任務:由於可以獲取更大範圍的連續資料並自主規劃分析方法,華泰 A 股觀察助手專家 Agent 能夠像更專業地工作,先定量後定性,先定性後定量,定量定性相結合,讓複雜深入的分析成為可能。 更靈活的交付方式:華泰 A 股觀察助手專家 Agent 不僅可以對早報或回答文件進行追問,還能幫你生成 PPT、網頁等各種形態的檔案
最近股市動盪頗多,來看看華泰與釦子團隊共同孵化的專家 Agent 能力如何。

這個專家執行任務中間有節點,可以看到它在進行了分析、總結、生成報告之後,在等待我確認是要開始任務還是修改任務。
雖然頁面上顯示 10 分鐘未開始任務,任務會自動確認並開始,但這個執行並不穩定。在之後再次出現類似節點時,我沒有在 10 分鐘之內反應,10 分鐘後任務並沒有自動開始,而是就停留在節點,導致該任務時長拖到了幾十分鐘還沒有結束。
我是 18 日晚上 21:59 左右開始的這個任務,但是直到第二天早上,這個任務也沒有完成。回頭翻看任務執行過程,有一些資料未能獲取,還有 Python 指令碼 fetch_kline_data.py 呼叫失敗,「可能是由於 API 呼叫許可權或資料來源問題」。
看來即使是 AI,股市專家也不好做。
02
2025 年之前就被稱為會是 agent 之年。
manus 在 3 月的火熱,加速了大廠在這一領域的推進。而 manus 能在今年「橫空出世」,也是基於 Claude 3.7 Sonnet 等新一代模型在工具呼叫和程式設計能力上有重大突破,為 Agent 發展奠定基礎。
位元組在 agent 賽道了再次展現了速度與執行力。17 日,豆包·深度思考模型正式釋出,同步升級文生圖模型 3.0、視覺理解模型,並推出 OS Agent 解決方案及 AI 雲原生推理套件,為企業構建與部署 Agent 應用提供了強力支援。18 日,通用 agent 平臺釦子空間即開啟內測,定位於提供「通用實習生」和「領域專家」Agent,展現了位元組從技術突破到產品落地的迅速節奏。
在 17 日的釋出會上,火山引擎總裁譚待強調要做好 agent,技術上需要做好三個準備,包括更強的、支援多模態的模型,更好的架構和工具能夠支援大模型運算元字和物理世界,以及透過 AI 雲原生降低模型推理的成本和延遲。
釦子空間的內測開啟,或說明位元組已經基本做好了這三項準備。
豆包 1.5·深度思考模型採用 200B 引數、20B 啟用引數的 MoE 架構,支援視覺推理和「邊想邊搜」,能在數學推理(AIME 2024)、程式設計競賽(Codeforces)和科學推理(GPQA)等任務中媲美 OpenAI o3-mini,達到全球第一梯隊。其 20 毫秒的極低延遲和多模態能力,使其能處理複雜任務,如基於照片推測地理位置或解讀企業專案流程圖。
OS Agent 方案透過 AI 雲原生元件(如 Sandbox)為企業提供了模組化的開發支援,顯著降低了 Agent 應用的開發門檻。火山引擎還支援 MCP 協議,譚待認為,類似網際網路早期 HTML 和 HTTP 的統一協議將加速 Agent 生態發展,降低開發者適配成本,推動行業標準化。
火山引擎正在透過垂直類 Agent(如 Data Agent)、通用 Agent 開發工具(如 OS Agent)及 AI 雲原生布局,全面推進 Agent 生態建設。
譚待提到,Agent 是 AI 為各行各業帶來變革的必經之路,需具備深度思考模型支援的反思和規劃能力,才能完成專業度高、耗時長的複雜任務。
不過,當前市場對 Agent 的定義較為混亂,部分廠商宣稱開發的「數千個 Agent」可能僅為初級(L1)水平,僅能處理簡單任務。未來,Agent 或將像自動駕駛分級(L1 至 L4)一樣明確標準,真正落地的 Agent 需達到 L2++及以上級別。接下來,Agent 的定義和應用場景將更加清晰。
可以看到,位元組的 Agent 戰略以技術突破、生態協同和成本優勢為核心,展現了「大廠碾壓」的實力。