釦子空間上手體驗:一個會主動跟你「對齊」的AI實習生

你是個
成熟 AI 了
該學會自己對齊了
Agent(智慧體)和 MCP(模型上下文協議)是 2025 上半年 AI 領域最熱門的趨勢。
前幾天位元組的 Agent 產品「釦子空間」,也正式開啟了內測。
在人山人海的 agent 產品中,釦子空間 (https://space.coze.cn/) 第一次提供了「規劃模式」——能夠和使用者分步協作,在關鍵步驟節點暫停確認、允許使用者即時修正路線的 agent 能力。
釦子團隊官方認為,人和 agent 協作起來,將會是一種更加絲滑的工作模式。
釦子空間內測申請:
https://bytedance.larkoffice.com/share/base/form/shrcntTvYomCXv5xQfBr46aXBzc
愛範兒也第一時間拿到釦子空間邀請碼,試跑了一些腦洞微開的任務。(看完文章,還有福利)。
官方網站:https://space.coze.cn
我們扮演了 「老師好我叫何同學」 的公關負責人,要求實習生釦子對近期輿情事件進行分析,生成輿情報告,進一步給出對策建議,然後再撰寫一份回應宣告:
Prompt: 我是‘老師好我叫何同學’團隊的公關負責人。近期我們的品牌遭遇了輿情事故,請你搜集資料,評估該事件的影響程度,瞭解網友的吐槽內容,從中分析提煉出網友認為我們所犯的錯誤以及改進方向。你可以利用你認為合適的網站和網際網路平臺來搜尋資料。然後,為我生成一份輿情報告,全面展示此次輿情事故的時間線、發展脈絡、網友反應與吐槽,以及應對策略。這份報告需要做得深入一點,特別是在應對策略方面要提供多種不同的角度。此外,我還需要你依據應對策略,生成一篇態度誠懇、不逃避責任且改進措施切實可行的回應宣告。你需要把輿情報告生成一個網頁和一個 pdf 檔案,把回應宣告生成為常規文件。
這個任務看起來比較簡單,主要動作是搜尋和文字生成,但同時對報告製作者的輿情分析的專業知識,以及將媒體報道和社媒貼文提煉、格式化成嚴肅報告的文稿能力,要求都不低——這些,都是一個 agent 產品在大模型方面的能力。
除了大模型能力之外,在 browser/computer use、程式碼、MCP 等能力上,這個任務也能讓釦子空間「小試牛刀」。
和工作水準。這是第一次生成的輿情報告的資料分析部分:
這是 AI 實習生編寫的應對策略
作為「初稿」,這次交付無論從輿情報告的詳實程度,邏輯拆解,分析的專業性,還是回應宣告的格式上,都算是達標了。具體細節不一定適用於真實場景,但至少生成結果提供了可以用於下一步行動的指導方向。
值得注意的是,由於輸入任務時提到了「時間線」的概念,生成的結果似乎把更多篇幅提到了「開源專案抄襲」、「會自己打字的鍵盤」等前序事件上。而這並非我們的任務意圖。
顯然,在工作場合中,同事之間目標對齊還是很重要的。
我們正好可以透過釦子空間的規劃模式,來與這個 AI 實習生對齊:

經過對齊後,不僅內容目標正確,還可以看到輿情報告的資料部分直接把粉絲量、「三連率」、完播率的對比展示了出來,資料的說明力和代表性有所增強:
下面這個影片是整個任務的完整回放。
線上檢視任務回放:https://space.coze.cn/s/RpemuvaYQkc/
停下來、慢一點:AI 工作搭子要學會自己「對齊」
從愛範兒的測試結果來看,釦子空間和傳統智慧體/MCP 產品最大的不同之處,就在於這個能夠「停下來、慢一點」的規劃模式。
簡單來說,交給 MCP 一個任務之後,它會自動分解任務指定規劃然後開始跑任務,最終生成結果。但這難免出現「一步錯,步步錯」的情況。
而釦子空間開啟規劃模式後,可以在執行復雜任務的關鍵節點上「停下腳步」和使用者對齊,讓使用者可以即時糾錯和糾偏,最佳化執行邏輯。
這種方式尤為適合不具備提示工程能力的小白使用者。第一次提交任務的時候,簡單扼要表達你的意圖就行了。
「規劃模式」的觸發條件有兩種:
一種是 agent 出於各種原因(比如查不到相關資料,或者不能準確理解使用者的意圖),導致無法完成當前步驟,或者結果的置信度不夠高——它會自己停下來。當任務暫停時,釦子空間會彈出通知,提醒使用者進行下一步操作。
另一種是使用者可以主動按下「暫停鍵」:智慧體的分步執行任務過程中,會把分步結果寫成 .md 文件,用於構建知識庫和輔助下一步執行。釦子空間也是如此,使用者如果發現分步文件有誤或者偏差,就可以自己暫停修正。
這種協作式的智慧體工作流程,使得智慧體避免因為「一上來就分析錯了」,以及思考和 token 不斷輸出中產生的幻覺等各種原因,導致偏離既定目標。 
可以這麼理解:如果說傳統大模型/智慧體是「自動駕駛」,那麼釦子空間其實是讓使用者來扮演 AI 的「copilot」(副駕駛)。使用者一旦發覺偏離,可以立刻踩一腳剎車,手動扶正方向盤。 
如果換成實習生的比喻,釦子空間就是一個能夠做到「不懂隨時問」,然後依據即時反饋來靈活調整工作方向的 AI 實習生。
實際上還不止一個 AI 實習生,而是可以有很多個:
對於常規型任務,比如文字處理、製圖製表、簡單分析等,釦子空間自己就是一個通用實習生,算是一個能力比較全面,但不強調專深領域的「小六邊形戰士」;
至於深度專業領域的任務,比如使用者調研、金融行研等,就需要「領域專家」智慧體出面了。
無論是通用型還是專家型智慧體,都透過「釦子空間」來一站式排程。 
不僅如此,如果現有的專家型智慧體還不夠用,開發者也可以充分利用釦子團隊同步推出的扣子開發平臺(零基礎開發智慧體)、釦子羅盤(智慧體 DevOps 調優工具)、Eino(Go 語言智慧體開發框架),來快速開發並上架自己的專家 Agent。
AI 實習生,終於長腦子了
當然,在愛範兒的大部分測試中,釦子空間都能比較準確地理解意圖,生成優質的結果。
最近關稅戰十分熱鬧,我們也讓它來試試這個難題:跟蹤美國在主要對華進口品類上的關稅水平。
Prompt: 近期美國政府關稅政策一天一變,我需要你製作一個能夠即時更新的線上表格,來追蹤自從 4 月1 號以來關稅變化。你需要追蹤中國向美國出口的最主要產品的稅率,比如消費電子裝置、針管、玩具等等,具體有哪些產品你自己去查,查不出來就隨時停下來問我。注意有一些關稅類別是近期新增的,但一些關稅類別是在 2025 年以前就有的,你需要在表格中體現不同關稅類別是如何疊加的,不明白隨時問我。
先來看一下生成的結果:
愛範兒觀察了一下思考過程,發現它對於「關稅」這樣的複雜概念已經有充分的理解,而這和可能和背後所使用的大模型有關。 
最近一個多月裡我們其實用過很多智慧體/MCP 類工具,特別是有些具備 deep research 能力,標榜能夠代替使用者執行復雜任務的產品——處理相同的任務時,卻需要做數十輪搜尋,似乎很用力地在理解使用者到底在說什麼,給人一種用力過猛的感覺,結果卻也並不理想。 
釦子空間總共只進行了六輪思考,其中只有四輪真正用來搜尋和了解關稅種類(剩下的兩輪分別是任務開始的規劃分配,以及任務結尾的網頁生成。) 
生成的結果,從視覺觀感上還是很有說服力的。 
而且能看出來這個 AI 實習生並不是指哪打哪,而是多少動了點腦子,做了一些並不在初始任務要求內,但它認為會有幫助的資料分析。比如列出了今年以來關稅增減的時間線:
做了短中長期分別的影響分析:
還有圖表與文字結合,結構化的呈現方式:
以及最讓我驚豔之處:它把 25 年前基準、「自由日」、「對等」等不同關稅名目的區別和疊加情況,給抓住了。
但錯誤也非常容易發現,比如大部分類別裡的稅率完全算錯了。至於錯誤的原因,我的理解是這個實習生採用純搜尋新聞的方式,容易被錯誤和不及時的資訊帶偏,而非直接到美國政府網站抓取資料。
當然,就算是真人實習生,恐怕也會這麼幹。進出口從業人士以及關稅方面專家才知道獲取最及時、準確數值的方法,這個任務需要的專業知識和經驗遠超實習生水平。 
但這並不代表釦子空間不能化解這個難題:我們可以在開啟「規劃模式」後,在糾偏的時候給它明確的資料來源定義,並且讓它主動呼叫 python/MySQL 或其他程式碼能力,去爬取最準確、真實的資料;或者,我們也可以從權威來源手動下載格式和內容未最佳化的報告,然後再透過官方支援的多維表格擴充套件外掛,來生成任務需要的知識庫。 
釦子空間支援呼叫外部 MCP 工具(正式版),目前已經支援了十多個字節跳動內部以及外部(例如墨跡天氣、高德地圖等)的 MCP 擴充套件。所以理論上,進出口行業專業資料庫提供商也可以開發自己的 MCP 擴充套件,整合到釦子空間裡。這樣再複雜、再無厘頭的關稅進展,也難不倒實習生了。
線上檢視任務回放:https://space.coze.cn/s/PB7iSD1_P34/
再來個純程式碼的小任務,可能有點大材小用了。讓釦子空間來做一個 hello world printer,並且中途修改需求。 
還不會寫程式碼的領導們,終於不用怕員工跑路了:你也可以讓 AI 實習生教你寫程式碼。
線上檢視任務回放:https://space.coze.cn/s/SWefUtObQ_A/
前面這些測試的都還是釦子空間預設啟用的「通用實習生」。 
而在首頁還有「專家 Agent」的入口,目前 beta 階段開放了兩個可用專家,分別是使用者研究專家(釦子官方開發)和華泰A股觀察助手(華泰證券和釦子共同開發)。 
以A股觀察助手為例,它的進入介面和通用實習生略微不同,允許使用者基於自選股和板塊定製日報,也支援一對一諮詢功能,將智慧體變成使用者可以獨享的證券分析師。
這兩個專家 Agent,也是釦子空間的 MCP 擴充套件能力的直接體現。它可以將釦子的大模型與第三方服務提供商的大模型能力放在同一個上下文裡,實現 MCP server 之間的「協作」。
當 AI 從 「工具」 變成 「搭子」:
人機不分工,而是共生進化
傳統大模型產品和工具的能力天花板,決定了它們的主要用途是處理事務性工作,替代重複性勞動(例:文字生成、資料整理和格式化、基礎規劃等);而正如前面提到,智慧體/MCP 整合深度思考、任務拆解與規劃、按步驟自動化執行任務的能力,但這種「全自動」的方式仍然存在弊端。
與前兩者相比,釦子空間提出一種新的思路:在全流程得到真人使用者即時監督的環境下,讓 AI 深度參與到解決問題的完整工作流中,實現人和智慧體的有機協同工作。
AI 實習生」確實是一個挺有趣的類比,它一邊和你協同工作,一邊從你身上學習,逐漸熟悉你的工作習慣和要求,掌握你的目的動機和思維邏輯——每一個優秀的 mentor 都希望自己的實習生能夠成長為獨當一面的全職員工,而這種成長,需要透過聰明的工作方式,和一次又一次的成果交付,才能逐漸獲得。
工具不斷推陳出新,工作方式也因為 AI 變得很酷。但歸根結底,高效穩定地交付成果,才是王道。
從另一角度來看,當 AI 工具的能力和服從性同步提升,每個職場打工人都能隨時召喚自己的 AI 實習生,愈發複雜困難的任務也能夠被輕鬆化解,打工人自己又將何去何從?
或許這既是一次警鐘,也是一次契機,提醒我們應該將自身的精力和時間,轉移到以下兩個方面:一是提高自己操控 AI 工具的能力;二是專注於那些永遠無法被 AI 所取代的創造性和思考性工作。
畢竟,在職場上,稀缺的永遠不是辦事的能力,而是獨到的思考。
當然,那樣的未來還需要時間去實現。現在不妨申請釦子空間體驗資格,讓你的 AI 實習生 / 數字職場好搭子先 「上崗」 試試。
粉絲福利🎁
愛範兒拿到了 30 個釦子空間邀請碼,提供給想要體驗 AI 實習生,甚至建立自己的專業辦公智慧體的朋友。你可以加入到我們的「釦子空間交流群」(見置頂評論),領取福利。
或許,你的工作方式,以及職場生活質量,將迎來巨大的改變。

相關文章