就在前幾天,位元組旗下的產品 釦子 Coze 也上線了自己的 Agent 產品,叫做 Coze Space 釦子空間。花了幾天做測試,跟各位分享下體感。
我們又多了一個實習生
從使用體感來說,Coze Space 的使用方式和基礎互動,跟別的 Agent 是差別不大的。
從細節來說,有這麼幾點差異。
第一,雙模式。
Coze Space 可以選擇使用兩種模式。分別是探索模式和規劃模式。
簡單的理解是,探索模式是一站式幫你把任務搞定。而規劃模式則要有中間步驟,你可以修改工作的內容,防止中間就跑偏了,浪費資源。
比如在這個工作流出現的時候,會讓使用者確認一步。

如果是規劃模式,執行中間,Agent 也會反覆確認,以便繼續進行:

第二,外掛能力。
Coze 釦子並不是位元組新出的產品,釦子宇宙裡,之前就有開發平臺、羅盤和 Eino 框架。所以在這些積累之上,有一些 Agent 原本的能力,尤其是外掛能力。
目前可新增的擴充套件包括高德地圖、飛書生態、天氣、影像、語音、文件等等。

這樣使用者可以自行選擇使用的擴充套件外掛,能力也就有增強了。
比如,可以呼叫高德地圖的 API,就能得到地點的準確資訊:

又或者直接生成一段短播客:
相較於單純的開啟瀏覽器獲取資訊,外掛的能力會更加精確、成本更低。只是現在的外掛還不算多,但也看到了未來的機會。
具體效果,後面會聊。
我讓 釦子空間 完成了 9 個任務。給每個任務做出了個人很主觀的評分。可以先說一下總分:

接下來是詳細的任務情況。其中的連結有全部的過程回放,各位都可以複製貼上到瀏覽器自行檢視。以證明內容均是可靠真實的。
任務 1:
「設計一個網頁,可以從調色盤上選擇 4 種顏色,使用者選擇完之後,可以自動生成一張以 4 種顏色為主色調的圖片」

這是我自己的一個痛點,用幾個顏色生成一張桌布。
Agent 不僅理解了我的意思,還非常體貼地給出了很多自定義的部分,還有預覽圖。每次生成也都是隨機的。
再欣賞幾個:



效果十分驚豔,是我試過的任務中最滿意的。給出唯一一個滿分 10 分。
大家也可以從連結試一下:reurl.cc/yRL31q
評分 :10/10
對話回放地址:space.coze.cn/s/JEIKYQAPeVI
任務 2:
「用高德地圖來幫我規劃一個去青海大環線的自駕遊,完成一個網頁,配備豐富的景點圖片。」



這次的完成度挺高的,呼叫高德介面的威力就顯現出來了。另外首頁上的行程圖是自己生成的,根據我說的出發地來設計的,這有點意外。
已經能到達可用的地步,同時美觀度有相當的加分。
評分:8/10
網站地址:reurl.cc/gRGqqQ
對話回放連結:space.coze.cn/s/oDkZemIjWM8
任務 3:
「幫我生成一期 10 分鐘的播客,講述今天的美股要聞,並且模擬兩個人的聲音對話,有一些觀點對立」
這屬於擴充套件外掛的簡單體驗。
可以直接生成一段內容。美股的資訊總結得還可以,聽感也還行,多數語句能夠以假亂真。只是本來要求的對話,實現得不太好,還是一個人在唸稿子。
另外,其它試用音訊的操作都不是很成功,看來呼叫外掛還不穩定。
評分:7/10
對話回放地址:space.coze.cn/s/0tgECMGcdE4
任務 4:
「製作一份詳盡的、可讀性強的中文網際網路的播客行研報告,以 PPT 形式展示。」


怎麼說呢。依賴於獨立生成的排版和圖片,PPT 的效果乍一看還行,但是內容有點拉胯,不太可用。要用的話,只能說提供了一個模板吧。
評分:5/10
對話回放地址:space.coze.cn/s/1oStTC8nfEk
任務 5 :
「我是半拿鐵的主播劉飛,我要做一期播客的逐字稿,主題是博世的歷史故事,幫助我整理一份詳盡的稿件,我來做錄製。」

這個不算是現在 Agent 的長項。在用過幾個 Deep Research 之後,深刻體會到 AI 協助做複雜資訊的處理的快樂。
而 Agent 的最大優勢還是在完成一些單純資訊處理之外的工作。
評分:4/10
對話回放地址:space.coze.cn/s/RXpjjSqGsnY
任務 6:
「完成一個 2048 遊戲,遊戲裡的美術設計都使用合乎邏輯的海賊王角色和海賊王的元素。」

這個效果也很意外,完全按照要求完成了。並且能玩。大家可以體驗一下也。
一句話就能做個小遊戲,時代真的變了…
哦有個小問題,烏索普用的頭像是錯的,用成了路飛。扣分。
評分:9/10
玩遊戲的地址:reurl.cc/RYqZj6
對話回放地址:space.coze.cn/s/PlWwe7F-XE0
任務 7:
「設計一個包含了 10 個題目的心理測試程式,測試結果為海賊王裡的幾個性格鮮明的特定角色,看使用者跟哪個角色的性格最接近。題目是單選題,角色也由你來制定。網頁裡要設計優良,最後的角色有頭像。評測結束頁面,要有語音介紹一下,使用者的性格特色」


也是一句話生成的遊戲,完成度也可以。尤其最後結果頁面的效果,是真的不錯。
本來想測試擴充套件外掛裡的音訊生成,發現呼叫效果有問題,不出聲音。
評分:8/10
測試網站地址:reurl.cc/pa3kGZ
對話回放地址:space.coze.cn/s/k1Xrr6rqG90
任務 8:
「根據飛書文件裡我的文章的風格,幫我寫一篇在 2000 字左右的公眾號文章,並且起一個有意思的標題」


可以看得出來,內容的處理上比較規規矩矩。釦子空間的優勢在於,視覺的呈現效果好了不少。其中的格式排版,以及那些小圖示,都做得不錯。
評分:5/10
對話回放地址:space.coze.cn/s/Wp3B7yTV23E
任務 9:
「我是產品經理和播客主播劉飛,幫我製作一個內容豐富的個人主頁。」


跟前面的播客報告一樣,亮點是做的排版,結構,還有「自作主張」的配圖和表格。但問題也類似,內容只是盲目填充,缺乏一定的邏輯。
評分:5/10
對話回放地址:space.coze.cn/s/XkTYbiKa-XI
——
最後,再說幾句。
由於有新的擴充套件,這次的可玩性又有了進一步的提升。像生成桌布那種小工具,效果驚豔。我們都可以用簡便的方法去完成一個小工具、小遊戲,甚至不需要看到程式碼頁面。
從穩定性而言,作為位元組大廠出品,能明顯感覺到不會輕易崩掉。不過,Agent 的普遍問題依然存在,即輸出的效果不夠穩定,也會存在各種幻覺,結果裡邏輯性欠佳。
樂觀的方面在於,釦子空間的使用場景再次拓展了。大廠入局,也是一個里程碑。大家可以用更強的算力、更低的成本去體驗 Agent 的場景。使用者提供的真實 case 本身也是一種當下快速創新階段的競爭力。
這麼看,我們離賈維斯,也越來越近了。

——
對了,手頭還有一些釦子空間的邀請碼。評論區留言,我會選出一些朋友送出。
題圖由 Midjourney 繪製。