

7 月 26 日,位元組將 AI Agent 平臺「釦子(Coze)」旗下最核心的兩個專案—— Coze Studio 與 Coze Loop 正式開源至 GitHub,並採用開放程度更高、可自由用於任何商業用途的 Apache 2.0 許可證,無任何附加條款。開源僅兩天,專案已在 GitHub 上收穫超過 6K star。
“事實上,在釦子專案啟動之初以及去年年中,內部都曾討論過開源的可能性,但當時我們認為時機尚未成熟。如今,我們認為已迎來開源的良好契機。”釦子業務負責人對 InfoQ 說道。
釦子從 2023 年海外試水起步,去年 2 月正式上線國內版。國內 據非凡產研資料 顯示,截至 2025 年 6 月,釦子的月訪問使用者數達到約 458 萬。擁有如此使用者體量的平臺選擇開源,這一決策的達成並不容易。期間,團隊內部透過定期審視與深度討論,不斷評估相關事項。
關於開源策略的主要爭議點集中在兩方面:一是開源對釦子意味著什麼;二是開源後長期如何與社群協作。對於這些問題,釦子負責人坦言,“目前我們尚無法給出百分之百確切的答案。不過團隊已就相關問題的應對思路形成了基本共識。”
釦子開源的決定過程,本質上折射出了 Agent 迅速變化的發展趨勢。
相較於去年行業對 Agent 定義及應用前景的模糊認知,如今 Agentic AI 理念已被普遍接受,並在多個領域已有原型應用。面對激烈的競爭,業界達成了更廣泛的共識:未來的 Agent 生態必將由成千上萬的開發者共同定義,而非由單一公司主導。
這意味著封閉平臺很難滿足生態爆發的需求。開源是直接獲取全球一線開發者反饋、程式碼貢獻以及寶貴創新思想的最佳路徑,可以充分挖掘尚未被發現的多樣化需求。
與此同時,一個真正可用的 Agent 的構建門檻仍然較高。雖然今年湧現了來自創業公司和大廠的約數十個 Agent 專案,涵蓋通用型與垂直領域,但市場需求遠未滿足——各行各業的企業使用者都期望開發定製化 Agent,來提升工作效率或實現商業轉化。然而,開發壁壘阻礙了這一程序。
從釦子對使用者畫像的預期和現實對比,也可以看出降低門檻的現實意義。釦子的使用者大致可以分為三類:熟練掌握各類開發技能的專業開發者; 擁有明確需求並能理解開發邏輯、可透過程式設計解決問題但不擅長編碼的準專業使用者;對程式設計概念和語言一無所知的零基礎使用者。
釦子最初的目標使用者是專業開發者和準專業使用者。但實際運營資料顯示,當前使用者群體中專業開發者、準專業使用者與零基礎使用者的比例接近 1:1:1。基於此,降低產品門檻必然是下一階段的重要任務之一。
以釦子當前最核心功能之一的工作流來說,建立工作流仍存在一定門檻,現在可以自主編寫工作流的人群主要還是專業程式設計師、產品經理與運營人員和技術愛好者。對此,釦子團隊正在努力讓工作流變得更加易用,具體包括:支援自然語言生成工作流、簡化工作流節點設計以及讓複雜難懂的概念更易於理解等。
釦子團隊也觀察到當前 Agent 生態熱鬧但同質化與碎片化問題嚴重的情況。“行業存在一定的浮躁,部分公司急於釋出產品,卻忽視了實用性,導致許多 Agent 僅停留在‘能聊幾句’的演示階段。‘做出一個 Agent’到‘做好一個 Agent’之間存在顯著差距。”
釦子團隊希望透過開源吸引更廣泛的開發者,包括非程式設計師和非科技公司,快速將行業知識轉化為 Agent 應用,豐富生態。同時,透過開放 LLMOps 工具引導開發者更加重視 Agent 的可靠性、穩定性和可觀測性,推動領域從“能做”到“做穩、做好”,再向工業級、生產級標準邁進。
事實上,團隊更是想透過開源將釦子打造成為 Agent 開發領域的基礎設施和事實標準。
“當前 Agent 生態在開發正規化、外掛介面、能力定義等核心環節尚未形成統一標準。去年底釋出的 MCP 在業內反響強烈,印證了市場對標準化能力呼叫的廣泛需求。然而,此類標準主要解決了能力呼叫環節,其他諸多介面與規範仍有待定義。”釦子業務負責人表示,“我們期望經過大規模實踐驗證的扣子體系,能夠成為社群廣泛採納的事實標準之一,這將促進不同 Agent 之間的互操作性及元件複用,有效減少行業的重複建設。”
在多輪深入討論後,團隊內部達成共識:贏得 Agent 時代的關鍵在於贏得開發者,而擁抱開源是贏得開發者的最佳方式。
在今年年初一次關鍵討論後,團隊最終決定將釦子開源,併為此組建了專門的團隊,投入近半年時間進行程式碼重構、文件完善和社群基礎設施準備,終於邁出了開源這一步。
針對開源專案十分關鍵的開源許可協議,團隊經過多番考量後選擇了 Apache 2.0,這既是對專案開放性的保障,也進一步映證了團隊希望借開源將釦子打造為事實標準的野心。
作為當前最流行的商業友好型許可證之一,Apache 2.0 許可既符合 OSI(開放原始碼促進會)認可的開源定義,也符合社群對開源的共識,因此最容易被全球開發者廣泛理解和接受。相較於有更多限制的許可證,Apache 2.0 許可證不對下游使用者(無論是個人開發者、創業公司還是大型企業)設定任何商業化限制,這意味著任何人都可以在開源釦子的基礎上構建自己的應用、服務,甚至是商業化的 SaaS 產品,而不必擔心許可證帶來的法律風險或商業限制。
此外,Apache 2.0 許可證對社群貢獻者也非常友好,有明確的專利授權和終止條款,能確保貢獻者受到保護,同時避免潛在的專利爭議。這也有助於增強社群開發者的信任,釦子團隊希望藉此吸引更多人參與貢獻,鼓勵社群自由修改和擴充套件開源版釦子的功能,最大程度地便利開發者參與,從而形成一個良性迴圈的開源生態。
此次開源的是釦子最核心的兩個專案:Coze Studio 與 Coze Loop。
Coze Studio 開源的核心功能包括:
-
完整的工作流(Workflow)引擎:這是釦子團隊投入最大精力構建的核心元件。本次開源涵蓋了工作流引擎所有節點及編排邏輯。開發者可直接在視覺化介面上進行拖拽操作,使用現有功能或進行二次定製與開發。
-
外掛(Plugin)核心框架:開放了外掛的定義、呼叫和管理機制,開發者可以便捷地將任何第三方 API 或私有能力封裝成外掛,無限擴充套件 Agent 的能力邊界。
-
開箱即用的開發環境: 只需一鍵部署,即可獲得一個功能完備的 Agent 開發平臺,包括建立、除錯、版本管理等全套介面,開發者可以專注於創造本身。
Coze Studio 的 GitHub 專案地址:https://github.com/coze-dev/coze-studio
此外,智慧體開發面臨的核心挑戰還在於模型輸出的不確定性及可能產生的幻覺。開發者自行測試時效果尚可的智慧體,一旦面向真實使用者,往往會暴露出諸多問題。這種不確定性是當前智慧體落地應用的主要痛點。為此,這次釦子同步開源了 AI Agent 全生命週期調優平臺 Coze Loop,專注智慧體開發和調優,可以做到效果評測、線上觀測和最佳化迭代的閉環。
Coze Loop 開源的核心功能包括:
-
Prompt 開發: 提供從編寫、除錯、一鍵最佳化到版本管理的系統化能力;
-
多維度評測:提供系統化的評測能力,能從準確性、簡潔性、合規性等多個維度,自動化地評估 Prompt 和 Agent 的輸出質量;
-
全鏈路可觀測性:提供覆蓋全過程的視覺化觀測能力,詳細記錄每個環節的處理細節與狀態,讓 Debug 不再是大海撈針。
Coze Loop 的 GitHub 專案地址:https://github.com/coze-dev/coze-loop
總體來看,釦子的開源整體上是“立體化”的:同時開放了上層編排邏輯和底層框架。

不同於從開源起步的專案,釦子是在商業化產品成熟後才決定開源。這其實給開源版釦子帶來了獨特優勢:其開源的工作流引擎、Agent 編排邏輯均經過位元組內部大規模驗證,可直接用於生產環境。
開源版釦子主要面向個人開發者、技術愛好者,以及處於技術預研和概念驗證階段的企業開發者。
在核心構建能力上,開源版釦子對企業使用者沒有限制,限制主要體現在一些附加的企業級功能和服務上,比如整個租戶管理體系未開源、面向企業提供的彈性擴充套件功能也未開源。這些功能是為了滿足大規模、高要求的企業場景而提供的增值服務。
對於這一決策,釦子業務負責人向 InfoQ 解釋道,當企業需要大規模部署應用時,例如基於開源版本構建日活躍使用者數達千萬級別的應用,理論上雖然可行,但實際會面臨顯著的二次開發成本。這些成本主要源於企業級應用所需的支撐能力,例如租戶管理體系、高併發處理能力等,這些需求超出了開源併發框架本身提供的能力範疇。
更深入來說,一方面,團隊要確保開源專案對開發者足夠友好、易於部署。許多企業版能力與字節跳動內部系統及其提供的雲服務存在深度耦合,將這些功能包含在開源版本中,反而會降低專案的開發者友好性——使用者可能需要依賴較重的外部服務資源才能使用它們。因此,團隊選擇將這些功能解耦,確保開源版釦子更易於開發者獨立部署和執行。
另一方面,開源版釦子還承擔了引導大型企業使用者放心採用商業化版本的作用。
在釦子團隊看來,開源版釦子透過有效展示核心價值,可以提升向功能更全面、服務更完善的企業版轉化的可能性。另外,對於需要連線企業內外部資料的 Agent 應用而言,信任至關重要。“開源意味著我們將核心程式碼邏輯向社群公開,這是建立信任最徹底且高效的方式。開發者和企業能夠充分審計程式碼,確保其安全可靠,這也有力地支撐了我們的商業化落地。”
據瞭解,開源版釦子的定位是整個釦子產品體系的基石與生態入口,團隊版和企業版則是服務企業客戶的商業化引擎。釦子內部對不同版本的定位如下:
-
開源版: 面向個人開發者與技術愛好者,是產品體系的核心引擎。它提供完整的智慧體開發、除錯與執行環境,核心價值在於技術賦能與生態構建。
-
團隊版: 面向中小企業及開發團隊。在開源版基礎上,增加了雲端託管、多人協作、團隊資源管理等,使團隊無需自行部署運維,註冊後即可在雲端快速開發。
-
企業版:面向中大型企業及對安全合規有更高要求的客戶,提供最全面的功能,包括單點登入(SSO)、更嚴格的許可權管理、審計日誌、高階人性化特性等,滿足企業級應用需求。
釦子業務負責人稱,“團隊承諾將實現‘內外同源’,即確保商業化版本與開源版本保持同步。”這意味著商業化版本與開源版本共享同一套核心程式碼庫,所有針對核心鏈路的最佳化與改進都會即時同步至開源版本,同時團隊不用再單獨分配大量人力維護開源分支。
現在使用者在釦子上建立智慧體,支援選擇是單智慧體還是多智慧體,這種劃分的形成是使用者多樣任務需求和期望的產物。單智慧體對話流(預設劇本式)會設定固定節點,適用於流程固定任務(如客服、查詢、預訂),特性是高穩定、可控,但無法處理預設外任務;單智慧體自主規劃模式(個人助理式)只需使用者設定目標,智慧體會動態規劃,適用於開放式任務,如資訊研究,支援複雜非預設路徑,但穩定性與效能受限;多智慧體協作(專案團隊式)需建立分工智慧體並由排程中心協同,適用於需多角色協作的複雜任務。
本次開源會涵蓋上述全部模式,釦子還計劃在第三季度對開發模式進行重大升級,核心目標是實現開發更簡單、能力更強、執行更穩定。
如何評判釦子開源是否成功,也是早期團隊討論較多的核心議題之一。釦子業務負責人表示,釦子開源成功的標準是多元的,具體會從以下三個維度來看:
-
基礎活躍度指標,包括但不限於開源社群(如 GitHub)的常見資料,如 Star 數、Fork 數、下載量,以及社群內的活躍使用者數、討論熱度等。這些指標反映了專案的初步吸引力和基礎活躍程度。
-
生態貢獻度指標,這是衡量開源生態是否真正繁榮的關鍵。釦子團隊觀察到部分專案將開源僅視為宣傳手段,而忽視生態建設,這違背了開源精神,因此釦子高度重視社群的實質貢獻,具體包括:社群貢獻的外掛數量與質量;外部程式碼貢獻者數量及其提交的 PR 質量。這些指標能有效反映專案的活力、技術深度及社群的協作參與程度。
-
行業影響力指標,這也是釦子團隊的終極目標,主要考察:基於釦子(包括開源版和商業版)構建的有影響力的 AI 應用或智慧體的數量;開源版釦子在企業生產環境中的實際採用率;開源對商業轉化的健康促程序度等。
在釦子團隊的預期中,開源能增強使用者對釦子的信任,從而自然引導更多企業使用者採用其功能更完善、服務更全面的商業化版本,這本身即是開源模式成功的重要驗證。
“當開發者社群普遍將釦子視為構建智慧體的首選平臺時,我們即認為其開源取得了成功。”釦子業務負責人說道。
在大模型技術發展初期,Agent 平臺的核心競爭力主要取決於模型本身的效能:模型能力越強,產品體驗自然越優。然而 ,隨著模型能力的持續演進並逐漸趨同,Agent 平臺的核心競爭力已轉向平臺的編排、整合與工程化能力,核心在於如何使大模型更穩定、高效且低成本地使用工具並連線外部世界。
釦子業務負責人表示,與市面上的其他同類產品相比,釦子能提供完整的開發、運維與分發全流程解決方案。相比之下,許多僅專注於單一環節的產品,如僅支援前端開發的低程式碼工具,難以支撐構建完整的帶後端程式的應用,更無法滿足生產環境需求。釦子支援開發者在單一平臺內流暢完成從創意構思到生產上線的全部環節。
如今,釦子的目標是真正服務企業生產環境,因此在編排引擎的穩定性、高併發處理能力、精細化控制與除錯等方面進行了深度打磨,具備顯著優勢。此外,釦子採取開放相容的態度,不繫結特定廠商模型,廣泛支援全球多樣化的模型與工具,將選擇權充分賦予開發者。
據介紹,上線至今,釦子架構最大的轉變是從緊耦合的 SaaS 應用演進為模組化、服務化的 AI PaaS 平臺。
從上線以來,釦子團隊廣泛吸納了來自國內外社群的反饋,包括大量關於 API、私有化部署、定製化的問詢。團隊注意到,國內眾多大型企業已在高頻使用釦子,這讓團隊意識到,釦子的價值不僅限於 SaaS 產品,更具備成為 Agent 開發 PaaS 平臺或 AI 開發基礎設施的潛力。
早期,釦子的功能高度耦合,難以靈活擴充套件。隨著企業客戶越來越多,團隊迅速意識到:過往開發者多將平臺用於概念驗證或構建 demo,但越來越多的使用者希望將構建好的工作流直接部署到生產環境,其中不乏日活使用者百萬甚至千萬級別的企業。
龐大的使用者量對釦子的高併發處理能力構成了嚴峻考驗。因此,去年下半年起,釦子團隊在支撐企業級應用生產環境部署方面進行了重點最佳化,透過大規模解耦重構來確保架構各層均能滿足企業生產環境要求。
當前釦子的架構已透過大規模生產驗證:引擎可支撐日活數萬至數千萬級應用,成功服務位元組內外眾多客戶,處理高併發與海量日均呼叫;宏觀上遵循標準化的模型呼叫鏈路,微觀層面實現深度解耦,如模型與外掛解耦,支援多模型與多外掛的低成本、無縫切換與動態組合,提升工程靈活性。
當前,釦子的核心架構可以分為四層:
-
模型層,透過統一介面和管理體系,適配市面上主流大模型,如豆包大模型、DeepSeek 等第三方模型,負責統一路由、排程與精細化管理,並整合 PagedAttention、KV Cache 等技術,最佳化生產環境中的模型推理成本與效能,該層的能力建設投入巨大。
-
能力層,提供構建智慧體的核心工具集,包括外掛系統、知識庫、上下文管理及資料庫支援,確保 Agent 具備靈活的能力擴充套件性。
-
編排層,為核心引擎,包含兩大核心模組:支援工程化編排的工作流引擎和實現基於模型的自主化編排意圖驅動引擎,該層是釦子的核心驅動力。
-
應用層,透過標準化 API 整合、提供 UI 元件庫等方式,支援開發者將 Agent 無縫嵌入各類應用如飛書、微信公眾號等。
儘管模型能力會持續演進,但在釦子團隊看來,始終會存在模型自身難以完成的任務。實際應用僅依賴基礎模型呼叫往往是不夠的,而是需要整合多種工具,另外構建效能優異的智慧體需要進行大量除錯工作,這正是專業工具的價值所在。
“這些任務需要沉澱在類似釦子這樣的平臺上,透過平臺固化的能力、流程或協作模式來解決。只是,模型能力覆蓋特定任務的時間點會因技術發展階段不同而有所差異。因此,避免被‘卷掉’的關鍵在於深刻理解並解決特定使用者群體在特定流程中的真實痛點,構建模型難以替代的平臺價值。”釦子業務負責人說道。
在其看來,智慧體賽道今年才真正起步。去年行業焦點在聊天機器人,比拼的是對話內容的吸引力和契合度;而今年智慧體的核心價值在於能否在使用者真實工作場景中完成特定任務,並且是高效可靠地完成。
那麼,如何將“勉強可用”的智慧體提升至“真正實用”的水平?釦子的核心解決思路有三點:
-
一是摒棄泛化、定義模糊的“通用智慧體”概念,深入特定領域與具體場景,構建針對性強的智慧體;
-
二是配備“釦子羅盤”類運維工具,精準診斷智慧體問題。智慧體的構建與最佳化必須透過反覆的測試、評估和調優,才能將其能力從及格的 60 分提升至優秀的 90 分;
-
三是持續洞察使用者需求,透過迭代調優(如增減工具、最佳化邏輯),逐步擴充套件和完善智慧體的能力邊界,最終實現能力的深度覆蓋與複用。
雖然技術熱門方向一直在快速變化,但釦子團隊認為這些“均在釦子產品初始規劃的技術框架考量範圍內。”
具體而言,無論是外掛機制還是上下文工程,都屬於釦子現有框架的組成部分。“無論 MCP 或上下文工程等我們都有較為完備的技術儲備。當然,我們始終保持開放態度,密切關注未來可能出現的新技術趨勢或應用模式。如有必要,我們將積極響應並跟進,確保釦子始終作為最前沿的智慧體開發平臺。”
未來 6-12 個月裡,在釦子團隊看來有兩個趨勢是確定的:模型能力將持續進步,這將解鎖更多應用場景與使用方式;更多企業將產生對 Agent 或 AI 應用的需求,AI 行業滲透率持續提升。
圍繞上述趨勢,釦子將重點推進三大戰略方向:
-
持續提升核心模型推理與整合引擎的技術水平,具體包括針對市場主流模型(閉源與開源),提供無縫適配與深度最佳化;持續最佳化引擎效能、穩定性,並降低模型使用成本;
-
大幅降低開發門檻,使非技術背景使用者也能輕鬆上手,包括進一步簡化工具、降低學習曲線;豐富官方外掛庫及除錯工具,提升開發便捷性等。
-
建立有效的開源貢獻者激勵機制,吸引開發者共同貢獻,將釦子打造成為開發社群中繁榮且健康的標杆專案。
能夠自主執行、協同完成複雜任務甚至超越當前人類能力,這既是智慧體未來發展的目標,也是行業高度期待的方向。但在達成目標的路上,智慧體仍面臨諸多持續性挑戰,比如:如何確保智慧體的行為符合預期、避免發生不可預見的偏離;當前 AI 僅應用於生產環節的有限部分,隨著未來用量激增,如何有效控制並進一步降低其執行成本?還有諸如長鏈條推理和複雜規劃的任務的能力突破、確保智慧體呼叫介面可信等問題都有待解決。
面對各種挑戰,開源只是釦子在前進路上的一大步。開源版釦子能否真正實現團隊預設的目標、這次開源大動作會讓 Agent 平臺之爭如何演變?不妨保持期待。
本文為 InfoQ 獨家原創報道,未經授權請勿轉載,如摘錄引用需明確註明出處。
首屆 AICon 全球人工智慧開發與應用大會(深圳站)將於 8 月 22-23 日正式舉行!本次大會以 “探索 AI 應用邊界” 為主題,聚焦 Agent、多模態、AI 產品設計等熱門方向,圍繞企業如何透過大模型降低成本、提升經營效率的實際應用案例,邀請來自頭部企業、大廠以及明星創業公司的專家,帶來一線的大模型實踐經驗和前沿洞察。一起探索 AI 應用的更多可能,發掘 AI 驅動業務增長的新路徑!
