中國大模型如何破圈?開源不能太“獨角戲”,也不是“上傳GitHub就完事兒”

採訪 | 霍太穩
整理 | 宇琪
編輯 | Tina、蔡芳芳
在技術日新月異的浪潮中,“開源”早已超越了單純的技術選型,演變為塑造未來、驅動創新的核心力量與協作哲學。它如何從工程師的工具箱,躍升為抗衡科技巨頭的戰略槓桿?在生成式 AI 掀起顛覆性變革的今天,開源模式又將面臨哪些前所未有的挑戰與機遇?
在 6 月 27-28 日於北京舉辦的 AICon全球人工智慧開發與應用大會上,InfoQ 在現場專訪了 Linux 基金會人工智慧與基礎設施總經理 Mark Collier(柯理懷)。他在採訪中詳細分享了對 AI 時代開源的看法,如何構建團結多元化的社群,以及他眼中開源未來的樣子。
部分精彩觀點如下:
  • 越開放,我們就能取得越多進展。
  • 構建一個真正全球化、具有多樣性的開源社群至關重要,這樣人們才有機會在一箇中立的平臺上平等參與。、
  • 商業限制實質上成了開源 AI 推廣的一個障礙。它會阻礙企業採用,也妨礙整個生態的發展。
AICon 全球人工智慧開發與應用大會將於 8 月 22-23 日首次落地深圳!本次大會以 “探索 AI 應用邊界” 為主題,聚焦 Agent、多模態、AI 產品設計等熱門方向,圍繞企業如何透過大模型降低成本、提升經營效率的實際應用案例,邀請來自頭部企業、大廠以及明星創業公司的專家,帶來一線的大模型實踐經驗和前沿洞察。訪問大會官網或點選文末閱讀原文瞭解最新日程:https://aicon.infoq.cn/202508/shenzhen/schedule
以下內容基於採訪速記整理,經不改變原意的刪減。
Q:從您的個人經歷來看,是哪些具體的經歷或轉折點讓您意識到開源不只是技術選擇,而是一種值得長期投入的事業?
Mark: 我最初從事的是技術崗位,但很快就轉向了商業方向,開始專注於企業發展,主要是跨公司的戰略合作。當時我的主要任務就是促成戴爾、雅虎兩家公司之間的深度合作,幫助雙方建立信任,我逐漸意識到:當兩家公司深度合作、共同開發產品時,創造的價值會遠超單打獨鬥。就在那時,我迎來了職業生涯的關鍵頓悟:兩家企業協同合作所能產生的價值,勝過任何一方的孤軍奮戰。
在雅虎工作的後期,我與一位才華橫溢的同事伊恩·羅傑斯(Ian Rogers)共事。儘管我早期對開源有過一些接觸,但是伊恩讓我真正理解了開源及其社群的重要性。當時我忽然“開竅”了:開源實際上是終極的業務發展與生態構建工具——它不同於傳統的雙邊合作,而是“多邊對多邊”的協作模式,能讓三家、三百家甚至更多主體共同參與。
也正是在這個關鍵時刻,我加入了 Rackspace。當時我參加了一個雲計算會議,WordPress 的創始人 Matt Mullenweg 在臺上說:“如果你想與 Amazon、Google 和 Microsoft 競爭,唯一能獲得真正槓桿效應的方式就是開源。“這番話讓我深受觸動。我剛加入 Rackspace,就立刻提出:我們必須為雲計算制定一個開源戰略,這就是 OpenStack 專案的起點。
背後的信念其實很簡單:如果你想要組織一支能與科技巨頭抗衡的開發者大軍,你不可能把他們全招進一家非萬億市值的公司。唯一的方式,就是共建一個開放的生態系統。這個系統由不同的公司、開發者、個體組成,他們有著共同的使命,想要一起構建一個完整的技術棧,解決同一類問題。正是這些瞬間,真正讓我走上了這條探索生態系統協作和開放合作的道路。
Q:很多知名開源專案,比如 Kubernetes 最初只是為了解決企業內部需求,但開源後卻帶來了超出預期的影響力與價值。您怎麼看 AI 時代的“開源”?它與傳統軟體時代相比,有哪些本質不同?
Mark: 我認為傳統開源軟體與如今的 AI 系統,特別是生成式 AI 之間確實存在一些本質差異。我們在構建社群、促進交流等方面有很多相似的做法,但也必須承認,兩者在核心機制上並不完全一致。最大區別之一在於,生成式 AI 往往是非確定性的。
傳統軟體的運作邏輯是這樣的:你有原始碼,將其編譯成可執行程式,每次執行時的結果都應該一致。這也是為什麼我們強調可重現構建,這構成了傳統開源軟體的供應鏈基礎。然而,生成式 AI 尤其是大語言模型(LLM),本質上是為了每次執行都可能生成不同的結果,這種行為是設計使然,而非異常,這種“非確定性”是很難用傳統軟體工程的方式去理解或建模的。
所以當我們嘗試將開源理念應用到 AI 時,就會發現這不是一種直接對應的遷移方式。從計算機科學或軟體工程的角度來看,這是一個概念上的轉變。它不再是一個“bug”,而是一種“特性”。我最近看到 Google DeepMind 的一次演示中提到,過去我們將模型產生的不準確輸出稱為“幻覺”,這在要求準確性的任務中確實是個問題。但在另一些領域,比如電影等藝術創作中,這種“幻覺”反而更像是一種創造力的體現。
因此,AI 系統與傳統軟體的這些差異,雖然帶來了挑戰,但同時也是它的魅力所在——它具備自發的、湧現式的行為。不過也因此,我們需要換一種思維方式來理解和應用它,而不能完全沿用傳統開源軟體的思路。
Q:在大模型時代,從實用角度看,許多團隊認為用開源權重就能快速微調並商業化落地,哪怕沒有資料或訓練細節,也照樣有效。您為什麼仍堅持強調“完整開源(full open-source)”的重要性?
Mark: 我認為,目前開源軟體與 AI 系統之間並沒有一個完全契合的類比,這也解釋了為什麼“什麼是開源 AI”以及“哪些算是真正開源”這類問題會引發如此多的爭議。說實話,我自己也沒有答案。這場討論之所以還沒有定論,正是因為 AI 系統本身的運作機制與傳統軟體確實不同。但基於我的經驗,我始終相信:越開放,我們就能取得越多進展,這也是我堅定主張開放協作的原因。
我一直倡導應該開放資料集、分享訓練程式碼。但與此同時,我並不是那種“教條式”的開源主義者,不會因為某專案只開放了模型權重,就全盤否定它的價值。哪怕只分享權重,也很有意義。我更傾向於一種務實的態度,把開源看作是一個光譜,而不是非黑即白的定義。
就我個人而言,我會鼓勵更開放的資料共享,但我也理解在某些情況下企業無法這麼做。比如資料中可能包含隱私資訊,或者是用於醫療診斷的訓練資料,這類資料公開會帶來倫理或法律風險。但我們也不希望模型的能力因此受限,只因為我們拒絕使用那些真正有價值的資料。所以,這裡確實還有很多討論空間,我在這個問題上更願意保持一種包容和現實的立場,而不是一味堅持“絕對開源”的立場。
Q:Meta 的 LLaMA 系列廣受歡迎,但其許可協議對商業使用有限制。您如何評價 LLaMA 的這種“開源”形式?是否應該為這類模型設立新的標籤,比如“開放可用”而非“開源”?
Mark: 以目前的許可證形式來看,LLaMA 模型並不符合任何對“開源 AI”的合理定義。不過,這個問題的核心不只是程式碼本身,還包括訓練資料的開放性。
資料是否開放,其實是目前討論得還不夠多的話題。所以,我很高興你提到了“商業限制”這個角度。舉個例子:如果你是一家公司,打算把某個開源模型的權重整合到產品中,那麼你就必須非常注意它的許可證條款。假如許可證裡寫著“禁止商業用途”,即便我是個非律師,我也會非常猶豫要不要在商業產品中使用這樣的模型。
從研究的角度看,LLaMA 模型的釋出確實推動了進展。研究者們可以檢視模型效能,與其他開源程度不同的模型進行對比和基準測試,這是好事。但我認為,商業限制實質上成了開源 AI 推廣的一個障礙。它會阻礙企業採用,也妨礙整個生態的發展。
我經常呼籲 Meta 能在許可協議上走向更開放的方向,去除商業用途限制。但現實是——這是一個競爭激烈的世界。如果出現了像 DeepSeek 這樣沒有商業限制的模型,並因此獲得大量關注和廣泛應用,那些採用更嚴格許可協議的實驗室和公司自然會面臨壓力。他們就需要作出選擇:是順應市場趨勢更開放?還是繼續堅持甚至收緊現有策略?這終究是各方的自由選擇。
不過我確實認為,商業限制不利於構建開放生態。我們希望企業能在生產環境中使用這些模型,執行它、測試它、反饋問題,而不是僅僅當個旁觀者。限制越多,參與越少,社群就越難壯大。
Q:隨著 Agent 相關的技術堆疊逐漸形成新一層“基礎設施”,它是否會像 Kubernetes 一樣成為下一個開源平臺?Linux 基金會準備如何參與?
Mark: 最近我一直在思考一個比 Agent 更廣的概念,那就是“AI 原生計算棧(AI-native computing stack)”,它包括訓練、推理以及 Agent 等多個部分。我認為在 AI 系統中,推理是整個棧的核心。訓練階段雖然重要,但在部署和執行模型時,推理就是實際執行時的執行環境。而當你在做 Agent 系統時,其實這些 Agent 本質上正是基於正在執行的推理系統在工作。因此,這幾個部分是無法被徹底分割的,尤其是 Agent 和推理之間的聯絡非常緊密。雖然在實際工作中,它們可能由不同團隊負責,但從系統架構和思考方式上看,我們必須整體性地理解和設計這個系統。
關於你提到的 Linux 基金會可以扮演什麼樣的角色,我認為我們可以從 Kubernetes 所在的 CNCF(Cloud Native Computing Foundation)的發展中找到經驗。當初 CNCF 在推動 Kubernetes、Prometheus 等專案的同時,也非常重視標準的建設,比如 OCI 容器格式等,這些標準在早期構建生態過程中起到了關鍵作用。
如今,在 Agent 領域我們也看到類似趨勢。例如 MCP,以及 Google 推出的 Agent-to-Agent(A2A)協議等標準。在 A2A 的案例中,他們幾天前剛剛宣佈將該協議納入 Linux 基金會旗下。Linux 基金會在推動標準制定、搭建中立治理結構、構建開放社群等方面經驗豐富,並且致力於打造一個“人人可參與”的大平臺。
所以我認為,Linux 基金會未來將在 AI Agent 和推理系統標準化方面發揮越來越重要的作用。我們目前正在積極倡導這一方向,也邀請更多人加入這項工作。當然,還有很多事情要做,但 A2A 納入基金會的訊息是一個積極訊號,說明我們已經邁出了正確的第一步。希望接下來能形成滾雪球效應,逐步構建起一個更有凝聚力和影響力的全球協作生態。
Q:百度、智譜、阿里等陸續開源大模型,但目前海外社群參與度仍有限。你怎麼看中國在大模型開源方面的進展?要走向國際,最需解決的挑戰是什麼?
Mark: 回顧我們過去的經驗,可以帶來一些啟發:構建一個真正全球化、具有多樣性的開源社群至關重要,這樣人們才有機會在一箇中立的平臺上平等參與。這些做法和策略在過去已經被驗證有效,我相信我們可以再次複用。歸根結底,這一切都與“信任”有關,而“透明”是建立信任的基礎。若能為這些合作活動提供一箇中立的歸屬平臺,將有助於進一步強化這種信任關係。
我在全球各地走訪時,能感受到外界對中國 AI 創新的高度認可。黃仁勳前幾天也說過,現在全球一半的 AI 研究人員都在中國。尤其是中國的一些開源模型,無論是開放權重還是開放介面,都讓全球研究者和開發者得以使用和研究,這本身就是一個非常好的開端。
關鍵是:我們如何在已有勢能的基礎上繼續推動?我沒有全部的答案,但歷史經驗已經告訴我們,如果一個專案雖然“開放”,但只由單一廠商主導,雖然比閉源強,但仍然難以實現真正的全球參與。所以我們必須想辦法讓更多外部貢獻者加入進來——不只是別的公司,也包括來自其他國家的參與者。
只要起步了,就可以逐步擴大。如果模型只是由一個公司在內部開發,然後釋出出來,比如放到 GitHub 或 Hugging Face 上,這樣確實會帶來使用者,但不會帶來開發者和貢獻者。我們稱這種方式為“把東西扔過牆”,它並不利於建立參與感。因此,如果我們能朝著更開放的設計、更開放的開發流程,以及更多企業間協作的方向邁進,就會看到哪怕是微小的進展,也可能迅速演化為真正的全球生態系統,關鍵是要邁出第一步。
Q:在大模型時代,很多“開源”專案其實難以復現、難以修改,門檻很高。你會給年輕開發者或學生什麼建議?他們該如何從使用者成長為貢獻者,甚至核心維護者?
Mark: 在開源社群中,其實有很多種方式可以參與貢獻。從小處開始非常重要,不管是提交一個 Bug 修復,還是參加一次社群活動、認識其他開發者,都是參與的起點。很多社群都有導師計劃,比如 OpenInfra Foundation 就設有連線導師與學員的專案,我們也看到不少參與者在掌握了基本的開源協作技能後,成功找到了工作。這類專案,尤其是與大學合作的計劃也很多,OpenInfra Foundation 現在也已經併入了更大的 Linux Foundation,他們也在推動類似的大學合作計劃。
參與的方式也不侷限於程式設計。有時只要在 Discord、IRC 或 Slack 這些線上社群中露個面,甚至到線下的技術聚會去,就能有很好的交流機會。其實,比起那些動輒上千人的大型會議,有時候本地的小型聚會反而更容易建立真實的連線。例如全球範圍內舉辦的 Kubernetes Community Days 或 OpenInfra Days,都是很好的參與場景。
很多時候,一個小小的貢獻就足以開啟參與之門,比如整理文件就是一個極好的例子。對於開發者來說,程式碼審查的需求也非常大——在你還不熟悉專案結構、不準備提交程式碼之前,完全可以先試著參與程式碼審查,這其實也是一種極其重要的貢獻。我們稱這種基礎性的工作為“砍柴挑水”,聽起來不起眼,卻是維繫社群健康運轉的關鍵。找準一個你能幫上忙的點,抱著“我來幫忙”的態度進入社群,大家通常都會非常歡迎你。哪怕是最小的貢獻,在剛起步階段也絕不微不足道,而且它是一個可以逐步積累並擴充套件的開始。
會議推薦
首屆 AICon 全球人工智慧開發與應用大會(深圳站)將於 8 月 22-23 日正式舉行!本次大會以 “探索 AI 應用邊界” 為主題,聚焦 Agent、多模態、AI 產品設計等熱門方向,圍繞企業如何透過大模型降低成本、提升經營效率的實際應用案例,邀請來自頭部企業、大廠以及明星創業公司的專家,帶來一線的大模型實踐經驗和前沿洞察。一起探索 AI 應用的更多可能,發掘 AI 驅動業務增長的新路徑!

相關文章