


就拿百度來說。前段時間,百度緊鑼密鼓做了3件事:
第一,宣佈文心一言4月即將全面免費。第二,文心下一代模型,也要開源了。第三,百度搜索整合了文心大模型和DeepSeek-R1深度思考模式,升級了百度APP。



(圖片可上下滑動)
這一套組合拳,有點精彩。
因為,去年世界人工智慧大會上,李彥宏還說開源是“智商稅”。到了今年,在2月百度財報電話會上,百度搖身一變成了開源的支持者。現在,已然成了踐行者。
所以不怪有網友評論:“那個堅定的開源反對者,也開源了。”
不只是百度。豆包、崑崙萬維、通義千問等等大模型,不是在“開源”,就是在“開源”的路上。還有許多公司,比如華為、騰訊、京東,也紛紛在雲計算上部署了DeepSeek模型。
2月的尾巴上,DeepSeek宣佈啟動“開源周”,每天開源一個程式碼。
開源。開源。開源。
開源到底是什麼?為什麼都在開源?開源到底有什麼用處?還怎麼掙錢?這幾天,我好好研究了一下,發現背後的商業邏輯太有意思了。
今天。我們就來聊聊這件事。從哪開始呢?
按照國際慣例,就從一個故事說起吧。


1991年,芬蘭赫爾辛基。頂著大雪,一位大二學生打開了商店的門。他手裡攥著聖誕節和生日得到的錢,準備買下一臺計算機。
這臺計算機價值3500美元,實在昂貴。他只能付出三分之一的“首付”,剩下的,3年之內還。
這位學生,就是後來開源作業系統鼻祖Linux的創始人,林納斯·託瓦茲(Linus Torvalds)。
林納斯買計算機,是為了能在家就能“黑”進學校,自由呼叫更強大的學校計算機。但想要做到這一步並不容易。
把計算機帶回家,事情還沒結束。除了解決錢的事,他還得不斷修改作業系統,修改模擬程式。
系統方面,他花了169美元,訂貨了MINIX軟體。當時主流系統是貝爾實驗室開發出來的UNIX,但是UNIX閉源了。而MINIX則是一位大學教授基於UNIX開發出來的系統,並且教授把原始碼免費開放給學生使用。
所以,MINIX就是比較早期的“開源”形態,林納斯後來做出的Linux則是基於這種精神建立的。
接著,林納斯在MINIX基礎上,又花了一個多月的時間,從大學電腦上把熟悉的程式下載下來,調製出了自己的終端模擬程式。每當他想讀新聞、看郵件,就執行自己的程式,來從大學的計算機裡調出新聞、郵件。
很長一段時間,他的日常就是穿著睡衣,坐在計算機前,不斷程式設計。
到了第二年,他不用再還計算機的尾款了。因為,他做出了Linux。
如果對Linux不熟悉,沒關係。你一定熟悉淘寶、京東、QQ、微信。這些影響著全球數十億人的服務,都執行在Linux系統上。像阿里雲、騰訊雲、亞馬遜雲服務等,也都是基於Linux系統構建的。
Linux本身並沒有給他帶來收入。做出來後,他就把Linux的原始碼公開了。但是因為大家受益於他開發出來的這個作業系統,得知他還在還計算機的款,發起了眾籌,幫他迅速攢好了錢。
開源,最開始並不是獨獨瞄準“免費”。
MINIX的教授是為了科研,Linux的林納斯是為了好奇心。如果要說一個共同點,那麼他們都是為了讓更多人,都能不斷在前人的基礎上,自由開發。
當年為了買計算機,林納斯參加過赫爾辛基清潔隊,在大雪裡鋸掉長高的灌木叢,還當過郵差。又因為數學成績一直很好,總是在拿學校的獎學金。
他很擅長,也很明白,想要擁有一些東西,應該怎樣去交換。這些故事,都寫在他的自傳《樂者為王》裡。
而開源的精神,最早來自“自由軟體之父”理查德·馬修·斯托曼。不僅是軟體領域,其他領域,理查德也在不斷呼籲共創、公開。他呼籲開發共創線上百科全書,促進了後來維基百科的誕生。
在這個時期,開源是一種精神:“人類知識必須共享,讓每個人可以自由在任何地點、時間呼叫知識”。
到這裡,你對於“開源”的概念,應該有了大概瞭解。
只是,並不是所有領域都適合開源。
比如,原研藥就不能。


原研藥的研發,大部分都不能開源
前段時間,我寫了篇文章和你聊了聊醫藥集採。對這個話題感興趣的朋友,可以在參考資料檢視。
不看也沒關係。重點就是,創新藥、原研藥的研發極其昂貴,動輒二十億美金的成本。
如果每次原研藥廠辛苦研發出來的新藥,立刻全部開源,會出現什麼情況?
都不需要仿製藥企業重新研究了,直接就會有烏泱泱各種藥廠,順手一個複製貼上,超低成本迅速搶佔市場。
所以,必須有20年的專利保護期,連仿製藥都不給侵犯它的智慧財產權。
就算專利保護期到了,仿製藥研製依然需要研發成本。雖然為了合規,原研藥也會公開化合物的成分資料。但是從生產工藝、品控把握等等方面,依然是商業機密。也就是說,依然是“閉源”的。
只有這樣,才能讓企業在有限的時間裡,儘量把成本賺回來。然後,進行相對公平的市場競爭。
如果開源了,商業模式覆蓋不了成本,研發成本太高了。那麼,還會有人願意嘔心瀝血地研究嗎?研究需要經費,誰來出呢?如此一來,就沒人有動力不斷研發新系統、提高執行效率了。
所以,可以說“閉源”這種方式,是一家企業或者專案,初期保護自身盈利能力和市場競爭力的手段。
和Linux相對的,是“閉源派”企業。他們的底層思路,其實就跟醫藥研發差不多。
軟體業早期,大多數的商業軟體是從“閉源”做起的,也就是原始碼不會對外公開,自己來獨家開發和維護。比如,微軟的Windows系統。
那麼,閉源到底怎麼盈利的呢?


閉源,是為了守住盈利
作為一個之前在軟體行業工作了十幾年的人,閉著眼想了3秒,還是打開了deep research,幫我整理了閉源比較常見的盈利模式。
真方便。我翻譯一下,簡單說給你聽聽。
閉源的商業模式,常見有三種,分別是:許可證、訂閱制、打廣告。
我們一個個來說。
第一種,是許可證授權銷售。
就是透過一次性授權,或者批次授權讓你用,從而獲取收入。
你用過Office辦公軟體嗎?一般是購買了軟體的永久使用許可權,比如Office 2019或Office 2021。
這種往往是一次性付費。
第二種,就是訂閱制和SaaS服務。
訂閱,是網際網路快速發展的產物。一般來說是根據選擇的服務型別,分為按時間或者按需求來收費。
所謂的SaaS服務收費,則是不需要下載任何軟體,線上也能同樣使用軟體的功能和服務。收費模式也是按訂閱或者按需求比較多。
OpenAI之前的模式就是典型例子:基礎版本免費,高階版本收費。
GPT-3免費使用,但是高階版本ChatGPT Plus,就需要按月訂閱收費了。
另一種,則是按照“呼叫量”收取費用,你用多少收多少。比如ChatGPT-4的API,輸入1000tokens,收費0.03美元。
OpenAI就是透過這種專有模型的API服務,短時間積累了大量付費使用者。根據財報,它的營收從2022年的2億美元,躍升到了2024年的37億美元,增長了幾十倍。
第三種,則是軟硬體繫結和廣告。
很典型的,就是任天堂的Switch遊戲機。
很多開發出來的獨立遊戲,只有用Switch才能玩,就是遊戲機平臺獨佔的遊戲。遊戲是閉源產品,遊戲機是硬體,把兩者繫結銷售。
而廣告,就更容易理解了。我們手機裡很多免費的應用軟體,你會發現裡面鑲嵌這很多廣告。這又是一部分收費形式。
怎麼樣,是不是快速喚起了很多平時使用各種軟體的回憶?
閉源的商業模式,不復雜,其實就是對“軟體使用權”收費。
而這樣做,可以直接且持續地,為廠商帶來源源不斷的流水。獲得的利潤,又能重新投入新研發,進入正迴圈。
那,既然閉源這麼好,為什麼現在這些企業都在接二連三地爭相開源呢?


“不要重複造輪子”
的確,開源起初不怎麼賺錢。就比如最開始的MINIX、Linux系統,開放是為了做學術、滿足好奇心。
但是開源這件事發展到今天,為什麼變得更有價值了呢?這是因為後來,有了開源社群的出現。
比如,最大的開源社群,2008年上線的GitHub。
作為一個開源協作的里程碑式平臺,人人可以在平臺上提交程式碼、報告漏洞、參與討論。這樣就會形成一種協作機制,大大降低了程式設計的門檻。隨著越來越多的人參與共創,越來越多的視角補充了上來,很多軟體就是在GitHub上,從封閉順暢走向開源的。
給你打個比方。
還記得以前讀書的時候,總有一些學霸,你不知道他們怎麼學習的,總之他們天天睡覺,上課偶爾還會翹課,但是成績就特別好。
但是有一天,他們把他們的學習方法論開放給你了。
你發現,原來把老師週二發的練習題做10遍之後,你也會有自己的做題方法論。原來遇到不懂的題不要先看答案,用盡所有辦法先自己證明一遍。就算是你原本是個文科生,看了理科學霸的筆記,也能去做物理考試題了。
GitHub社群,就是這樣的一個,把學霸具體怎麼做的步驟,一步步開源給你的地方。甚至,你提交了“作業”後,可能學霸還會幫你改改。
Linux、Swift、Ruby等等開源專案,往往會優先在GitHub上開原始碼。全球頂級的科技公司,比如蘋果、臉書、阿里巴巴等加入了GitHub,在上面釋出一些專案程式碼。上面還聚集了很多程式設計大佬,比如Linux的發明者林納斯,被稱作Android之神的“J神”,以及活躍的各大大廠員工,不勝列舉。
老師把答案捂得再緊,學霸也能給你推匯出來。
開源社群,漸漸形成了一種“開源”文化。演算法世界,從此越來越透明、互通。
那麼,這樣不斷迴圈下去,就會出現一件事:演算法,無法100%閉源。


閉源,或許是沒法真的“閉源”的
什麼意思?
就算A研發出來的大模型是閉源的,其他BCDE等等公司,依然可以開發。只會慢一點,但不會完全做不到。
可能有點抽象。我們這樣來看。如果只是看當下這個時點,你可能會有一種感覺,那就是“國內的大模型似乎一直追不上國外的先進技術”。
但如果我們把時間線具體拉出來呢?你會發現,雖然最新的技術或許沒跟上,但是幾個月前的國外版本,我們如今也自己做出來了。
比如豆包大模型,在中文理解和生成能力上,某些場景下已經能夠超越早期的國際模型。又比如百度的文心一言、清華智譜的ChatGLM4等模型,在多模態能力上也取得了突破,整體逼近GPT-4。
現象背後,是有原因的。
作為一個1985年就開始學程式設計的商業顧問,我也去諮詢了一些演算法工程師朋友,和你分享兩個可能原因,也歡迎你在評論區補充。
第一,學術界在理論創新上,常常領先工業界。
雖然從模型開發數量上來看,工業界佔據了主導地位。但是論基礎研究、理論創新和前沿探索上,學術界似乎更勝一籌。
學術界領先的程度,比起工業界,要以年計算。
比如現代大語言模型的基礎,Transformer架構,早在2017年就在《Attention is All You Need》的學術論文裡被提出了。工業界在2020年左右才開始大規模訓練。又比如深度學習裡的反向傳播演算法、強化學習的理論基礎等等,都是學術界提出,然後逐步完善的。
而做學術研究的人,核心目標是發論文。那麼,大部分的先進技術,想法本身是公開的。
所以,原理性的知識,很難被完全封鎖。其次,高校之間的流通,也會帶著技術流通。
等著論文出來,工業界又可以腳跟腳找到研發支點。所以最後比的,不是核心技術,而是誰能真正讓技術變成有商業價值的產品、真正讓技術推廣起來。
第二,人員流動性強。
除了學術界,其實在各大廠商、各大企業之間,相關技術人才的流動性也很強。
從A公司到B公司,再到C公司。來來去去,技術和知識也跟著流動。不僅如此,還可以選擇私下交流,或者花錢請顧問,內部細節,也有可能被拿到手。
所以,核心技術,其實很難被100%封鎖的。而社群文化,大大加速了互通、共創的進度。
現在,在人工智慧領域,開源已經不僅僅是指開放原始碼。
於是,除了原始碼的開放,進一步,你訓練用的什麼資料、從哪裡整理的乾淨資料集,也可以開源。就像是把菜譜公開,讓其他廚師也能跟著炒菜。
更進一步,則是直接把一盤熟菜端上桌,你嚐嚐,覺得欠點辣味。你不用重起爐灶,只需要思考往上加辣椒油還是辣椒粉就行。
所以,開源還包括已經訓練好的模型引數權重,直接開放下載,別人就不用從零開始訓練,拿來即用。
與此同時,越來越多的模型和資料的開源社群平臺也開始出現。比如這幾年很火的AI模型開放共享平臺,Hugging Face Hub,上面託管了90萬個機器學習模型、30萬個應用程式、20多萬的資料集,都對公眾開放。
類似的還有資料集和競賽平臺Kaggle、TensorFlow Hub、PyTorch Hub等等,他們共同組建了一個龐大的AI領域的開源基礎設施。
社群的出現,這就好比原本只有你和你的團隊,可能十幾個人在研究一款配方,現在開源到社群,擴張到有1000人、甚至1萬人在幫你最佳化配方了。
這樣的進化速度,遠非閉源專案可比,這就是開源的巨大優勢。
這也解釋了,DeepSeek為何開展開源專案,這與它此前從開源中積累的經驗有關,但更重要的是,這個方向能加速其模型訓練。
另外,社群平臺本身,就有一定的變現能力。從中誕生了各種可以變現的培訓課程,平臺的贊助功能還能讓優秀的創作者接受使用者的捐贈。
但是隨著人和專案越來越多,社群平臺也遇到了問題。
這就像是,當可口可樂的配方、肯德基的配方、片仔癀的配方被人公開的時候,難道不會存在侵權的問題嗎?怎麼來證明呢?
有一種通用的方法,那就是:許可證授權。


自由傳播,靠的是許可證
開源的寬鬆程度,是透過開源許可證來決定的。這是一種法律框架,開發者可以自己去選擇開放程度大小,那麼使用者就得遵循這套規律。

(圖片來自網路)
開源許可證有很多,目前商業世界裡比較常見的有三種,分別是:GPL、MIT、Apache。
第一種,GPL,又叫做“通用公共許可證”。
也就是咱們開頭提到的。“自由軟體基金會”推出的許可。
它更像是一種“自由契約”,帶著創始人理查德的精神,它賦予使用者自由使用、修改和分享的權利,但是也要求任何基於GPL程式碼衍生的作品,也必須保持同樣開放、自由的狀態。
GPL又被叫做“傳染性”許可證。無論傳到多少代,都要繼續把自由、開源傳遞下去。
比如Linux用的就是GPL許可,這種許可模式,促成了超級龐大的自由軟體生態。
第二種,Apache,加入了專利授權和保護條款。
你依然可以自由使用、修改,而且在同時,不用擔心專利問題帶來的法律風險了。
所以許多企業都比較喜歡用Apache。它能提供雙重安心。
第三種,MIT,則是比較寬鬆的許可證。
DeepSeek用的就是這一種。
MIT不限制你使用和分發,只不過,要求你在用的時候,署名。
所以,你會在各大平臺上,看到“接入DeepSeek-R1”這樣的字樣。
這很有意思。天下沒有免費的午餐。每一種要求,背後都有它存在的目的。
不論是嚴格的GPL,暖男般的Apache,還是要求署名的MIT,你有沒有發現,他們都有自己的條件。
而這些條件,其實就是在引導開源模式的賺錢思路。
前面提到,開源是因為研發費用太過高昂。那如果能找到在開源的同時,也能帶來源源不斷流水和使用者粘性的商業模式呢?
只要用其他方法,能把錢掙回來,那為什麼不讓這個知識開放讓全人類享受呢?越來越多的人參與創造,參與測試,人類不就進步更快嗎?
這,其實就是開源的核心驅動力。
那麼,具體怎樣做,才能讓開源也能賺錢?
讓不同開源程度的產品,承擔不同的角色。


開源是可以盈利的
開源,那就意味著“程式碼”是免費的,“模型”是免費的。那麼,什麼可以收費呢?更高階的技術和服務。
免費,降低了使用門檻。但是但凡你開始使用了,你就會存在更多的需求。而滿足你的需求,就可以坐下收費了。
比如,教人怎麼用。
有的企業不想用雲服務,把資料完全掌握在自己手裡,就想著把完全開源的程式碼在公司內部電腦上部署開發。
程式碼免費拿走沒關係,但是,部署完成後,這麼複雜的內容到底怎麼除錯,怎麼改造,怎麼定製開發,遇到問題怎麼修復,一旦系統宕機了,誰來解決?
這些就被打包成了“服務”,如同一份保險,能確保系統正常運轉,“遇到問題由我來處理”。透過售賣這樣的服務,也能盈利。
又比如,鼻祖可以推出雲服務版本。
開源之後,作為釋出者,相當於這個專案的“鼻祖”。很多人會基於鼻祖的版本進行延展分支,但大家往往更信賴“鼻祖”版本。
所以,鼻祖推出雲服務版本,就像開發APP一樣,使用者可以使用,還能呼叫API等。
使用者使用它就可以收費,若有需求,還能提供更多增值服務。
還比如,把免費開源的部分當做“引流品”。
一套是免費版,包含核心部分,所有程式碼毫無保留開源出來,使用者下載到電腦上就能直接使用,另一套則是商業化版本。
對於企業使用者而言,他們的需求往往不止免費版的這些功能,還涉及企業許可權管理、多伺服器部署等諸多複雜功能。
於是,發行兩個版本:免費版面向所有人公開,可隨意使用,程式碼能全部拿走;商業版則是為付費企業使用者量身定製。
如果市面上有同樣型別的模型,他們閉源了,你免費開源,自然會虹吸過來大量的人來使用你。用著覺得好用,傳播起來,又可以觸達需要商業版的使用者。
再比如,社群眾籌和捐贈。
就像Linux最開始的募捐,自由軟體之父鼓搗的基金會,透過接受企業贊助和個人捐款,從而支援專案持續發展。
所以,不用擔心開源賺不到錢。開源降低了門檻之後,還可以透過提供服務、高階功能、定製開發等等後續“配套”賺錢。後續配套賺的錢再重新投入技術開發,再加上越來越多的人參與使用,技術進步就越滾越快。
那麼,隨著開源的知識越來越多,閉源的侷限,就被放大了。人工智慧時代來臨,閉源,就有可能扎堆出現效率問題。
理解了這個,你就能明白,為什麼企業開始成堆開源了。
有意思的是,所謂的開源,也很少有“真正完全開源”的。什麼意思?
當顆粒度足夠細,你會發現,開源後的使用權,依然牢牢掌握在開發技術的廠商手裡。
我們接著聊。


開源,也不會是完全開源的
比如,模型的開源,到底開源到什麼程度?
一個模型,往往是由幾千億個數字組成。每個數字有一定區間範圍。這裡為什麼這個值?那裡為什麼那個值?核心的原因和生產能力,其實還是握在廠商手裡的。
再加上,版本不斷更新,一兩個月就會更新一次。什麼時候停止共享最新的資料,什麼時候也可能停止當下的開源。
所以,如果你去看這些宣佈開源的企業,仔細閱讀你就會發現,他們並不是把所有的東西都開源了。
而開源的好處,是把一個做得還可以的模型,拿來給大家用。別人用了覺得好,就會開始直接用你的方案去做企業級產品。做得多了,就更認可你。
這家公司在你的土壤上種下了一束玫瑰,那家公司在旁邊種了棵柳樹。漸漸地,你這片土壤就長出了各樣的生態。之後,玫瑰和柳樹想要長得好,都得看你的土壤營養夠不夠豐富。
所以你就能理解,百度部分開源,建立生態。OpenAI最開始是開源的,到後來又閉源。
有的公司是為了確保領先優勢,商業變現為主。有的公司是新版本閉源,舊版本開源。在組合拳的打法下,尋找一種變現和技術的平衡。
既然開源有這麼多好處,那,是不是所有的公司都會紛紛把程式碼、模型、系統開源起來了?
我覺得,不太可能。


並非所有人都是開源派
不過,並不是所有人都支援開源。
Linux創始人林納斯曾在一封給微軟副總裁Mundie的信裡這樣寫道:
“不知Mundie是否聽過牛頓?牛頓說:‘我之所以能夠看得更遠,是因為我站在巨人肩膀上的緣故’。”
即便如此,微軟副總裁Mundie依然公開痛批說,開源是一件破壞智慧財產權的行為。不支援,不看好。
早期微軟,是堅定的“閉源派”。這的確有他們的道理,因為開源,確實也存在不少問題。
比如,安全隱患。
不光是“好人”在用模型進行愉快的開發、協作,“壞人”也擁有同樣的權利,來使用、修改模型。許可證,防君子,不防小人。
比如,恐怖分子,可能使用開源AI去研究生物武器。比如,不法分子僱傭駭客,向友商發動網路攻擊。又比如,醫療領域的患者隱私資訊等等。
還比如,研發成本的回收壓力。
對於投入巨資來研發AI的公司,就像原研藥廠一樣,開源會大大削弱他們的優勢。原本透過閉源熬走小玩家,現在一開源,小玩家也能上來分蛋糕了。
你就能理解,為什麼一些頂尖模型,比如GPT-4會突然選擇閉源。因為在前期開源引流後,確實存在變現困境,那就需要回歸閉源的盈利模式,得回收數億美元的研發投入。
所以我想,至少,微軟的核心業務就不太可能開源。
比如,已經處於市場主導地位的Windows系統。Windows系統的程式碼龐大且複雜,開源後,微軟還需要額外投入大量資源來管理開源社群、修復漏洞和維護程式碼。有的程式碼還有專利,開源後是否侵犯專利,又是一串問題。
所以目前來看,哪怕是老版本的Windows系統,開源出來還是有些得不償失。
不過有意思的是,微軟直接把最大的開源社群GitHub給買了,還是融入到了這個開源世界。


最大的閉源公司買了最大的開源平臺
但是,想參與“開源派對”,不一定需要自己親自出手。還可以選擇,用其他的開源替代品,來分一杯羹。
系統雖然不能開源,但是一些比較輕巧的模型、智慧體框架、資料處理框架等等工具,微軟依然積極參與到了開源大軍裡。
比如跨平臺的開發框架.NET Core,程式碼編輯器Visual Studio Code,也都開源出來,開發者們可以在這些基礎上,開發企業級應用。
並且,透過GitHub社群,這些開源的專案,得到了很高的關注。同時,微軟還能透過這扇窗,隨時觀察專案和市場需求,靈活調整。
微軟的這套組合,也是現在許多科技企業的縮影。
既要copyright,也要copyleft。進可攻,退可守。動態平衡。
閉源就像一個人走路,而開源就像一群人接力。
有人為了自由而開源,有人為了生態而開源,有人為了未來而開源。
開源和閉源的平衡,就像是這個時代的鼓點。一群人,各有各的選擇,但是在一起總是走得更遠一些。
幾十年前,那個縮在一間斗室裡,只有一臺電腦、一碗麵條就已經無比幸福的林納斯,一定不曾想到,如今他身後,已經站著千軍萬馬。
還會有無數個大學生的好奇心,將改變整個未來。
祝福。
*個人觀點,僅供參考。
參考資料
2、《全球最大開源作業系統前世今生:一個書呆子讓微軟頭疼》,新浪科技
https://tech.sina.com.cn/csj/2019-07-26/doc-ihytcitm4728357.shtml?cre=tianyi&mod=pchp&loc=4&r=0&rfunc=43&tj=none&tr=12
3、《DeepSeek開啟“開源周”,與我們有什麼關係?》,36氪
https://36kr.com/p/3181994658681737?channel=wechat
4、《樂者為王》,林納斯·本納第克特·託瓦茲

主筆/ 木言聲 編輯 / 二蔓 版面 / 黃靜
這是劉潤公眾號的第2530原創文章

