DeepSeek開源Day1,我們聊聊背後的開源精神|【經緯低調分享】

DeepSeek又「炸」出圈了,這次不是因為功能和邏輯,而是因為一個震撼業界的舉動——開源工作程式碼。
開源第一天,DeepSeek亮出核彈級技術——FlashMLA正式開源!這是用於 Hopper GPU 的高效 MLA 解碼核心,針對可變長度序列進行了最佳化,現已投入生產。
具體亮點:
  • BF16精度全解鎖
  • 64位分頁KV快取(記憶體焦慮退退退!)
  • H800實測炸裂:3000GB/s記憶體吞吐 + 580T算力天花板!
許多網友發問:為何要將辛苦研發的成果免費分享?背後其實蘊含著深刻的“開源精神”。
提到開源精神,不得不說起經典著作《大教堂與集市》。書中以“大教堂”和“集市”代表兩種截然不同的開發模式,為我們展現了開源世界的獨特魅力。Linux作業系統的誕生,便是開源精神的生動詮釋。1991年,芬蘭大學生李納斯·託瓦茲出於個人對UNIX作業系統的嚮往,課餘用家用電腦編寫核心,並分享到網際網路社群,吸引眾多程式設計師參與,最終讓Linux成長為全球重要的開源作業系統。這一過程完美體現了開源的底層邏輯:源於個人需求、早釋出常釋出、並非單純出於高尚道德,而是開發者與社群相互成就。
如今,DeepSeek的開源舉措,恰似復刻Linux的傳奇之路,卻又青出於藍而勝於藍。它不僅開源工作成果,還將工作細節毫無保留地公開,讓全球開發者能清晰看到其研發過程。這種極致的“早釋出,常釋出”,為行業發展注入了新的活力。DeepSeek掀起的這場技術海嘯才剛剛開始,本篇文章,將深入探究DeepSeek開源背後的故事。 以下,Enjoy:
本文授權轉載自公眾號“快刀青衣” ‍‍‍‍
最近DeepSeek很火,已經火到了各行各業,以至於有一些很多年沒有跟我聯絡過的好朋友,都開始在微信上私信我:“DeepSeek到底是個啥?”
我大部分時候都會說:“就是一款超強的開源模型,能自己推理、自己思考。開源就是把程式碼全放出來,大家隨便用。”
當我這麼說了之後,下一個問題一般都是:“為啥啊?他們做出來的東西為啥免費給別人用啊?”
其實,這背後就是“開源精神”。
可能聽到這裡,你也好奇,什麼是“開源精神”?
對於這個問題,我推薦大家去讀一本經典老書,名字叫《大教堂與集市》。
今天,我將結合《大教堂與集市》這本書的內容,跟你科普一下什麼是開源精神,也進一步聊聊這輪DeepSeek開源模型的爆火,將對整個社會的技術發展帶來什麼影響。
01
這裡沒有象牙塔,只有純粹的車庫精神
在分享本書之前,我先跟大家分享一個最近看到的資訊。
昨天中午,2025年2月21日12點,DeepSeek團隊在X平臺釋出了一段英文內容。
我用DeepSeek把它翻譯過來了,給大家分享一下:“我們是一個探索通用人工智慧(AGI)的小型團隊。我們將開源5個程式碼倉庫,以完全透明的方式分享我們微小但真誠的進展。這些在線上服務中經過完整文件記錄、部署和生產環境實戰檢驗的基礎模組,雖然謙遜但足夠堅實。作為開源社群的一員,我們相信每一行共享的程式碼都將轉化為加速探索程序的集體動能。每日解鎖即將到來——這裡沒有象牙塔,只有純粹的車庫精神與社群驅動的創新。”
有些同學可能不是從事軟體行業的,我來簡單解釋一下,DeepSeek說的其實就是:從本週開始,他們將把每天的工作程式碼開源出來。
能做出這樣的行動,是非常有魄力的。
你可能要問,這跟之前開源DeepSeek R1模型有啥區別?
我給你打個比方,之前開源的是工作成果,就像一個老師傅,把他所有的經驗無私傳授給你。而現在,你不但能拿到老師傅的秘籍,還能看到老師傅在過程中是怎麼幹活兒的。這對很多人來說,會比結果更有價值。
不出所料,看到這條內容的各國網友都反響熱烈。第一條評論就寫道:“這才是真正的Open AI!”他們故意把“Open”和“AI”之間加了個空格,這話說得恰到好處,不僅是對DeepSeek的讚美,還順便對山姆·奧爾特曼率領的OpenAI發起了一波嘲諷。
02
開源的“命運齒輪開始轉動”
接下來,咱們進入正題。
咱們先從書名說起,大家可能都會好奇,一本講技術文化的書,為啥會有“大教堂”和“集市”這兩個詞?到底是什麼意思?
其實,作者是用“大教堂”和“集市”這兩種形態,來代表兩種不同的開發方式。“大教堂模式”就像是一個宏大的規劃,先列好長遠的目標和計劃,可能是五年、十年的打算。然後,一小部分領導或資深專家來主導,下面一層層管理、協作,直到最後按部就班地完成某個任務,等到釋出的那一刻,才一鳴驚人。
“集市模式”,你可以把它想成一個熱鬧的菜市場,裡面有賣菜的、賣魚的,也有買東西的、閒逛的。這裡沒有統一的領導,也沒有明確的開發目標或盈利方向。大家在這裡各自為營,雜亂無章,卻依然保持著獨特的生命力,充滿了無限的可能和活力。
那什麼是開源精神呢?
開源,簡單來說,就是一個技術人或者團隊將自己的所有程式碼無私公開,全球的開發者都可以免費獲取、學習,甚至修改和應用到自己的專案中。我之前提到過的GitHub就是全球最大的開源社群。
回到《大教堂與集市》這本書,作者埃裡克·史蒂文·雷蒙德(通常稱為ESR),他不僅是經驗豐富的程式設計師,同時也是開源運動的旗手。
這本書的核心案例是開源作業系統Linux的故事。雖然大部分普通使用者對微軟的Windows系統或蘋果的MacOS更為熟悉,但實際上,我們生活中用到的很多網站伺服器、智慧家電,甚至路由器的底層系統,都在使用Linux。而且,安卓手機的底層核心也是基於Linux的。所以說,事實上,我們幾乎都是Linux的使用者,只是很多人並不知情。
而Linux的背後,其實有一段非常有意義的故事。
1991年,一個名叫李納斯·託瓦茲的芬蘭大學生,在課餘時間用自己的家用電腦,想體驗一下類似早期大型機上才有的UNIX作業系統,於是他開始重新編寫核心。
乍一看,這只是個大學生的玩票專案。但他並沒有止步於此。他把自己寫的原始碼上傳到了網際網路社群上,並且邀請其他程式設計師一起來改改看。
用一句特別俗套的爛梗,那就是“命運的齒輪開始轉動”。這件事,成了開源運動的重要里程碑。隨著越來越多的程式設計師參與其中,大家一起修復Bug、改進程式碼,Linux逐漸變得越來越強大。因為每個人都可以看到原始碼、修改程式碼,並將自己的修改貢獻回來。隨著時間的推移,Linux社群從最初的一個“學生專案”成長為全球最活躍、最成熟的開源作業系統之一。
03
開源,讓我印象深刻的三大底層邏輯
當然,除了講述Linux的故事,這本書還深入探討了開源的核心理念,並詳細解釋了為什麼開源運動能夠取得成功,其中有三條底層邏輯讓我印象深刻:
1.好的軟體品,往往源自開發者的個人需要
在開源世界裡,無論是專案的發起者,還是遍佈全球、不計報酬地提交Bug反饋、修復程式碼的貢獻者,很多人參與的動力其實都很簡單,就是因為他們自己需要這個工具。
要知道,現實中有大量程式設計師對自己開發的軟體並沒有太多熱情,他們只是把程式設計當作一份餬口的工作,每個月拿著不菲的薪水,完成任務就好。但在開源社群,情況完全不同。很多程式設計師大神,哪怕已經身家千萬,依然會無償更新和維護一些開源專案。因為他們真正喜歡、真正在乎這個東西,這就是“興趣使然”的最佳例子。
2.早釋出,常釋出,傾聽使用者的反饋
在開源專案的開發模式中,儘早釋出和頻繁釋出是至關重要的。剛開始時,許多成熟的開發者習慣性地認為,軟體的早期版本往往會有很多問題。如果提前釋出給使用者,使用者可能會因為體驗不佳而流失。
因此,傳統的開發模式通常是“大教堂式”的。它們集結精英、集中開發,經過六到八個月的測試,最終才推出一個穩定版本。
而Linux的創新就在於快速釋出,最初階段,甚至一天會發布多次更新。這樣,許多早期測試者和專案貢獻者能夠迅速發現問題並進行修復。
正因如此,Linux的發起人Linus曾提出一句很有趣的話:“只要眼睛多,Bug容易捉。”
在“大教堂”開發模式下,Bug通常藏得很深,難以發現。需要經過多人、幾個月的投入和檢查,才能揭示出來。
但在集市模式下,如果上千個開發者都在熱衷地研究每個新發布的版本,每個人都在不同的裝置上執行該系統,那麼問題就能被更快發現。而且,發現Bug的人為了自己的使用需求,通常會順手修復它。
3.免費開源軟體,不是因為道德高尚
這本書的作者還強調,千萬不要把開源的技術人員或團隊當作“利他者”,去誇讚他們的高尚品格。他指出,好的開源專案發起人其實也從中收穫了很多,比如圈子裡的影響力,或者幫助解決技術難題的人。這與閉源專案一樣,只是一種開發選擇,並不意味著開源專案比閉源專案更高尚。
當然,作者這樣說,顯得有些謙虛。在分享自己的開源專案時,他提到,如果你真心承認自己欠了別人很多,你就會發現整個開源社群會認為你是這個軟體的發明者,並且在專案執行過程中,收到大量讚美郵件,這些正向反饋會不斷湧來。來自全球各地的人會告訴你,你的專案如何幫助了他們。同時,當你採納了其他人的測試報告或修改的程式碼時,給予每個貢獻者的正反饋也非常強烈。
所以,我相信,DeepSeek這次願意在本週將他們的程式碼倉庫和工作細節公開出來,一定是因為在過去一個月裡,他們收到了大量正向反饋,這激勵他們作為開源社群的一員,願意將自己的每一步探索都貢獻出來。
那麼,就像當初的芬蘭大學生李納斯·託瓦茲推動“開源”的命運齒輪開始轉動一樣。你有沒有想過,DeepSeek這波操作,又會給全世界帶來怎樣的影響?會不會新的齒輪已經開始悄然轉動?
我認為,一切才剛剛開始。
04
DeepSeek掀起的海嘯才剛剛開始
在具體聊DeepSeek開源之前,我想先插播一個題外話。
2024年12月,一部挪威製作的災難劇集《逃離火山島》在奈飛上線,講的是虛構的拉帕爾馬島火山噴發的故事。最開始,山頂的裂縫冒出白煙,裂縫越來越大,最終火山爆發。但奇怪的是,火山爆發並不是整個災難的高潮。火山灰帶著岩石滑入海中,最初就像泥石流一樣。但隨著波浪不斷傳遞,最後竟然變成了滔天巨浪,席捲鄰近的島嶼。
我為啥要說這個評分不高的小眾劇集呢?因為當時看到火山爆發的時候,我以為那就是最大的災難,完全沒想到後面竟然會有海嘯。現在回頭看,DeepSeek的情況其實也差不多,目前的進展就像火山爆發,而真正對各行各業帶來的巨大沖擊,才剛剛開始。
就比如DeepSeek要開源他們所有的程式碼庫,這件事對我來說,比之前開源的R1模型更有價值。
為什麼呢?很簡單,R1只是他們內部訓練的成果,拿出來讓大家用,你可以在R1的基礎上開發自己的產品,這本身就很厲害。但現在,他們不僅僅開源了成果,更是把每天的工作細節都放出來。這意味著什麼?如果他們的訓練方法行不通,全球的團隊可以立馬調整方向;如果方法有效,其他團隊會立刻受到啟發,推動更大的創新。這就體現了“早釋出,常釋出”的精神,而DeepSeek做得更極致,他們直接每天都開原始碼,持續推進創新。
去年年底,我們還在說,這個AI領域一直沒有出現殺手級應用,現在DeepSeek就是第一個殺手級應用了。
在我看來,DeepSeek掀起的海嘯主要有以下兩波大浪。
第一波,是對普通使用者來說,個性化體驗將大幅提升。
現在,很多獨立開發者或普通使用者,都能基於DeepSeek的模型,做很多以前根本無法實現的任務。就像之前開源的AI影像模型Stable Diffusion(我們通常簡稱SD),它在2022年8月釋出後,幾個月內就衍生出了各種插畫生成應用。而且,更牛的是,在GitHub開源平臺上,和SD相關的專案瘋長到1000多個。這意味著一個開源專案的成功,激發了更多開源專案的誕生。
還有很多普通使用者,過去根本沒接觸過AI工具,但現在可以用DeepSeek來寫文案、找資料,極大提升了工作效率。正因為用的人多了,未來會衍生出更多基於AI的產品,專門解決個性化需求,這才是真正的技術普惠。
第二波影響,是對企業來說,尤其是中小企業,AI應用的門檻大大降低,未來會滲透進各個場景。
過去,企業要做一個內部系統,通常得層層外包、招投標。如果要做一個AI應用,那就更麻煩了,人才、技術、資源等方面的限制都很大。但現在,DeepSeek的開源讓很多企業裡有想法的個人,經過研究後,可以非常快速地搭建出自己的企業應用。
而且,像R1這麼強大的開源大模型,對於所有非AI企業來說,底層的模型已經不再是瓶頸,也不會是核心競爭力了,因為大家都可以擁有。這意味著,企業的關注點會轉向自己的核心資料、行業獨特的洞察力、或者AI場景的落地能力,只有這些才能成為新的競爭優勢。
別說百度、騰訊、阿里這些大廠,或者我們這些原本就有軟體研發能力的團隊快速擁抱DeepSeek,就連我家保險門上的智慧鎖品牌,前天晚上也發了一篇公眾號,宣佈他們家的智慧鎖接入了DeepSeek。
那一刻,我有點恍惚。作為一個產品經理,我開始遐想:如果智慧鎖接入了思考推理模型,到底能做些什麼?是我站在門口時,它根據心情來決定是否開門?還是它安裝在某個渣男家門口,發現有小三來訪時,AI自動通知女主人?
當然,這只是開玩笑,但至少說明一點,企業接入AI已經不再是難事。
回到DeepSeek,他們這波成功的核心,實際上就是開源。
開源R1模型,讓全球開發者都能把它下載到電腦上,動手一試,驚訝地發現這個模型真的是“能打”。
不僅如此,DeepSeek還開源了R1模型的論文和報告,吸引了一批技術大神前來關注,解讀他們在強化學習等方面的獨到之處。正是這些技術突破,讓矽谷的科技圈開始平視DeepSeek,平視中國的AI產品。
再說到DeepSeek的R1模型回答中的思維鏈,第一個具備推理能力的AI模型是OpenAI的o1,雖然它能推理,但OpenAI並沒有將思考過程展示出來,認為這不是重點。而DeepSeek則大膽地將自己的思考過程用文字一一展示出來。對我來說,這個過程的展現,比最終的輸出結果更觸動人心。
而接下來,DeepSeek又要開源自己的程式碼倉庫,讓全世界的開發者看到,他們團隊每天都在做什麼。
他們釋出的那段話,簡直就像是一篇開源世界的宣言。最後一句,簡直點亮了整個話題:“這裡沒有象牙塔,只有純粹的車庫精神和社群驅動的創新。”
我把這句話發給DeepSeek,想讓它為我的這篇文章寫個結尾。它說:“大教堂的壁畫終將斑駁,而集市的賬本永遠鮮活。”
也許你還想看:

經緯張穎內部講話:2024,四大關鍵決策

經緯徐傳陞:做VC這麼多年,人們總在問我同一個問題 


相關文章