為什麼deepseek沒有誕生在頂尖科研機構和大公司? 2025-05-14 11:23 知識分子 防走失,電梯直達安全島報人劉亞東A 來源:知識分子 作者:王立銘 圖源:pixabay DeepSeek的誕生,也許標誌著人工智慧的“愛迪生時刻”已經到來。儘管法拉第早在1831年就發現了電磁感應現象,為發電機和電動機的出現提供了理論基礎,但直到半個世紀後愛迪生髮明瞭耐用便宜的電燈並建立了穩定輸出電能的珍珠街電站,人類世界才整體性的進入了電氣時代。DeepSeek的獨特技術方案,可能標誌著人工智慧真正具備了走進千家萬戶、改變各行各業的能力。 而我想在這裡討論的問題是,為什麼DeepSeek沒有誕生在為大語言模型投入數百億元的網際網路大廠和“AI六小虎”,也沒有誕生在承擔大量人工智慧國家級課題的大學和研究院,卻誕生在深度求索這家規模不大、此前在決策者和公眾視野中默默無聞的小公司——儘管前者掌握的資源要遠多於後者? 也許,我們可以從現代科學技術的組織制度中可以找到幾條明確的線索。 網際網路大廠和傳統科研機構的性質和定位差異甚大,但其組織特點卻高度相似,都是馬克思·韋伯筆下的“科層制”組織。這類組織有兩個明確的特點:第一,組織模式上,有明確的權威、上下層級和專業分工;第二,工作流程上,有明確的規則、流程和績效考核方式。 正是依靠這兩個特點,科層制組織能夠將成千上萬人組織起來,高效實現特定的目標。從古代的水利工程到現代的高鐵5G,從載人航天到人類基因組計劃,科層制組織都證明了巨大的威力和價值。在人工智慧領域同樣如此:儘管大語言模型最早並非誕生於中國,但在科層制組織的驅動下,中國機構在大語言模型的開發方面取得了驚人的進展。早在DeepSeek誕生前,全球各大榜單中都能找到中國大模型的身影,例如通義千問,豆包、Kimi,智譜清言等等。 但需要注意的是,科層制組織想要發揮威力也有兩個明確的前提:目標清晰,實現路徑明確——換句話說,專案目標是“工程化”的。因為只有目標和路徑確定的時候,科層制組織才能將目標沿路徑進行拆分和細化,最終落實到組織內部每一層級,才能將目標和路徑落實到每一個組織成員的績效考核。 同樣需要注意的是,科層制組織顯然無法用於創造從0到1的源頭創新。因為源頭創新從本質上就是無法事先定義目標,更無法事先規劃路徑的。龐大的人類基因組計劃固然可以層層分拆,但這一切的前提是Watson和Crick在1953年首先理解基因的分子本質;國產大模型固然可以層出不窮,但沒有卷積神經網路、Transformer和Llama的鋪墊,國產大模型們圍繞規模和價效比的激烈競爭根本無從談起。 更有甚者,科層制組織不光無法主動孕育源頭創新,實際上還會(有意無意的)破壞源頭創新。因為源頭創新究其本質就是無法準確預測的、隨機的、甚至是不務正業的。它的出現需要天馬行空的探索,需要對事物本源的狂熱追求,需要個性,需要靈光一閃。科層制組織的層級制度、嚴格分工和績效考核,做的越是嚴格和徹底,就越是沒有源頭創新的機會和土壤——後者會被組織認定為是無效的、浪費的、破壞性的。在ChatGPT成功後,OpenAI公司的成員寫出了《為什麼偉大不能被計劃》。恰如書名所提示的那樣,OpenAI的一系列源頭創新,究其來源都是意外、熱情、大膽設想,勇於試錯的產物。 打個比方,科層制組織就像是現代工業,只要目標明確、路徑清晰,它就可以透過嚴密的分工和考核制度全力推進,無堅不摧。但孕育真正的源頭創新,卻需要傳統的農業,一把種子撒下去,我們能做的只有澆水施肥,耐心等待。 說到這裡,讓我們重新回到中國科研製度的討論上來。 從某種程度上說,儘管人們談及科研都會提到“興趣導向”“自由探索”之類的詞彙,但全球的現代科研活動都是科層制組織的領導下進行的。這本身不足為奇。一方面,現代科研活動的主要支持者是政府(也就是老百姓的納稅),理所應當有嚴格的組織模式和工作流程以應對納稅人和監管者的審查;另一方面,現代科研活動經常需要組織大量科研人員進行長期的團隊攻關,明確的分工和績效管理也無可避免。 而真正的問題在於,在這種嚴密的組織模式勢在必行的背景下,我們是否為真正的源頭創新留出了足夠的彈性空間? 這方面的成功案例也有不少。谷歌獨特的20%時間政策允許員工投入20%的工作時間進行自由探索,為他們帶來了諸如Gmail和AdSense這樣的重要創新。貝爾實驗室固然是個龐大的傳統科研機構,但允許自由探索的文化也孕育了諸如電晶體這樣的偉大發明。 但熟悉國內科研體制的人可能立刻會意識到,這種空間即便不是完全消失,也是非常逼仄和零散的。 在組織模式上,我們的科研人員有著極其複雜的分工和層級。作為金字塔頂端的院士們基本徹底脫離了研究一線,但卻掌握著鉅額的研究資源分配權利。而剛剛入行的科研人員,又被困在研究生-博士後-青年教師-教授-四青人才-傑青/長江等高階“帽子”構成的複雜鏈條中。相比到底關注哪些重要的科學和技術問題,研究人員們更關心的往往是鏈條上更高級別的頭銜如何獲取。 在工作流程上,複雜動態的科研活動同樣被縱橫切割成稀碎的片段。每一筆經費的計劃和實際報銷;每一項研究課題的申報、開題、年度總結和結題彙報;科研發現被量化為研究論文的影響因子和引用次數;教育創新被量化為課時數量和教學獎勵。相比到底準備怎樣解決一個重要的科學和技術問題,研究人員們的時間和精力被大量消耗在滿足各種各樣複雜量化的過程性績效考核指標中。 公平的說,這樣的問題並不是僅僅出現在中國。以美國為例, mRNA疫苗的發明者Katalin Kariko長期得不到經費支援和永久教職,有史以來最為成功的抗癌藥物Keytruda被長期冷落在大公司的角落。同樣公平的說,我們也必須承認,即便有著這樣那樣的限制,原始創新仍然持續誕生在中華大地上。我無需一一例舉,關注科技新聞的讀者們自然能如數家珍。 但我更想追問的是,我們的科研製度能否再鬆鬆綁,讓同樣的資源投入,能更高效的用於原始創新的孕育中? 比如,科研共同體內部,複雜的分工和層級是不是真的無法避免?每年到了科研專案申報和評審的季節,我們都會看到大量的資源和精力被投入到無謂的混圈子、打招呼、套近乎上。是不是取消了帽子,取消了一層層晉級的階梯,我們就沒有能力評估科研人員的工作了?當然不是!來自同行的評價是最能直擊本質的。在DeepSeek誕生後,OpenAI的CEO公開承認“我們站在了歷史的錯誤一方”;而微軟和亞馬遜的雲計算服務快速部署和開放了DeepSeek的模型入口——來自同行的反饋,就是對DeepSeek能力的直接認可。難道說,基金評審機構不給個帽子頭銜,好的科技成果就會被埋沒和無視麼? 再比如,當目標和路徑明確的時候,“有組織的科研”當然能體現效率和規模的威力。人類基因組計劃就是很好的證明:當基因的分子本質已經揭示、基因測序技術已經成熟時,組織全世界的科學家和科研組織集團攻關是合理的選擇。但面對大量目標仍然無法定義、路徑仍然晦暗不明的重要問題——例如如何攻克癌症和衰老,如何理解人腦的工作原理,怎樣用AI技術預測複雜生命活動等等——我們是否應該放下對效率和規模的執念,讓對這些問題有巨大熱情的科學家們,遵從自己的靈感,去做有巨大可能失敗的探索? 總結和幾個具體建議: ·科層制組織只適合管理目標清晰、實現路徑明確的工程化專案,不適用於充滿不確定性的源頭科學技術研究 ·DeepSeek這樣的源頭創新專案,難以誕生在科層制組織中,不管是網際網路大廠還是傳統科研機構。 ·源頭科學技術研究從本質上就難以透過定點支援的方式製造,但卻可以透過廣泛支援的方式孵育;源頭創新需要農業視角,而非工業視角。 ·現代科研製度逐漸走向科層制難以避免,但要害在於還留出了多少給源頭創新的伸展空間。 ·國內的科研管理制度在科層制下走得太遠太深,需要強有力的扭轉。在需要源頭創新的領域,大面積取消帽子,取消大多數量化考核指標,減少有組織科研的覆蓋範圍,可能是必須的。