


DeepSeek時刻
2025年1月27日,一家杭州的人工智慧大模型公司DeepSeek(深度求索),憑藉釋出僅一週的開源推理大模型DeepSeek-R1,在蘋果AppStore中國區和美國區的免費榜上雙雙贏得第一,OpenAI的ChatGPT、Google的Gemini等產品都在其後。
這是DeepSeek繼2024年12月26日釋出DeepSeek V3後,再次驚豔AI世界。
這兩個產品證明,在AI這一美國資本最看重的戰略競爭領域,中國正在走出自己的路。美國有ChatGPT時刻,中國也在很短時間有了“DeepSeek時刻”。
和ChatGPT的“三高”特徵——高階晶片叢集、高額訓練投入、高額算力供給相比,DeepSeek的最大特徵是訓練成本大大降低,而效能依然優異。這和中國製造走向世界的“必殺技”——超高性價比,如出一轍。
特別值得關注的是,DeepSeek的發展,不是短平快地複製Meta的開源模型Llama,而是在架構設計、演算法最佳化上做了很多創新,從而極大提升了推理的效率,減少了對資源的消耗。
例如,它提出了全新的MLA機制(多頭潛在注意力),與傳統的MHA機制(多頭注意力)相比,把視訊記憶體佔用降到只是原來的5%~13%。具體來說,MLA機制透過引入潛在化的概念,在處理輸入資訊時先做一定的預處理,對資訊進行選擇性壓縮和簡化,從而在生成查詢(Query)、鍵(Key)和值(Value)時顯著減少了引數數量,降低了計算複雜度。
DeepSeek所代表的創新,已經成為全球AI界的現象級事件。
位於舊金山的AI創新企業Perplexity CEO斯里尼瓦斯說:“他們(DeepSeek)以更高效、更低成本的方式開發了類似(Anthropic和OpenAI)的技術。這確實讓人感到壓力。”
前谷歌CEO埃裡克·施密特和MakerMaker.AI公司CEO達瓦爾·阿喬達撰文指出:“DeepSeek能夠以遠少於美國科技巨頭的資源與其競爭,這給美國大廠帶來了巨大壓力。美國針對中國的出口管制政策旨在切斷其獲得最先進計算晶片的渠道,以遏制中國在AI領域的發展。然而,事實可能恰恰相反——晶片短缺反而迫使中國企業提高計算效率,並探索降低訓練成本的新方法。”


DeepSeek是怎樣一群人做出來的?
DeepSeek脫穎而出後,美國Anthropic聯合創始人傑克·克拉克說,DeepSeek僱用了“一批高深莫測的奇才”。
2024年在接受36氪採訪時,DeepSeek創始人梁文鋒就此回應說:“並沒有什麼高深莫測的奇才,都是一些Top高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人,沒有海外回來的人,都是本土的。”
MLA機制的創新,最早來自一個年輕研究員的idea,“在總結出注意力架構的一些主流變遷規律後,他突發奇想去設計了一個替代方案,之後從想法到落地,一個團隊花了幾個月時間跑通了。”
好一個“突發奇想”!今天中國最缺的可能就是不亦步亦趨的突發奇想,併為突發奇想者創造充分發揮其潛能的環境。
梁文鋒說,在Open AI釋出的時候,中國普遍對前沿的科技創新缺乏信心,從投資人到大科技,都覺得差距太大了,應該像以往一樣,等著摩爾定律從天上掉下來,在家裡躺18個月等更好的硬體和軟體出現。
而DeepSeek的價值態度和選擇是——
“隨著經濟的發展,中國應該成為貢獻者,而不是搭便車的人,去參與真正的技術創新。”
“過去三十年,我們都只強調賺錢,對創新是忽視的。創新不完全是商業驅動的,還需要好奇心和創造欲。我們只是被過去那種慣性束縛了,但它也是階段性的。”
“以後硬核創新會越來越多。現在可能還不容易被理解,是因為整個社會群體需要被事實教育。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。”
DeepSeek寫在官網上的口號是:探索未至之境/Into the unknown。因為它的轟動,中國商界和社會有可能發生一些變化:更追求前沿科技而不是複製科技,更看重硬核科技而不是醬香科技,更推崇創新大神而不是老闆大亨,更熱愛探索未知而不是守成求穩。

在我看來,如果這些變化能成為現實,讓整個社會都深度求索起來,求索真知,探索未知,才是DeepSeek的最大影響所在。

硬科技與硬精神
中國的硬核創新並非始自DeepSeek,但任何硬核創新都需要深度求索的精神。
春節前,我在上海張江的高質量孵化器和中科創星創始合夥人、“硬科技”概念提出者米磊交流。他說:“中國的一個問題還是很多人的心態沒過關,覺得我們跟美國沒法比,覺得差距特別大,追不上。實際上不是這樣。投對了資源,投對了人,就能追上,甚至超越。從量子計算突破邊界、商業航天扶搖九天,到《黑神話:悟空》,再到DeepSeek,都證明了這一點。”
1月26日深夜,《黑神話:悟空》製作人、遊戲科學創始人馮驥透過微博盛讚DeepSeek。他說:“太幸運了!太開心了!這樣震撼的突破,來自一個純粹的中國公司。知識與資訊平權,至此又往前邁出了堅實的一步。”
其實,《黑神話:悟空》的團隊也是一個非常本土的團隊,最初只有十幾個人。去年在比亞迪第1000萬輛新能源汽車下線慶典上,我和馮驥鄰座,問他最重要的成功因素是什麼,他說第一就是在2018年下決心做一箇中國題材的大型3A級單機遊戲(注:3A指高投入、高製作、開發週期長,A lot of money、A lot of resources、A lot of time),第二是保證高品質。
“從現在看,如果當初我們選擇做‘悟空’時,還有別的團隊也做中國題材的3A遊戲,也可能會取得成功。只是過去大家都不敢想。現在,是一個時代到了。”馮驥說。

按我的理解,馮驥所說的“時代到了”,除了是指遊戲使用者市場的規模、遊戲產業軟硬體技術的飛躍外,也是指中國因素、中國題材已是產品走向世界的紅利,而不是拖累。從中國新三樣、智慧化科技生活產品、泡泡瑪特等在海外的暢銷,到中國網遊網文網劇和眾多網際網路應用在海外的走紅,在在處處也都是證明。
當然,要建立全球影響力,光有中國題材是不夠的,還要做成一流精品。
為做好《黑神話:悟空》,從形象、畫面、音樂到文字字型,馮驥團隊如履薄冰,精益求精。每個遊戲人物的名字都是歐陽詢楷書字型,源自歐陽詢的碑刻和拓本,有31個角色可以在1986版電視劇《西遊記》裡找到原型,部分角色還用了電視劇的演員配音。公司自建的掃描團隊用了三四年時間在全國100多個地方掃描古建築和不同的地貌,並在遊戲中用合理方式呈現出很多實景和實物,也讓這部作品在發行後很快出圈,形成了虛擬世界和文旅世界的互動。
遊戲科學公司官網上,關於“遊戲科學名字的由來”,馮驥這樣詮釋:
“在建立遊戲科學這家公司之前,我們感覺遊戲行業在國內似乎遠遠算不上一門科學(類比通訊行業或者計算機行業),而是充斥著由當前成功產品反推的,形形色色的成功學。
“為什麼叫遊戲科學?因為遊戲也和其他行業一樣,是一門99%勤奮+1%靈感的嚴謹學科,而不是一樁跟風押注的賭徒生意。”
從梁文鋒所說的“這一波浪潮裡,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展”,到馮驥堅持的絕不做“跟風押注的賭徒生意”,我們看到了和資產負債表瘋狂擴張那個年代所迥異的態度與追求。
硬核創新的競爭,從根本上說,在於前沿技術。
在張江高質量孵化器展廳,我看到了光量子計算原型機“九章三號”的模型。量子計算是後摩爾時代的一種新計算正規化,在原理上具有超快的平行計算能力。2023年,中科院量子資訊與量子科技創新研究院團隊與中科院上海微系統所、國家平行計算機工程技術研究中心合作,成功構建了255個光子的“九章三號”,其在百萬分之一秒時間內所處理的最高複雜度的樣本,需要當前最強的超級計算機“前沿”(Frontier)花費超過200億年時間。
這表明,光量子技術原型機在某些特定的複雜問題求解上,具備經典計算機難以企及的強大算力。
雖然要做出真正實用化的量子計算機,還要解決很多核心技術難題,但“九章三號”又一次重新整理量子計算優越性的世界紀錄說明,在前沿科技的探索上,中國不是隻能當跟隨者,而有希望成為引領者。
米磊說,中國過去的發展路徑,很大程度上是沿著“國外蹚路、國內跟隨”的模式,不用承擔探索方向出錯的浪費,獲得的是確定性的中低收益。未來則必須向硬科技進軍。
“典型的硬科技有兩種,一種是當下中國卡脖子的關鍵核心技術,一種是未來能夠引領新一輪科技變革的顛覆性技術。”
“如果晶片的尺寸從幾百奈米到幾奈米,這屬於延續性創新,但如果能夠做出架構完全不同的量子晶片或光子晶片,這就是顛覆性創新。”
硬科技時代,需要硬科技精神。米磊說,硬精神有幾個內涵:一是勇擔使命,二是敢為人先,三是啃硬骨頭,四是十年磨劍。
梁文鋒說,對頂級人才吸引最大的,肯定是去解決世界上最難的問題。“其實,頂尖人才在中國是被低估的。因為整個社會層面的硬核創新太少了,使得他們沒有機會被識別出來。我們在做最難的事,對他們就是有吸引力的。中國產業結構的調整,會更依賴硬核技術的創新。很多人發現過去賺快錢很可能來自時代運氣,現在賺不到了,就會更願意俯身去做真正的創新。”
一個時代的商業精神正在嬗變,它跟隨這個時代的國家戰略目標而變。


中國製造,硬核創新的代表
DeepSeek時刻是當下最熱的AI事件,AI又是中美博弈最具話題性的看點,自然成為本文的主題。
但我認為,中國的硬核創新之本,還是在製造業,在大國重器,在專精特新,在一批具備世界級競爭力的技術創新企業的崛起。
為什麼?最簡單的理由是,過去這幾十年,不少發達國家將製造業外包了,“放逐”了,而中國好像命裡註定就是乾製造業的,硬生生幹成了包羅永珍的世界工廠,一刻也沒停過。不是十年磨一劍,二十年磨一劍,是四十多年磨一劍,想一想,就算一開始是再粗糙不堪的鏽鐵,最終能磨成什麼樣的鋒刃?!
對製造業的長期觀察,讓我越來越將製造業理解為人類在物質材料上實現的知識進化和能力進化,包括物理、化學、生物、運算、資訊等各種知識,也包括生產、組織、運營、創新等各種能力。知識和能力的進化需要一種現實載體,以接受使用者的檢驗、反饋、改進、超越,再檢驗、再反饋、再改進、再超越。製造業就扮演了這樣的角色。
因之,守住製造業,實際是守住了知識和能力進化的根,放棄製造業也就放棄了一種重要的進化與創新方式。
最近20年,美國已有很多學者指出,創新是要以產品開發和製造過程中形成的知識和經驗體系為基礎的,創新與製造業密不可分。的確,在大多數情況下,最賺錢的不在製造業,比如美國最賺錢的公司是蘋果公司,它在美國設計產品,在全球分銷產品,但並不製造,製造基本在中國完成。在中國社交媒體上也一直有一種說法,即果鏈企業所獲的利潤佔比太少。
而美國學者在調研中的發現則是,蘋果的高階設計師、研究人員有超過一半的時間待在中國的工廠裡,幫助果鏈企業把東西造好。可見物品的製造並不簡單,中間要投注、消化很多的要求,這些要求的背後就是一代代不斷提高的知識引數與能力標準,沉澱在材料、工藝、裝置、檢驗的各個環節,以及關於產品功能的定義,和對這些定義的可靠穩定的實現之中。
在這個過程裡,美國公司賺到了能賺的錢,中國企業獲得了能得的能力。兩不虧欠。關鍵看未來。美國要看能不能用錢賺更大的未來,中國要看能不能用能力賺更大的未來。
也許是命中註定,也許是情有獨鍾,如果歷史重來一次,我猜中國大機率還是會選提升能力這條路。技不壓身。攢能力比攢錢更重要。
今天我有一個感覺,無論走到哪裡,經常可以看到中國製造的種種奇蹟,讓我明白,時間就是能力進化的最好朋友。
去年底我到廣東南海獅山鎮,在一家混合所有制企業中海萬泰看到專為深地、深海油氣開發量身打造的高階油氣裝備,名叫“璇璣”,它可以在幾千米地下瞄準油層鑽探,控制鑽頭在0.7米的薄油層中,橫向或斜向穩定穿行數千米,並對地層資料進行即時分析。

|中海萬泰製造的“璇璣”
而以前在海上進行石油開採,要先測算一個半徑約10公里的範圍進行鑽井,一旦定位不準就要移動鑽井位,移動一次的費用要上千萬元。有了“璇璣”,油氣田的開發成本大大降低。
看起來是製造,其實是知識和技術。“璇璣”技術就是旋轉導向鑽井與隨鑽測井技術,被譽為石油鑽井技術“皇冠上的明珠”,橫跨20多個學科、涉及1000多道高階工藝,有多達幾百萬行控制程式碼。
2008年,中國海油確立了自主研發的技術路線,7年攻關,成功研發出了“璇璣”系統。之後為更好地推動產業化,中國海油旗下的中海油服和佛山一家專注高階精密機械研發與製造的民企“中南機械”強強聯合,成立了中海萬泰,投入了超過200臺定製型數控加工裝置,先後突破了多個特種材料加工應用難題以及槍鑽細深孔加工、高精度深孔電火花等技術難點,實現了“璇璣”全系零件的自主加工。
我在車間裡看到了槍鑽工具。要在高溫高強度特種合金裡埋上電線,就要用這根刀杆,打穿一個細長孔,孔徑只有2毫米到8毫米,長度最長可達6米。從2022年起,中海萬泰總經理許冠和工程師、技師們持續鑽研近兩年,終於徹底捅破了這層“窗戶紙”。
今天在中國,像這樣默默無聞卻內蓄著硬核創新的案例,用雨後春筍來形容毫不為過。作為一個觀察者,我的遺憾就是看不完,寫不盡。
這就是一步步發展到今天的中國製造,充滿了知識、能力、技術的艱辛創造與創新突破。在某種意義上,中國供應鏈,就是中國的科技創新鏈。
即使中國最優秀的那些製造企業,也不可能贏得DeepSeek的轟動,但在我內心,它們更是硬核創新的代表,是真正的英雄。
我也希望,中國的AI大模型能夠幫助它們,在智慧化方向上更進一步。

結語
從我接觸的大量優秀企業中,發現都有那麼幾個關鍵時刻,構成了它們的“成人禮”。
這些時刻基本上都是下定決心,挑戰技術難題,去做以前不敢想、不敢投,覺得自己做不了、做不成、風險太大的事。
真的做了,過了這一關,整個心態就會改變,就會真正建立起自信,否則就永遠覺得,逾越不了國際上的某某標杆。
這並不是說,對外開放、對外學習、對外合作不重要,事實上,整個中國產業能力的變遷,與開放是分不開的。前一段,一家民營鋼鐵企業的總經理向我回憶了上世紀80年代上海寶鋼引進日本先進技術和設備的建設過程中,冶金部讓全國的鋼鐵企業都到現場學習,極大提高了整個中國鋼鐵工業的水平。
我也聽不少中國企業講到,雖然自己已經收購了當年想收購自己的國外同行,但當初從這些“洋老師”身上獲益匪淺。
即使今天,DeepSeek的創新,也是站在美國生成式AI和Meta開源模型的基礎上展開的。作為中國最重要硬核創新代表之一的“大飛機”,也在強調統一戰線的重要性,強調需要廣泛團結、凝聚國內外各方力量,共謀發展,共贏未來。
對外開放絕不應該是一種權宜之計。也沒有誰真的能夠包打天下。
但是,總想著躺在別人懷裡實現創新,那註定不會有什麼大出息。今天,中國企業已經有了比過去好得多的條件,迎難而上,克難攻堅,展開方方面面的硬核創新。
2000年中國的研發經費為896億元,2001年超過1000億元,2012年超過1萬億元,2019年超過2萬億元,2022年超過3萬億元,2024年超過3.6萬億元。過去1/4個世紀,中國在研發方面的複合增速遠超GDP增速。創新研發的後勁正在爆發。
去年我提出,未來中國經濟有兩大戰略機遇,一是從世界的工廠、工地到世界的市場和創新場,二是走出去,實現中國能力的全球化,再造一個“經濟中國”。從DeepSeek時刻到中國製造的脫胎換骨,大致可以下一個判斷,即中國的硬核創新時代已經來臨,中國成為世界的創新場並非虛幻,已在不可抑制地強力啟動。
如此再腳踏實地,專心專精,幹上十年二十年,則中國巍然屹立於世界科技創新之林,當不容動搖。
/// END ///
No.6187 原創首發文章|作者 秦朔
開白名單 duanyu_H|投稿 tougao99999|圖片 視覺中國/豆包

歡迎點看【秦朔朋友圈影片號】