▲點選圖片報名,抓住風口(iOS使用者請用電腦端開啟小程式)
本期要點:DeepSeek的真正價值是什麼?
你好,我是王煜全,這裡是王煜全要聞評論。
今年,或許出乎了所有人的意料,春節期間最火爆的話題竟然是一款國產大模型,由此引發的中美AI科技戰討論也異常熱烈。
1月20日,幻方量化旗下公司DeepSeek悄然釋出了推理大模型DeepSeek-R1。起初,由於宣傳不多,它並未引起太多關注。然而,僅僅幾天後,DeepSeek在國內外都爆火,不僅下載量迅速登頂各大應用商店,還導致英偉達股價暴跌,進一步證實了DeepSeek-R1的巨大影響。

相信不少朋友已經體驗過了DeepSeek-R1的“深度思考”功能,應該會感受到,這次R1模型不再只是紙面資料高了,現實表現也確實比較出色。
但很快,DeepSeek的官網就頻繁出現伺服器繁忙、無法註冊等情況。據稱這源於美國駭客的攻擊。而且,美國政府以及相關主流輿論也開始一邊倒地對DeepSeek進行打壓,甚至有議員提議要對下載DeepSeek的個人和機構進行重罰。
同時,OpenAI也很快做出了回應。他們不僅向公眾推出了推理能力更強的o3模型,還發布了一款名為“Deep Research”的智慧體產品,可以幫助使用者進行深入、複雜的資訊查詢與分析,而且對Pro使用者開放。也就是說,只要你願意支付每月200美元(約合人民幣1450元)的訂閱費,就能體驗到這款產品。

在這樣科技戰劍拔弩張的背景下,DeepSeek事件得到了公眾極大的關注。雖然我們也在初二對此進行了簡單評論,但仍有不少朋友在詢問我的具體看法。那麼,今天就再深聊聊。
首先,毋庸置疑的是,美國,尤其是他們的政府部門和主流媒體,對於DeepSeek的重視是真實存在的。
這不禁讓人想起,1957年蘇聯成功發射了“斯普特尼克1號(Sputnik 1)”衛星後美國人的反應。
那顆僅重83.6公斤的小衛星,是全世界第一顆人造地球衛星,它震撼了整個西方世界,尤其是讓自詡科技領先的美國感受到了前所未有的緊迫感。它不僅展示了蘇聯在火箭技術和太空探索方面的能力,還表明美國在國家安全方面也落後於蘇聯。
美國國內輿論一片譁然,覺得美國在美蘇爭霸中突然之間被蘇聯反超了。這種巨大的心理壓力,直接催生了後來的登月計劃。美國政府迅速將國防預算提升到了GDP的9.1%,同時成立了NASA(美國航空航天局)。在接下來的十幾年裡,NASA聚焦於阿波羅登月計劃,最終在1969年實現了人類歷史上的首次登月。
因此,當年這件事被稱為”斯普特尼克時刻(Sputnik Moment)“,代表著美國的覺醒和決心趕超的開始。

斯普特尼克1號
這次也有幾分相似之處。雖然美國一直在渲染“中國威脅論”,從2018年便開始對中國的科技企業進行打壓,但“中國威脅論”的具體證據卻並不充分,因為中國企業—比如晶片企業—更像在追趕,並不那麼領先,所以更像是美國政府的神經過敏。
然而DeepSeek的橫空出世,資料超越了美國引以為傲的頂尖AI公司的水平,這終於讓美國人足夠驚慌,覺得像是中國人又放了一顆“斯普特尼克1號”衛星。
但我們認為,這可能又是美國的一次過度解讀。
一方面,早在9月份OpenAI釋出o1模型的時候,我們就曾表示,o1的技術優勢並非難以超越。思維鏈的思考過程以及在訓練過程中使用強化學習演算法,並不是什麼獨家秘籍,也不是像算力、資料集這樣耗時耗力的事情,其他公司完全有可能在短期內學會並掌握這些技術。
但是,我們確實也沒想到,率先追上o1模型步伐的,既不是Meta、也不是Anthropic,而是一箇中國公司,而且它是如此默默無聞,甚至很多人都記不住它的名字。
另一方面,說句雖然公道、但大家可能不愛聽的話,雖然DeepSeek-R1本身具有重要意義,但它並不是ChatGPT3.5那樣劃時代的戰略級產品。
DeepSeek-R1的意義更多體現在戰術層面,核心在於三個主要的技術改進:訓練能耗的大幅降低、推理延遲的顯著減少以及微調成本的巨幅下降。這是典型的最佳化過程,也是我們中國企業比較擅長的事情。
然而,這種最佳化存在剛性約束,也就是說,最佳化空間有限,而且難以實現連續提升。如果過於重視這種最佳化,可能會在技術競賽中出現戰略級的失誤。
而從戰略層面看,當前AI的發展還遵循著scaling law,也就是說,砸錢堆晶片堆資料,效能就能提上去。從長期看,已有模型的效能調優的提升空間是有限的,而增加資源投入來推出更強大的模型以提升效能則是沒有上限的。
DeepSeek的最佳化是建立在近期Transformer架構一直難有突破的這個機會視窗期,利用混合專家系統(MoE)將引數利用率提升至了極限。可是,這也意味著,如果留給效能調優的機會視窗期很短暫,這種最佳化所帶來的戰術優勢將難以維持。
打個比方,14世紀手持火器剛出現時,熟練的弓箭手仍是軍隊的搶手貨,最佳化自身的射箭技術非常重要;17世紀,燧發槍出現了,弓箭手再怎麼訓練也難以與之抗衡,戰術上的勤奮終究難以彌補戰略上的失誤。
弓箭手的視窗期長達3個世紀,但在科技日新月異的今天,留給DeepSeek的持續最佳化、降本增效帶來的優勢視窗期又是多久,值得大家仔細分析。
但最後,我們認為,美國AI業界確實也出現了很大的失誤。他們太急著往前跑,都在想著怎麼在效能上領先。但問題是效能領先了,應用能否跟上?
別忘了,市場最先接受的,是能滿足應用需求且更廉價的技術,並不需要技術遙遙領先。
就像當年Intel和Windows結盟,就是在摩爾定律的加持下,Intel的算力提升大大超過了應用的需求,因此Intel只好求助於微軟,讓Windows把系統做得越來越複雜,以消耗更多算力,逼著使用者升級硬體,從而延續了Intel的晶片生意。但這個模式明顯是不可持續的。
現在雖然AI在終端智慧和空間智慧等方面還有巨大的提升空間,對算力仍然有很強的需求,但在OpenAI領先的生成式人工智慧領域,現有算力已經足以支撐應用。我們在去年底的要聞評論裡就提到過,OpenAI明顯有戰略問題,對應用開發的支援明顯不足,這時候他們需要的是Wintel聯盟,是最佳化結構、降低成本,而不是一味不惜成本地追求技術領先。
有趣的是,我們看到,雖然美國政府在想盡辦法來封殺DeepSeek,眾多美國科技巨頭卻紛紛接入DeepSeek的模型。你看,很明顯各家科技巨頭、尤其是雲平臺提供者確實看懂了DeepSeek的價值,希望引入DeepSeek,以獲得對AI應用的更好支援。
如果延續這個趨勢,生成式AI的應用—也就是我們說的AIGS人工智慧生成服務—的大繁榮應該就快到來了,只不過這個繁榮是DeepSeek、而不是OpenAI帶來的。
但仍然有個懸念,那就是美國政府除了對DeepSeek封殺之外還會做什麼?當年的斯普特尼克時刻確實帶來了美國政府的空前投入,導致了航天科技的大繁榮,這次的DeepSeek時刻又會帶來什麼呢?
這也是我們科技特訓營在今年的研究重點:在這個機會層出不窮、但形勢也瞬息萬變的時代,在潮流將要到來時做出準確預測,幫大家把握住機會。
週四天晚上的特訓營直播課上,我為大家剖析AI帶來的趨勢、機會和未來可能的格局。如果你感興趣,歡迎前來學習探討,先人一步,看清未來!
以上就是今天的內容,我們明天見。
推薦閱讀:
【科技特訓營】看懂科技產業,離不開長期觀察。線上書院模式,與王老師深度連結!為未來五年做好準備,先人一步,看清未來!
↓長按圖片掃碼報名,先人一步,看清未來


↓¥399,掌握王煜全AI產業預測精華(iOS使用者請在電腦端開啟)
↓點選加入,學會用AI為你工作(iOS使用者請在電腦端開啟)
此外,我們還為您準備了一份清單
“全球重要開源AI大模型一覽表”
