美國政府震怒，矽谷卻讚不絕口？聊聊最近爆火的DeepSeek

▲點選圖片報名，抓住風口（iOS使用者請用電腦端開啟小程式）

本期要點：DeepSeek的真正價值是什麼？

你好，我是王煜全，這裡是王煜全要聞評論。

今年，或許出乎了所有人的意料，春節期間最火爆的話題竟然是一款國產大模型，由此引發的中美AI科技戰討論也異常熱烈。

1月20日，幻方量化旗下公司DeepSeek悄然釋出了推理大模型DeepSeek-R1。起初，由於宣傳不多，它並未引起太多關注。然而，僅僅幾天後，DeepSeek在國內外都爆火，不僅下載量迅速登頂各大應用商店，還導致英偉達股價暴跌，進一步證實了DeepSeek-R1的巨大影響。

相信不少朋友已經體驗過了DeepSeek-R1的“深度思考”功能，應該會感受到，這次R1模型不再只是紙面資料高了，現實表現也確實比較出色。

但很快，DeepSeek的官網就頻繁出現伺服器繁忙、無法註冊等情況。據稱這源於美國駭客的攻擊。而且，美國政府以及相關主流輿論也開始一邊倒地對DeepSeek進行打壓，甚至有議員提議要對下載DeepSeek的個人和機構進行重罰。

同時，OpenAI也很快做出了回應。他們不僅向公眾推出了推理能力更強的o3模型，還發布了一款名為“Deep Research”的智慧體產品，可以幫助使用者進行深入、複雜的資訊查詢與分析，而且對Pro使用者開放。也就是說，只要你願意支付每月200美元（約合人民幣1450元）的訂閱費，就能體驗到這款產品。

在這樣科技戰劍拔弩張的背景下，DeepSeek事件得到了公眾極大的關注。雖然我們也在初二對此進行了簡單評論，但仍有不少朋友在詢問我的具體看法。那麼，今天就再深聊聊。

首先，毋庸置疑的是，美國，尤其是他們的政府部門和主流媒體，對於DeepSeek的重視是真實存在的。

這不禁讓人想起，1957年蘇聯成功發射了“斯普特尼克1號（Sputnik 1）”衛星後美國人的反應。

那顆僅重83.6公斤的小衛星，是全世界第一顆人造地球衛星，它震撼了整個西方世界，尤其是讓自詡科技領先的美國感受到了前所未有的緊迫感。它不僅展示了蘇聯在火箭技術和太空探索方面的能力，還表明美國在國家安全方面也落後於蘇聯。

美國國內輿論一片譁然，覺得美國在美蘇爭霸中突然之間被蘇聯反超了。這種巨大的心理壓力，直接催生了後來的登月計劃。美國政府迅速將國防預算提升到了GDP的9.1%，同時成立了NASA（美國航空航天局）。在接下來的十幾年裡，NASA聚焦於阿波羅登月計劃，最終在1969年實現了人類歷史上的首次登月。

因此，當年這件事被稱為”斯普特尼克時刻（Sputnik Moment）“，代表著美國的覺醒和決心趕超的開始。

斯普特尼克1號

這次也有幾分相似之處。雖然美國一直在渲染“中國威脅論”，從2018年便開始對中國的科技企業進行打壓，但“中國威脅論”的具體證據卻並不充分，因為中國企業—比如晶片企業—更像在追趕，並不那麼領先，所以更像是美國政府的神經過敏。

然而DeepSeek的橫空出世，資料超越了美國引以為傲的頂尖AI公司的水平，這終於讓美國人足夠驚慌，覺得像是中國人又放了一顆“斯普特尼克1號”衛星。

但我們認為，這可能又是美國的一次過度解讀。

一方面，早在9月份OpenAI釋出o1模型的時候，我們就曾表示，o1的技術優勢並非難以超越。思維鏈的思考過程以及在訓練過程中使用強化學習演算法，並不是什麼獨家秘籍，也不是像算力、資料集這樣耗時耗力的事情，其他公司完全有可能在短期內學會並掌握這些技術。

但是，我們確實也沒想到，率先追上o1模型步伐的，既不是Meta、也不是Anthropic，而是一箇中國公司，而且它是如此默默無聞，甚至很多人都記不住它的名字。

另一方面，說句雖然公道、但大家可能不愛聽的話，雖然DeepSeek-R1本身具有重要意義，但它並不是ChatGPT3.5那樣劃時代的戰略級產品。

DeepSeek-R1的意義更多體現在戰術層面，核心在於三個主要的技術改進：訓練能耗的大幅降低、推理延遲的顯著減少以及微調成本的巨幅下降。這是典型的最佳化過程，也是我們中國企業比較擅長的事情。

然而，這種最佳化存在剛性約束，也就是說，最佳化空間有限，而且難以實現連續提升。如果過於重視這種最佳化，可能會在技術競賽中出現戰略級的失誤。

而從戰略層面看，當前AI的發展還遵循著scaling law，也就是說，砸錢堆晶片堆資料，效能就能提上去。從長期看，已有模型的效能調優的提升空間是有限的，而增加資源投入來推出更強大的模型以提升效能則是沒有上限的。

DeepSeek的最佳化是建立在近期Transformer架構一直難有突破的這個機會視窗期，利用混合專家系統（MoE）將引數利用率提升至了極限。可是，這也意味著，如果留給效能調優的機會視窗期很短暫，這種最佳化所帶來的戰術優勢將難以維持。

打個比方，14世紀手持火器剛出現時，熟練的弓箭手仍是軍隊的搶手貨，最佳化自身的射箭技術非常重要；17世紀，燧發槍出現了，弓箭手再怎麼訓練也難以與之抗衡，戰術上的勤奮終究難以彌補戰略上的失誤。

弓箭手的視窗期長達3個世紀，但在科技日新月異的今天，留給DeepSeek的持續最佳化、降本增效帶來的優勢視窗期又是多久，值得大家仔細分析。

但最後，我們認為，美國AI業界確實也出現了很大的失誤。他們太急著往前跑，都在想著怎麼在效能上領先。但問題是效能領先了，應用能否跟上？

別忘了，市場最先接受的，是能滿足應用需求且更廉價的技術，並不需要技術遙遙領先。

就像當年Intel和Windows結盟，就是在摩爾定律的加持下，Intel的算力提升大大超過了應用的需求，因此Intel只好求助於微軟，讓Windows把系統做得越來越複雜，以消耗更多算力，逼著使用者升級硬體，從而延續了Intel的晶片生意。但這個模式明顯是不可持續的。

現在雖然AI在終端智慧和空間智慧等方面還有巨大的提升空間，對算力仍然有很強的需求，但在OpenAI領先的生成式人工智慧領域，現有算力已經足以支撐應用。我們在去年底的要聞評論裡就提到過，OpenAI明顯有戰略問題，對應用開發的支援明顯不足，這時候他們需要的是Wintel聯盟，是最佳化結構、降低成本，而不是一味不惜成本地追求技術領先。

有趣的是，我們看到，雖然美國政府在想盡辦法來封殺DeepSeek，眾多美國科技巨頭卻紛紛接入DeepSeek的模型。你看，很明顯各家科技巨頭、尤其是雲平臺提供者確實看懂了DeepSeek的價值，希望引入DeepSeek，以獲得對AI應用的更好支援。

如果延續這個趨勢，生成式AI的應用—也就是我們說的AIGS人工智慧生成服務—的大繁榮應該就快到來了，只不過這個繁榮是DeepSeek、而不是OpenAI帶來的。

但仍然有個懸念，那就是美國政府除了對DeepSeek封殺之外還會做什麼？當年的斯普特尼克時刻確實帶來了美國政府的空前投入，導致了航天科技的大繁榮，這次的DeepSeek時刻又會帶來什麼呢？

這也是我們科技特訓營在今年的研究重點：在這個機會層出不窮、但形勢也瞬息萬變的時代，在潮流將要到來時做出準確預測，幫大家把握住機會。

週四天晚上的特訓營直播課上，我為大家剖析AI帶來的趨勢、機會和未來可能的格局。如果你感興趣，歡迎前來學習探討，先人一步，看清未來！

最後，我們的前哨AI矽谷行正在火熱招募中，我們將一起到矽谷看高科技企業，跟前沿創業者溝通交流，一起發掘屬於未來的機會，現在點選連結報名，還有不小優惠！報名即將截止|王煜全帶隊，直擊矽谷AI革命前沿

以上就是今天的內容，我們明天見。