DeepSeek:一場中國網民的春晚

文 | 清和 智本社社長  來源:智本社
大過年的,被DeepSeek鬧得沸沸騰騰。
這是一場剛到海里開會的浙大學霸創辦的頂級量化基金開發的A股股民贊助的被稱為國運級別的低成本高效能的國產大模型一舉擊潰英偉達股價刺破美股科技泡沫單挑美國矽谷震驚特朗普或引來聯邦政府調查堪稱美國斯普特尼克時刻的在中國蛇年春節上演的東西方頂尖技術對決大戲。
說DeepSeek是一場春晚,並不是指它華而不實,而是說,這是一箇中國方面樂見其成的情緒價值滿滿的故事,正如新年人人互道:新年好。
很多人會在除夕夜看春晚,但看完後又免不了吐槽幾句。DeepSeek這出新年大戲太完美,完美到讓一些人冷靜下來後不禁懷疑。一些社友在微信上問我怎麼看。大年初二,我來公司加班簡單地說兩句。
本文邏輯
一、討論兩個問題
二、對美股的影響
三、中美技術競賽
01
討論兩個問題
先討論兩個問題。
第一個問題:DeepSeek的技術是不是這麼牛?
這是一個首要的關鍵問題。但是,我不懂技術,也不懂技術測試,沒辦法正面回答。我看了一些技術文章說得也不清不楚,可能是DeepSeek目前披露的資訊還太少。
我下載了DeepSeek,問了幾個我熟悉的問題:介紹公眾號智本社,誰創立的?回答很糟糕,居然不知道是我創立的。同樣的問題,Kimi的表現要出色得多。這個Seek不夠Deep呀?
後來,一些社友跟我說,社長可能沒有聯網。我不知道這個系統還要聯網。然後,一個美國的小朋友把同樣的問題輸入DeepSeek,輸出的結果讓我很滿意。
這事只能說明我不懂測試,仍不知DeepSeek水平幾何。
接下來,我用常識去理解這個事情,沒錯,用常識就夠了。
根據現在披露的資訊,DeepSeek最厲害之處是價效比極高:DeepSeek-V3的基準測試效能接近GPT-4,但其預訓練成本約為557.6萬美元,而GPT-4的訓練成本成本高達7800萬美元甚至是1億美元,雙方的成本至少是10倍的差距。
DeepSeek不需要消耗大量英偉達昂貴的高效能晶片,其效能也能夠接近GPT-4的水平,因此被稱為“大模型界的拼多多”。其原因是,DeepSeek改進了演算法。
不過,有些人懷疑DeepSeek撒謊,難道Open AI和美國團隊不會改進演算法?其實,價效比極高是典型的中國故事,從製造業到技術產業皆如此。
有人懷疑DeepSeek是“套殼”,認為是基於OpenAI的GPT企業版API做了一些二次封裝和微調。美國官方對DeepSeek是否“偷竊”展開調查。這個估計不容易有結果,即便有結果也是來回扯皮。
根據常識,美國團隊在原創技術方面(0-1)天下第一,中國團隊在技術應用方面(1-1000)尤其是在價效比上天下第一。
所以,當美國研發出大模型後,中國團隊跟進是很快的。你看,現在的矽谷AI公司,哪家沒有華人工程師。沒有華人工程師,他們的活誰幹?
但是,DeepSeek團隊是怎麼做到的?
這是個迷。
不過,DeepSeek R1釋出文字的第二行提到一個被很多人忽略的技術,叫蒸餾技術。這個概念是 Geoffrey Hinton等在其論文《Distilling the Knowledge in a Neural Network》(2015)提出來的。
什麼意思?打個比方。上高中時,班裡的學霸只學習了10年的數學,在考試時比學習了近60年數學的數學老師更強(同是150分,但速度更快)。沒錯,當時我們的數學老師就是退休返聘的60多歲的數學大牛,但滿身武藝的數學老師怎麼考不過學生呢?原因就是,學生用了蒸餾技術,迅速地從知識豐富的老師身上學到滿足考試的數學知識、思維和技能,加上拳怕少壯,學生反而能在小領域(考試)比試中表現得更出色。這類書經濟學中的“幹中學”。
但是,蒸餾技術有缺陷,最開始你可以蒸餾一個小模型出來,成本很低,效能很好,但是想要繼續突破,做成真正的大模型,要投入很高的研發和訓練成本。這就是DeepSeek後面的難題。就像一個考上大學的學霸,想要真正學好數學,還是要投入大量的時間。
祛魅後,這個故事變成:美國AI在原創技術上依然天下無敵,中國在低成本計算應用層面迅速跟進,如今二者似乎直接競爭,但讓子彈飛一會兒。
第二個問題:是不是媒體炒作?
這是毫無疑問的,但不能否定什麼。
這個春節大戲太完美,完美就是最大的破綻。剛剛在海里開完會的中國學霸單挑矽谷精英,帶領量化私募四大天王之一幻方研發AI,在蛇年春節跟美國爭奪技術主導權,以低成本高效能擊潰英偉達股價、震撼美國,突破半導體技術“卡脖子”。
這個故事有太多宏大敘事的元素,我們憑常識就能夠判斷媒體在其中扮演了重要角色。瞭解中國金融的人都知道,金融是吃資源飯的,任何一家頂級量化私募都不是一個學霸能夠搞定的。瞭解中國媒體的人也知道,媒體是特殊行業,一類資訊集中密集釋出,不僅僅是平臺演算法發揮神力,更是背後的人在操作。
不過,從中國方面來說,大多數人都樂於看到這故事的出現。中國官方肯定希望看到這樣的團隊和技術出來,同時希望把它提升到宣傳層面。技術人喜歡看新東西,投資人喜歡看前景,還有一些投資人可以趁機做空英偉達。官方媒體有宣傳可寫,有廣告費收入,自媒體人有話題有流量。
我也希望看到這種事情發生。只是我不希望它是一個被宣傳的故事,不希望它變成春晚,而是希望看到真實的故事,儘管這是不可能的。我更希望看到的是,AI應用落地,包括在量化交易上。
有實力才能炒作,你看沒有媒體炒作智本社。而且,有實力才能經得起炒作。後面這句話更為重要。頂級技術競爭,容不得半點虛假,如果在美國資本市場上,任何虛假很快就被做空者擊穿,價格很快就會懲罰弄虛作假的行為。
所以,我的態度是,中國有一些傑出的技術團隊,如果做出不錯的應用技術,讓市場去評價,讓價格去檢驗,讓使用者去體驗,不要被宏大敘事所裹挾,要努力創造消費福利。
02
對美股的影響
如果這是中國單方面炒作,那麼人家美國人為啥配合你?
你看,特朗普都震驚了,美國政府準備調查,英偉達不得不出來發聲明,黃仁勳、馬斯克、Open AI和微軟一群矽谷大佬都出來說話。
更重要的是,美股也配合。
週一(27日),英偉達股價收盤暴跌16.86%,創下自2020年3月以來的最大跌幅,市值在一日之內蒸發了近6000億美元。這成為美股歷史上最大的單日市值蒸發案例。除了英偉達外,博通跌17.40%,AMD下滑6.35%,微軟下跌2.14%。受半導體股衝擊,當天納指大跌3.07%。
我們經常講,價格不會騙人,尤其是美國資本市場的價格更不會騙人。那麼,這是否能夠說明DeepSeek一舉擊潰英偉達股價、挑戰整個矽谷、刺破美股AI泡沫、讓美國各界與投資人感到恐慌?
一些投資美股的社友比較著急地問我:DeepSeek是否改變了美股走勢?
我的觀點有四:
第一,毫無疑問,DeepSeek在媒體上的表現,是導致英偉達以及半導體股價大跌的直接原因。
邏輯上是這樣的:DeepSeek的訓練成本大幅度下降,對英偉達高效能晶片的依賴度大大降低,英偉達等半導體公司的短期營收被看空;隱含的問題是,美國科技公司在大模型方面的資本開支過高。
第二,但是,DeepSeek不過是誘因,主要的問題還在英偉達和生成式AI自身上。
自大模型爆發以來,生成式AI潛藏著一個讓投資者擔心的問題:到目前為止,大模型還沒有出現一個殺手級的應用。
當前,微軟、谷歌等科技公司大規模採購英偉達晶片,推動英偉達的業績和股價狂奔,實際上,這是投資者在不斷地給AI輸血。但是,如果終端市場上一直沒能湧現一個殺手級應用,沒能大幅提高生產率,沒能產生經濟效益,那麼大型科技公司最終會放棄對算力的瘋狂儲備,而英偉達的“鏟子”終有一天會賣不動。
這個擔憂就像懸在英偉達頭上的達摩克利斯之劍,一旦英偉達股價漲勢太猛,投資者會感覺它太貴了、泡沫太大了,一點風吹草動就較大幅度回撥,近半年皆如此。更何況,這次DeepSeek所宣稱的極高價效比,可謂直擊英偉達的“軟肋”。這就好比在野球場上一個光腳大叔碾壓了一個裝配齊全、身穿24號、跳投美如畫的籃球小子。
但是,英偉達的技術實力是毋庸置疑的,客觀上來說,DeepSeek不是英偉達的競爭對手,而是英偉達的客戶。如果DeepSeek真能如它所宣稱的那樣把成本降到這麼低,那麼DeepSeek實際上擴充套件了市場,促進了英偉達的業務,只是當前英偉達遭遇了傑文斯悖論(Jevons paradox)。
微軟執行長納德拉就在社交媒體X上引用了傑文斯悖論(Jevons paradox)來解釋。1865年,英國經濟學家傑文斯在《煤炭問題》一文中提出,隨著蒸汽機效率的提升,煤炭消耗量不降反增。
如果DeepSeek把成本壓低,短期內市場對低效能(類似於煤炭)半導體的需求增加,對英偉達高效能的採購會下降。
第三,成本下降是大勢所趨,DeepSeek等高性價比應用的出現,將擴充套件到整個內容式AI市場,長期對英偉達、半導體、人工智慧產業以及美股AI板塊都是利好的。
為什麼內容式AI在大模型誕生三年來都未能出現殺手級應用?
最重要的原因是成本過高,尤其是算力成本。
ChatGPT是一個革命性的產品,但它為什麼不是一個殺手級應用?
我一個朋友分析得有道理,他說,從應用的角度來看,ChatGPT是一個過時的產品,是網際網路1.0時代的搜尋產品。這個時代,使用者獲取資訊的方式完全被演算法控制,已經形成了演算法推送、被動接收的習慣,使用者不再是網際網路1.0時代的精英使用者,他們提不出幾個好問題,甚至懶得提問。
我的理解是,如果要產生殺手級應用,那麼它一定是在垂直領域。ChatGPT是通用人工智慧,就像是一個智力超群的數學天才,他的智力要產生經濟價值,必須落到具體的領域,比如AI生文、繪圖、製作影片、製作數字人、創作音樂、教授英文、實驗分析、財務核算、市場預測、量化交易等等。
垂直領域為什麼沒有產生殺手級應用?
成本是攔路虎。目前,ChatGPT多數版本都未開源,垂直領域的公司沒有能力自己開發大模型。大多數垂直行業的公司一不具備頂尖的技術力量,二無法承受技術失敗的風險。而初創公司往往又不具備行業資料和行業專業能力。
但是,幻方量化是特殊的,這家量化私募的規模很大、資金雄厚,背後定然有強力支持者。這家公司的創始人梁文鋒又是技術背景出身,而且擁有一個懷揣技術理想的精英團隊。2021年,幻方管理基金規模一度超過千億元。2022年,幻方量化大力進攻AI,平均每天用近2000張GPU卡在跑科研,而不是在做量化交易。第二年,他們把DeepSeek獨立出來運作。令人疑惑的是,DeepSeek擁有萬卡叢集算力,是大廠之外唯一擁有萬張 A100 晶片的公司。在中國,只有騰訊、阿里等極少數公司有能力有動力囤積如此大規模的晶片和算力。
可見,這不是一個簡單的創業故事,可能是另外一個華為,其背後市場之外的力量是關鍵。
不管是DeepSeek也好,還是通用AI也好,只要能夠把算力成本降下來,並且對全世界開源,那麼,很多垂直領域都可能出現殺手級應用。
所以,價效比下降和開源推動垂直領域殺手級應用湧現,將是全球生成式AI的現金牛時代。
第四,不管DeepSeek真正實力如何,都不會影響這輪美股的成長性,仍堅持之前的預測,2025年美股繼續上漲,其中代表週期性的道瓊斯指數比代表成長性的納斯達克指數更穩定。
美國經濟正在擺脫2008年以來的低增長、低利率、低通脹陷阱,正在形成一輪新的景氣週期,未來三年美股的走勢基本上由經濟週期決定。
正如我之前預測的,2025年,美股整體上漲,代表週期性的道瓊斯指數上漲,受AI影響的納斯達克指數波動會大一些。你看,27日,納斯達克指數大跌3.07%,道瓊斯指數依然上漲0.65%。
2025年,在配置策略上,納斯達克指數和科技七巨頭回撤時買入,切勿追高;同時,資金可以往道瓊斯指數和週期性龍頭股調配。拉長時間來看,未來3年,AI的商業化應用應該可以兌現,納斯達克指數和科技七巨頭能夠跑贏道瓊斯指數。
當前,市場一直在懷疑AI泡沫風險,風險反而不大;當市場達成共識,形成美國經濟景氣週期和AI商業化兌現的預期,市場泡沫反而會快速地堆積。
03
中美技術競賽
中美技術競賽,是當下正在發生、且未來十年將持續加劇的不可迴避的主旋律。
DeepSeek火爆中外媒體,中國民間喜歡看到本土學霸挑戰美國矽谷高富帥,而美國總統特朗普借梯子上樓,趁機強化中美技術競爭形勢。
如果DeepSeek的低成本、高性價比是真實的,那麼,中國低成本(生產製造與技術應用)與美國高技術之間的競爭,已經從製造業蔓延到最火熱的AI領域。
對美國來說,中國的產業競爭力到底是什麼水平?
美國人說的不客觀,中國人說的也不清楚。國內有兩種傾向:一是認為中國技術很強大,除了美國,其它國家都不用看,而且喜歡上升到意識形態的對抗上;二是認為中國技術很弱,拿蘋果、微軟和ChatGPT做對比。
我的觀點是,中國產業競爭力在國際上是“七七八八”,比上不足、比下有餘,不要誇誇其談,也不要妄自菲薄。
美國在原創技術上,如晶片底層設計、大模型演算法,是天下第一。而這個天下第一,是彙集天下英才而成。這源自其國家制度的吸引力。這也是美國最核心的競爭力。
中國在產業鏈上,尤其是生產製造低成本和技術應用層面,是天下第一。不用懷疑,你去長三角、珠三角的工廠,去騰訊、阿里、聯想這些大廠走一遍,然後去美國、日本、歐洲、越南、印度走一遍,不用深入調查,走馬觀花,就能夠理解我說的話。
中國最大的優勢就是極其廉價的全產業鏈,為全球提供了30%多的產品。廉價全產業鏈的好處為新技術的落地提供了條件,即非常有利於技術應用。以手機為例,過去10年,蘋果等智慧手機不斷迭代,除了作業系統等少部分頂尖技術外,大部分軟體和硬體的應用技術的創新和落地都發生在中國。原因是全球手機產業鏈基本都在中國。
在AI方面,中國擁有龐大的AI基礎和工程師隊伍,而且,很多工程師在美國頂尖高校畢業,在美國科技公司工作過,接觸到全球最領先的技術。中國工程師在某些AI領域作出創新成果,其實並不意外。實際上,AI創新在矽谷華人工程師中每天都在湧現。
假如這種產業格局是全球化競爭與比較優勢選擇的結果,這沒多大的問題。但是,如今美國認為,這不是市場競爭的結果。
這到底是市場競爭的結果,還是人為設計的?
肯定是有市場的因素,中國勞動力人口多,工人願意加班,等等。當然,也有明顯的非市場因素。例如,要素價格均等化為什麼沒有發生?工人工資為什麼沒有快速上升?假如工人工資上升到一定水平,他們還願意加班?又如,為什麼大規模的貿易順差長期存在?匯率機制為什麼失靈?如果開放進口市場、外匯市場、金融市場,是否可以平抑貿易失衡?
這些問題我認為是說得清楚的,但是沒辦法呈現出來,更沒辦法成為雙方溝通的內容。於是,貿易摩擦與技術競爭不可避免地成為主旋律。
特朗普的想法是簡單粗暴,懶得區分市場因素、非市場因素,不管民間的因素還是官方的因素,看到貿易逆差就暴躁,看到DeepSeek就來勁。他習慣於用關稅手段、制裁手段來施壓。不僅是對中國,包括解決邊境的非法移民問題,特朗普也是用關稅手段來警告、懲罰鄰國。
這次DeepSeek震驚了美國,美國人沒有想到,中國廉價競爭力這麼快從製造業領域滲透到AI領域。而且,DeepSeek-R1基於MIT許可協議,允許全球開發者自由修改、使用、分發模型,這涉及到內容式AI的領導權之爭。
客觀上來說,DeepSeek乃至中國整個AI都無法撼動美國的技術力量。但是,在中美競爭的當下,特朗普會藉此機會強調來自中國的競爭,而且,可能會對半導體和AI技術領域實施更嚴厲的禁令。另外,特朗普政府已宣佈投資5000億美元建設AI基礎設施“星際之門”,有人此專案比喻為當年美國的“星球大戰”計劃。
過去,我可能會說,像DeepSeek這樣的產品出來,不要過度宣傳,尤其不要上升到中美競爭的內宣層面。如今資訊非常通暢,這類內宣很快就進入美國社交媒體,最終或引來更多的衝突。
同一個商業故事,在全球化時代,與在國家競爭時代,其結局是完全不同的。
DeepSeek的出現,放在20年前,可能就像淘寶的出現,一個成本更低的應用在中國誕生,然後獲得美國風險投資,經過幾輪融資,最終赴美上市,美國投資者獲利,中國創業者創富,中國消費者獲得普遍實惠。這就是一個全球化的完美故事。但是,放到今天,DeepSeek可能面臨來自兩國競爭的風險,正如深陷困境的TikTok。
實際上,兩國競爭,很多無辜的人會被捲入。但是,這將不可避免地發生。
大多數人沒辦法用歷史的視角看待當下,當下的中國是美國從未見過的競爭對手,美國不好定義當下的中國,二者的競爭將以什麼的方式展開,邊界在哪裡、競爭領域在哪,還在探索之中。
所以,2025年,我們需要直面現實,看清大勢,做好對沖,做好小事。
從歷史的角度來看,福山的時代已一去不復返,當然當下與未來也絕不是亨廷頓的時代。
對此,您怎麼看?
期待您在留言區理性發布高見,留言點贊最高的朋友,掃碼文末投行君微信,可以獲得投行圈子商務揹包一個
投行圈子已組建多個私域社群,根據會員職業及愛好,進入(投行業務交流、專業學習、股權投資、資管、業務推廣、上市公司高管、銀行、海外資產配置、單身脫單、摜蛋等等)相關社群。目前已超過6000位精英會員,歡迎加入。
 ↓點選關注投行精英,對話視窗回覆“乾貨”,獲得投行乾貨大禮包

商務合作、投稿、約稿以及金融同仁資源對接、入群請新增管理員投行-滌生微信。

我正在「投行圈子」和朋友們討論有趣的話題,你⼀起來吧?點選閱讀原文,加入投行圈子知識星球。

相關文章