2025.03.22

本文字數:3860,閱讀時長大約6分鐘
導讀:DeepSeek出現後,AI六小龍最後還能剩下幾家?
作者 | 第一財經 呂倩
3月18日,前VC投資人莊明浩在朋友圈轉發了三段文章片段:百川“斷臂”醫療To B,零一萬物明確不做萬億規模超大引數模型,以及朱嘯虎稱金沙江的LP們非常感謝他沒有在基礎模型公司上浪費一分錢。莊明浩的轉發配文是:“或許旁觀者可以笑看,但如果你身在其中呢?”
目前來看,“身在其中者”紛紛調整船頭,以“AI六小龍”為例,明確掉轉船頭的是退出“超大基模”燒錢賽的零一萬物、聚焦醫療方向的百川智慧。剩餘“四條龍”中,智譜與階躍星辰分別背靠北京市與上海市政府資源推進專案進展,Minimax在海外市場與影片領域較為穩定。月之暗面受到DeepSeek衝擊較為明顯,QuestMobile 1月資料顯示,當月DeepSeek 日活(DAU)超越豆包,Kimi 退居第三,且使用者增速明顯放緩。
DeepSeek的技術革新與成本降低拉動行業“技術平權”,一方面衝擊大模型原有格局,一方面拉動算力聚焦推理端,帶動大模型應用的繁榮。全球投資機構a16z3月釋出的AI產品流量TOP50榜單中,Web端排名前五十名裡,中國共有19款產品入榜,佔比升至38%。去年8月的榜單中,中國市場僅有8款產品上榜。同期美國AI產品的數量從33款降至23款,佔比降至46%。
當訓練端技術代差縮小,算力壓力得到一定程度的緩解,開源市場助推創業者想法落地,中國市場在產品端的優勢得以凸顯。而原本佔據行業頭部位置的競爭者們,亟需調整方向,補充彈藥,備戰新一輪大模型倖存者挑戰賽。

▲a16z榜單Web端TOP50

DeepSeek之後基模還有意義嗎?
DeepSeek的爆火之所以直接衝擊了原本的大模型格局,核心原因在於DeepSeek-R1模型在更低成本與開源生態的基礎上,在多個關鍵任務上展現出與國際頂尖閉源模型相當甚至更優的效能。此外,DeepSeek採用的強化學習技術和混合專家架構(MoE)等技術也提高了模型的推理能力和效率。
另外,不同於多款模型有限度的“偽開源”,DeepSeek將模型架構、訓練方法,以及資料處理方案完整公開,徹底的開源策略吸引了全球超過20萬開發者參與生態建設,衍生出醫療、金融、教育等垂直領域的定製模型,直接衝擊了傳統大模型廠商依賴高昂授權費用與閉源模式來盈利的途徑。
但目前市場上對DeepSeek是否徹底顛覆基座大模型市場與Scaling Law(擴充套件定律)仍有不同聲音。在堅定的應用派朱嘯虎看來,目前市場已經沒必要去關注傳統“AI六小龍”了,創業公司做底層模型已經毫無意義。他稱,自己一開始便認為基礎模型會成為水電煤一樣的這種通用的商品服務,但沒想到會這麼快,並且以這麼劇烈的方式。
大洋彼岸的英偉達也因DeepSeek的熱度而一夜暴跌近六千億美元,投資者主要擔憂DeepSeek的技術突破可能會降低市場對英偉達昂貴硬體的需求,特別是其高階GPU。在剛剛結束的GTC大會上,英偉達創始人兼CEO黃仁勳回應該疑問時稱:從兩年前的ChatGPT到如今的推理機會,AI Scaling Law並沒有消失,而是從一個變成了三個——預訓練擴充套件、在代理人工智慧(Agentic AI)階段的後訓練擴充套件,以及針對推理模型的擴充套件法則。其中推理(inference)實際是計算的最終難題。他認為,去年全世界對Scaling Law的預測都錯了,如今的算力需求已比去年預估的規模高出100倍。
然而,大會當日英偉達收跌3.4%,華泰證券分析師認為,此次GTC上,雖然公司也提出了後訓練Scaling和測試時間Scaling的敘事,但從英偉達當天股價表現上來看,此次GTC或未能打消投資人在算力需求增長方面的擔憂。
第四正規化創始人戴文淵對記者表示,DeepSeek給全行業提供了一個更好的基座,給全行業帶來巨大幫助,更大的推動意義是推動深度推理方向的出現,幫助中國AI產業減少在預訓練環節面臨的限制。當更多算力聚焦在推理端,整體技術與效能上也追上來了。
但不能因為更多算力聚焦推理端便否定訓練端的意義。戴文淵打了比方:訓練端就像考前刷題庫,推理端就像考試時的具體思考,如果平時沒有好好做題,就需要在考試時多思考。只是對於國內市場來說,訓練端確實會面臨算力的壓力,所以當行業進入推理週期後,對原有的基座大模型產生了影響。

▲英偉達強調Scaling Law三條曲線

“六小龍”轉向
對於Scaling Law的辯論雖然尚未停止,但更多算力資源傾斜推理端漸成事實,投入大量資金押注基座摸底的廠商主動或被動地調整業務方向。
最新的動態發聲中,零一萬物創始人李開復回應第一財經等媒體時稱:公司未來不再做單一大模型,而是採取模型開放策略,研發能夠相容適配國內主流模型的產品,轉型之後,零一萬物從基座大模型重投入調整為軟硬體解決方案提供商,不再訓練萬億引數規模的超大基模,但仍會繼續做輕量化模型。
另外便是百川智慧調整業務方向:最佳化金融業務,聚焦醫療To B賽道。對於金融業務的收縮,百川官方對記者回應稱:百川正按照既定規劃,對金融業務進行最佳化調整,以集中資源、聚焦核心業務。
據記者瞭解,百川自2024年便逐步縮減對預訓練大模型的投入,今年將逐漸加大對醫療增強大模型的傾斜。AIGCLINK發起人、行行AI合夥人佔冰強對記者表示,目前AI六小龍各家基因不同。其中百川相較其他廠商,醫療賽道反而是其優勢行業,因王小川在創業搜狗搜尋時,積累了大量醫療行業的客戶。從整個AI領域來講,佔冰強認為,發展已不能僅僅參考廠商開發能力,還要具備各種商務能力,目前百川的醫療商務資源是一項優勢。
3月20日,百川智慧與北京兒童醫院、小兒方健康共同釋出全球首個兒科大模型“福棠·百川”兒科大模型。技術的落地目前對百川不成問題,但市場份額的爭奪仍面臨嚴峻挑戰,尤其目前行業多家企業已開始側重醫療方向。如華為組建醫療衛生軍團、聚焦醫療大模型臨床落地,科大訊飛控股子公司訊飛醫療推出訊飛星火醫療大模型,騰訊與邁瑞聯合開發“啟元”重症大模型,多家醫院宣佈接入DeepSeek大模型。
另外,資金壓力也是醫療場景需要考慮的重點。目前部分醫院缺乏高效能計算資源(如GPU)和高速網路連線,難以滿足大模型的算力需求;醫院內部對資料管理嚴格,限制了資料的共享和呼叫;醫療領域對錯誤的容忍度極低,醫療大模型需要達到極高的準確率才能在臨床場景落地,多數醫療模型還停留在合作試水的階段。因此相較金融、營銷、社交娛樂等場景,醫療並不利於初創公司緩解資金壓力。
不同於其他廠商進行業務層面的收縮,智譜透過加快拿單與融資速度的方式緩解資金焦慮。僅在3月內,智譜便先後宣佈獲得杭州國資、珠海華髮集團、四川成都高新區的融資,同時伴隨雙方專案合作協議達成。例如珠海高新區、華髮集團與智譜簽署合作協議,宣佈聯合智譜搭建首個城市級GLM大模型空間“智譜+珠海華髮空間”,為珠海產業提供從技術層、平臺層到應用層的全棧AI技術支援。另外,四川成都高新區合作智譜打造四川省基座大模型“智譜諸葛大模型”,同步建設大模型訓練中心、研發中心及西部賦能平臺三位一體的AI基礎設施。
但需注意的是,如果智譜的新輪募資需要以專案進展為節點,那麼公司在資金層面的壓力並未從根本上得到緩解。
剩餘“三龍”跟進開源方向。階躍星辰從去年的態度審慎到今年明確加大開源力度,3月20日再次披露圖生影片模型開源;MiniMax在收縮B端業務後,持續投入影片生成、視覺多模態與海外產品;月之暗面大幅收縮產品投放預算,逐漸披露在長文字與開源技術方面的進展。

▲DeepSeek、Perplexity和Claude月訪問量變化對比

從技術追趕到產品博弈
DeepSeek影響之下的行業格局會走向怎樣的分化,不同位置的人士給出不同表達。
朱嘯虎認為,未來基礎模型的競爭格局內,大廠中只會留下阿里、騰訊、位元組這三家。在他看來,阿里通義千問本身佈局非常好,也有開源模型;騰訊在基礎模型上原本是落後的,但因為全面擁抱DeepSeek,反而一下子趕上來了;位元組目前投入很大,並且對自己的AI能力很有信心。至於創業公司,朱嘯虎認為必須找到自己的根據地,才有機會異軍突起,但從現狀來看,他認為還沒有看到能夠顛覆阿里、騰訊、位元組的萬億美元機會。
李開復結束業務調整之後,也表達了對大模型格局的看法。他認為中國大模型格局很大機率會收攏到三家——DeepSeek、阿里巴巴和字節跳動,理由是他們的模型會隨著時間不斷迭代進化,其中DeepSeek 目前最具勢頭。至於其他基模平臺,李開復認為,吸納大量資金訓練的基座模型開始趨近同質化,它們成本高昂,越來越難和開源技術競爭。
如果將眼光聚焦在中美兩地的AI格局,李開復認為,中美市場中的超大模型預訓練正在逐漸寡頭化,並且寡頭化的程度在不斷加大,其中開源圈展現出壓倒性的優勢。美國市場中,OpenAI 和 Anthropic 都相信自己還能訓練出遠超其他玩家的閉源模型。但從結果來看,OpenAI 在2024年的運營成本為70億美元,而DeepSeek的運營成本可能只有OpenAI的2%。
從技術層面來講,各家模型各有優勢,李開復認為的核心痛點並非哪家模型在效能上能夠較其他模型高出1%,而是模型路線本身是否具有可持續性。例如OpenAI每年花費 70 億美元,面臨鉅額虧損。但現在出現了一個競爭對手,將成本低廉數倍的開源模型免費開放給市場,且這個競爭對手資源充沛,目前看來 DeepSeek 有足夠的資金儲備持續投入模型研發,並已經有效地將計算成本降低了五到十倍。“有了這樣一個強大的競爭對手,我認為OpenAI的薩姆·奧爾特曼可能夜裡輾轉難眠。”李開復表示。
奧爾特曼也在調整動作。近期,在對外採訪中,奧爾特曼對DeepSeek的爆火進行了反省,他認為是OpenAI對“思維鏈”的隱藏留給了其他人病毒式傳播的機會,這也是一次很好的警醒,未來GPT5可能免費。
OpenAI最近的更新越來越多地聚焦在產品端,包括API更新、釋出語音轉錄和語音生成AI模型等,這也符合奧爾特曼“產品套件”的策略,奧爾特曼認為如果執行出色,未來五年,OpenAI將擁有一系列數十億使用者規模的產品。但一位聚焦Agent領域的創業者對記者表示,OpenAI的產品做得“一般”,相較於技術層面的原始創新,中國創業者在產品端擁有更多的成功經驗,而這也將成為DeepSeek推動技術平權之後,中美新一輪的競賽場。
微信編輯 | 生產隊的驢(拉磨版)
推薦閱讀