
圖片來源:Unsplash
2025 年開年,DeepSeek 的爆火出圈,在中國大模型領域掀起了層層衝擊波。
自 1 月 20日 DeepSeek-R1 模型正式釋出以來,DeepSeek的應用在全球範圍內掀起了下載熱潮。據 Sensor Tower 資料顯示,DeepSeek App 在上線的 18天內累計下載量已突破 1600 萬次,這一數字較 ChatGPT 首次釋出時的 900 萬增長了近 80%,其日活迅速突破2000 萬,超越了豆包、Kimi、智譜清言等一眾大模型 ToC 應用。
在技術圈內,DeepSeek 同樣引發熱議,圖靈獎得主、Meta 首席 AI 科學家楊立昆,斯坦福大學計算機科學系和電子工程系副教授、人工智慧實驗室主任吳恩達等多位技術專家紛紛對 DeepSeek 新模型表示認可。在開源社群 GitHub 上,DeepSeek-V3 狂攬 8.25 萬個star,對標 OpenAI o1 的DeepSeek-R1 的 star 數也已達 7.17 萬,而OpenAI最熱門的開源專案 whisper 的 star 數僅7.6 萬。
這匹毫無疑問的黑馬,給國內頭部大模型公司“六小虎”們拋下了一個不得不回答的問題:為什麼是 DeepSeek?“小虎”們的競爭力在哪裡?
零一萬物出招:抱緊阿里雲加速產業大模型落地蘇州
從近期的動向來看,零一萬物算是最為直接做出回應的小虎之一。近日,零一萬物宣佈與中細軟集團、超媒體集團(原現代傳播集團)、創新奇智、倍漾量化、呈元科技、穹徹科技、隨銳科技等企業在蘇州共同成立產業大模型基地,打造製造、金融、醫療、政務等多個領域的行業大模型解決方案。

蘇州市副市長毛偉(左二),蘇州高新區黨工委書記、虎丘區委書記宋長寶(左一),零一萬物 CEO、創新工場董事長李開復博士(右二),零一萬物聯合創始人馬傑(右一)在零一萬物產業大模型基地授牌儀式現場
這與其年初的轉型發聲一致。李開復此前在接受媒體採訪時曾對外講述了零一萬物的內部轉型路徑,提前變道規劃了至少半年。
2024 年 5 月:評估和探索模型輕量化兼具頂級效能的路徑。釋出 Yi-Large 後,零一萬物內部對 Scailing Law 的邊際收益遞減進行推演,最終決定放棄訓練原定萬億引數的超大模型 Yi-X-Large,而轉為訓練更具商業落地前景的混合專家模型 Yi-Lightning。
2024 年 10 月:千億引數模型 Yi-Lightning 對外發布。其在 LMSYS 總榜上取得世界第六、中國第一的排名,超過了 GPT-4o-2024-05-13,據零一萬物介紹,Yi-Lightning 推理速度快於GPT-4o 的同時,模型價格僅為 GPT-4o 的 1/30。
2025 年 1 月:零一萬物與阿里雲成立產業大模型聯合實驗室。輕量化模型的技術路線得以驗證後,零一萬物的商業落地程序不斷加速。今年年初,零一萬物宣佈與阿里雲成立產業大模型聯合實驗室,補強自身超大引數模型的佈局的同時,正式宣佈聚焦引數適中、效能領先、推理速度快、推理成本低的輕量化模型,以產業大模型發力商業落地。一個月之後,零一萬物再次宣佈產業大模型基地落地蘇州。
2025 年 2 月:零一萬物與蘇州高新區聯合成立的產業大模型基地正式授牌,聚焦製造、金融等領域。零一萬物零一萬物聯合創始人馬傑現場一次性公佈了七個產業大模型計劃,以此作為零一萬物產業大模型基地的首批重點落地領域:
•與中細軟集團合作,共建智慧財產權大模型;
•與超媒體集團合作,打造彭博商業週刊中文版大模型;
•與創新奇智合作,瞄準製造場景研發製造大模型;
•與倍漾量化合作,聚焦產業大模型在金融領域落地;
•與呈元科技合作,推進生物大模型探索;
•與穹徹科技合作,共同打造具身智慧大模型;
•與隨銳科技合作,共同開發視訊會議大模型。
值得一提的是,此次產業大模型基地合作伙伴名單中,如創新奇智、倍漾科技、呈元科技、穹徹科技、隨銳科技均為創新工場被投企業,隨著各地政策重注大模型應用,像零一萬物+創新工場此類兼具技術與商業場景的組合或將吸引各地政府基金的關注。
在這股生成式 AI 浪潮中,多地政府已然敏銳地洞察到大模型的關鍵意義與價值。從融資維度剖析,政府基金已逐步成長為大模型領域獨角獸企業的重要資金來源;商業落地方面,“政策驅動” 與 “場景驅動” 已成為大模型商業落地的兩大核心要素。當大模型公司在政策、資源以及市場準入等多方面收穫便利之後,它們便能夠順利切入製造、政務、醫療等關鍵公共服務領域,挖掘出更為豐富的應用場景,並藉此積累真實場景資料,最終帶來商業價值的回報。
2025 最大“黑馬”DeepSeek來了,大廠小虎如何應對?
2025 年開年以來,DeepSeek 以黑馬之姿讓基座模型的技術競賽更加紅海和頭部化,據傳幾個大廠和大模型小虎們技術團隊加班加點,蛇年春節都能沒好好過。一個大家關心的話題是:經過 2024 年不斷收斂,本來位元組+阿里+六小虎的格局基本穩定,不料 DeepSeek 來了,原本的頭部玩家們怎麼接招?
我們先看看 DeepSeek 的打法。
從融資側看,近期投資圈的梗無疑是“你當初為何錯過 DeepSeek”,真相是這個梗有點“自作多情”:DeepSeek 自 2023 年誕生起就沒啟動融資,本質是“初創+隱形大廠”打法——雖然 DeepSeek 是初創公司,但其背後所背靠的正是資源量不亞於大廠的量化巨頭幻方,源源不斷地為 DeepSeek 供給資金、晶片等等巨量資源支援,這也讓 DeepSeek 有底氣做“純投入不計商業回報”的打法追求 AGI。
2025 年已經是中國大模型“商業化拷問之年”, DeepSeek 過往兩年的成長路徑對資源有限且今年“無大腿可抱”仍需單打獨鬥的初創公司而言,已經毫無“複製性”。
從基座模型側效能看,2024 年 12月以來,智譜AI、月之暗面、階躍星辰、百川智慧則相繼推出了自身對標 OpenAI o1 的推理模型,MiniMax 也開源了其全新 MiniMax-01 系列模型。其中,月之暗面更是幾乎與 DeepSeek 同時釋出了其推理模型 K-1.5。雖然榜單上各自“好看”,但沒有一家獲得足以匹敵 DeepSeek-R1 的行業聲譽和破圈的聲量。
從模型訓推成本看:2024 年 10月至今,僅有 DeepSeek 和零一萬物兩家對外公開過訓推成本。DeepSeek-V3 六千多億引數效能對標 GPT-4o-2024-05-13,訓練成本僅為557.6 萬美元;早於前者兩個月釋出的零一萬物 Yi-Lightning 引數量為千億級別,訓練成本為 350 萬美元左右,於國際權威盲測榜單 LMSYS Chatbot Arena 總榜上同樣超越 GPT-4o-2024-05-13,且Yi-Lightning 的推理速度遠快於 GPT-4o,模型價格僅為 GPT-4o 的1/30(輸入輸出按 3:1 計算)。
從應用角度來看,DeepSeek 爆紅之後一度讓其 API 和 ChatBot 成為現象級產品,據 AI 產品榜資料顯示,DeepSeek 2025 年 1 月活躍使用者為 3370 萬,遠遠超越了 Kimi 的月活使用者數(1943萬);另 QuestMobile 資料顯示,DeepSeek的日活躍使用者數在 1 月 28 日超越了豆包的約1695萬,隨後在2月1日突破3000 萬大關。重注 API 和 ToC ChatBot 賽道且投入驚人的字節跳動和月之暗面,或將被敲響警鐘。大力投放所獲得的使用者是否值得、如何保護自身產品使用者心智是亟待解決的問題。
加速商業化、構建生態將是大模型公司最強護城河
客觀來看,儘管同為中國大模型初創公司,但是“六小虎”與 DeepSeek 的企業定位卻完全不同。
依託背後幻方量化的持續輸血,DeepSeek 得以大膽啟用缺乏經驗的年輕技術人才,搭配大量算力、資金資源投入,以此來追求突破性的技術創新。從 2024 年 2 月首次提出 GRPO(Group Relative Policy
Optimization)、2024 年 5 月提出MLA(Multi-head Latent Attention),再到此次集合多項創新,探索純強化學習訓練路徑,推出了令人驚豔的 DeepSeek-R1 和DeepSeek-R1-Zero,DeepSeek 已經取得了技術理想主義的初步成功。
Optimization)、2024 年 5 月提出MLA(Multi-head Latent Attention),再到此次集合多項創新,探索純強化學習訓練路徑,推出了令人驚豔的 DeepSeek-R1 和DeepSeek-R1-Zero,DeepSeek 已經取得了技術理想主義的初步成功。
但成功的另一面,DeepSeek 目前並未給出成熟的商業化變現路徑。DeepSeek App 爆紅之後,仍要面臨著使用者留存難和 Chatbot 應用變現難的問題;ToB 方面,DeepSeek 僅開放了 API 平臺而並未有其他商業落地的新進展;由於採用開源策略,阿里雲等頭部雲計算平臺迅速完成了DeepSeek-V3、DeepSeek-R1 等模型的部署,DeepSeek 自身 API 平臺的模型用量也被進一步分流。
可以說,背靠幻方量化的 DeepSeek 更像是非營利性科研機構而不是經營性公司。這也是“六小虎”們與 DeepSeek 的最大不同。
對於“六小虎”們來說,“以己之長攻彼之短”,發力模型商業化或許是面對 DeepSeek 技術挑戰時另闢蹊徑的發展策略。即便基座模型存在差異,但早早積累起的 C 端使用者心智、B 端行業 Know-how 仍可稱得上是壁壘所在。
另一方面,模型商業化也已經成為行業發展的大勢所趨。隨著模型效能的提升與推理成本的下降,2025年被視為中國大模型賽道的商業化拐點。中國大模型行業正由早期的預訓練賽道嚮應用落地和商業模式最佳化轉變。與“不計商業回報”的 DeepSeek 不同,“六小虎”們今年的決勝點將是大模型能力的商業落地。
目前,“六小虎”們在商業落地方面已經出現了明確的分野:
-
智譜AI:嘗試 ToC,側重 ToB,聚焦國央企定製化需求。 -
百川智慧:專注發力醫療領域,探索大模型技術在醫療領域落地的多種應用。 -
階躍星辰:仍在追趕基座模型,商業落地方面目前主要為toB。 -
零一萬物:聚焦ToB垂直場景,與阿里雲合作發力產業大模型。 -
月之暗面:聚焦 ToC 應用 Kimi,仍在探索商業變現途徑。 -
MiniMax:聚焦海外 ToC 應用,探索國內 ToC 變現路徑。
目前看,零一萬物提前半年變道更追求落地和商業化的打法已經有了初步成果:與阿里雲成立“產業大模型聯合實驗室”,超大引數教師模型方面抱緊阿里,零一萬物則基於自身技術積累與行業理解重注B端產業模型,目前與多家垂直行業頭部企業合作構築起“模型-產業-價值”的閉環,算是初步交上了一份答卷。與抱緊阿里雲大腿的零一相比,仍然重注基座模型的其他小虎們所面臨著的投入壓力無疑會更大一些。
在開源模型效能不斷提升的當下,六小虎要想築牢自身發展的壁壘,就必須在垂直場景的精耕細作與技術差異化打造上持續發力,同時積極構建以自身為核心的創新生態體系,以此培養 “基於技術打造應用” 的能力,進而打造可持續造血的動力引擎。唯有如此,才能在激烈的行業競爭中走出一條適合自身的盈利之路。
而這,也將是面對“DeepSeek衝擊波”最穩固的護城河。
另一個被敲響警鐘的則是宣佈進行“更長期、更基礎AGI 研究”的字節跳動。據媒體報道,字節跳動 2024 年 8 月以來組建了大模型研究院,陸續挖了不少頂尖的大模型人才加盟,成為行業關注焦點。時隔半年,DeepSeek 在基座模型與 ChatBot 均已在國內外取得出彩的成績,而位元組的豆包模型卻仍未推出對標 OpenAI o1 的推理模型,壟斷流量池所培養出的 ToC 應用豆包的日活日前也被 DeepSeek App 輕鬆超越。如上文所說,據 QuestMobile 資料顯示,DeepSeek在正式釋出後不到兩週,日活躍使用者便超越了豆包的約 1695 萬。
位元組所選擇的“慢下來、獨立探索”的路徑究竟成效幾何,仍待時間檢驗。
歡迎掃碼加群參與討論

———END——–
極思 TopMinds 相信認知能夠跨越階層,
致力於為年輕人提供高質量的科技、資本和商業內容。
