
徹底的技術開放,成就的商業奇蹟。
文丨賀乾明 張家豪
製圖丨黃幀昕
編輯丨程曼祺 黃俊杰
中國正在經歷自己的 “ChatGPT 時刻”。過去三週,DeepSeek 的官方應用永遠被人流擠到癱瘓邊緣,與此同時數百家公司正式接入了它研發的大模型。MiniMax、階躍星辰等與它有競爭關係的 AI 創業公司接入了,元寶、文心一言這樣的大公司 AI 產品也接入了。
高潮是上週末,微信,這個幾乎從不追趕任何潮流的國民級應用也在搜尋頁面接入了 DeepSeek-R1。根據我們瞭解,騰訊最高層在近期曾與 DeepSeek 創始人梁文鋒見面。除了微信以外,QQ 瀏覽器、QQ 音樂、騰訊文件等騰訊的十幾個產品也都接入 DeepSeek。
一個沒花一分錢營銷的技術公司實現了 “DeepSeek Inside” 的品牌奇蹟。
這個奇蹟只能誕生在中國:
-
網際網路滲透最徹底的人口,每天 6 小時泡在數字世界裡,抖音、小紅書、微信、微博等平臺接力將 DeepSeek 送到每個人眼前。
-
先在全球技術社群引發熱議,後在國內發酵,完美貼合在全球 AI 競賽激發的情緒。
-
春節假期造就社交裂變溫床,被子女 “安利” 的長輩們點開小鯨魚圖示,完成 AI 在中國的首次全民級破圈。
做到這一切,DeepSeek 用的是從業者、投資者此前不敢想的方式:持續開源自己最好的模型。
ChatGPT 震撼世界後,OpenAI 選擇保密、引入微軟投資,竭力接入儘可能多的流量。兩年後,面對類似的流量海嘯,DeepSeek 仍中立、開放,沒拿投資,不與任何一個大廠深度合作。這讓各公司在接入 DeepSeek 模型時都少了一份決策壓力。
“上善若水,水利萬物而不爭。” 開源的 “不爭”,讓底層雲平臺,中間層 AI Infra 廠商,再到直接面向用戶的消費級 AI 應用都加入這場 “接流量” 大賽,也在全行業做了一次 AI 普及教育。

48 小時定增幅的平臺算力競速
算力雲平臺是 DeepSeek 流量盛宴中最直接的受益者。
1 月 28 日,春節假期第一天,DeepSeek 的官方 API 呼叫介面已接近癱瘓。
大模型推理引擎雲平臺矽基流動創始人袁進輝在朋友圈覆盤:1 個月前,DeepSeek 創始人梁文峰就問過他,要不要在矽基流動平臺上部署 DeepSeek 12 月底發的 V3,他算賬後發現,如要保證使用者體驗,得用 80 張 H800(英偉達的一款 GPU),每個月要花五、六百萬元,覺得風險太大就放棄了。
“現在 DeepSeek 這麼火,決策失誤 …… 欲哭無淚。” 袁進輝說。
3 天后的 2 月 1 日,假期緊急加班的矽基流動與華為合作,成為中國率先接入 DeepSeek V3 和 R1 模型的雲服務公司,接到前所未有的流量。
據 SimilarWeb 資料,矽基流動網站訪問量之後 10 天增長 30 多倍突破到 100 萬,超過騰訊雲,甚至一度超過行業第一阿里雲。
緊接著,中國頭部的公有云平臺,騰訊雲、阿里雲、百度雲、火山引擎,同樣趕在春節期間上線 DeepSeek 模型的 API 服務,甚至拿出更低的價格。但因為晚了 48 小時,它們的增長幅度就比矽基流動差一大截。

緊隨其後的是電信、移動、聯通等運營商的雲平臺以及國家超算平臺。春節假期剛結束,它們就上線 DeepSeek 模型,推動其往城市服務、大型國企中擴散。
儘管有充足的準備,雲廠商們還是低估了 DeepSeek 的流量。
2 月 1 日上線 DeepSeek 模型當天,矽基流動的 DeepSeek 模型 API 服務就和 DeepSeek 官方一樣,陷入癱瘓狀態。
“我原本以為我們能接住。” 袁進輝說,他們只能限流,然後去找更多算力卡支援洶湧而來的客戶需求。大量使用者流向位元組、阿里、騰訊的平臺。
但巨頭也沒能平穩接住。位元組火山引擎在 2 月 4 日上線 DeepSeek 新模型,API 服務也一度陷入癱瘓。
用於本地部署大模型的硬體跟著上漲。一名算力服務商人士告訴我們,現在一塊 GeForce RTX 4090(英偉達的遊戲顯示卡,可用於大模型推理)的價格已經從去年中的 1.4 萬一塊漲到 1.9 萬。到 2 月 14 日,英偉達市值已回到 3.4 萬億美元,此前下跌的股價完全修復。
也有人的判斷是,中小云平臺不該急於跳入這場 API 接入競賽。
開源 AI 框架 Caffee 的主要作者之一,推理引擎雲平臺 Lepton.ai 創始人賈揚清認為,雖然 DeepSeek 是很牛的模型,但跟風用它做推理服務很難做出差異化:AI Infra 不能燒錢,因為都是標品。而今天的公共 API 比速度、比穩定性,意義不大,比的就是鈔能力。小廠沒必要跟著大廠一起燒錢。
“所以我的朋友圈現在就像加持良治,別人在打使徒,他在種西瓜。” 賈揚清在社交媒體上說。
1 月 27 日至今,DeepSeek 的應用一直在中國蘋果 App Store 免費總榜的下載量第一。其擴散曲線快過 ChatGPT,也快過抖音,一個是 AI 時代增長最快的產品,一個是移動網際網路時代增長最快的產品。
而且只靠 DeepSeek “一個盆” 完全承接不住大海般的對 AI 的好奇與試用。DeepSeek 的定位也使它無意響應洶湧而來的消費級使用者需求。現在當用戶使用 DeepSeek 官方產品,短時間內只能問一個問題,再問就是 “伺服器繁忙”。
據 SimilarWeb 資料,DeepSeek 的網頁版產品,訪問量在 1 月 28 日達到高峰的 3786 萬,半月後已下跌超過一半至 1683 萬。同期,微信中討論 DeepSeek 的熱度(微信指數)增長了 27%。

這帶來需求外溢的機會。據 SimilarWeb 資料,豆包網頁版春節後的高峰訪問量比春節假期前的高峰期高了 27%,Kimi 是 54%。
2 月 8 日,百度悄然更新核心的大模型應用文小言,稱接入 DeepSeek-R1 最佳化拍照解題功能,之後又宣佈將把 DeepSeek 接入搜尋中。
差不多同一時間,阿里系的釘釘和大模型產品通義靈碼也都接入 R1,釘釘甚至還在應用商店中改了名字,加上 “DeepSeek R1 大模型已接入”。而釘釘的對手,位元組系的飛書也很快宣佈在多維表格功能中引入 R1。
騰訊,這家兩年前在自研大模型上略慢一籌的巨頭,此刻表現出前所未有的進攻性。2 月 13 日,騰訊宣佈大模型應用元寶接入 R1。據 SimilarWeb,元寶網頁版當天流量上漲 250%。
2 天后,騰訊再拋 “炸彈”——每天超過 10 億人在用的微信,開始灰度測試在 AI 搜尋功能中接入 R1 模型。
這是一個在微信中隱藏較深的功能:使用者開啟微信後,需要先點搜尋框,再點下方可能會出現的 AI 搜尋,然後選 R1 模型,才能對話。即使如此,該功能也很快就被衝擊到崩潰狀態,無法正常使用。
市值超過千億美元的中國大型科技公司中,還有拼多多沒在旗下產品中接入 DeepSeek 的模型。它自 2023 年就獨立於 AI 競爭之外,沒對外發布過任何大模型或產品進展。
在此期間,憑藉自研大模型獲得高額融資的部分創業公司,如 MiniMax、階躍星辰,也都在旗下個人應用中引入了 DeepSeek。
這種狀況與兩年前大模型行業的主流觀點截然相反。那時大模型在中國掀起熱潮,大多數創業者信奉 “雙輪驅動”,同時做大模型和商業化應用,相互繫結。
核心產品接不接,一號位的選擇題
據我們瞭解,把 DeepSeek 接入核心產品的網際網路巨頭,基本都是一號位做的最終決策。此前他們基本都只用自研大模型。
一位知情人士說,騰訊最高管理層與 DeepSeek 梁文鋒近期見過。在大公司中,騰訊目前對 DeepSeek 的接入範圍最廣。除元寶、微信外,騰訊接入 DeepSeek 的產品還有騰訊文件、QQ 瀏覽器、QQ 音樂等,到現在已有至少 14 個。
多位百度人士告訴我們,百度要在搜尋場景中用 R1、要在 4 月 1 日將文心一言免費、6 月 30 日把模型開源等一改常態的決策,是 CEO 李彥宏最終拍板。
與此同時,對增加新功能新技術遠比微信更積極的位元組至今沒有在主力個人 AI 產品豆包上接入 DeepSeek。
位元組 1 月釋出大模型豆包 Pro 1.5 時,在官方技術部落格中寫道,位元組用推薦、搜尋和廣告領域積累的 AB Test 經驗,開發了基於使用者反饋的模型訓練流程,可以 “透過使用者資料飛輪持續提升模型的實際使用體驗”。位元組認為使用者與自身模型迭代之間有正反饋。
關於產品和應用是否應該分開,巨頭有不同的看法,這可以從它們的組織結構看出來。
騰訊和阿里近期都拆開了原本放在一起的大模型研發團隊與應用開發團隊。去年底,阿里把通義應用從阿里雲轉到智慧資訊事業群,由該事業群總裁吳嘉負責,模型研發留在阿里雲旗下的通義實驗室。1 月中旬,騰訊將大模型應用元寶從研發大模型的事業群 TPG 轉到 CSIG,交給騰訊會議的負責人吳祖榕。大模型研發團隊混元仍然留在 TPG。
而在位元組,模型研發和產品的組織依然緊密——位元組 AI Flow 大部門下,有做豆包等 AI 產品的 Flow,也有做模型的 Seed,還有做工程最佳化的 Stone。
創業陣營中,MiniMax 創始人閆俊傑今年 1 月中旬曾告訴我們,過去 AI 行業的一個誤區就是,“認為使用者越多,模型能力提升越快”,其實二者沒有直接關係,應該把模型和技術分開看:“技術就是要不斷提升上限;而產品的目的不是讓模型變好,它就是一個商業化產品,真正需要思考的是怎麼更好滿足使用者。”
MiniMax 在其 MiniMax Chat 產品和 to B 的開放平臺上都已接入了 DeepSeek 模型。
“新一代模型不在牌桌上,基於上一代模型的產品也沒意義。”MiniMax、Liblib.ai 等 AI 公司的早期投資人,明勢資本合夥人夏令的觀察是,AI 產品和模型當前是 “松耦合”,如果決定繼續追基座模型和推理模型,就不要被產品制約,從商業化考慮,該接別人的模型就接,“短中期看,產品本身不是模型和公司的關鍵勝負手了”。
頭部創業公司中,與 DeepSeek 官方產品形態相似的 Kimi (月之暗面)暫未接入 DeepSeek。OpenAI 近期發表的一篇關於思維鏈的論文裡提到了兩個來自中國的模型,一個是 DeepSeek-R1,一個就是 Kimi-k1.5。一位接近月之暗麵人士稱,“都是推理模型,又都有比肩 o1 的表現,這可能是月之暗面還未接入 DeepSeek 的主要考量。”
不論大公司還是創業公司,都一邊接入 DeepSeek ,一邊在迅速迭代自己的模型。就在今天,騰訊在接入 DeepSeek-R1 的元寶中也上線了自研推理模型混元 T1 ,稱 “使用者可以選不同的模型,解決複雜問題”。這更像網際網路公司都熟悉的賽馬。
徹底的開放,成就最大的商業奇蹟
“一家非美國公司正在延續 OpenAI 的初心——真正開放、前沿的研究,賦能所有人。”DeepSeek 開源 R1 模型後,英偉達 AI 科學家吉姆·範(Jim Fan)說,DeepSeek 不僅開源一系列模型,還公開訓練秘訣。
同一時間,Meta 首席科學家楊立昆(Yann LeCun)也說,外界不要只關注中美 AI 競爭,DeepSeek 更重要的價值是 “開源對閉源的勝利”。
DeepSeek 之前,中美都有大模型公司開源模型,其中 Meta 的 Llama 系列模型迅速擴散,讓 Google 一位資深研究員聲稱,OpenAI、Google 等模型閉源公司都沒有護城河。但最後填上護城河的是 DeepSeek。
DeepSeek 比肩第一梯隊閉源模型的效能和較低的訓練和部署成本,是它的核心與爆發基礎。
更深入的開源則給它帶來 “魔法加成”:從第一個自研大模型 DeepSeek LLM 至今,它一直開源自己最好的模型,而且一直用自由度最高的開源協議之一 “MIT 開源協議”,允許開發者自由下載使用、修改釋出,用於商業用途也不需要付費。相比一批開源轉閉源的公司,如 Mistral 等,DeepSeek 到目前為止保持一貫的開源動作。
與 Meta、阿里相比,DeepSeek 更中立:它沒有像 OpenAI(與微軟)、Anthropic(和亞馬遜)那樣,與某家大公司繫結,也沒有引入任何投資方。
在各類公司決定是否接入 DeepSeek 的決策中,這是一個與模型效能、開放程度同等重要的因素。
開源之路在之前對中國創業公司來說幾乎不是一個選擇。
“DeepSeek 說明這條路(開源)能走通。如果在以前,一個拿幾億美金融資的公司說自己要開源,估計投資人會吐血。” 一位投資人說。據我們瞭解,至少有兩家此前閉源的大模型公司接下來可能會開源自研的領先模型。
DeepSeek 不是一家典型的創業公司,它做大模型的路徑不是從 0 開始,以融資撬動未來回報,而是基於幻方成立 9 年的積累。在相對充足的資金、算力環境下,實踐大部分人不看好發展路徑,這是它到現在為止極致開源、開放的基礎。
梁文鋒對 Open 的 AI 有多執著?一個小故事是,2023 下半年,矽基流動(SiliconFlow)籌備期間,梁文鋒想要投資,但說 “如果 LLM 推理引擎不開源就沒興趣了”。矽基流動創始人袁進輝後來分享,當時他並沒有想明白開源的商業模式,就沒拿這筆錢。
一位頭部大模型公司人士最近看到這個故事感慨說:“梁文鋒真是太瘋了!”
題圖來源:《駭客帝國》
· FIN ·






