DeepSeek重新整理全球AI格局;50美元模型蒸餾術;美國公司們宣佈8000億美元算力投資丨AI月報

2025 年 1 月的全球 AI 大事記。
文丨賀乾明
編輯丨程曼祺
2025 年 1 月的 AI 月報,你會看到:
  • DeepSeek 怎麼重新整理全球大模型格局
  • 李飛飛在內的團隊如何低成本 “蒸餾” 出特定領域追趕 o1 的模型
  • 到去年底,OpenAI 年化收入超 60 億美元
  • OpenAI 的星門計劃:投 5000 億美元建算力
  • 26 家獲得超過 5000 萬美元融資的 AI 公司,中國有 2 家
  • 大模型公司的爬蟲遭 “下毒” 抵抗
以下是我們第 3 期 AI 月報,歡迎大家在留言區補充我們沒有提到的重要進展。
格局丨DeepSeek 重新整理全球 AI 格局,“蒸餾” 開啟低成本開發模型魔盒
DeepSeek 在 1 月 20 日上線 R1 模型後,憑藉高效能(比肩 OpenAI o1)、低使用成本(API 價格是 o1 的 1/30)、開源模型權重等,迅速接管 OpenAI 等公司主導的大模型敘事。
這之前,因為 OpenAI 展示能力超強的 o3 模型,不少 OpenAI 和矽谷的研究者正在討論 AGI (通用人工智慧)即將到來。R1 釋出後,行業焦點變成 DeepSeek,一些媒體用 “DeepShock” 形容它帶來的衝擊。 
市值大跌的英偉達、臺積電,現在已經開始反彈
最直接的影響發生在資本市場:投資人拋售了價值萬億美元的股票,英偉達首當其衝。
這些動作背後隱藏著一種風向轉變:如果一家名不見經傳的中國公司,幾乎不花錢,就能研發出能力與 OpenAI、Anthropic 等公司領先模型接近的模型,為什麼還要買那麼多先進 GPU?
有媒體報道,美國總統特朗普也把類似的問題拋給了英偉達 CEO 黃仁勳,得到的回覆是:公眾反應過度了。
從 2023 年下半年開始,黃仁勳一直在談論的 GPU 需求是使用大模型,而不是訓練大模型。DeepSeek 的訊息經過 10 多天發酵,英偉達的股價開始反彈,目前再次來到 3 萬億美元。
反思的 OpenAI、專項研究的 Meta、呼籲加大制裁的 Anthropic
DeepSeek 給資本市場的衝擊或許是暫時的,但它給同行們帶來更長遠的影響,以下是部分大模型公司對 DeepSeek 的反應:
  • OpenAI:CEO 說,在開源方面,“OpenAI 站在歷史的錯誤一邊”,但不會把開源當做重點推進;部分 OpenAI 研究者認為,DeepSeek 讓 OpenAI 感受到壓力,激發了團隊的鬥志;OpenAI 上線了類似 R1 的模型 o3-mini,開放給免費使用者使用,公開經過處理的模型思考過程。
  • Meta:一些員工認為,證明他們選擇開源是正確的。Meta 組建專門團隊,研究 DeepSeek 論文中提到的技術,計劃把它用到新款 Llama 模型中。
  • Anthropic:CEO 說,DeepSeek 有創新,但落後他們 7-10 個月,成本降低並沒有公眾想象中的大,而是恰好踩在了行業降本曲線上。他呼籲加大晶片出口管制,建議 DeepSeek 的人才到美國來,研究更安全的大模型。
推動 DeepSeek 登上榜首的使用者,積極擁抱的雲平臺和企業
圍繞 DeepSeek 的爭議很難有定論,但使用大模型的公司、使用者,已經開始用行動投票。
因為免費開放使用,R1 釋出一週,DeepSeek 的應用程式就登頂美國蘋果 App Store、Android Play Store 的榜首,之後在近 150 個國家和地區封頂。根據 Sensor Tower 資料顯示,前兩週其下載量是 ChatGPT 同期的兩倍,中國地區之外,印度新增使用者比例最大。
DeepSeek 隨後限制個人使用者使用頻率。根據 QuestMobile 資料,DeepSeek 應用在中國的日活使用者(DAU)在 1 月 28 日超過豆包,2 月初超過 3000 萬,比豆包、Kimi 等國內同類大模型應用總和還高。
因為開源,DeeSeek 給大模型企業市場衝擊更大。
Databricks CEO 阿里·戈德斯里(Ali Ghodsi)說,R1 剛上線 1 個小時,就有客戶詢問他們能否上線這個新模型。Databricks 有 12000 個客戶,半個月內就有超過 1000 個客戶使用 V3 或 R1。
微軟、英偉達、亞馬遜的雲平臺,都上架了 DeepSeek 的模型。我們在 12 月 AI 月報中提到,當時正在企業服務市場搶佔 OpenAI 份額的是 Anthropic。
據媒體報道,微軟還在考慮把 DeeSeek 的模型用到核心大模型服務 Copilot 中。在此之前,微軟正在考慮用自研的 Phi 系列模型替代 OpenAI。
國內,幾乎所有的雲計算平臺都上線 DeepSeek 新模型,還有成批的大模型應用公司把基礎模型換成 DeepSeek,把它當作業務亮點宣傳,儘管不少公司也在研發大模型。
450 美元→50 美元,“蒸餾” 開啟低成本開發模型魔盒
DeepSeek 走紅,讓 “蒸餾” 成為大模型行業 1 月的討論熱點——不乏有研究人員懷疑,DeepSeek “蒸餾” 了 OpenAI 的領先模型,才有那麼強的效果,截至目前還沒有人拿出來證據。
在 AI 領域,“蒸餾” 是指,讓大模型(老師)指導小模型(學生)學習,開發者就可以用更少資源,研究出效能接近大模型的模型。
“就好比你採訪愛因斯坦幾個小時,走的時候能擁有他大多數物理知識。”Databricks CEO 阿里·戈德斯里如此形容蒸餾。
DeepSeek 在 R1 論文的最後,也討論了 “蒸餾” 有助於提升小模型的推理能力。他們讓 R1 生成了 80 萬資料,精調 Qwen、Llama 的開源模型,發現它們的推理能力有明顯提升。
相比 DeepSeek 的含蓄展示,加州伯克利分校的研究者則直接公開了怎麼做蒸餾,以及它有多簡單、多有效、多便宜:
  • 用阿里開源的 QwQ-32B-Preview(有推理能力的模型)生成數學、程式設計等領域的資料。
  • 呼叫 GPT-4o-mini 重寫生成的資料,提高資料的質量,方便後續解析資料。
  • 數學題資料,對比正確的答案,排除錯誤的資料;程式設計資料,直接跑一遍,排除錯誤資料;一共得到 5000 條程式設計資料和 10000 條數學題資料。
  • 用這 15000 條資料和他們此前收集的 1000 條科學、解謎資料,精調 Qwen2.5-32B-Instruct(沒有推理能力的開源模型),整個過程用了 8 個 H100 ,持續 19 個小時,一共花費 450 美元。
最後的評測結果顯示,該模型在 Math500、AIME2024、LiveCodeBench-Medium、LiveCodeBench-Hard 等評測數學和程式設計能力的基準上,得分超過 o1-preview。
他們給這個模型命名為 Sky-T1-32B-Preview,並開源資料、程式碼和模型權重,還提到 “模型規模” 和 “資料混合” 很重要,他們剛開始精調 70 億和 140 億引數模型,發現效果提升有限;而使用不同資料訓練模型,也會影響效能。
450 美元只是一個開始。2 月初,李飛飛等斯坦福大學和華盛頓大學的研究者宣稱,他們只用 50 美元就蒸餾出了一個在數學、程式設計能力測試中追趕 o1 和 R1 的模型,具體的做法是:
用 Gemini 2.0 Flash Thinking Experimental 生成資料,處理方法此前 450 美元的模型相似,收集 1000 條涵蓋程式設計、數學的問題、對應的答案以及答案的 “思考過程” 資料;用 16 個 H100 GPU 跑了不到 30 分鐘,精調阿里開源的 Qwen2.5-32B-Instruct。
研究人員在論文中寫道,“只要在推理過程中加入 ‘Wait’ 這個詞,就能讓模型輸出的答案更準確一些。”
他們蒸餾出來的模型比不上 o1 或 DeepSeek 的 R1,但提供了一種低成本開發高效能模型的可能——並不是所有的問題都需要最領先的模型解決。
隨著 Scaling Laws 放緩,開發先進模型的投入越來越大,我們上期月報中提到,OpenAI 花了 10 億美元也沒訓出來滿意的 GPT-5。而用開源模型加上蒸餾,做出一個性能夠用的垂直模型成本大幅降低。
這意味著,未來願意訓練模型的公司可能越來越少,大模型行業的分化將會越來越明顯。一些公司已經開始選擇。微軟 CEO 薩提亞·納德拉在 12 月的一檔部落格中說:
“既然網路效應都集中在應用層,我們為什麼還要為某些模型能力投入大量資金呢?”
在大模型競技場上,一批中國公司存在感上漲
整個 1 月,中國並不只有 DeepSeek 釋出新模型,其他公司的模型也都有亮點。不過它們聲量都被 DeepSeek 大幅削弱,以下是部分新模型:
  • 與 DeepSeek 釋出 R1 同天,月之暗面釋出類似的推理模型 Kimi 1.5,罕見釋出詳細技術報告,稱在多項能力基準測試中比肩 o1。
  • 階躍星辰連續 6 天釋出 6 款新模型,覆蓋語言、語音、推理、圖片理解、影片生成等多個領域。
  • 智譜釋出端到端模型 GLM-Realtime,類似 GPT-4o 的端到端語音模型,融入清唱功能,稱支援 2 分鐘的記憶及 Function Call 功能。 
  • MiniMax 釋出、開源基礎語言大模型 MiniMax-Text-01 和視覺多模態大模型 MiniMax-VL-01,其中語言模型可以處理最長 400 萬 token 的上下文,全球最長。
  • 百川智慧釋出 Baichuan-M1-preview,稱在數學、程式碼等多個評測中,其表現超過 o1-preview,開源醫療增強大模型 Baichuan-M1-14B。
  • 騰訊開源 3D 生成大模型 2.0 版本,稱生成質量、結構精細度、紋理表現等多個基準測試中,表現超過業界先進的模型。
  • 位元組釋出豆包 1.5 Pro 模型,稱模型能力追上 GPT-4o,並強調不使用任何其他模型資料。他們宣佈組建 Seed Edge,目標是研發 AGI。
  • 阿里開源能處理百萬長度文件模型 Qwen2.5-7B/14B-Instruct-1M、視覺理解模型 Qwen2.5-VL,釋出 Qwen2.5-Max,稱多項能力基準測試追上 GPT-4o,超過 DeepSeek-V3。
隨著中國公司密集釋出新模型,大模型競技場 Chatbot Arena 的存在感大漲——排名前 20 的佔比達到 5 個,比 12 月多 2 個,而且整體排名上漲。
從 Chatbot Arena 的表現來看,許多中國大模型公司的模型能力已經追上 GPT-4o。這意味著中國公司在大模型領域的追趕已經達到一定階段,接下來可能需要考驗創新能力。
應用丨OpenAI 去年底年化收入超 60 億美元,搶跑 Agent
OpenAI 付費訂閱使用者增長 2 倍、API 用量增長 6 倍
據媒體報道,OpenAI 向一些股東披露了去年公司經營資料:
  • ChatGPT 付費訂閱使用者數量,從一年前的 580 萬增至 2024 年底的 1550 萬。據此測算,OpenAI 該部分年化收入至少達到 30 億美元。
  • 向企業客戶提供服務的模型 API 使用量,增長 6 倍,每分鐘處理和生成約 14 億個 Token。根據代理方之一 Braintrust 提供的資料(70% 是 GPT-4o、27% 是 GPT-4o mini、剩下是 o1 等),OpenAI 該部分年化收入會達到 32 億美元。
ChatGPT 過去一年持續提高應用使用體驗,為付費使用者提供更多功能,也有資料證明有效。
根據 Earnest Analytics 資料,ChatGPT 付費 6 個月後還願意付費的使用者,佔比超過 70%,排在第二的是 Claude Pro,相差 10 個百分點。
Agent 競爭一觸即發,OpenAI 搶跑
去年 12 月,OpenAI 就宣稱 Agent 是今年的重點業務。1  月,他們釋出 2 款 Agent 應用:
  • Task,允許付費使用者呼叫 ChatGPT 設定未來的動作和提醒事項,比如每天早上 8 點收集熱點新聞等。
  • Operator,每個月花 200 美元訂閱 ChatGPT 的使用者,可以提出要求,讓 OpenAI 的模型自動預訂航班、點外賣、打車等,甚至付款等。
Anthropic、智譜展示過類似的功能,並開始對外測試。甚至在 OpenAI 上線 Operator 前不久,位元組和清華的研究者還開源了一個類似的專案。
但 OpenAI 第一個把它做成了直接面向 to C 消費者的產品功能。
2 月,OpenAI 又釋出名為 “Deep Research” 的功能,讓付費的 ChatGPT 使用者可以呼叫 o3 推理、搜尋,數十分鐘寫一份金融、科研、工程等領域的報告等。OpenAI 稱,每月花 20 美元訂閱 ChatGPT 的使用者,一個月只能用 10 次。
算力丨英偉達推個人 AI 算力平臺,大公司們繼續加大算力投入,OpenAI 的 5 千億美元投資計劃
英偉達的新品:售價 3000 美元,能跑 2000 億引數模型
1 月舉辦的 CES 上,黃仁勳釋出了一款英偉達新品:Project Digits。這是一個面向個人使用者的算力平臺,使用 GB10 的 GPU,可以在本地跑 2000 億引數大模型。
黃仁勳稱,這是專門為從事 AI 研發的專業人士(開發者、資料科學家、研究員)等設計的產品,並預裝了英偉達 DGX 基礎作業系統(基於 Linux)和英偉達的 AI 軟體棧。
“實用的量子計算機還要十年以上才能問世,Project Digits 填補了空白。” 黃仁勳說。本地訓練或部署模型的需求一直存在,但沒有對應的產品。大多數使用者會用多臺 Mac Mini 並聯起來,在本地訓練或部署大模型。
英偉達稱,Project Digits 將於 5 月發貨,售價 3000 美元(約 2.2 萬元人民幣)。
四大科技公司 +OpenAI 聯盟超 8000 億美元的算力投資計劃,但也有猶豫跡象
2024 年,因為投資 AI 算力中心,微軟、Google、亞馬遜三個大型雲計算平臺和 Meta 的資本超過 2000 億美元。
2025 年,它們的資本開支將繼續增長,預計會達到約 3200 億美元。
大公司們興建資料中心,並不只是為了訓練更大、更先進的模型,而是看重大模型推廣時需要算力支援——對於雲平臺來說,這是一個確定的增量市場。
1 月,OpenAI 終於擺脫早年融資時與微軟簽訂的獨家算力供應條約,可以引入第三方算力供應商。
他們與甲骨文、軟銀一起宣佈總投資額達到 5000 億美元的 AI 基礎設施投資計劃 Stargate(星門)。
放緩跡象也在 1 月出現——微軟暫停建設位於威斯康星州的資料中心建設。
微軟在 2024 年初開始動工建設該資料中心,計劃兩年內投資 33 億美元,分三部分建成,現在第一部分將於 2025 年完工,剩下兩部分暫停施工。
“我們在評估最近的技術變化。” 微軟發言人解釋為什麼暫停施工。
投融資丨26 個單筆融資超 5000 萬美元的 AI 公司
1 月,至少有 26 個與 AI 相關的公司獲得超 5000 萬美元融資,比上個月多 5 家。其中有兩類公司融資訊息最多:幫助節省 AI 算力的公司、用 AI 改造醫療行業的公司。
模型:OpenAI、Anthropic 還在融資,有兩家語音 AI 公司拿到錢
上個月徹底轉型為營利機構的 OpenAI,開啟新一輪融資,融資額 400 億美元,估值預計達到 3000 億美元。根據媒體報道,軟銀會投資。去年 9 月,軟銀就給 OpenAI 投資 5 億美元,又在 11 月花了 15 億美元收購 OpenAI 老股。
Anthropic 融資 30 億美元,其中 10 億來自 Google、20 億來自 Lightspeed,估值達到 600 億美元。它成立於 2021 年,被稱為 OpenAI 最大的競爭對手。DeepSeek 走紅前,Google 、亞馬遜都引入其模型,對抗微軟和 OpenAI 聯盟。
ElevenLabs 融資 1.8 億美元,估值達到 33 億美元。它成立於 2022 年,是一家研發大模型語音技術的公司,上個月推出對標 Google Notebook LLM 的語音功能。
思必馳完成 5 億元融資。它成立於 2007 年,主要研究 AI 語音模型,為消費硬體、汽車廠商、智慧家居硬體等公司提供技術服務,接下來打算優先在國內上市。
Infinite Reality 融資 30 億美元,估值達到 125 億美元。它成立於 2019 年,研發一款引擎 iR Studio,讓開發者能夠開發沉浸式網站、虛擬化身。
基礎設施:節省算力的公司密集融資,專業收集資料的公司冒頭
DNN 融資 3 億美元。它成立於 1998 年,主要的業務是開發管理大型計算設施的軟體。馬斯克 xAI 建成的 10 萬張 GPU 叢集就用了他們的產品。這是它成立以來第一次融資。
Together AI 融資超 2 億美元,估值超過 30 億美元。它成立於 2022 年,主要的業務是採購英偉達的 GPU 建算力中心,然後開發軟體最佳化算力利用,對外租賃。英偉達也是它的股東之一。
Vertice 融資 5000 萬美元。它成立於 2021 年,主要的業務是用 AI 技術,幫公司最佳化在軟體、雲服務上的支出。
Neural Magic 被 Red Hat 收購。它成立於 2018 年,主要的業務是開發最佳化 CPU、GPU 的軟體和演算法,從而節省訓練資源。此前它累計融資 5000 萬美元。
Xocean 融資 1.19 億美元。它成立於 2017 年,主要的業務是用無人艦艇收集海洋資料,為能源、海洋測量、航運公司提供服務。
Mercor 融資 7500 萬美元,估值達到 20 億美元。它成立於 2023 年, 主要的業務是建招聘專家的平臺,專家們為 AI 公司提供訓練模型的資料。一方面,AI 模型在特定行業中部署,依賴有針對性的資料。另一方面,隨著大模型吞掉所有公開的優質資料,未來模型的競爭會更加依賴專業人員生產的資料。
Helion 融資 4.25 億美元,估值超過 50 億美元。它成立於 2013 年,主要研發可控核聚變發電站。OpenAI 的 CEO 山姆·阿爾特曼是它核心投資人。
應用:9 家醫療 +AI 公司拿到融資,總和超 10 億美元
“在醫療健康領域,AI 將會帶來巨大的益處,顯著提升生產力,並讓每個人的生活更加美好。”2024 年 10 月,傑弗裡·辛頓在慶祝獲得諾貝爾獎的釋出會上說。而醫療行業,也是 Google、OpenAI、Anthropic 等 AI 公司近年重點關注的領域。1 月,有 9 家醫療 +AI 公司融資超 5000 萬美元:
Innovaccer 融資 2.75 億美元,估值達到 34.5 億美元。它成立於 2014 年,主要的業務是統一不同保險公司、醫療系統的資料,為這些行業客戶提供護理、健康管理等 SaaS 軟體。
Neko Health 融資 2.6 億美元,估值達到 17 億美元。它成立於 2018 年,主要的業務是用多種感測器給人做全身掃描,然後結合 AI 分析、預測患病風險。
Cera 融資 1.5 億美元。它成立於 2016 年,用 AI 技術開發護理軟體,預測患者生病、受傷的風險。
Hippocratic AI 融資 1.41 億美元,估值達到 16.4 億美元。它在 2023 年公開亮相,開發一個醫療人員能自建 Agent 的平臺。
Qventus 融資 1.05 億美元,估值超過 4 億美元。它成立於 2012 年,主要的業務是用 AI 技術,把各種醫療場景,比如手術、住院出院、門診檢查等自動化。
Rad AI 融資 6000 萬美元。它成立於 2018 年,主要的業務是研發專注於看醫學影像的 AI 產品。
Eleos 融資 6000 萬美元。它成立於 2020 年,正在開發 Agent,幫臨床醫生幹活,比如做記錄病情等,減輕管理負擔。
Quibim 融資 5000 萬美元。它成立於 2012 年,研發 AI 醫學影像技術,幫醫生看檢測結果。
Synthesia 融資 1.8 億美元,估值達到 21 億美元。它成立於 2017 年,主要的業務是為企業開發虛擬人,支援 120 種語言,已經談下 6 萬家客戶。
Alterya 以 1.5 億美元的價格被 Chainalysis 收購。它成立於 2022 年,主要的業務是用 AI 技術檢測金融、加密貨幣領域的欺詐行為。
Neura Robotics 融資 1.23 億美元。它成立於 2019 年,主要使用者研發 AI 機器人。去年的一個演示中,他們展示了機器人熨衣服、調製雞尾酒等。
傅利葉完成總額 8 億元的 E 輪融資。它成立於 2015 年,主要研究智慧機器人。這輪融資傅立葉打算用於人形機器人研發。此前一年,中國人形機器人行業已經貢獻多筆大額融資,比如宇樹、智元、銀河通用。
Netradyne 融資 9000 萬美元,估值達到 12.5 億美元。它成立於 2015 年 ,開發了一套監測司機駕駛行為的 AI 產品。
StackBlitz 融資 8350 萬美元。它成立於 2017 年,主要的業務是給 Web 開發者提供線上整合開發環境(IDE),現在引入了大模型能力。
Overhaul 融資 5500 萬美元。它成立於 2016 年,主要的業務是用 AI 技術幫微軟、戴森等公司提高貨運物流環節的效率,包括預警貨物延誤、失竊等事件,目前已經有 350 家客戶。
最後丨大模型公司瘋狂 “爬蟲”,“下毒” 軟體出現
1 月,一個名叫 Triplegangers 的網站忽然崩潰。其 CEO 一度以為遭遇 DDoS 攻擊,但後來發現始作俑者是來自 OpenAI 的 “爬蟲”。
他們發現,OpenAI 用了 600 個 IP 地址,傳送 “數以萬計” 的伺服器請求,試圖下載網站上所有內容,包括數十萬張照片及其詳細描述。
Triplegangers 是一個經營 10 多年,專門收集人類雙胞胎資料(從手、頭髮、皮膚)的網站,提供給遊戲公司等使用。
這一輪的 “爬蟲” 攻擊中,他們不清楚 OpenAI 抓走了什麼資料,但明確的是網站宕機,以及宕機前網站訪問量大漲,他們要給 AWS 付更多錢。
這不是個例。DoubleVerify 的一項研究顯示,AI 爬蟲在 2024 年推動全球網際網路 “無效流量” 增加了 86%。
根據 Cloudflare 的報告,OpenAI 的爬蟲在 2024 年並不是最積極的,來自位元組的 “Bytespider” 爬蟲排在第一,下半年活躍度才降低。(上文提到,今年 1 月,位元組釋出豆包 1.5 模型時,強調自建資料體系。)
2024 年,AI 公司爬蟲程式的流量分佈。圖片來自 Cloudflare。
如果想要防止這些爬蟲,網站開發者得使用正確配置的 robot.txt 檔案,告訴爬蟲機器人不要訪問網站。但這種方法並不總是有效。
1 月,技術論壇 HackNews 上出現一個熱門帖子,介紹了一個專門針對大模型爬蟲的 “陷阱” 程式,它會隨機生成無限序列的頁面,每個頁面都有數十個連結。為了防止爬蟲拖慢伺服器、浪費它們的時間,程式中還刻意添加了延遲演算法。
根據介紹,這款程式還能在這些無效頁面中 “下毒”,為爬蟲提供一些可以抓取並訓練大模型的資料。如果大模型公司不認真清洗資料,就用它們訓練模型,模型可能會迅速崩潰。
題圖來源:AI 生成。
·  FIN  ·


相關文章