DeepSeek帶火英偉達GPU“庫存的禁售型號都搶空了”

來源：經濟觀察報

作者：沈怡然

DeepSeek的出現顛覆了市場將高效能GPU視為AI賽道核心的傳統認知，導致作為高效能GPU壟斷者的英偉達率先被市場看空。更多產業人士發現，近期，無論是高效能的H系列GPU，還是RTX 40系列的高階顯示卡，英偉達的GPU重新變得供不應求。

封圖：圖蟲創意

2月13日，一位英偉達代理商告訴經濟觀察網記者，春節後第一週，兩家中國科技企業為支撐開源大模型DeepSeek的推理服務，緊急向他們公司採購了L20 GPU算力裝置。“去年，客戶下單總要反覆考慮和比價，現在連庫存的禁售型號都搶空了”。

DeepSeek的出現顛覆了市場將高效能GPU視為AI賽道核心的傳統認知，導致作為高效能GPU壟斷者的英偉達率先被市場看空。

然而，更多產業人士發現，近期，無論是高效能的H系列GPU，還是RTX 40系列的高階顯示卡，英偉達的GPU重新變得供不應求。

算力需求爆發

前述英偉達代理商目前正加緊為客戶調配英偉達的產品。他發現，英偉達晶片在中國市場全線緊缺，一些已經禁售的H800系列存貨一卡難求。

此時，接入DeepSeek的中外企業已達數百家，國內雲服務、網際網路、手機、晶片、金融、醫療、汽車等行業都在上線和部署DeepSeek。

迅速增長的使用者量為上述企業帶來“潑天富貴”：雲服務藉此兜售算力、晶片企業藉此推廣產品、車企以更低成本升級自己的軟體、上市公司藉此推升市值。

一家IT廠商對經濟觀察網記者稱，其呼叫DeepSeek的平臺在上線首日增加了上萬個使用者，伺服器幾乎崩潰，現有算力已經跟不上使用者的需求。團隊為緩解壓力，不得不緊急調配更多英偉達GPU。許多上線DeepSeek的平臺顯示伺服器繁忙，實際上是平臺提供的算力跟不上飛速增長的使用者需求。

向金融、科研、航空航天等企業提供超算雲服務的並行科技（839493.BJ）董事長陳健稱，模型的生命週期通常是先訓練，然後部署為服務，最後進行推理。目前是企業在DeepSeek模型推理過程中爆發了大量算力需求。

據經濟觀察網記者統計，英偉達在中國合法銷售的型號包括：H20、L20，T4；遊戲顯示卡涵蓋RTX 40系列（除RTX 4090外）和RTX 30系列及更早型號，還有新推出的RTX 5090限制版5090D。

目前市面上有十幾款國產GPU品牌，但普遍在效能、穩定性和生態上與英偉達存在一定差距，英偉達卡仍是企業們的最優選擇。

DeepSeek的R1模型釋出後，英偉達股價遭遇過去一年來最大跌幅17%，但自2月3日開始出現反彈，目前回升了13%。

國內某模型廠商一位人士對經濟觀察網記者稱，DeepSeek的出現讓業界反思算力泡沫，AI訓練是否可以不再依賴大規模的高階GPU叢集，但是隨著提供模型和使用模型的個人和企業都在爆發式增長，大量的模型推理再一次推升了對英偉達卡的需求。

陳健認為，DeepSeek帶給產業界的震動是AIGC大模型訓練、推理算力消耗大幅降低。相比模型推理，模型訓練的需求並沒有在短期內出現爆發式增長。

算力需求可持續嗎？

DeepSeek展現出強大的推理能力與優秀的文采，但是提供DeepSeek服務的代價也很大。

上述國內模型廠商人士表示，目前DeepSeek滿血版對硬體配置要求非常高，至少需要兩臺H800卡才能執行起來，而國內大多數基礎模型只需要一臺4090卡就能執行。

通常來說，模型能力與引數量和精度密切相關，引數量影響AI的知識量，精度影響AI的準確性和推理能力，這也是為什麼很多平臺上線的DeepSeek看起來“智商”不足，因為背後的算力不足以支援模型在引數量和精度上達到最佳狀態。

不過，上述國內模型廠商人士認為，這種急迫的算力需求未必持續很久。在實際應用中，開發者通常會將超過600B引數量的模型進行蒸餾，壓縮到更低引數規模，再用於商業化。而DeepSeek發展得太快以至於團隊還沒來得及完成蒸餾，可能後續幾個月蒸餾好後，那些上線DeepSeek的企業可以節約一些推理算力。

dignews.cc