DeepSeek帶火英偉達GPU“庫存的禁售型號都搶空了”

 防走失,電梯直達安全島報人劉亞東A 


來源:經濟觀察報
作者:沈怡然

DeepSeek的出現顛覆了市場將高效能GPU視為AI賽道核心的傳統認知,導致作為高效能GPU壟斷者的英偉達率先被市場看空。更多產業人士發現,近期,無論是高效能的H系列GPU,還是RTX 40系列的高階顯示卡,英偉達的GPU重新變得供不應求。

封圖:圖蟲創意


2月13日,一位英偉達代理商告訴經濟觀察網記者,春節後第一週,兩家中國科技企業為支撐開源大模型DeepSeek的推理服務,緊急向他們公司採購了L20 GPU算力裝置。“去年,客戶下單總要反覆考慮和比價,現在連庫存的禁售型號都搶空了”。
DeepSeek的出現顛覆了市場將高效能GPU視為AI賽道核心的傳統認知,導致作為高效能GPU壟斷者的英偉達率先被市場看空。
然而,更多產業人士發現,近期,無論是高效能的H系列GPU,還是RTX 40系列的高階顯示卡,英偉達的GPU重新變得供不應求。
算力需求爆發
前述英偉達代理商目前正加緊為客戶調配英偉達的產品。他發現,英偉達晶片在中國市場全線緊缺,一些已經禁售的H800系列存貨一卡難求。
此時,接入DeepSeek的中外企業已達數百家,國內雲服務、網際網路、手機、晶片、金融、醫療、汽車等行業都在上線和部署DeepSeek。
迅速增長的使用者量為上述企業帶來“潑天富貴”:雲服務藉此兜售算力、晶片企業藉此推廣產品、車企以更低成本升級自己的軟體、上市公司藉此推升市值。
一家IT廠商對經濟觀察網記者稱,其呼叫DeepSeek的平臺在上線首日增加了上萬個使用者,伺服器幾乎崩潰,現有算力已經跟不上使用者的需求。團隊為緩解壓力,不得不緊急調配更多英偉達GPU。許多上線DeepSeek的平臺顯示伺服器繁忙,實際上是平臺提供的算力跟不上飛速增長的使用者需求。
向金融、科研、航空航天等企業提供超算雲服務的並行科技(839493.BJ)董事長陳健稱,模型的生命週期通常是先訓練,然後部署為服務,最後進行推理。目前是企業在DeepSeek模型推理過程中爆發了大量算力需求。
據經濟觀察網記者統計,英偉達在中國合法銷售的型號包括:H20、L20,T4;遊戲顯示卡涵蓋RTX 40系列(除RTX 4090外)和RTX 30系列及更早型號,還有新推出的RTX 5090限制版5090D。
目前市面上有十幾款國產GPU品牌,但普遍在效能、穩定性和生態上與英偉達存在一定差距,英偉達卡仍是企業們的最優選擇。
DeepSeek的R1模型釋出後,英偉達股價遭遇過去一年來最大跌幅17%,但自2月3日開始出現反彈,目前回升了13%。
國內某模型廠商一位人士對經濟觀察網記者稱,DeepSeek的出現讓業界反思算力泡沫,AI訓練是否可以不再依賴大規模的高階GPU叢集,但是隨著提供模型和使用模型的個人和企業都在爆發式增長,大量的模型推理再一次推升了對英偉達卡的需求。
陳健認為,DeepSeek帶給產業界的震動是AIGC大模型訓練、推理算力消耗大幅降低。相比模型推理,模型訓練的需求並沒有在短期內出現爆發式增長。
算力需求可持續嗎?
DeepSeek展現出強大的推理能力與優秀的文采,但是提供DeepSeek服務的代價也很大。
上述國內模型廠商人士表示,目前DeepSeek滿血版對硬體配置要求非常高,至少需要兩臺H800卡才能執行起來,而國內大多數基礎模型只需要一臺4090卡就能執行。
通常來說,模型能力與引數量和精度密切相關,引數量影響AI的知識量,精度影響AI的準確性和推理能力,這也是為什麼很多平臺上線的DeepSeek看起來“智商”不足,因為背後的算力不足以支援模型在引數量和精度上達到最佳狀態。
不過,上述國內模型廠商人士認為,這種急迫的算力需求未必持續很久。在實際應用中,開發者通常會將超過600B引數量的模型進行蒸餾,壓縮到更低引數規模,再用於商業化。而DeepSeek發展得太快以至於團隊還沒來得及完成蒸餾,可能後續幾個月蒸餾好後,那些上線DeepSeek的企業可以節約一些推理算力。


相關文章