DeepSeek真的衝擊英偉達了嗎?摩根士丹利最新報告:英偉達仍將保持主導地位

DeepSeek“四兩撥千斤”的模型訓練方法,讓不少業內人士開始懷疑依靠英偉達 GPU 進行“大力出奇跡”式的訓練是否還有必要。然而,最近摩根士丹利的一份報告指出,透過研究大約 25 個英偉達 GPU 的替代品,該報告發現大多數替代品都沒有得到認可。這些替代品的價格只有英偉達同類產品的零頭,也被宣稱具備較好的潛在效能,這讓它們能夠收穫最初的熱情和最初的部署。然而,幾乎總是有人中途棄用這些替代品,轉而繼續擁抱具備最成熟生態系統的英偉達 GPU。
這裡的替代品主要指的是專用積體電路(ASIC,Application-Specific Integrated Circuit)。在過去六個月裡,由於英偉達的漲勢已經開始疲軟,而 AMD 的表現相對落後,這讓 AI 行業的投資勢頭明顯轉向 ASIC。英偉達 3 萬億美元的市值是由每季度超過 320 億美元的 AI 營收所支撐的,而博通 1.1 萬億美元的市值則來自每季度 32 億美元的營收。顯然,市場認為 ASIC 的增長潛力將是 GPU 的數倍之多。那麼,從長期來看,ASIC 會勝過通用晶片嗎?這份報告的觀點是:除非發生新的變化,否則應該假定仍將由目前的行業領導者英偉達保持主導份額。
(來源:Morgan Stanley Research)

谷歌 TPU:ASIC 的最成功案例
ASIC 是否會因為更適合較窄的應用範圍而優於通用解決方案呢?有時,這一問題的答案是肯定的。當出現這種情況時,這便是定製化晶片最有說服力的應用場景之一。最明顯的例子便是谷歌 TPU 的成功,它之所以能取得這樣的成功,是因為谷歌發明了針對大模型的 Transformer 技術,並指導博通開發出一種針對該技術進行最佳化的晶片。而在當時英偉達正圍繞使用卷積神經網路的視覺模型來最佳化其 GPU。
截至目前,谷歌 TPU 是最能體現雲客戶因定製化解決方案而明顯受益的例子,這也為博通帶來了 80 多億美元的 TPU 營收。但是,同樣重要的是谷歌在 2025 年的一部分支出也將流向英偉達,其中一部分是對雲的投資。在雲計算領域,通用晶片的表現往往優於 ASIC。
與此同時,英偉達也在圍繞 Transformer 模型進行最佳化,並專注於訓練多模態通用 AI 模型。對於一些上一代應用程式來說,英偉達的這種投入可能顯得大材小用。不過,在提供高階訓練能力方面,很難有比英偉達更出色的玩家。具體到谷歌來說,本次報告預計 2025 年穀歌對於英偉達產品的採購量將翻一番左右。其中一些是谷歌出於投資企業雲的角度開展的採購,但是本次報告顯示其中谷歌的一些採購是因為英偉達產品在大模型 Transformer 方面有著非常強大的效能。
(來源:Morgan Stanley Research)

英偉達:似乎有一種引力把所有人都引向最昂貴的顯示卡
的確,某一款 ASIC 晶片的效能可能低於英偉達的 H100,但是這款 ASIC 晶片的售價為 3000 美元,而 H100 售價 20000 美元,所以這款 ASIC 晶片的總擁有成本更低。但是,僅僅透過製造售價 3000 美元的 AI 晶片就能與英偉達競爭,真的這麼容易嗎?報告援引一個例子稱:英特爾在這方面已經苦苦掙扎十年左右,它曾多次收購那些已經開始出貨且產品定價較低的公司,然而卻並未在這一領域取得顯著成績。
再以 AMD 為例,它的前幾代產品都沒有取得太大成果,直到 2024 年才憑藉 MI300 取得突破。如果真的有必要,那麼英偉達的競爭對手可能都會改為只生產 3000 美元的晶片。其實,就連英偉達自己也推出過幾款針對傳統推理應用的低價晶片。但是,英偉達發現似乎有一種引力在把所有人都引向最昂貴的顯示卡。
為什麼會這樣?處理器本身的成本或許可以做得很低,但是系統的整體成本可能會更高。透過 ASIC 晶片構建叢集的成本,可能遠高於使用英偉達的產品。原因在於:英偉達利用銅纜打造了包含 72 個 GPU 的光線互連域,而 ASIC 則通常要使用成本更高的光通訊技術。除此之外,ASIC 和英偉達晶片的其他主要成本構成部分較為相似,比如兩者在高頻寬記憶體上的成本是一樣的。即便如此這對於英偉達也更加有利,因為英偉達在新型高頻寬記憶體晶片(HBM,High Bandwidth Memory)的採購上擁有買方壟斷的議價能力。
就晶片的軟體適配來說,對於晶片客戶來說這是一項又難又耗時的工作。在處理軟體變更以及執行不同工作負載時,易用性非常重要。而在總體擁有成本計算中,“軟體開發工時”這一因素常常被忽視。該報告舉例稱,美國大資料公司 Databricks 購買了亞馬遜雲科技(AWS,Amazon Web Services)的晶片 Trainium,買到晶片之久 Databricks 預計需要“數週或數月的時間來啟動和執行”。延遲部署可能會讓部分晶片客戶遠遠落後於使用英偉達晶片的客戶,原因在於英偉達配備了目前已被廣泛使用的 CUDA 軟體開發工具包。
儘管谷歌的 TPU 和 AMD MI300 取得了一定程度上的成功。但是,即便如此本次報告依然發現,客戶對於英偉達生態系統仍舊保持強勁熱情,這讓英偉達在 2025 年的市場份額有所增加。這並不是說價格較低的處理器沒有存在價值,只是它們並沒有像預期那樣獲得廣泛應用。
(來源:Morgan Stanley Research)

DeepSeek 真的衝擊英偉達了嗎?
ASIC 作為一個晶片類別,並不優於或劣於商用 GPU,兩者都是實現相同結果的不同方法。ASIC 的開發預算通常低於 10 億美元,在某些情況下甚至更低。相比之下,僅 2025 年這一年英偉達就將投資約 160 億美元用於研發。憑藉這筆資金,英偉達能夠維持一個為期 4 年-5 年的開發週期。英偉達還將投資數十億美元用於連線技術,以提高機架規模和叢集規模的效能。英偉達確實有能力在軟體生態系統方面進行大規模投資,而且由於其產品存在於世界各個地區的每一個雲平臺(前提是美國商務部允許),因此對英偉達生態系統的任何改進性投資,都會在全球生態系統中傳播開來。
儘管 DeepSeek 在推理與訓練做法開始讓人們反思“堆硬體”這一做法的意義。但是,本次報告並不認為從訓練到推理會發生巨大轉變,也不認同 ASIC 是“推理贏家”的說法。實際上,在 Deepseek“出圈”之後,科技巨頭和 OpenAI、xAI 等公司的 CEO 們,都對大型叢集規模的回報持積極態度。因此,這份報告並不認為 ASIC 在推理方面更具優勢,而是堅信那些效能最佳的解決方案將會脫穎而出。因為,推理工作負載正呈現出日益趨同的態勢,而且大部分訓練和推理涉及的是大模型 Transformer 工作負載。
報告還指出,博通的 750 億美元服務可獲得市場(SAM,Service addressable market)絕大多數來自於大模型訓練。預計在沒有大規模叢集規模的情況下,GPU 會被重新用於推理工作。基於此,該報告指出 ASIC 不會成為事實上的贏家。英偉達在每瓦的原始處理能力方面具有優勢,雖然 ASIC 晶片更便宜,但是構建機架/叢集的成本可能更昂貴。
一位雲計算高管公開表示,每隔兩年他的 ASIC 團隊都會提供比英偉達落後 2 年-3 年的技術,但這並沒有帶來太多收益。這並不是一種罕見的抱怨,這些抱怨有時甚至來自於已經大規模部署 ASIC 的雲供應商。他們原本將此視為對於未來的投資,然而大多數並未完全實現這一目標。
AMD 曾預測其產品 MI400 將帶來“每年數百億美元收入潛力”,儘管 AMD 的預測也是基於與潛在客戶溝通得出的,但是投資者的反饋是:“嗯,我們怎麼知道應該對 AMD 2026 年的產品(MI400)有信心,而不是對英偉達的未來新產品(Rubin)有信心?”
不過,本次報告也指出 AMD 的努力不可等閒視之。AMD 在更廣泛生態系統中的投資可能會遠遠超過 ASIC 供應商。2024 年,AMD 收購了伺服器製造商 ZT Systems。AMD 透過這種迭代投資在伺服器生態系統中取得了主導技術。在這份報告看來,AMD 與 ASIC 競爭對手擁有同樣大的市場機會。但是,兩者都不應該輕視與英偉達競爭時所面臨的挑戰。
2024 年,英偉達的處理器收入預計為 980 億美元,而 AMD 為 50 億美元,博通為 80 億美元,世芯電子和 Marvell 加起來約為 20 億美元。這使得商用矽的市場份額佔比約為 90%,ASIC 的市場份額佔比約為 10%。
與此同時,本次報告認為 2025 年商用矽的市場份額還會略有增長。預計在 2025 年,英偉達的增長幅度將比谷歌 TPU 高出 50%-100%。報告認為,英偉達在 2025 年下半年的收入勢頭將遠遠強於 ASIC 廠商或 AMD。
報告強調,其對於任何一家 AI 公司都沒有負面看法。然而,儘管 AMD 的估值越來越有吸引力,但是 AMD 的 MI350 似乎並沒有改變遊戲規則,同時 AMD 的 MI400 也存在一些未知因素。
目前來看,英偉達的產品仍然有著較大需求,而英偉達面臨的最大短期風險依然是美國的出口管制。總的來說,英偉達實力仍在,由此也就不難理解為何 DeepSeek 目前只能短時間挫敗英偉達股價。但是,AMD 等廠商的努力也能為人們提供更多的選擇,這也是一件好事。
排版:羅以


相關文章