DeepSeek真的衝擊英偉達了嗎？摩根士丹利最新報告：英偉達仍將保持主導地位

DeepSeek“四兩撥千斤”的模型訓練方法，讓不少業內人士開始懷疑依靠英偉達 GPU 進行“大力出奇跡”式的訓練是否還有必要。然而，最近摩根士丹利的一份報告指出，透過研究大約 25 個英偉達 GPU 的替代品，該報告發現大多數替代品都沒有得到認可。這些替代品的價格只有英偉達同類產品的零頭，也被宣稱具備較好的潛在效能，這讓它們能夠收穫最初的熱情和最初的部署。然而，幾乎總是有人中途棄用這些替代品，轉而繼續擁抱具備最成熟生態系統的英偉達 GPU。

這裡的替代品主要指的是專用積體電路（ASIC，Application-Specific Integrated Circuit）。在過去六個月裡，由於英偉達的漲勢已經開始疲軟，而 AMD 的表現相對落後，這讓 AI 行業的投資勢頭明顯轉向 ASIC。英偉達 3 萬億美元的市值是由每季度超過 320 億美元的 AI 營收所支撐的，而博通 1.1 萬億美元的市值則來自每季度 32 億美元的營收。顯然，市場認為 ASIC 的增長潛力將是 GPU 的數倍之多。那麼，從長期來看，ASIC 會勝過通用晶片嗎？這份報告的觀點是：除非發生新的變化，否則應該假定仍將由目前的行業領導者英偉達保持主導份額。

（來源：Morgan Stanley Research）

谷歌 TPU：ASIC 的最成功案例

ASIC 是否會因為更適合較窄的應用範圍而優於通用解決方案呢？有時，這一問題的答案是肯定的。當出現這種情況時，這便是定製化晶片最有說服力的應用場景之一。最明顯的例子便是谷歌 TPU 的成功，它之所以能取得這樣的成功，是因為谷歌發明了針對大模型的 Transformer 技術，並指導博通開發出一種針對該技術進行最佳化的晶片。而在當時英偉達正圍繞使用卷積神經網路的視覺模型來最佳化其 GPU。

截至目前，谷歌 TPU 是最能體現雲客戶因定製化解決方案而明顯受益的例子，這也為博通帶來了 80 多億美元的 TPU 營收。但是，同樣重要的是谷歌在 2025 年的一部分支出也將流向英偉達，其中一部分是對雲的投資。在雲計算領域，通用晶片的表現往往優於 ASIC。

與此同時，英偉達也在圍繞 Transformer 模型進行最佳化，並專注於訓練多模態通用 AI 模型。對於一些上一代應用程式來說，英偉達的這種投入可能顯得大材小用。不過，在提供高階訓練能力方面，很難有比英偉達更出色的玩家。具體到谷歌來說，本次報告預計 2025 年穀歌對於英偉達產品的採購量將翻一番左右。其中一些是谷歌出於投資企業雲的角度開展的採購，但是本次報告顯示其中谷歌的一些採購是因為英偉達產品在大模型 Transformer 方面有著非常強大的效能。

（來源：Morgan Stanley Research）

英偉達：似乎有一種引力把所有人都引向最昂貴的顯示卡

的確，某一款 ASIC 晶片的效能可能低於英偉達的 H100，但是這款 ASIC 晶片的售價為 3000 美元，而 H100 售價 20000 美元，所以這款 ASIC 晶片的總擁有成本更低。但是，僅僅透過製造售價 3000 美元的 AI 晶片就能與英偉達競爭，真的這麼容易嗎？報告援引一個例子稱：英特爾在這方面已經苦苦掙扎十年左右，它曾多次收購那些已經開始出貨且產品定價較低的公司，然而卻並未在這一領域取得顯著成績。

再以 AMD 為例，它的前幾代產品都沒有取得太大成果，直到 2024 年才憑藉 MI300 取得突破。如果真的有必要，那麼英偉達的競爭對手可能都會改為只生產 3000 美元的晶片。其實，就連英偉達自己也推出過幾款針對傳統推理應用的低價晶片。但是，英偉達發現似乎有一種引力在把所有人都引向最昂貴的顯示卡。

為什麼會這樣？處理器本身的成本或許可以做得很低，但是系統的整體成本可能會更高。透過 ASIC 晶片構建叢集的成本，可能遠高於使用英偉達的產品。原因在於：英偉達利用銅纜打造了包含 72 個 GPU 的光線互連域，而 ASIC 則通常要使用成本更高的光通訊技術。除此之外，ASIC 和英偉達晶片的其他主要成本構成部分較為相似，比如兩者在高頻寬記憶體上的成本是一樣的。即便如此這對於英偉達也更加有利，因為英偉達在新型高頻寬記憶體晶片（HBM，High Bandwidth Memory）的採購上擁有買方壟斷的議價能力。

就晶片的軟體適配來說，對於晶片客戶來說這是一項又難又耗時的工作。在處理軟體變更以及執行不同工作負載時，易用性非常重要。而在總體擁有成本計算中，“軟體開發工時”這一因素常常被忽視。該報告舉例稱，美國大資料公司 Databricks 購買了亞馬遜雲科技（AWS，Amazon Web Services）的晶片 Trainium，買到晶片之久 Databricks 預計需要“數週或數月的時間來啟動和執行”。延遲部署可能會讓部分晶片客戶遠遠落後於使用英偉達晶片的客戶，原因在於英偉達配備了目前已被廣泛使用的 CUDA 軟體開發工具包。

儘管谷歌的 TPU 和 AMD MI300 取得了一定程度上的成功。但是，即便如此本次報告依然發現，客戶對於英偉達生態系統仍舊保持強勁熱情，這讓英偉達在 2025 年的市場份額有所增加。這並不是說價格較低的處理器沒有存在價值，只是它們並沒有像預期那樣獲得廣泛應用。

（來源：Morgan Stanley Research）

DeepSeek 真的衝擊英偉達了嗎？

ASIC 作為一個晶片類別，並不優於或劣於商用 GPU，兩者都是實現相同結果的不同方法。ASIC 的開發預算通常低於 10 億美元，在某些情況下甚至更低。相比之下，僅 2025 年這一年英偉達就將投資約 160 億美元用於研發。憑藉這筆資金，英偉達能夠維持一個為期 4 年-5 年的開發週期。英偉達還將投資數十億美元用於連線技術，以提高機架規模和叢集規模的效能。英偉達確實有能力在軟體生態系統方面進行大規模投資，而且由於其產品存在於世界各個地區的每一個雲平臺（前提是美國商務部允許），因此對英偉達生態系統的任何改進性投資，都會在全球生態系統中傳播開來。

儘管 DeepSeek 在推理與訓練做法開始讓人們反思“堆硬體”這一做法的意義。但是，本次報告並不認為從訓練到推理會發生巨大轉變，也不認同 ASIC 是“推理贏家”的說法。實際上，在 Deepseek“出圈”之後，科技巨頭和 OpenAI、xAI 等公司的 CEO 們，都對大型叢集規模的回報持積極態度。因此，這份報告並不認為 ASIC 在推理方面更具優勢，而是堅信那些效能最佳的解決方案將會脫穎而出。因為，推理工作負載正呈現出日益趨同的態勢，而且大部分訓練和推理涉及的是大模型 Transformer 工作負載。

報告還指出，博通的 750 億美元服務可獲得市場（SAM，Service addressable market）絕大多數來自於大模型訓練。預計在沒有大規模叢集規模的情況下，GPU 會被重新用於推理工作。基於此，該報告指出 ASIC 不會成為事實上的贏家。英偉達在每瓦的原始處理能力方面具有優勢，雖然 ASIC 晶片更便宜，但是構建機架/叢集的成本可能更昂貴。

一位雲計算高管公開表示，每隔兩年他的 ASIC 團隊都會提供比英偉達落後 2 年-3 年的技術，但這並沒有帶來太多收益。這並不是一種罕見的抱怨，這些抱怨有時甚至來自於已經大規模部署 ASIC 的雲供應商。他們原本將此視為對於未來的投資，然而大多數並未完全實現這一目標。

AMD 曾預測其產品 MI400 將帶來“每年數百億美元收入潛力”，儘管 AMD 的預測也是基於與潛在客戶溝通得出的，但是投資者的反饋是：“嗯，我們怎麼知道應該對 AMD 2026 年的產品（MI400）有信心，而不是對英偉達的未來新產品（Rubin）有信心？”

不過，本次報告也指出 AMD 的努力不可等閒視之。AMD 在更廣泛生態系統中的投資可能會遠遠超過 ASIC 供應商。2024 年，AMD 收購了伺服器製造商 ZT Systems。AMD 透過這種迭代投資在伺服器生態系統中取得了主導技術。在這份報告看來，AMD 與 ASIC 競爭對手擁有同樣大的市場機會。但是，兩者都不應該輕視與英偉達競爭時所面臨的挑戰。

2024 年，英偉達的處理器收入預計為 980 億美元，而 AMD 為 50 億美元，博通為 80 億美元，世芯電子和 Marvell 加起來約為 20 億美元。這使得商用矽的市場份額佔比約為 90%，ASIC 的市場份額佔比約為 10%。

與此同時，本次報告認為 2025 年商用矽的市場份額還會略有增長。預計在 2025 年，英偉達的增長幅度將比谷歌 TPU 高出 50%-100%。報告認為，英偉達在 2025 年下半年的收入勢頭將遠遠強於 ASIC 廠商或 AMD。

報告強調，其對於任何一家 AI 公司都沒有負面看法。然而，儘管 AMD 的估值越來越有吸引力，但是 AMD 的 MI350 似乎並沒有改變遊戲規則，同時 AMD 的 MI400 也存在一些未知因素。

目前來看，英偉達的產品仍然有著較大需求，而英偉達面臨的最大短期風險依然是美國的出口管制。總的來說，英偉達實力仍在，由此也就不難理解為何 DeepSeek 目前只能短時間挫敗英偉達股價。但是，AMD 等廠商的努力也能為人們提供更多的選擇，這也是一件好事。

排版：羅以