
👆如果您希望可以時常見面,歡迎標星🌟收藏哦~
英偉達在2025 年開局不利。相關統計資料顯示,今年迄今為止,這家全球領先的晶片巨頭的股價已下跌超20%,公司市值與高峰期相比縮水近萬億美元。
當一家公司的股價開始下跌時,人們很容易將其歸咎於糟糕的運營業績。但英偉達的情況並非如此。第四季度的收益顯示,該公司的業務仍在全力以赴。收入較上年同期飆升 78%,達到創紀錄的 393 億美元,這得益於該公司資料中心部門的強勁表現,該公司在該部門生產用於執行和訓練大型語言模型(LLM) 的先進 AI 晶片。

截至本文撰寫之時,Nvidia 的股價較 2 月 26 日公佈財報時下跌了 14%。這一下跌表明,儘管該公司增長率高且成功推出了 Blackwell 晶片,但市場對該公司的印象並不好。有些人可能將此歸咎於毛利率下降。雖然公司CEO黃仁勳表示晶片需求瘋狂。
然而,更大的挑戰可能來自長期需求。或者說,背後的很多邏輯已經變了。
DeepSeek改變了需求?
在DeepSeek橫空出世以後,英偉達曾經暴跌17%,雖然後面他們已經收復了失地。但在分析人士看來,這動搖了大家瘋狂堆積算力的根基。
今年 2 月,微軟取消了美國部分資料中心的租約,此舉震驚了科技界。據信,微軟是 Nvidia 的最大消費者之一,而資料中心容量的減少可能表明其希望減少對該行業的投資。
雖然微軟可能不會放棄人工智慧,但其執行長薩蒂亞·納德拉 (Satya Nadella) 表示,這項技術目前還沒有創造太多有意義的價值。如果一位行業領袖公開這麼說,其他 Nvidia 客戶(如Alphabet和Meta Platforms)在幕後可能會有同樣的感受。
金融時報在最新的報道也指出,DeepSeek 的 R1 和其他所謂的“推理”模型(例如 OpenAI 的 o3 和 Anthropic 的 Claude 3.7)在使用者提出請求時消耗的計算資源比以前的AI系統更多,這個過程稱為“推理”。
這改變了人工智慧計算需求的焦點,因為直到最近,人工智慧計算還以訓練或建立模型為中心。隨著個人和企業對超越當今流行聊天機器人(如 ChatGPT 或 xAI 的 Grok)的應用程式的需求不斷增長,推理預計將成為該技術需求的重要組成部分。
Nvidia在大型計算叢集市場佔據主導地位,例如埃隆·馬斯克在孟菲斯的 xAI 設施或 OpenAI 與軟銀合作的 Stargate 專案。但其投資者希望確保 Nvidia 能夠繼續在專注於推理的、規模小得多的資料中心的銷售上超越競爭對手。
摩根士丹利 (Morgan Stanley) 的分析師估計,未來幾年美國資料中心 75% 以上的電力和計算需求將用於推理,但他們警告稱,這一轉變究竟如何進行存在“很大的不確定性”。
巴克萊分析師也預估,未來兩年內,“前沿人工智慧”(指最大、最先進的系統)的推理資本支出將超過訓練資本支出,從 2025 年的 1226 億美元躍升至 2026 年的 2082 億美元。

根據金融時報引述巴克萊的資料預測,儘管Nvidia 將在前沿 AI 訓練領域“佔據 100% 的市場份額”,但從長遠來看,它只能佔據 50% 的推理計算份額。這意味著到 2028 年,該公司的競爭對手將面臨近 2000 億美元的晶片支出。
雖然Nvidia 執行長黃仁勳堅稱,該公司晶片的推理能力與訓練能力同樣強大,因為他看到了巨大的新市場機會。但從市場的反應看來,很多廠商正在趁機崛起。
競爭對手的咄咄逼人
在英偉達眾多競爭對手中,Cerebras無疑是其中最激進的一個。基於其打造的晶圓大小晶片,這家公司近年來在推理領域頻頻發力。Cerebras 一直將自己定位為高速推理專家,聲稱其晶圓級引擎 (WSE-3) 處理器可以比基於 GPU 的解決方案快 10 到 70 倍地執行 AI 模型。隨著 AI 模型向更復雜的推理能力發展,這種速度優勢變得越來越有價值。
為了挑戰Nvidia在人工智慧市場的主導地位,該公司週二宣佈大幅擴充套件其資料中心足跡,並建立兩家主要企業合作伙伴關係,使該公司成為高速人工智慧推理服務的領先提供商。
據介紹,該公司將在北美和歐洲增加六個新的 AI 資料中心,將其推理能力提高 20 倍,達到每秒超過 4000 萬個tokens。
Cerebras 產品營銷總監 James Wang 在接受採訪時表示:“今年,公司的目標是真正滿足所有需求,我們預計所有新需求都將隨著 Llama 4 和新 DeepSeek 模型等新模型的推出而出現。這是我們今年的重大增長計劃,旨在滿足對推理token的幾乎無限的需求。

他們指出,透過這些新配置,公司將速度提高了 10 倍,以前需要五秒鐘或更長時間才能完成的任務在 Cerebras 上基本上可以立即完成。
Cerebras 認可黃仁勳推理是下一個大趨勢的說法。但他們認為,黃仁勳並沒有告訴我們,推理會讓整個過程慢 10 倍,因為模型必須思考併產生一堆內心獨白,然後才能給出最終答案。這種放緩為 Cerebras 創造了機會,其專用硬體旨在加速這些更復雜的 AI 工作負載。
“目前使用 GPT-4 的任何人都可以直接升級到 Llama 3.3 70B 作為替代品,”Cerebras解釋道。“GPT-4 的價格約為 4.40 美元。而 Llama 3.3 的價格約為 60 美分。我們大約是 60 美分,對吧?因此,成本幾乎降低了一個數量級。如果你使用 Cerebras,速度就會再提高一個數量級。”
與此同時,類似Fractile、Groq和d-Matrix 等初創公司以及 Nvidia 的傳統晶片製造競爭對手(如 AMD 和英特爾)推出更適合推理的晶片,因為 Nvidia 專注於滿足大型科技公司對其高階硬體的巨大需求。
此前,一家名為Positron 的公司獲得了鉅額融資,他們也將成為英偉達的挑戰者。據介紹,該公司的的晶片主要用於推理,即使用 AI 模型的階段,而不是用於訓練 AI 模型。目前,對訓練晶片的需求更高,但分析師預測,隨著更多 AI 應用的部署,對推理晶片的需求可能會超過訓練晶片。
寫在最後
其實,在英偉達的這個故事裡面,還有很多繞不開的公司。例如博通和Marvell這些ASIC供應商,他們利用其裝備精良的武器庫,為其克服提供源源不斷的武器庫。這也讓亞馬遜、Meta和谷歌等公司擁有時間和機會來叫板英偉達。
同時,特朗普的關稅政策以及出口限制,也在給英偉達帶來新的風險。
當然,如果從整個市場層面上看,英偉達也應該是無憂的。例如甲骨文在週一報告稱,其訂單積壓金額達 1300 億美元,其中不包括星際之門的任何合同。執行長薩弗拉·卡茲指出,創紀錄的訂單量表明需求“巨大”。背後帶來的GPU需求顯而易見。
此外,埃隆·馬斯克的 xAI 購買了 100 萬平方英尺的土地,用於建設第二個孟菲斯資料中心。據介紹,新的資料中心最多可容納 350,000 個 GPU。據報道,該資料中心執行著 10 萬個 GPU,但馬斯克在 2024 年 10 月表示,計劃將GPU 數量增加到20 萬個,該公司在 12 月透露,最終希望在孟菲斯執行100 萬個 GPU。
不過,英偉達的邏輯變了,應該也是個不爭事實。
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4061期內容,歡迎關注。
推薦閱讀



『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦

