
👆如果您希望可以時常見面,歡迎標星🌟收藏哦~
來源:內容編譯自nextplatform,謝謝。
可以肯定地說,在 2025 年,世界上最好的工作是 Nvidia 的執行長,而該公司的聯合創始人黃仁勳 (Jensen Huang) 帶領公司走向了輝煌,就像聯合創始人托馬斯·沃森 (Thomas Watson) 帶領公司走向國際商業機器公司 (International Business Machines)、拉里·埃裡森 (Larry Ellison) 帶領公司走向甲骨文公司 (Oracle) 以及史蒂夫·喬布斯 (Steve Jobs) 帶領公司走向蘋果電腦公司 (Apple Computer) 一樣。
但 Nvidia 的第二好工作無疑是 Bill Dally 所從事的工作。或者更確切地說,Dally 同時從事這兩份工作。Dally 於 2009 年出任 Nvidia 首席科學家,在此之前,他曾擔任斯坦福大學計算機科學系主任十幾年,並在麻省理工學院和加州理工學院從事晶片、互連和系統研究數十年,成績斐然。Dally 說,他會關注公司內部發生的一切,並努力讓所有這些技術“儘可能地好”。在聖何塞舉行的最新 GPU 技術大會上,Dally 在演講中補充說,他還有另一份工作,負責管理 Nvidia 研究部門,這意味著他可以“與許多真正聰明的人一起解決許多艱難的智力問題”。
Dally 的演講總是很有趣,最近一次 GTC 上的演講也不例外。像往常一樣,Dally 挑選了一些硬體和軟體方面的精妙技術,並深入研究了它們,展示了它們如何為 Nvidia 帶來了當前的優勢,或者未來在銷售 GPU 加速系統方面可能帶來的優勢。
這讓我們想到了 Nvidia 的研發支出,這筆支出相當大,但由於 Nvidia 過去一年半的收入和利潤激增,這筆支出現在看起來微不足道。但毫無疑問:Nvidia 投入巨資打造未來,現在它從中受益最多,比地球上任何其他供應商都多。
早在 2008 年 11 月,當 Nvidia 在奧斯汀舉行的 2008 年超級計算大會上首次在 HPC 模擬和建模領域闡述其 GPU 計算願景時(這比第一屆 GPU 技術大會在費爾蒙酒店舉行,約有 1,500 名與會者),IBM 基於 AMD Opteron CPU 和 IBM PowerXCell 數學加速器的“Roadrunner”混合超級計算機剛剛在去年 5 月突破了高效能 LINPACK 基準測試的千萬億次浮點運算障礙。為了向您展示我們距離人工智慧革命和當前現實有多遠,太平洋西北國家實驗室舉辦了一場小組討論,題為“電力公司是否會在購買電力合同時贈送超級計算機? ”
但現實卻大相徑庭:你會為超級計算機和電力合同支付比你想象的預算更多的錢嗎?也許我們會向 SC25 的人們提出這個問題作為小組討論。而這一現實完全取決於 Nvidia 資料中心 GPU 的效能、功耗和成本。
而且,我們認為,未來出現差異的原因部分在於,儘管帶有向量和有時張量引擎的 CPU 也執行大量並行工作,但 Nvidia GPU 已成為 HPC、分析和 AI 工作負載的主力平行計算引擎。
如果 Nvidia 沒有看到Brook Stream 處理程式語言的價值,那麼這一切都不會發生。該語言將數學計算轉移到 ATI(現為 AMD)和 Nvidia GPU 上的浮點著色器單元,並聘請其創始人 Ian Buck 建立現在所謂的 CUDA。資料中心對 GPU 計算的需求迫使 GPU 設計不斷發展,其程式設計堆疊也隨之發展。當世界創造了足夠的資料,使自古以來(20 世紀 80 年代初)的 AI 演算法能夠真正發揮作用時,GPU 就是完成這項工作的最佳計算引擎,併成為 AI 革命的平臺——具體來說,我們指的是經典機器學習。GenAI 及其基礎模型只是 AI 創新浪潮中的第二波浪潮,未來很可能會出現許多波浪潮。在 Dally 的密切關注下,Nvidia Research 確保 GPU 晶片不斷發展,並且可能在大量平行計算中表現良好的工作負載可以與未來的 GPU 相結合,並保持技術飛輪(從而保持金錢飛輪)轉動。
但這需要投資。
我們直到 2010 年 4 月才開始跟蹤 Nvidia 的財務狀況,也就是其 2011 財年第一季度,因為其資料中心業務尚未實現。Nvidia 直到 2015 財年第一季度才公佈資料中心部門的收入,當時的收入僅為 5700 萬美元,而當時的總銷售額為 11 億美元,淨收入為 1.37 億美元。這並非毫無意義的——我們真的是這麼認為的——Nvidia 在那個季度花費了 3.37 億美元(佔收入的 30.6%)用於研發,並且在過去兩年中,其研發支出佔收入的比例一直保持在新高,在 2014 財年第一季度達到頂峰,佔收入的 34.2%。
這是 Nvidia 為利用第一波人工智慧浪潮和為第二波浪潮做好準備所做的基礎工作。而且請放心,它已經預測了第三波浪潮(它稱之為物理人工智慧),而且毫無疑問,它正在為第四波浪潮做準備。

現在,在外行看來,Nvidia 似乎正在大幅削減研發支出,我們應該擔心其未來的投資。事實並非如此。事實是,Nvidia 之所以能夠壟斷 GPU 計算市場,是因為它花了二十年時間建立了 CUDA 平臺,該平臺收集了超過 900 個庫、框架和模型,支撐著世界上每一個加速的 HPC 和 AI 應用程式,而且它可以為現代資料中心 GPU 執行 AI 訓練工作負載所需的稀缺 HBM 記憶體支付絕對最高的價格,並且由於思路鏈或推理模型的計算需求,它越來越多地用於 AI 推理。
如果 HBM 不是那麼稀缺和昂貴,AMD 的 DRAM 將會與 MI250 和 MI300 GPU 競爭,並且其 GPU 銷量也會比現在多得多。但是 HBM 非常稀缺,AMD 無法像 Nvidia 那樣支付那麼多錢。但是,對於某些使用者子集(HPC 人群)來說,CUDA X 堆疊(Nvidia 軟體的名稱)並不像對 AI 人群那樣重要,AI 人群站在 HPC 人群的肩膀上,無論他們如何抗議。(例如,NCCL 是一個經過修飾的 MPI。)這就是為什麼你會看到 AMD 用其 GPU 追求傳統的 HPC 中心,並在那裡獲得關注,因為 HPC 中心在計算方面對價格極為敏感。AI 客戶透過計算來製作有望賺錢的模型,他們可以找到任意數量的投資者來實現這一目標。HPC 中心依靠州和國家政府。
回顧過去十五年,你會發現 Nvidia 的研發支出佔營收的 20% 到 25% 之間,這與 Meta Platforms 在同一時期接手設計自己的伺服器、儲存、網路和資料中心以來所做的差不多。谷歌傾向於將營收的 15% 到 20% 用於研發,甲骨文也是如此。微軟的研發支出約為 15%,上下浮動不大,亞馬遜的研發支出則低幾個百分點。AMD 的研發支出過去在 15% 到 20% 之間,但現在與 Nvidia 處於同一水平。但是,在過去的十二個月裡,Nvidia 的銷售額為 1305 億美元,是 AMD 258 億美元的 5.1 倍。
儘管如此,儘管 Nvidia 在 GenAI 熱潮期間一直在增加研發預算,但它並沒有將 20% 到 25% 的收入用於研發。事實上,自 2023 年夏季 GenAI 熱潮使 Nvidia 的收入和收益飆升以來,其銷售額佔比一直呈下降趨勢。在過去的 12 個月中,它的平均收入略低於 10%。但與 2024 財年相比,這仍然代表著 2025 財年增長了 48.9%,研發總額為 129.1 億美元。
這張對數圖可以更好地展示 Nvidia 研發支出增長的穩定性:

我們不知道這個數字中有多少是研發,有多少是開發,但我們認為,隨著 Nvidia 接管越來越多的資料中心硬體和軟體堆疊,研發投資將穩步增長,開發成本也將激增。很難準確說出。
正如 Dally 所說,Nvidia Research 大致將其分為兩個部分,即所謂的供給方和需求方。

供應方涉及從電路到系統架構等各個方面的研究,其明確任務是提供“讓 GPU 變得偉大的技術”,正如他所說。這種供應方研究現在包括 GPU 儲存系統和安全性,它們是任何商業 AI 系統不可或缺的一部分。
需求方是對各種應用領域進行研究,以便加速計算領域不斷擴大,從而推動對 Nvidia GPU 的需求。有兩個不同的 AI 小組,一個在多倫多,另一個在特拉維夫,還有一個在聖克拉拉,從事應用深度學習研究。臺灣的實驗室是進行生成式 AI 工作以及多模態學習和 3D 視覺的地方。有專門的 AI 實驗室專注於機器人和自動駕駛汽車,其他小組專注於大型語言模型或高效的 AI 演算法。顯然有三個小組專注於圖形,一個小組從事量子物理和化學。
Nvidia Research 剛剛組建了一個量子計算研究小組,試圖評估該技術的現狀,並瞭解 Nvidia 何時何地能夠抓住這一機遇。
偶爾,大家也會有 Dally 所說的“登月計劃”,即來自 Nvidia 研究機構和產品部門的研究人員將一項新技術付諸實踐。RT 核心是顯示卡的一部分(因此一些推理卡賣給了資料中心),用於加速光線追蹤的處理,這就是登月計劃的一個例子。該專案於 2013 年啟動,RT 核心於 2017 年進入“圖靈”GPU。
Nvidia 可能有大約 500 名研究人員,他們正式隸屬於 Nvidia Research,但還有數千名來自產品組的工程師,他們也是某些專案的一部分。Nvidia 目前擁有大約 36,000 名員工,我們估計其中 75% 從事軟體工作,這是過去至少十年來 Nvidia 員工的傳統份額。
Nvidia Research 向產品部門轉移的最成功的技術之一是 NVLink 和 NVSwitch,這是我們之前討論過的。但在 GTC 2025 的主題演講中,Dally 進一步闡述:
“我實際上在 2012 年左右從能源部獲得了一份合同,當時我們正在為 Oak Ridge 建造超級計算機,”Dally 解釋道,他指的是 IBM 是“Summit”超級計算機的主要承包商的合同。“作為這些專案的一部分,有研發資金。所以我申請了一些資金來開發 GPU 網路。我記得,當時,能源部希望分攤該專案的成本。他們希望 Nvidia 支付 40%,能源部支付 60%。我去找 Jensen,他說,“絕對不行。是的,我們不做網路。我們是一家 GPU 公司。”所以我回到了能源部,幸運的是,他們 100% 資助了開發第一個 NVSwitch 和第一個 NVLink 的專案。從那時起,實際上,這些專案在我們完成之前就被奪走了,他們意識到他們需要讓幾個 GPU 看起來像一個大 GPU。從那時起,Nvidia 就一直參與網路業務。”
但達利表示,對於 Nvidia Research 來說,最重要的技術轉移可能是機器學習。
“因此,在 2011 年與斯坦福同事吳恩達共進早餐後,我讓 Nvidia Research 參與了機器學習,”Dally 回憶道。“當時他告訴我,他在 Google Brain 使用 16,000 個 CPU 在網際網路上尋找貓。我想,哇,我們可以用 GPU 做到這一點,而且花費的資源少得多。所以我指派當時擔任程式設計系統研究員的 Brian Catanzaro 與 Andrew 合作,他將該軟體移植到 48 個 GPU 上執行,實際上在 48 個 GPU 上執行速度比在 16,000 個 CPU 上執行速度更快。該軟體變成了 cuDDN,並引領我們走上了如今深度學習的道路。”
多年來,技術轉讓取得了許多成功,以下是一些例子:

Dally 在本次 GTC 上談到的技術之一是接地參考訊號,早在 2019 年夏天的 Hot Chips 上,他就曾與我們討論過這項技術。GRS 是一種單端訊號技術,為了將其大大簡化,它允許 Nvidia 透過有機基板上的導線驅動兩倍的每針頻寬,這是其他差分訊號技術的兩倍,也是晶片邊緣每毫米頻寬的兩倍。六年後,GRS 訊號被用於將 Nvidia 的“Grace”CG100 CPU 與 DGX GB300 系統中即將推出的“Blackwell”B300 GPU 連線起來。

早在 2013 年,當 GRS 研究剛剛開始時,Nvidia 就能以大約半皮焦耳/位元的速度傳輸 25 Gb/秒的訊號,但為了使訊號更穩定,它在生產 GRS 時將其提升到大約 1 皮焦耳/位元。Dally 說,典型的 PCI-Express 鏈路需要大約 5 皮焦耳到 6 皮焦耳/位元的訊號。
每天丟擲新想法,我們期望這些想法最終能成為產品。這是插入器上基於反相器的訊號,例如,您可以在單個封裝上將多個 GPU 晶片相互連線:

以下是 Nvidia 針對 3D 晶片堆疊的互連方法:

以下是 3D 堆疊與中介層在每引腳頻寬以及推送訊號所消耗的每位飛焦耳方面的比較:

它會一直持續下去,正如你從觀看 Dally 在 GTC 2025 上的 Nvidia Research 演示以及他多年來在各種活動中所做的演示中所看到的那樣。
當時,IBM 非常富有,可以進行任何它想進行的研究。後來,當公司在 20 世紀 90 年代初陷入困境,藍色巨人距離破產只有一步之遙時,唯一一位從外部聘請的 IBM 執行長路易斯·郭士納 (Louis Gerstner) 所做的第一件事就是讓 IBM 研究部門專注於解決影響真正客戶的問題。
Nvidia 從未需要重新集中研究人員和工程師來實現這一點。他們所做的就是這些。希望 Nvidia 現在的收入來源和淨收入池非常豐富,公司不會過度沉迷於研究,擔心會錯過即將到來的下一波浪潮。它所需要做的就是堅持自己的 GPU knitting,,而其路線圖表明這就是計劃。
還有一件事需要考慮:Nvidia 並不是什麼都發明的,但它確實發明了它認為需要與競爭對手區分開來或開拓新市場的東西。例如,Nvidia 從第三方購買 PCI-Express 交換機和重定時器。它從多個供應商那裡購買 DRAM、GDDR、HBM 和快閃記憶體。它對從外部引進的技術的特定用例有偏好,並在有必要的情況下保持中立。當它想以比從頭開始建立技術更快的速度為客戶做某事時,它會收購公司——Mellanox Technologies 就是一個很好的例子,Cumulus Networks 和 Run.ai 也是如此。
參考連結
https://www.nextplatform.com/2025/03/30/nvidia-research-the-real-reason-big-green-commands-big-profits/
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4080期內容,歡迎關注。
推薦閱讀



『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦

