Dynamo 是一款分散式推理服務庫,為需要 token 但又無法獲得足夠 token 的問題提供開源解決方案。簡單來說,Dynamo 有四個方面的優勢:GPU 規劃引擎,動態排程 GPU 資源以適應使用者需求智慧路由器,減少 GPU 對重複和重疊請求的重新計算,釋放更多算力應對新的傳入請求低延遲通訊庫,加速資料傳輸記憶體管理器,智慧在低成本記憶體和儲存裝置中的推理資料人形機器人的露臉環節,永遠不會缺席人形機器人再一次成為了 GTC 大會的壓軸節目,這次英偉達帶來了 Isaac GR00T N1,全球首款開源人形機器人功能模型。
黃仁勳表示,通用機器人技術的時代已經到來,藉助 Isaac GR00T N1 核心的資料生成以及機器人學習框架,全球各地的機器人開發人員將進入 AI 時代的下一個前沿領域。這個模型採用「雙系統」架構,模仿人類的認知原理:系統 1:快速思考的動作模型,模仿人類的反應或直覺系統 2:慢思考的模型,用於深思熟慮的決策在視覺語言模型的支援下,系統 2 對環境和指令進行推理,然後規劃動作,系統 1 將這些規劃轉化為機器人的的動作。GR00T N1 的基礎模型採用廣義類人推理和技能進行了預訓練,而開發人員可以透過真實或合成數據進行後訓練,滿足特定的需求:既可以完成工廠的特定任務,也可以在家裡自主完成家務。黃仁勳還宣佈了與 Google DeepMind 和 Disney Research 合作開發的開源物理引擎 Newton。
晶片無疑是重頭戲,但一些軟體的亮相同樣值得關注。矽谷著名投資人馬克·安德森曾提出軟體正在吞噬世界(Software is eating the world)的論斷,其核心邏輯在於軟體透過虛擬化、抽象化和標準化,正在成為控制物理世界的基礎設施。不滿足於做「賣鏟人」,英偉達的野心是打造 AI 時代的「生產力作業系統」。從汽車智慧駕駛,到製造業的數字孿生工廠,這些貫穿整場釋出會的案例都是將 GPU 算力轉化為行業生產力的具象化表達。實際上,無論是釋出會上亮相的最新核彈晶片,還是押注戰未來的量子計算,黃仁勳在這場釋出會上對 AI 未來發展的洞察和佈局,都比當下的技術引數與效能指標更具看點。
在介紹 Blackwell 與 Hopper 架構的對比時,黃仁勳還不忘幽默一把。他以一個 100MW 工廠的對比資料為例,指出採用 Hopper 架構需要 45,000 顆晶片和 400 個機架,而 Blackwell 架構憑藉更高的效率顯著減少了硬體需求。於是,黃仁勳那句經典的總結再次丟擲,「the more you buy, the more you save」(買得越多,省得越多)。隨後話鋒一轉,他又補充說,「the more you buy, the more you make」(買得越多,賺得越多)。隨著 AI 領域的重心從訓練轉向推理,英偉達更需要證明其軟硬體生態在推理場景的不可替代性。一方面,Meta、Google 等巨頭自研 AI 晶片,可能分流 GPU 市場需求。另一方面,英偉達最新 AI 晶片的適時亮相,回應如 DeepSeek 的開源模型對 GPU 需求的衝擊,並展示推理領域技術優勢,也是為了對沖市場對訓練需求見頂的擔憂。最近估值跌至 10 年低位的英偉達,比以往任何時候都需要一場酣暢淋漓的勝利。