

小紀有話說:
-
釋出史上最快的消費級顯示卡RTX 5090; -
提出Scaling Law仍在繼續,並表示要建立一個名為Grace Blackwell NVLink72的巨型晶片; -
在NIM微服務中新增Nemotron系列模型和用於影片搜尋和摘要的AI代理,入局Agentic AI; -
釋出Nvidia Cosmos世界基礎模型平臺,以助推Physical AI的發展; -
釋出人形機器人合成數據藍圖Isaac GR00T Blueprint和新一代智駕晶片Thor; -
釋出全球最小的個人AI超級計算機Project DIGITS。
文章來源:甲子光年微信公眾號(ID:jazzyear)
作者|王藝 蘇霍伊 編輯|王博

史上最快的消費級顯示卡
黃仁勳在這次演講中釋出的產品,最受關注的莫過於RTX 5090。

RTX 5090是迄今為止最快的GeForce RTX GPU,在Blackwell架構創新和DLSS 4的加持下,RTX 5090的效能是RTX 4090的2倍。
它在多款熱門遊戲中都表現優異,這些遊戲包括《賽博朋克 2077》《黑神話:悟空》等,同時在D5 Render渲染器上也有不錯的表現。

RTX 5090和RTX 4090效能對比
但也有現場觀眾對「甲子光年」表示,這些遊戲的測試結果參考價值有待商榷。比如,《瘟疫傳說:安魂曲》這款遊戲在使用了DLSS 3(NVIDIA的深度學習超級取樣技術第三代)和光追技術(RT)的情況下,RTX 5090效能提升也不到50%,其相對於RTX 4090的效能提升低於預期,特別是光柵化效能增長幅度較小,光追效能也沒有得到充分驗證。
從引數上來說,RTX 5090擁有920億個電晶體,具備4000 AI TOPS(每秒萬億次操作)的效能,能夠實現380 RT TFLOPS(每秒萬億次浮點運算)的光線追蹤效能,具備1.8 TB/s的記憶體頻寬,能夠快速地讀取和寫入資料,具有125 Shader TFLOPS的著色器效能。

與RTX 5090 PU一同釋出的是RTX 50全系列產品,包括RTX 5080、RTX 5070 Ti、RTX 5070等。值得注意的是,與4090釋出時的1599美元相比,售價為1999美元的5090還是漲價了。

與此同時,搭載了RTX 5070的AI PC也在CES上釋出。這臺5070筆記型電腦具有與4090相當的效能,但能耗只有4090的一半。
“很難以置信對吧,我們把一個4090顯示卡縮小並塞到了這檯筆記本電腦裡!”黃仁勳有些得意地說。

黃仁勳表示,之所以能實現這一技術,是因為英偉達使用Tensor Core(張量計算核心)生成了大部分畫素,先回溯需要的畫素,然後再用AI生成其他畫素,“能源效率已經超出預期,計算機圖形學的未來是神經渲染,它是人工智慧和計算機圖形學的融合。”
RTX 50系列AI PC的價格也隨之公佈,其中搭載了RTX 5090顯示卡的AI PC售價為2899美元。


超級晶片隊長
釋出完RTX 50系列顯示卡後,黃仁勳話鋒一轉,開始大談AI。
在關於Scaling Law是否“撞牆”的討論絡繹不絕的當下,黃仁勳堅信Scaling Law仍在繼續,而且除了Pre-Training Scaling Law(預訓練縮放定律)之外,還出現了後兩個階段的Scaling Law,分別是Post-Training Scaling law(後訓練縮放定律)和Test-Time Scaling Law(測試時間縮放定律)。
這個表態並不讓人意外,畢竟Scaling Law與英偉達的生意息息相關。

黃仁勳表示,從ChatGPT到OpenAI o1、OpenAI o3、再到Genimi 1.5 Pro,這些新模型的強大能力都印證了Scaling Law的延續。
在演講現場,黃仁勳還向大家展示了包括液冷、風冷、x86伺服器等在內的Blackwell全系列產品。
“當然,我們需要的計算量是驚人的,我們希望社會有能力擴充套件計算量,以生產越來越多更新、更好的產品。Scaling Law正在推動對NVIDIA計算的巨大需求,也推動了對Blackwell架構晶片的巨大需求。”黃仁勳從自己的角度說了大實話。

介紹完Blackwell全系列產品後,黃仁勳拿出了一個巨大的晶片,並擺出了一個驚訝全場的造型,儼然成為了漫威電影中的“美國隊長”。

他手裡拿著的是GB200 NVLink 72的展示樣品。這個巨大的晶圓上有72個Blackwell GPU和144個晶片,擁有14TB的記憶體,和1.2PB/s的頻寬,AI浮點效能達到了1.4 ExaFLOPS,與上一代相比每瓦效能提高了4倍。
“基本上全世界的網際網路流量都能在這個晶片上進行處理。”儘管聽起來有些誇張,但“超級晶片隊長”黃仁勳就是這麼說的。


代理型AI助力企業工作流自動化
基座模型是生成式AI的基石。
在演講現場,黃仁勳推出了基於Llama的一系列模型,包括Llama Nemotron Nano、Super和Ultra。它們涵蓋從PC和邊緣裝置到大型資料中心等所有領域。

英偉達還發布了執行在NVIDIA RTX AI PC上的基礎模型,可增強數字人、內容創造、生產力和開發能力。
這些模型都以NIM微服務的形式提供。NIM微服務是由Black Forest Labs、Meta、Mistral和Stability AI等頂級模型開發商為RTX AI PC開發的關鍵元件,可以部署在RTX PC、工作站和雲端。其用例涵蓋大型語言模型(LLM)、視覺語言模型、影像生成、語音、用於檢索增強生成(RAG)的嵌入模型、PDF提取和計算機視覺等。
同時,NIM微服務還將與頂級AI開發和代理框架相容,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow和LM Studio。
總結來看,英偉達為幫助生態系統構建代理型AI做了三件事:
-
NVIDIA NIM,它基本上是一個打包好的人工智慧微服務; -
NVIDIA NeMo,本質上是一個數字員工入職和培訓評估系統,英偉達可以幫助客戶的數字員工(人工智慧代理)做培訓、以適應客戶公司的具體業務; -
NVIDIA AI Blueprints,它提供了一整套藍圖,用於將PDF轉換為播客,以及另一個用於構建影片搜尋和摘要的AI代理。此外,還有四個額外的NVIDIA Omniverse藍圖,使開發人員能夠更輕鬆地為物理AI構建可用於模擬的數字孿生。

在釋出會現場,黃仁勳還展示了Project R2X。這是一個支援視覺的PC化身,可以將資訊放在使用者的指尖,協助桌面應用程式和視訊會議通話,閱讀和總結文件等。


AI的下一個前沿是物理AI
演講過半,黃仁勳突然向現場觀眾提出了一個問題。
“想象一下,你正在給大模型做上下文提示,按照我的習慣,我可能會在問問題之前上傳幾個PDF檔案。這些PDF被大模型轉換成tokens,因此這些PDF檔案可能被轉換成數十萬個tokens,並且透過Transformer的每一層進行處理。但如果我上傳的不是PDF,而是周圍的環境怎麼辦?如果你在上傳之後你給大模型的不是提示,而是一個請求,讓它去某地拿起一個盒子並且把它帶回來怎麼辦?”
黃仁勳其實是想引出AI與物理世界的關係。
「甲子光年」去年5月就曾提出,能源、資訊和行為是現代社會和自然界中三個基本而相互關聯的概念——科技的進步,就是三者之間轉化能力加強的反映。隨著AI對物理世界對映能力的不斷最佳化,將會在實踐中構建一條AI影響世界發展的動態平衡線。

圖片來源:《張一甲:AI創生時代,2024中國AI新風向30條判斷》
2024年,讓AI理解物理世界,成為了AI產業界的新浪潮。
曾經在英偉達工作過的群核科技董事長黃曉煌表示:“這幾年隨著深度神經網路的發展,用機器模擬人腦已經獲得了巨大突破,標誌性事件就是ChatGPT的誕生。但我們也意識到,我們發展AI本來是希望AI能替代人類打掃衛生、做家務,現在卻是人類在打掃衛生、做家務,而AI在寫詩作畫。所以,讓AI從虛擬世界走入物理世界,去幫人類執行物理世界的任務,是技術發展的必經之路。”
這次CES上,黃仁勳揭幕了英偉達的下一代重磅產品——NVIDIA Cosmos世界基礎模型平臺。

世界基礎模型(WFM),指的是透過輸入多種模態的資料(包括文字、影像、影片和動作)來生成和模擬虛擬世界,從而準確地模擬場景中物體的空間關係及其物理互動的模型。
NVIDIA Cosmos是一個用來加速物理AI(能夠讓機器人和自動駕駛汽車等自主機器感知、理解和執行物理世界中的複雜動作的AI)開發的平臺,它由一套開源的擴散(Diffusion)和(Auto-regressive)模型組成,用於生成物理感知影片。這些模型在2000萬小時的現實世界人際互動、環境、工業、機器人和駕駛資料之上訓練而成,包含9000萬億個tokens。
該平臺將模型分為了三類:
-
Nano,針對即時、低延遲推理和邊緣部署進行了最佳化的模型; -
Super,針對高效能基線模型; -
Ultra,針對最高質量和保真度,最適合用於提煉自定義模型。

具身智慧創業者Edward說,他這次最關注的是開源的世界模型,Cosmos World Foundation Model開源模型讓訓練的門檻變低了,對資料的需求減少了,這對於機器人開發非常重要。
“透過‘Sim-to-Real’的方式,我們可以更快地實現像自動駕駛領域那樣的突破。特別是英偉達在這方面的最佳化,讓‘Sim-to-Real’的質量更高了,這對整個行業的進展幫助很大。”Edward說。
除了幫助生成大型資料集外,NVIDIA Cosmos還能透過將影像從3D擴充套件到真實場景,縮小模擬與現實之間的差距。將Omniverse(一個用於構建3D應用程式和服務的應用程式程式設計介面和微服務開發平臺)與Cosmos相結合至關重要,透過其高度可控、物理精確的模擬提供關鍵保障,有助於最大限度地減少世界模型常見的幻覺問題。

目前NVIDIA Cosmos已在Github上開源。開發人員可以根據自己的需求,直接使用Cosmos平臺上的模型來生成基於物理的合成數據,也可以用NVIDIA NeMo框架透過自己的影片對模型進行微調,以適應特定的物理AI設定。

NVIDIA Cosmos主要用於機器人和自動駕駛場景,目前,1X、Agility Robotics等機器人公司和XPENG、Uber和Waabi等自動駕駛公司都已經與Cosmos合作開發模型。
“The next frontier of AIis Physical AI。(AI的下一個前沿是物理AI)”這句話,去年年中黃仁勳就說過,這一次在CES 2025,他又一次面向世界強調了一遍。

合成數據與新一代智駕晶片
人形機器人是一個380億美元的超級市場,英偉達自然不會放過這一超級風口,很早就釋出了一系列機器人基礎模型、資料管線和模擬框架,以加速下一代人形機器人的開發程序。
“通用機器人的ChatGPT時刻即將到來。”黃仁勳在演講中下了判斷。
他宣佈英偉達正式推出用於合成運動生成的NVIDIA Isaac GR00T Blueprint,該Blueprint可幫助開發者生成海量的合成運動資料,以便透過模仿學習來訓練人形機器人。
模仿學習是機器人學習的一個子集,它能讓人形機器人透過觀察和模仿人類專家的示範來獲取新技能。在真實世界中收集這些廣泛、高質量的資料集既繁瑣又耗時,而且成本往往高得令人卻步。透過用於合成運動生成的Isaac GR00T Blueprint,開發者只需少量人類示範,就能輕鬆生成海量的合成數據集。

自動駕駛汽車同樣是英偉達關注的焦點。在演講中,黃仁勳宣佈英偉達推出下一代智駕晶片“Thor”。此前,英偉達Thor晶片原本計劃於2024年年中量產,但後來進度大幅推遲。

1月7日,極氪汽車宣佈,未來新車型將搭載NVIDIA Thor智駕晶片。此外,極氪與自動駕駛公司Waymo基於SEA-M架構聯合開發的全球首款量產原生無人駕駛汽車——ZEEKR RT將在2025年開啟大規模交付。
值得注意的是,在現場公佈的將搭載Thor智駕晶片的車企中沒有蔚來,這或許與蔚來去年7月宣佈其自研的智駕晶片“神璣NX9031”正式流片有關。

英偉達還展示了其最新的自動駕駛平臺——Hyperion 9以及DRIVEOS系統。Hyperion 9平臺基於英偉達最新的Blackwell架構打造,它配備了12個攝像頭、9個雷達、1個雷射雷達、12個超聲波感測器,在感測器配置和處理能力上都有顯著提升。


全球最小的個人AI超級計算機
在演講的最後,黃仁勳釋出了一款令人眼前一亮的產品——AI超級計算機Project DIGITS。
就像變魔術一樣,黃仁勳把一個超級計算機“變小”,然後拿了出來。

該計算機是基於此前的AI超級計算機DGX-1升級而成,但體積更小,功能更強。透過Project DIGITS,使用者可以使用自己的桌面系統開發和執行模型推理,然後在加速雲或資料中心基礎設施上無縫部署模型。

Project DIGITS搭載了全新的Grace Blackwell超級晶片(GB10),在FP4精度下可以提供高達1千萬億次浮點運算的AI效能。GB10採用NVIDIA Blackwell GPU,配備最新一代CUDA核心和第五代Tensor核心,透過NVLink-C2C晶片到晶片互連連線到高效能NVIDIA GraceCPU,其中包括20個採用Arm架構構建的節能核心。

GB10超級晶片使Project DIGITS僅使用標準電源插座即可提供強大的效能。每臺Project DIGITS都具有128GB的統一、一致記憶體和高達4TB的NVMe儲存。藉助這臺超級計算機,開發人員可以執行多達2000億個引數的大型語言模型,從而增強AI創新。此外,使用NVIDIA ConnectX網路,兩臺Project DIGITS AI超級計算機可以連線起來,執行多達4050億引數的模型。
正如前文所說,1小時35分鐘的演講,黃仁勳的每一句都像是一枚精準投射的晶片,深深嵌入了觀眾的腦中。
而這一枚枚晶片又如同種子一樣在觀眾腦海中快速生根發芽,並開出了未來之花。
這是一種很難用語言形容的感受,直到會場裡的標語提醒了我們——“Step Into Tomorrow”(走向明天)。

*頭圖及封面圖來源於“周鎣”。

