

作者 | ZeR0 駿達
編輯 | 漠影
備受期待的卡皇RTX 5090,終於正式釋出!
智東西拉斯維加斯1月6日報道,今日,在年度“科技風向標”國際消費電子展(CES 2025)開幕前夕,英偉達創始人兼CEO黃仁勳發表主題演講,智東西作為受邀媒體從現場發來報道。

“皮衣老黃”不愧是科技圈頂流,演講火爆程度堪比熱門明星演唱會,開場前2個半小時門外已經排起長隊。

18:42,熱場音樂戛然而止,會場霎時從人聲鼎沸轉為屏息凝神,一段開場影片後,黃仁勳穿了件閃亮的新皮衣,意氣風發地走上演講臺,與現場觀眾寒暄。

網友調侃老黃的皮衣簡直“開了光追”。
皮衣開光追是假,但新顯示卡GeForce RTX 50系列的光追是實打實的強。黃仁勳稱Blackwell融合了AI驅動的神經網路渲染和光線追蹤,是英偉達自25年前推出可程式設計著色技術以來最重要的計算機圖形創新。

新一代旗艦顯示卡RTX 5090無疑是年度重頭戲之一。RTX 5090擁有920億顆電晶體,AI算力最高達3352TOPS ,效能達到RTX 4090 D GPU的2倍(得益於架構創新和DLSS 4)。

演講期間宣佈的RTX 5090售價1999美元,RTX 5080售價999美元,RTX 5070Ti售價749美元,RTX 5070只賣549美元。
對於國內桌上型電腦使用者,擁有2375 AI TOPS的RTX 5090 D售價16499元,擁有1801 AI TOPS的RTX 5080售價8299元,將於1月30日上市。

擁有1406 AI TOPS的RTX 5070 Ti建議零售價為749美元,擁有988 AI TOPS的RTX 5070建議零售價為549美元,產品將於2月上市。5080和5070Founders Edition京東在售。
RTX 5090、RTX 5080、RTX 5070 Ti筆記型電腦將於3月上市,RTX 5070筆記型電腦將於4月由全球領先OEM發售。

作為英偉達2025年第一場重磅釋出活動,猛料當然不能只有消費級顯示卡。
光是在硬體上,黃仁勳就接連整活兒,先搬出一個由72塊Blackwell GPU組成的NVLink72巨型“盾牌”,並現場cosplay起美國隊長,引起現場觀眾的歡呼。

黃仁勳也現場揭曉了這塊“盾牌”裡的核心引數。

還曬出Blackwell全系照片。

在最後的One More Thing環節,黃仁勳釋出單手可持的全球最小AI超級計算機Project DIGITS,搭載全新GB10超級晶片,小到能塞進口袋裡,堪稱“掌上超算”。如果將兩臺相連,能跑4050億個引數的AI模型,3000美元起售。

此外,黃仁勳連珠炮般亮出一大波全新基礎模型,以及面向AI agents、物理AI、人形機器人、自動駕駛的多款新品。
作為科技圈知名“預言家”,黃仁勳對AI的前瞻性判斷,對接下來科技產業走向極具參考價值。
他判斷在感知AI、生成式AI後,AI浪潮的下一站是代理型AI(Agentic AI),再之後是物理AI(Physical AI)。黃仁勳相信,機器人的ChatGPT時刻即將到來,而世界基礎模型對於推進機器人和自動駕駛汽車的開發至關重要。

黃仁勳還現場公佈了一些人形機器人、自動駕駛汽車合作廠商。其國內人形機器人合作伙伴有星動紀元、智元、傅立葉、銀河通用、宇樹科技、小鵬”等,國內自動駕駛合作伙伴有比亞迪、理想、蔚來、小米、極氪等。

01.
RTX 50系列顯示卡來了!
首度支援FP4精度,AI效能翻倍提升
英偉達GeForce RTX 50系列是第一款支援FP4精度的消費類GPU,將FLUX等模型的AI影像生成效能提高到上一代硬體的2倍,並能在更小的視訊記憶體佔用中本地執行。
該系列GPU還內建第九代NVIDIA編碼器,用於高階影片編輯,支援4:2:2專業級色彩格式,並配備DLSS 4和32GB VRAM,以解決大規模的3D專案。

RTX 50系列採用Blackwell架構、第五代Tensor Cores、第四代RT Cores,在AI渲染領域,包括神經網路著色器、數字人技術、幾何圖形和光照等方面取得突破。
基於Blackwell架構的NVIDIA Max-Q技術最高可延長電池續航時間達40%。
DLSS 4首次推出多幀生成技術,藉助AI可為每個渲染幀生成多達3幀,從而進一步提高幀率。該技術可與全套DLSS技術協同執行,相比傳統渲染技術相比,效能提升高達8倍,同時透過NVIDIA Reflex技術保證響應速度。
DLSS 4還引入了圖形行業第一個即時應用的Transformer模型架構。基於Transformer的DLSS超解析度和光纖重建模型有2倍的引數量和4倍以上的計算量,可提高畫面穩定性,減少偽影,增加細節並增強抗鋸齒效果。
超過75款遊戲和應用程式將在RTX 50系列上支援DLSS 4。

此外,NVIDIA Reflex 2引入了Frame Warp創新技術,可在將渲染幀傳送至顯示器前,根據最新的滑鼠輸入訊號對其進行更新,從而降低遊戲延遲,相比原生渲染最高可減少75%的延遲,提高遊戲響應速度。
英偉達還推出了RTX神經網路著色器(RTX Neural Shaders),將小型AI網路融入可程式設計著色器,為即時遊戲帶來電影級的材質、光照等。
RTX Neural Faces只需使用簡單的光柵化面孔和3D面部姿態資料作為輸入,即可使用生成式AI即時渲染具有時間穩定性的逼真面孔,配備了全新的支援光線追蹤毛髮和皮膚的 RTX技術。全新RTX Mega Geometry可將場景中的光線追蹤三角形數量至多增加100倍,提升遊戲角色及環境真實感。
RTX 50系列的出色AI算力能夠在遊戲渲染的同時為自主遊戲角色提供動力。英偉達推出了一套新ACE技術,使遊戲角色能夠像人類玩家一樣感知、計劃和行動。由ACE驅動的自主角色被整合到《絕地求生》和即將推出的生活模擬遊戲《InZOI》,以及Wemade Next的《MIR5》中。
NVIDIA Broadcast應用為主播帶來兩項AI驅動功能:可升級麥克風音訊質量的音棚音效(Studio Voice),可對面部重新打光的虛擬補光 (Virtual Key Light)。
Streamlabs推出由NVIDIA ACE和Inworld驅動的智慧直播助手,擔任助播、製作和技術助手的角色以增強直播效果。
02.
RTX AI PC本地可跑基礎模型,
公開具有視覺能力的PC虛擬化身
英偉達還發布了可在RTX AI PC本地執行的基礎模型。這些模型作為NIM微服務提供,由RTX 50系列GPU加速。
適配RTX AI PC的AI基礎模型涵蓋大語言模型、視覺語言模型、影像生成模型、語音模型、檢索增強生成(RAG)的嵌入模型、PDF提取和計算機視覺模型等。
NIM微服務及PC上執行AI的所有必要元件均已針對所有英偉達GPU的部署進行了最佳化。
黃仁勳提到英偉達想將AI放到PC上,希望讓Windows PC成為世界級的AI PC,而一個方法是Windows WSL 2(Windows Subsystem for Linux 2),它有兩個作業系統,針對雲原生應用程式進行了最佳化,開箱即用。

為了展示如何使用NIM構建AI agent和助手,英偉達將釋出來自Black Forest Labs、Meta、Mistral、Stability AI等頂級開發商的一系列NIM微服務和RTX AI PC的AI Blueprint。
英偉達還推出了一款具有視覺能力的PC虛擬化身Project R2X。它能夠讓資訊觸手可及,協助使用者使用桌面應用、影片電話會議、閱讀和總結文件等。R2X將在數月內向RTX50系列和筆記型電腦使用者開放下載。
03.
全球最小AI超級計算機:搭載GB10超級晶片,能跑2000億引數模型
為了讓AI超算能擺到每個人的桌上,英偉達釋出全球最小AI超級計算機Project DIGITS,能跑2000億個引數的AI模型。

兩臺Project DIGITS可透過NVIDIA ConnectX網路連線,執行多達4050億個引數的AI模型。
這相當於是臺掌上AI超算,採用了全新的GB10 Grace Blackwell超級晶片。

GB10由英偉達和聯發科合作設計,透過NVLink-C2C互連技術將Blackwell GPU和有20個Arm能效核的Grace CPU連線,可在FP4精度下提供多達1PFLOPS的AI算力。
每臺Project DIGITS擁有128GB的高頻寬統一記憶體和高達4TB的NVMe儲存。
Project DIGITS將於5月推出,3000美元(約合人民幣2.2萬元)起售。
04.
新模型、新AI Blueprint,
支援快速建立AI agents
英偉達判斷代理型AI代表了生成式AI進化的下一波浪潮,使AI能解決複雜的多步驟問題、複雜推理和規劃。
對此,英偉達推出了Llama Nemotron系列開放許可的基礎模型,為AI agents開發提供最佳化的構建模組:
1)Nano(4B):最具成本效益的模型,針對低延遲的即時應用程式進行了最佳化,非常適合部署在PC和邊緣裝置上;
2)Super(49B):在單個GPU上提供卓越吞吐量的高精度模型;
3)Ultra(253B):精度最高的型號,專為要求最高效能的資料中心規模應用而設計。
這些模型基於Llama構建,可幫助開發人員在一系列應用程式中建立和部署AI agent,包括客戶支援、欺詐檢測、產品供應鏈和庫存管理最佳化。
Llama Nemotron模型使用英偉達最新技術和高質量資料集進行蒸餾、修剪和訓練,使模型足夠小,能在各種計算平臺上執行,同時提供高精度和增加的模型吞吐量,增強了agent能力,擅長指令遵循、聊天、函式呼叫、程式設計和數學。
除了新模型外,英偉達與合作伙伴推出了多款生成式AI Blueprint,用於降低企業級AI agents的開發門檻。

英偉達將AI Blueprint稱作“構建AI agents的起點”,目標使全球2500萬名軟體開發人員能輕鬆將AI整合到各行業的應用程式中,為超10億的知識工作者構建agents。
AI Blueprint提供NVIDIA NIM微服務、NeMo和代理型AI框架,可實現AI agents的編排、管理和可追溯性。只需點選一下,開發人員就能構建和執行新的代理型AI Blueprint。
有了AI Blueprint,開發人員可以構建和部署能做推理、規劃的自定義AI agent並採取行動,並採取行動快速分析大量資料,從影片、PDF及影像中總結和提取即時見解。
要管理、監控、協調多個AI agents一起工作,對編排系統提出很高要求。英偉達與CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases五家代理型AI編排和管理工具供應商合作構建AI Blueprint,用於軟體開發、即時語音對話、結構化報告生成、部落格建立、AI虛擬助手等。

英偉達還推出了自家的兩個AI Blueprint:
一個用於PDF轉播客,將複雜PDF檔案輕鬆轉換成好理解的、用自然聲音敘述的對話式播客。
另一個用於影片搜尋和總結,構建於Metropolis平臺上,由Cosmos Nemotron視覺語言模型、Llama Nemotron大語言模型和NeMo Retriever進行強化,提供了構建和部署可分析大量影片和影像內容的AI agents的工具。

為了幫助企業快速將AI agents投入生產,埃森哲宣佈用NVIDIA AI Enterprise構建AI Refinery,包括NVIDIA NeMo、NVIDIA NIM微服務和AI Blueprint。埃森哲計劃在今年年底前推出100多個AI Refinery行業agent解決方案。
埃森哲與英偉達合作構建了12個全新行業agents解決方案,涉及公共部門招聘、電信代理協助聯絡中心、保險理賠承保、銀行遺留現代化、消費品和服務的收入增長管理、生命科學臨床試驗夥伴、工業資產故障排除和B2B營銷等。

05.
世界基礎模型開發平臺Cosmos:
為先進物理AI而生
物理AI將改變價值50萬億美元的產業,涉及1000億的工廠、20萬的倉庫、未來數十億計的人形機器人和15億的汽車及卡車。
自動駕駛汽車的發展由三種不同的計算機實現:1)DGX系統用於在資料中心訓練基於AI的堆疊;2)在OVX系統上執行Omniverse用於模擬和合成資料生成;3)AGX車載計算機用於處理即時感測器資料以確保安全。
這三款計算機同樣被用來構建物理AI,在此基礎上,英偉達今日釋出了又一新組成部分——世界基礎模型開發平臺Cosmos。

Cosmos擁有一套開放的擴散和自迴歸模型,還有先進的影片tokenizer、護欄和加速資料處理流程,專為開發機器人和自動駕駛而設計,旨在加速先進物理AI開發。
這些模型接受了18000萬億次tokens的訓練,包括2000萬小時的真實世界自動駕駛、機器人、無人機鏡頭和合成資料。模型也有3款:
1)Nano(約15B):針對即時、低延遲推理和邊緣部署進行了最佳化;
2)Super(34B):用於高效能基線模型;
3)Ultra(約70B):以獲得最大的質量和保真度,最適合用於提取定製模型。
當與Omniverse 3D輸出配對時,擴散模型生成可控的、高質量的合成影片資料,以引導機器人和自動駕駛感知模型的訓練。自迴歸模型根據輸入幀和文字預測影片幀序列中接下來應該出現的內容,使即時預測下一個token成為可能。
開發人員可使用這些開放模型,從文字、影像、影片等輸入以及機器人感測器或運動資料的組合中生成基於物理的影片,也可以用其生成合成資料以增強訓練資料集,還可以透過微調這些世界基礎模型來構建定製模型。

其他模型包括:120億引數上取樣模型,用於精煉文字提示;70億引數影片解碼器,用於最佳化增強現實;護欄模型,確保可靠、安全地使用。
相比最先進的方法,Cosmos的tokenizers提供8倍的總壓縮和12倍的處理速度,在訓練和推理方面提供了更出色的質量和更低的計算成本。
Omniverse和Cosmos世界基礎模型相結合,使開發人員能夠更輕鬆地生成大量可控、逼真的合成數據,幫助物理AI模型做出更好的行動,還有助於減少世界模型相關的潛在幻覺。

1X、Agile Robots、Agility Robotics、Figure AI、小鵬、Foretellix、Uber、Waabi、Wayve等都採用Cosmos加速和加強模型開發。
06.
Omnvierse Blueprint:
助攻人形機器人、Vision Pro和自動駕駛模擬
此外,英偉達釋出了Isaac GR00T合成運動生成Blueprint,用於幫助開發人員從少量人類演示中生成指數級大的合成數據集,以使用模仿學習訓練人形機器人。

波士頓動力、Figure等人形機器人公司已經開始採用並展示Isaac GR00T的結果。
英偉達還發布了4個全新Omniverse Blueprint,使開發人員更容易為物理AI構建基於OpenUSD(通用場景描述)的數字孿生,包括:
1)Mega工業機器人佇列數字孿生:由Omniverse Sensor RTX API提供支援,用於在部署到現實世界的設施之前,在數字孿生中大規模開發、測試和最佳化物理AI和機器人佇列。
2)自動駕駛汽車模擬:由Omniverse Sensor RTX API提供支援,使自動駕駛汽車開發人員可以回放駕駛資料,生成新的地面真實資料並執行閉環測試,以加速其開發管道。
3)面向蘋果Vision Pro的Omniverse空間流播:幫助開發人員建立面向蘋果Vision Pro大規模工業數字孿生沉浸式流播的應用程式。
4)面向計算機輔助工程(CAE)的即時數字孿生:基於NVIDIA CUDA-X加速、物理AI和Omniverse庫構建的參考工作流,可實現即時物理視覺化。

其中Mega為企業提供包含NVIDIA加速計算、AI、Isaac和Omniverse技術的參考架構,用於開發和測試數字孿生,用於測試驅動機器人、影片分析AI agents、裝置等的AI驅動機器人大腦,以處理巨大的複雜性和規模。
Omniverse Cloud Sensor RTX API支援物理上精確的感測器模擬,以大規模生成資料集,現可供選擇的開發人員早期訪問。Mega便集成了該API,使機器人開發人員能同時渲染來自工廠中任何型別的智慧機器感測器資料,以實現高保真度的大規模感測器模擬。
汽車方面,英偉達新一代智駕晶片DRIVE AGX Thor的算力是上一代的20倍,還可以用於人形機器人。

其自動駕駛汽車平臺NVIDIA DRIVE AGX Hyperion已透過由業內兩大權威機構TÜV SÜD和TÜV Rheinland的行業安全認證。

DRIVE Hyperon是業界首個也是唯一一個端到端自動駕駛系統平臺,包括DRIVE AGX SoC和參考板設計、英偉達DriveOS汽車作業系統、感測器套件以及主動安全和L2+軟體棧。
NVIDIA DRIVE AI系統檢測實驗室獲得了美國國家認證委員會的認證,可以為自動駕駛汽車進行功能安全、網路安全和AI方面的檢查。
作為全球最大汽車製造商,豐田將在下一代汽車中採用DRIVE AGX Orin SoC並執行安全認證的DriveOS作業系統。
Aurora、大陸和英偉達本週還宣佈了一項長期戰略合作伙伴關係,以大規模部署由英偉達DRIVE驅動的無人駕駛卡車。
英偉達預計其汽車垂直業務將在2026財年增長到約50億美元。
07.
結語:將“AI信仰”進行到底
每年的CES都起到科技風向標的作用,而英偉達近兩年堪稱是AI計算產業的北極星。在此次主題演講中,英偉達除了向消費者交出被期待已久的旗艦顯示卡外,也相當闊氣地繼續大秀AI組合拳——從GPU、AI PC、AI超算到雲端,從生成式AI、AI agents、物理AI、機器人到自動駕駛。

按照英偉達的劃分,計算正規化已從手搓程式碼+“檢索+CPU+軟體1.0”時代的轉變向由機器學習主導的“生成+GPU+軟體2.0”時代。RTX AI PC已經讓訪問部署最新生成式AI模型變得越來越隨手可得。接下來企業級AI agents將成為AI工廠的核心,透過生成tokens,在各行各業創造前所未有的智慧和生產力。
再往後,物理AI將成為下一波AI浪潮,將所有移動的東西都由AI實現機器人化,機器將依靠物理AI世界基礎模型來理解現實世界並與之互動,而汽車將成為最大的AI和機器人產業之一。

(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)
