深度揭秘RTX5090八大看點:遊戲“兵器庫”逆天,將AI煉丹術塞到桌面

RTX 50系列即將開售,刀法如何?
作者 |  ZeR0
編輯 |  漠影
今年一開年,NVIDIA GeForce RTX 50系列GPU終於猛獸出籠,能玩頂配遊戲,能做AI開發。趕上春節期間上市,估計會成為不少消費者的硬核新年禮物。
國內外有區別的是旗艦卡RTX 5090,RTX 5090起售價1999美元,中國合規版RTX 5090 D起售價16499元。其他非旗艦產品的價格則至少減半。
關注新顯示卡的朋友們可能還有很多疑問,比如RTX 5090和RTX 5090D有什麼區別?除去AI外,其他設計的變化和效能提升有多少?AI和顯示卡的深度融合到底是噱頭還是真有用?
在CES 2025期間,芯東西受邀參加了NVIDIA閉門編輯日,聽多位NVIDIA副總裁連講一整天的大師課,涉及很多GPU效能提升、基準測試和技術原理的細節。在此將一些乾貨整理分享給大家。
先說結論,如果你不關注AI,只想看傳統顯示卡效能提升,可能50系列顯示卡會讓你略感失望,因為從架構來看,RTX Blackwell和上一代Ada架構相差不大,硬實力升級幅度比較收斂,但是圍繞AI的軟實力提升可以稱得上十分驚豔。
這也是NVIDIA迄今最大膽的一次將AI和遊戲顯示卡高度融合,並讓AI成為提升效能的頭號主角。
RTX 5090的TDP是575W,比上一代高125W。這麼高的功耗,怎麼快速冷卻呢?以前的設計是空氣進來後撞到PCB板拐彎,從一個較小的排氣口排出,風扇轉得越快噪聲越大。NVIDIA則把原來的PCB拿掉,中間做了個更小更緊湊的PCB板,讓氣流可以從兩邊風扇的散熱鰭片直接順滑透過,效率更高,還大降噪音。
我們將從以下8個方面,詳細解析RTX 50系列消費級GPU的特點:
1、RTX 50系列的基礎規格與基準測試表現;
2、Blackwell架構的設計目標、主要變化;
3、DLSS 4多幀生成的效果及用途;
4、多幀生成的技術原理與難點;
5、圖形業首個即時Transformer模型應用;
6、首次將AI引入可程式設計著色器;
7、給遊戲世界構建AI隊友、AI助手、AI敵人;
8、AI PC本地部署生成式AI模型,最佳化直播和3D創意工作。
注:本文資訊量偏大,讀者朋友可直接跳至感興趣的章節閱讀。
01.
遊戲+AI效能猛獸出籠:
全系視訊記憶體換新,暢玩超250幀4K遊戲
RTX 5090仍然採用臺積電NVIDIA 4N定製工藝,面積變得更大。上一代4090的GPU芯片面積是608mm²,RTX 5090系列的面積則增加到744mm²。
RTX 5090擁有920億個電晶體、21760個CUDA核心(比上一代多50%),AI峰值算力是3352TOPS。RTX 5090 D硬體配置是一樣的,AI算力受合規限制到2375TOPS,也就是比5080高了約32%。
▲RTX 50系列顯示卡規格
目前公開的RTX 50系列GPU,視訊記憶體都升級到GDDR7,位寬、容量做了分級:5090是512bit、32GB,5080和5070 Ti是256bit、16GB,5070是192bit、12GB。
GeForce RTX 50系列筆記型電腦GPU規格也同步更新,相比上一代,能效更高、能跑2倍大的AI模型、影片編輯速度快40%,電池壽命延長40%。
▲RTX 50系列筆記型電腦GPU規格
令人印象深刻的依然是AI技術,效能最多暴漲至8倍。
尤其是DLSS 4,在跑《黑神話:悟空》、《賽博朋克 2077》等硬體密集型光線追蹤遊戲時,4K解析度下幀率超過200FPS,而且顯著減少延遲。
RTX 5090 / 5090 D無疑是效能猛獸,開DLSS 4和全景光追時升級幅度非常可觀。NVIDIA官方公佈的遊戲及渲染測試顯示,4K解析度、最高遊戲設定的情況下,在開DLSS 4時,RTX 5090 / 5090 D / 5080基本上都表現出至少翻倍的效能提升。
RTX 5070 Ti / 5070也藉助DLSS 4實現了超過翻倍的效能提升,在採用 2560×1440 解析度、最高遊戲設定的情況下,能以高幀率暢玩《心靈殺手2》、《黑神話:悟空》、《賽博朋克2077》等遊戲。
不過在沒開DLSS的情況下,例如《生化危機4》,RTX 50系列相比上一代的提升幅度更小一些,約提升15%~30%。
這些基準測試效能對比已經在官網公佈。
RTX 5070的硬體規格雖然難與旗艦卡相提並論,但透過DLSS 4等AI軟實力的提升,NVIDIA稱其效能表現已經堪比前代旗艦卡4090。
02.
Blackwell架構:
支援神經網路渲染,FP4精度AI算力暴漲
RTX 50系列GPU採用Blackwell架構。NVIDIA稱Blackwell融合了AI驅動的神經網路渲染和光線追蹤,是自25年前推出可程式設計著色以來最重要的計算機圖形創新。
RTX Blackwell架構的設計目標包括最佳化新神經網路工作負載、減少視訊記憶體佔用、提高能效等。
上一代Ada架構的SM多單元流處理器裡,Shader Core有一半僅支援FP32,一半可以同時支援FP32/INT32。Blackwell SM則變成所有Shader Core都支援FP32/INT32,並首次支援神經網路著色器,可提供125TFLOPS算力;承載AI計算的Tensor Core由第四代升級到第五代。
下圖中間灰框是著色器執行重排序(SER),用於最佳化GPU光線追蹤和圖形渲染。它會遍歷並重新排序工作,把相同工作分別放在一起,提高執行效率,將整體重排序效能翻倍。
負責光線追蹤計算的Blackwell第四代RT Core,能夠更好支援NVIDIA RTX Mega Geometry技術。該技術可將場景中的光線追蹤三角形數量增加多達100倍,能夠更有效地處理超大幾何圖形簇。
RT Core增加了對線性掃描球體(Linear-swept spheres)、三角形簇交匯引擎(Triangle Cluster Intersection Engine)、三角形簇解壓縮(Triangle Cluster Decompression)的支援,可支援的幾何複雜度增加很多。
Blackwell也更擅長加速3D渲染,可將採用生成式AI的3D工作流的效能,較上一代提升50%。相比上一代,由第四代RT Core驅動的3D渲染,效能提升約40%。使用D5 Render時,RTX 5090的效能更是達到上一代的2.3倍。這對3D內容創作大有裨益。
得益於神經網路渲染架構,Blackwell的每幀AI TOPS相比上一代最多提升達8倍。
針對AI運算,第五代Tensor Core首度增加對FP4精度的支援,AI推理效能是上一代Ada FP8的2倍,並使生成式AI模型能夠在PC本地執行,佔用的視訊記憶體更小。現在RTX 50系列GPU已經能支援本地執行影片生成模型了。
舉個例子,同樣是跑Black forest labs影像生成模型FLUX.1,用RTX 4090在FP16精度下要花15秒、佔用超過23GB的視訊記憶體,而用RTX 5090在FP4精度下只花5秒、佔用10GB視訊記憶體。
Blackwell還添加了一個可程式設計的AI管理處理器,可以實現對AI和圖形工作負載同時執行的智慧排程分配。比如在玩遊戲時,它能優先保證AI隊友第一時間作出響應。
Blackwell顯示引擎和編解碼器同樣更新迭代。顯示引擎首度支援DP 2.1,能執行更高的重新整理率;還新增了對硬體級Flip Metering的支援,用於最佳化多幀生成中的幀節奏邏輯。
升級的還有影片編解碼,現支援4:2:2格式的硬體編解碼,能夠更好地服務於專業級影片編輯。第9代影片編碼器可在DaVinci Resolve、Adobe Premiere Pro等應用中實現快速影片匯出,並使用AI驅動特效。
03.
DLSS 4多幀生成:
幀率暴漲至8倍,佔用更少視訊記憶體
近年來DLSS(深度學習超級取樣)已經成為RTX系列GPU升級的重頭戲,用於提高幀率,同時提供媲美原始解析度渲染的清晰高質量影像。
RTX 50系列裡最搶眼的技術當屬最新引入的DLSS 4,首次推出多幀生成功能。
▲支援DLSS技術的硬體
多幀生成可以為每個渲染幀額外生成最多3幀。整套DLSS技術全開,可將運行遊戲或應用的幀率提高到傳統影像渲染時的8倍、單幀生成時的1.7倍。
僅用超解析度或光線重建,4個畫素中有3個是AI生成的;新增單幀生成時,8個畫素中有7個是由AI生成的;最後透過DLSS 4多幀生成,16個畫素中就有15個由AI生成。
可以看幾張對比圖,來直觀感受下開DLSS 4對畫面細節的最佳化效果有多明顯。
鏡中重影得到最佳化:
紋理更精細:
髮絲、光影的質量也顯著提升:
開了DLSS 4後,RTX 5090顯示卡可以駕馭4K 240 FPS全景光線追蹤遊戲。
比如玩《賽博朋克2077》,與傳統渲染相比,RTX 5090的幀率提高近8倍,PC延遲減少一半,影像質量也得到增強。
NVIDIA還針對RTX 40和50系列GPU強化了幀生成模型。新CNN模型速度提高了40%,視訊記憶體佔用量減少了30%。例如在《戰錘40000:暗潮》中,使用DLSS幀生成,在4K、最高設定下提供了10%更快的幀率,同時減少了400MB的視訊記憶體使用量。
同時,DLSS光線重建、DLSS超解析度和DLAA也轉由Transformer模型驅動, 它將進一步提升RTX20、30、40、50系卡的DLSS 效能體驗。
在1月30日產品上市時,將有超過75款遊戲和應用支援DLSS 4。《黑神話:悟空》也將在新卡發售當天支援DLSS 4,並在未來提供對DLSS 4的原生支援
除了遊戲外,DLSS 4還將用於虛幻引擎5、D5 Render、Chaos Vantage等創作應用,顯著增強即時檢視的埠體驗,提高D5 Render中的幀速率,使得設計師能更好地迭代和協作工作。
04.
多幀生成的技術難點:
控制成本、幀節奏、延遲
RTX 50系列能用上多幀生成,得益於Blackwell硬體和DLSS軟體創新的相輔相成。
DLSS 3幀生成功能在2022年釋出,用AI模型來預測序列中的下一幀。該幀生成AI模型使用遊戲裡的運動向量、深度等資料和RTX 40系列光流加速器的光流場,在每對傳統渲染的幀之間建立一個額外幀。
而要實現多幀生成,成本就變得很高。因為每個新生成的幀都需要光流加速器和AI模型,效能成本會限制GPU,導致輸入幀率降低。
多幀生成難在需要一致且精確的幀節奏。DLSS 3幀生成使用基於CPU的幀節奏,由於不同遊戲引擎在CPU和GPU之間劃分工作負載的方式不同,其可變性可能會隨著其他幀而增加,導致每幀之間的幀間隔是變化的,會造成卡頓。
對此,NVIDIA研究團隊開發了一個全新AI模型,搭配Blackwell的硬體級Flip Metering,確保GPU提供一致且最佳的幀率。高效的AI模型取代了硬體光流加速器,來加快光流場生成速度,能顯著降低生成額外幀的計算成本。
Flip Metering可以調整幀傳送速度,使GPU在生成和渲染幀時能更高效地進行時序管理,實現更穩定的幀生成,避免嚴重卡頓。
如果一款遊戲執行所有DLSS 4功能,包括超解析度、光線重建、多幀生成,GPU需要在幾毫秒內為每個渲染幀執行5個AI模型,否則DLSS多幀生成可能會成為減速器。
這就需要配備更強的硬體。基於Blackwell第五代Tensor Core,RTX 50系列的AI處理效能最高達到上一代GPU的2.5倍。新幀生成後,其節奏均勻,從而能提供流暢的體驗。
針對AI補幀會增加延遲的問題,NVIDIA的解法是引入Reflex 2來最佳化影像渲染管線,最多能將延遲減少75%。Reflex低延遲模式透過在GPU與CPU之間進行精確渲染同步來降低PC延遲。Reflex 2引入了一種新技術Frame Warp,可以在將渲染幀傳送到顯示器之前,根據最新滑鼠輸入資料來更新渲染幀,以提高遊戲響應速度。
NVIDIA還開發了一個Inpaint預測修補技術,用於修復前一幀的顏色與深度資料的空白區域,讓畫面更加接近原生渲染。
05.
DLSS 4全面引入Transformer:
增強畫質,提升穩定性,減少重影
DLSS 4的光線重建、超解析度、深度學習抗鋸齒(DLAA),都採用了由NVIDIA超級計算機訓練的全新Transformer模型。
DLSS 4是Transformer模型首次以高即時幀率生成連續影像,由Blackwell Tensor Core提供額外硬體加速。新模型使用多達2倍以上的引數、4倍的Tensor Core計算能力,能夠更深入地理解場景、更好地渲染遊戲場景中複雜部分,提高幀到幀之間的穩定性,減少重影,增加光照細節和運動細節。
以前DLSS使用卷積神經網路(CNN),透過將少量相鄰畫素區域性聚合並跟蹤連續幀中的區域變化來生成新畫素。但經過六年改進,這種方法已經逐漸到達極限。
Transformer是當前主流大模型所採用的架構。新DLSS Transformer模型採用ViT(視覺Transformer),可實現自注意力操作來跟蹤評估整個幀和多幀中每個畫素的相對重要性。與CNN相比,Transformer可以用更大的資料集訓練,更具通用性和可擴充套件性,能在更大的畫素視窗內輕鬆識別更長距離的模式,而且更多關注到有問題的細微區域。
光線重建改用Transformer模型,可大幅提升影像質量。例如《心靈殺手2》遊戲場景中,相比CNN,Transformer模型改善了高度精細的鐵絲網圍欄的穩定性,減少了風扇葉片上的重影,並消除了電線周圍的閃爍。
超解析度的Transformer模型效果也很好,顯示更穩定,影像細節也更豐富,將先以測試版的形式釋出。
具有光線重建、超解析度、DLAA的DLSS遊戲都可以升級到新的DLSS Transformer模型。
對於尚未更新到最新DLSS的遊戲,NVIDIA app Driver設定選單中增加了DLSS優設(DLSS Override)選項,可在Frame Generation下拉選單中設定所需的輸出模式。
06.
將AI引入著色器,
秀材質、皮膚、毛髮渲染黑科技
自2001年GeForce 3引入第一個可程式設計著色器起,NVIDIA 20多年來持續點亮圖形創新,推出高階著色語言、幾何著色器、計算著色器、Low-level程式設計,以及2018年釋出的光線追蹤。
到RTX 50系列GPU,Blackwell開發人員首次將小型AI網路引入可程式設計著色器,在即時遊戲中解鎖電影級材質、光照等。NVIDIA將它命名為RTX神經網路著色器,稱其重塑了著色器的程式設計方式,可用於將紋理壓縮多達7倍。
DirectX將很快支援一個由NVIDIA和微軟合作建立的新API,Cooperative Vectors。它可以真正利用到Tensor Core的能力,更充分加速Windows上的神經網路著色器。相信神經網路技術將很快取代傳統圖形管線的一部分。
神經網路材質就是一個例子。傳統材質採用帶有即時圖形的著色程式設計,光線與材質互動的計算量和資料儲存量浩大,如果是電影級渲染,可能要用成百上千行程式碼。而RTX Neural Materials透過引入一個只有幾層的小型AI神經網路,能大幅減少著色器程式設計程式碼量和資料。在Zorah遊戲演示中,用傳統材質要佔用47MB視訊記憶體,用RTX Neural Material則可將視訊記憶體佔用量壓縮至16MB,視覺效果還更逼真。
RTX Neural Radiance Cache是一個更準確地追蹤間接光線的方法。與許多隻用推理的神經網路技術不同,該技術有一個即時自訓練網路,接受了特定遊戲資料訓練,學習了任何給定陣列所應達到的間接光照情況,能透過追蹤每畫素一次光線彈射推斷出更多的彈射。
還有RTX Skin,針對半透明材料,NVIDIA借鑑了迪士尼的電影渲染技術,將次表面散射演算法首次引入即時光線追蹤。
RTX Neural Faces採用簡單的光柵化面部和3D姿勢資料作為輸入,並使用生成式AI即時推理,渲染出穩定、高質量的數字面孔。NVIDIA在不同的光照條件下,用不同的情緒和動畫、不同的遮擋(比如部分臉被遮蓋),在每一個可能的姿勢下做渲染,然後在超級計算機上建立一個模型,用於構建特色角色的照片級逼真影像,再在遊戲系統上進行部署。
渲染毛髮也很有挑戰性。光線追蹤的毛髮渲染成本高昂。傳統毛髮渲染技術無法兼顧效能和影像質量,需要用很多三角形來保證精度。在NVIDIA展示的例子中,一個角色的毛髮渲染要用到600萬個三角形。
全新RTX Hair技術改用Linear-swept spheres單元,能夠讓角色頭髮看起來更逼真細緻、陰影更準確。相比多邊形,球體能更好地貼近真正的毛髮。這種渲染方式執行速度更快,影像質量更高,同時大幅減少視訊記憶體佔用。
RTX Mega Geometry是一項突破性技術,可以智慧地聚集和更新複雜幾何體,以進行即時光線追蹤計算,能夠減少CPU開銷,提高幀率,並減少大量光線追蹤場景中的視訊記憶體消耗。
近30年來遊戲裡的幾何體數量一路飆漲,Zorah遊戲場景有超過5億個三角形,啟用RTX Mega Geometry技術後能在RTX 50系列GPU上流暢執行。
《奪寶奇兵:古老之圈》未來的更新將引入全新NVIDIA RTX Hair技術。《心靈殺手 2》將率先採用RTX Mega Geometry技術。
07.
自主AI agent湧入遊戲:
AI隊友、AI助手、AI Boss
一個充滿生命感的遊戲世界,會是什麼樣子?
可能是一個充滿自主AI的模擬空間,你的隊友、系統、敵人等角色都由自主AI agent驅動。
而讓AI去複製人類決策,是一個困難的感知認知行動,它要像人一樣具備感知、認知、記憶、規劃與行動的能力。
NVIDIA ACE便旨在為自主遊戲角色提供支援。使用該技術,開發者可以建立在本地裝置上執行的自主AI隊友,協助玩家暢玩遊戲。
感知方面,ACE有音訊理解模型Nemoaudio-4B-Instruct、視覺理解模型Cosmos Nemotron-4B-Instruct-v2。比如玩槍戰遊戲,它能理解槍聲的狀態與位置,據此來制定計劃;在複雜遊戲場景中,視覺理解模型能夠掌握很多關於遊戲中發生事情的資訊。
認知方面,ACE提供了Mistral NeMo Minitron instruct模型系列,有不同引數版本,規劃模型能輸出agent將要執行計劃的純文字,基於這個計劃,行動選擇模型將產生一些行動;音訊生成模型Riva A2 Flow TTS是一個文字轉語音模型,可輸出自然、有感情的音訊。
在呈現更好的動畫效果上,ACE提供由音訊驅動的全新AI面部模型新一代Audio2Face,能讓遊戲角色說話時的表情和口型更貼合;還有由文字驅動的身體運動ACE AI Body Motion,只需輸入文字,就能從大量動作捕捉資料中生成動畫序列,可以幫動畫師節省時間。還可以用前文提過的RTX Neural Faces、RTX Skin、RTX Hair等套件,來渲染出栩栩如生的數字人。
動作遊戲《動物朋克》的demo中便使用ACE來實現遊戲中的語音理解,使角色互動更自然細膩,從而增強遊戲的代入感。玩家可以用語音或文字,要求AI更改遊戲中的裝備塗裝,比如更換飛船的顏色或logo中的動物形象。
ACE驅動的自主角色正在整合到戰術競技遊戲《絕地求生》、人生模擬遊戲InZOI、多人線上角色扮演遊戲《傳奇5》中。
在《絕地求生》中,由ACE提供支援的AI隊友可以跟玩家討論戰略、提供遊戲建議或者閒聊,也能計劃和執行戰略行動,與人類玩家動態合作以確保生存。
InZOI中由ACE支援的CPC角色Smart Zoi,可以根據生活目標和遊戲內的事件自主調整行為,能做出規劃、制定決策、提供反饋。它支援透過自然語言來定製性格、關係、記憶。每一天結束時,Smart Zoi會分析獲得的經驗,由此影響它第二天的行為,從而塑造出一個真正獨特且個性化的性格。
《傳奇5》則設定了一個AI Boss。以往基於固定指令碼的Boss會遵循可預測的模式來行動,比較乏味。而由大語言模型驅動的突襲Boss能夠分析玩家資訊,識別每個玩家的獨特技能,從而調整戰術。這樣一來,玩家在每次遊戲會話中都能遇到獨特的Boss,它的攻擊策略變得更不可預測,也更具挑戰性。
考慮到遊戲玩家很難找到一個適合自己系統和喜好的最佳配置,NVIDIA釋出了一個AI助手Project G-Assist。該AI助手透過NVIDIA app提供,可以幫助提高RTX PC系統的效能。
Project G-Assist支援使用者用語音或文字命令來控制系統,可以最佳化幀率、延遲、能效等,支援利用AI來診斷和監控效能,還能透過外掛呼叫不同系統,定製周邊照明、管理風扇噪音。
NVIDIA建立了一個外掛框架,使得外設製造商可以構建和測試自己的外掛和輔助工具、連線流行的AI工具。
08.
RTX AI PC:輕鬆部署生成式AI模型,
用AI增強影片體驗和3D創作
除了暢玩遊戲外,RTX 50系列GPU還有一個重要功能——加速AI模型訓練和推理。
GeForce做AI開發最早可以追溯到2012年,開啟深度學習革命的AlexNet模型就是用GeForce GTX 580訓練的。根據NVIDIA披露的資料,在去年發表的AI研究論文中,超過30%都提及對GeForce RTX的使用。
全新Blackwell架構首度支援FP4精度,AI推理效能翻倍。其使用案例涵蓋大語言模型、視覺語言模型、影像生成、語音、用於檢索增強生成的嵌入模型、PDF提取、計算機視覺等。
你可以用ChatRTX定製專屬AI聊天機器人,透過文字或語音搜尋個人筆記、檔案及照片;用Broadcast應用做AI降噪和背景替換,提升視訊會議通話、語音聊天和直播的體驗;用RTX Video透過AI超解析度和影片HDR技術,將網際網路影片升級為超清4K HDR影片。
Broadcast應用為直播者提供了2項由AI提供支援的測試版功能:1)Studio Voice,用於去除噪音和混響,升級麥克風音訊;2)Virtual Key Light,透過AI補光改善主播的面部光影,從而提升與玩家的互動氛圍。
Streamlabs正在推出由NVIDIA ACE和Inworld AI框架提供支援的智慧流媒體助手。它可以充當聯合主持人、製作人和技術助理來輔助直播,比如做些點評、和觀眾互動或者提供排除故障的建議。這個AI助手將在今年下半年釋出。
包括NVIDIA Studio專屬AI工具套件在內,有超過100款由AI賦能並由RTX加速的創意應用可輔助內容創作,比如加速影像生成、增強影片編輯、助力3D設計等。
利用NVIDIA NIM微服務和AI藍圖,你還可以在RTX AI PC上本地執行最新的生成式AI模型。
NIM微服務針對RTX GPU最佳化,包括在PC上執行AI所需的各種元件,包含為RTX最佳化的基礎模型、領域特定程式碼、推理後端(TensorRT、TensorRT-LLM)、支援定製化的工具、行業標準API、預構建容器。
可以把這些微服務想象成堆積木,易組裝和使用。NIM微服務可從ChatRTX、AnythingLLM、ComfyUI、LM Studio等常用開發者工具中體驗前沿AI,讓做AI開發變容易。
第一波RTX NIM微服務將在2月份上線。
NIM微服務針對Windows PC整合AI模型做了最佳化。適用於Linux的Windows子系統為Windows 11上的AI開發以及Windows Copilot Runtime提供了跨平臺環境。
將NIM微服務與AI藍圖(AI Blueprint)結合,可以快速設定、定製和部署AI驅動的工作流。
AI藍圖基於NIM微服務構建,向開發者提供瞭如何使用微服務來構建AI體驗的預配置參考,比如基於PDF建立播客、構建數字人、生成由3D場景引導的影像等應用。
NVIDIA展示了一款具有視覺能力的PC虛擬形象Project R2X,它可以協助桌面應用和影片電話會議、閱讀和總結文件等。R2X可以透過常用開發者框架連線到GPT-4o、Grok等雲端AI服務以及NVIDIA NIM微服務和AI藍圖。該虛擬形象採用RTX Neural Faces渲染,用完全生成的畫素來增強傳統光柵化渲染,然後用Audio2Face模型來最佳化面部表情和對口型。
還有一個由3D引導的生成式AI藍圖,可實現對影像生成更精細的控制。創作者可以用Blender等3D渲染器中佈置的簡單3D物體來引導AI影像生成:手動或用AI生成建立3D資產,將其放到場景中,設定3D檢視相機,由FLUX NIM微服務驅動的預打包工作流將可以透過外掛使用當前佈景來生成與3D場景相匹配的高質量影像。
NVIDIA也提供了在RTX上開始使用NIM和AI藍圖的建議:先在網頁端體驗NIM,然後在RTX一鍵下載安裝和執行NIM;有一個管理AI開發專案的工具AI Workbench,便於共享專案和協同管理;你還可以嘗試整合agent、構建數字人並連線到UI。
消費級GPU RTX 50系列、4090、4080以及臺式工作站GPU RTX 6000、5000都將從2月起首發支援NIM微服務和AI藍圖。來自Black Forest Labs、Meta、Stability AI、Mistral等頂級模型開發商的NIM微服務和RTX AI PC AI藍圖流程即將釋出。
GeForce RTX 50系列筆記型電腦將於今年3月開始釋出。針對能效改進,AI驅動型技術Max-Q可從GPU、CPU、視訊記憶體、散熱、軟體、螢幕等方面最佳化筆記型電腦。全新Blackwell Max-Q技術包括DLSS 4、GDDR7電壓最佳化、加速頻率切換、低延遲休眠、高階電源門控等,有助於提升能效和效能、延長電池續航時間。
09.
結語:AI與遊戲的融合更加極致
正如前文所述,這次RTX 50系列將升級重點和賣點放在了AI軟實力上,把AI和遊戲的融合玩得更加極致,不僅能駕馭高畫質遊戲,在專業3D內容創作和渲染能力上也更具吸引力。
想必不少骨灰級遊戲發燒友、專業3D製作渲染人員已經搓手準備好將RTX 5090 D放進購物車了。
隨著摩爾定律逐漸走到頭,硬體提升也會受到一定束縛。而NVIDIA工程師的思路非常靈活,透過新硬體和AI驅動的神經網路渲染的結合顯著提高GPU效能。DLSS 等神經網路渲染技術提高了圖形效能,同時也提高了遊戲的影像質量。隨著神經網路著色器的推出,Blackwell為遊戲渲染的未來開啟了大門。
正如黃仁勳在主題演講強調的,GeForce顯示卡系列和AI相輔相成的關係,過去 GeForce助力了AI的發展,現在AI又反過來加速革新GeForce。
至於顯示卡實際效能、用AI補幀對遊戲體驗的真實影響,請關注將在不久後釋出的評測。
這次RTX 50系列GPU的主要升級,你怎麼看?


相關文章