

英偉達不久前宣佈了有關 GeForce RTX 5090、GeForce RTX 5080、GeForce RTX 5070 Ti 和 GeForce RTX 5070 等 GPU 的一些新細節,這些細節與技術和功能相關。某些資訊是全新的,某些資訊是對已知內容的補充,本文帶來了新的基準測試。
英偉達之前提供的基準效能測試對比的是 GeForce RTX 5000 系列的三個型號與它們的 4000 系列基本型號,現在又加入了 4000 系列 Super 型號的對比。之前的 4070 和 4070 Ti 的 Super 型號在效能方面有所提升,後者的視訊記憶體規格也增強了。
此外,官方的 RTX 5000 與 RTX 4000 的價格對比現在也加入了與 Super 型號的對比,英偉達已經透過這些版本大幅降低了之前備受批評的 RTX 4080 的定價。雖然 RTX 5080 的起價將比 RTX 4080 便宜很多,但與 RTX 4080 Super 相比就不一樣了。
對於遊戲玩家來說,Blackwell 一代最重要的兩個新特性一個是 DLSS 4,它具有新的神經網路能力,包括 Transformer 模型和 DLSS 多幀生成(MFG),可提高影像質量和效能;另一個是 Reflex 2,旨在透過一種新方法控制延遲。除了 DLSS 4 多幀生成(現在它透過 AI 來生成三個中間幀,上一代是一個)之外,所有新的 DLSS 4 和 Reflex 2 特性和增強功能都將立即或在可預見的未來被舊款 GeForce RTX 顯示卡支援。
本文中展示的新資訊指的是 DLSS 4 和 Reflex 2 以外的特性。詳情如下。
藉助 Blackwell,英偉達希望將更多 AI 特性帶入不支援 DLSS 的遊戲。 因此,所有 GeForce RTX 5000 顯示卡都支援“神經著色器”,它們是普通著色器程式碼中的 AI 程式,以前沒有。如果沒有特殊的附加 API,以前是不可能在遊戲中使用神經網路的。
神經著色器現在應該會改變這種情況。著色器程式的 AI 程式碼是在 Tensor 核心上計算的,實際渲染仍由普通的 FP32 ALU 執行。
新的神經著色器也將進入 DirectX,因此可能被所有顯示卡製造商使用。微軟稱該特性為“協作向量”,應該很快就會出現在 Windows 中。


英偉達還首次介紹了神經著色器的能力。這被稱為“RTX 神經材質”,旨在透過開發人員預訓練的材質實現電影級的物體表面畫質,同時降低記憶體消耗。“RTX 神經輻射快取”旨在使用即時自學習神經網路,透過路徑跟蹤提供間接照明,每個畫素反彈一次光線。
所有型別的元素表示也可以透過神經著色器得到改進。英偉達將皮膚表示稱為“RTX 皮膚”,將面部表示稱為“RTX 神經面部”。面部照明和表現的情緒都要在超級計算機上預訓練,然後使用顯示卡上的神經網路為遊戲場景實現和渲染。
下一個是“RTX 頭髮”,頭髮表示可以用更美觀、更節省資源的方式實現。與傳統的光線追蹤渲染方法相比,RTX 頭髮只需要三分之一的資料需求,這可以節省視訊記憶體,同時提高效能。





左右滑動檢視更多
英偉達沒有透露關於新一代 GPU 架構的新資訊,這可能是因為與 Ada Lovelace 相比,新架構沒有太大變化。
也就是說,Blackwell 的總體結構似乎與 Ada Lovelace 沒什麼差別,改進主要是規模方面的擴充套件,有了更多計算單元。隨著流式多處理器的發展,英偉達在過去幾代架構中已經改變了一些東西。


例如,Turing 架構的流式多處理器(SM)可以每時鐘執行 64 次浮點和 64 次整數計算,而 Ampere 和 Ada Lovelace 則分別是 128 次浮點或 64 次浮點和 64 次整數計算。在 Blackwell 上,英偉達將 Turing 和 Ampere 的架構結合在一起,新的 SM 可以執行 128 次浮點或 128 次整數計算,於是整數方面也得到了相應的改進。同樣,新 SM 也可以同時執行混合的浮點和整數運算,儘管目前尚不清楚是否只有固定的 64/64 比率,或者是否可以動態配置。
這正是英偉達想要做的事情,因為它更適合神經著色器程式的要求。
Blackwell 配備了第四代光線追蹤單元,與 Ada Lovelace 相比,交叉率翻了一番。這意味著新單元能夠以之前兩倍的速度檢查光束是否擊中了多邊形。自 Turing 以來,英偉達的每一代新 RT 核心都將交叉率翻一番。
Ada Lovelace 引入的著色器執行重排序(SER)功能現在在 Blackwell 上的速度翻番了。除了經典的著色器程式外,Blackwell 還應該能夠對神經著色器進行排序並在張量核心上做計算準備。SER 必須得到遊戲的明確支援,並且主要提高的是完整光線追蹤遊戲的效能。



左右滑動檢視更多
此外,Blackwell 上的光線追蹤所需的視訊記憶體應該比 Ada Lovelace 少 25%。
Tensor 核心在 Blackwell 中升級到了第五代,雖然它們在相同精度下的資料吞吐量不如 Ada Lovelace,但可以處理新的資料格式。RTX 4000 只能處理到 FP8,RTX 5000 現在也支援了 FP4。因此,如果矩陣計算以 FP4 精度執行,Blackwell 可以執行的運算元是 Ada Lovelace 的兩倍。
Blackwell 還配備了一個新的“AI 管理處理器”,旨在改善渲染 ALU、RT 單元和 Tensor 核心同時工作時的協作操作。例如,由於 AI 管理處理器可以對單元進行優先順序排序,幀生成的幀節奏應該比之前沒有這個管理處理器時更好了。



左右滑動檢視更多
所有 GeForce RTX 5000 顯示卡都配備了新的顯示引擎,支援資料速率為 UHBR20 的 DisplayPort 2.1,傳輸頻寬 80 Gbps。對於 HDMI,它依舊支援 2.1 標準。
Blackwell 的顯示引擎還支援所謂的“翻轉測光”,這在 DLSS 多幀生成中很重要。使用翻轉測光時,不再是 CPU 決定影像輸出的節奏,而是顯示卡的顯示引擎來決定,這意味著使用 DLSS MFG 應該可以實現良好的幀節奏。

Blackwell 配備了第九代編碼器和第六代解碼器單元,可以加速 AV1 編解碼器的新的超高質量預設,MV-HEVC(多視角高效影片編碼)也是如此,後者用於 VR 頭顯上的 3D 內容播放。RTX 5000 的新增功能是加速色彩取樣為 4:2:2 的影片,而 Ada Lovelace 只能處理 4:2:0。
英偉達不僅希望提高編碼和解碼器的質量,還希望透過增加單元數量來進一步提高效能。GeForce RTX 4000 顯示卡首次配備了 2 個 NVENC 單元用於編碼,而部分 RTX 5000 GPU 配備了 3 個 NVENC 單元。藉助新的 GPU 架構(BD-BR PSNR),影像質量提高了 10%,而且藉助額外的第三個 NVENC 單元,GeForce RTX 5090 可以在 10 分鐘內編碼一段影片,而 GeForce RTX 4090 則需要 16 分鐘。此外,部分 RTX 5000 顯示卡首次配備 2 個解碼器單元,而 GeForce RTX 4000 一代都只有一個解碼器。


英偉達還展示了新的遊戲基準測試,對比了 GeForce RTX 5090 與 GeForce RTX 4090。在大多數測試中,英偉達依舊用的是 RTX 5000 上的 DLSS 4 與多幀生成(三個中間幀)設定,對比 RTX 4000 上的 DLSS 4 與幀生成(一箇中間幀)設定,這些遊戲包括了《生化危機 4》(光線追蹤,但沒有 DLSS)和《地平線:西部禁域》(沒有光線追蹤,DLSS 超級解析度,沒有 DLSS (M)FG),但有兩個新結果有相同的設定。






左右滑動檢視更多
《生化危機 4》和《地平線:西部禁域》的兩個基準測試可以推斷出以下改進:

RTX 5070 的效能顯然比其他幾款型號的表現更好,它的實際效能增幅比著色器規模增幅更大。視訊記憶體頻寬應該沒變,但 TDP 卻顯著增加。不過目前還不能說新一代架構的效能整體上有了大幅提升。
英偉達目前只將新一代 GPU 與 GeForce RTX-40 系列的原始版本做了對比。在此基礎上,看起來 5080 的提升是最小的。但如果對比的是上一代的 Super 型號,情況就會發生變化:因為 4070 Super 和 4070 Ti Super 帶來了顯著更高的效能,而 4080 Super 相比 4080 基本原地踏步。這樣對比的話,5080 相比上代 Super 版本的效能增幅最明顯,而 5070 對比 4070 Super 幾乎沒什麼改進。不管怎樣,所有新一代 GPU 對比上代 Super 版本時,效能增幅都縮小了。
GeForce RTX 5090 和 GeForce RTX 5080 上新的 Founders Edition 散熱器還有一些新細節。英偉達將此稱為“雙流”設計,因為兩個風扇都可以將空氣吹過散熱器,不會讓空氣被 PCB 阻礙。上一代的 RTX-4000 高階型號中,只有後一個風扇可以做到這一點,因為 PCB 擋住了前面的風扇。所以風扇不會將空氣吹過散熱片,而是會通過後擋板吹出去,這樣就會被 PCB 阻擋了。

英偉達表示,雙流式設計應該會比之前的設計實現更好的散熱效能,但 英偉達只將新的雙槽設計與 RTX 4000 一代的雙槽設計做了對比,而沒有與 GeForce RTX 4080 和 GeForce RTX 4090 更大更好的 3 槽設計做對比。
在 2 槽位的對比中,雙流式散熱器的效能比前代產品好得多,即使是 600 瓦的功率下也應該能比 400 瓦負載的舊散熱器更安靜,同時幾乎不會比舊散熱器在 300 瓦負載時的噪音更大——這可是非常明顯的差別。在 400 瓦的負載下,新的散熱器可以比舊款在 200 瓦負載時的噪音稍低一些。
據傳言,RTX 5090 的測試禁令將於 1 月 24 日解除,RTX 5080 的測試禁令將於 1 月 29 日(入門級 UPV 卡)或 1 月 30 日(更昂貴的型號)解除。兩個系列的上市日期都是 1 月 30 日。
GeForce RTX 5000 與 RTX 4000 的廠商建議零售價對比:

RTX 5000 核心資訊表:

原文連結:
https://www.computerbase.de/artikel/grafikkarten/geforce-rtx-5090-5080-5070-ti-5070-details.91036/
宣告:本文為 InfoQ 翻譯,未經許可禁止轉載。
