最強AI顯示卡一手實測!英偉達RTX5090D滿滿狠活:老黃誠不我欺

英偉達RTX 5090 D首發測評:AI成未來20年遊戲產業最大變數。
作者 |  雲鵬
編輯 |  心緣
RTX 5090,老黃的最新核彈,一經發布就引爆了整個PC圈,今天,它終於將最後一塊麵紗解下,實測效能正式解禁。
芯東西1月24日報道,英偉達GeForce RTX 50系新顯示卡的旗艦款GeForce RTX 5090以及中國合規版GeForce RTX 5090 D今天解禁了效能測試,芯東西提前拿到了RTX 5090 D並重點針對其遊戲、生產力、AI三方面進行了測試。
測試中我們使用了目前地表最強遊戲顯示卡RTX 5090 D+地表最強遊戲CPU AMD銳龍7 9800X3D+的組合。
▲七彩虹RTX 5090 D Advanced
眾所周知,這一代顯示卡尤其強調AI技術的深度應用,芯東西也專門針對RTX 50系背後的逆天遊戲“兵器庫”進行了深入解讀深度揭秘RTX 5090八大看點:遊戲“兵器庫”逆天,將AI煉丹術塞到桌面)。
所以AI到底只是PPT上的數倍暴漲,還是實際遊戲中實打實的幀數提升、畫質提升,這是玩家們非常關心的話題,也是我們今天要透過實際測試回答的問題。
直接說結論:在支援DLSS 4的遊戲中,《賽博朋克2077》竟然直接飆到了400多幀,簡直逆天;RTX 5090 D相比RTX 4090 D有著翻倍的幀數表現,幀數飆漲,直接讓3A單機遊戲第一次有了突破240Hz的終極電競級體驗。
▲400幀的《賽博朋克2077》(4K解析度、開啟光追最高設定及路徑追蹤、DLSS超解析度為超級效能檔、開啟DLSS 4多幀生成,其他畫質選項全部為最高)
RTX 5090 D在生產力和AI方面的技術點也都點在了“刀刃”上,在FP4下,AI影像生成速度相比RTX 4090 D最高有150%以上的提升。
▲RTX 5090 D與RTX 4090 D在部分代表性AI測試專案中的成績對比
16499元的中國合規版RTX 5090 D,著實香爆了。
去年的英偉達Blackwell B200企業級核彈可以說成為資料中心GPU市場的AI新王炸,而今天,英偉達在面向消費者的GeForce系列中也加入了一系列AI“秘密武器”,讓AI給日常遊戲和生產力帶來顛覆性體驗。
如果用英偉達的話來說,AI會是影響遊戲產業未來二十年的最關鍵技術。從DLSS 4帶來的幀數數倍提升,到AI在遊戲的紋理、材質、光線反射、Mega Geometry乃至NPC構建中的應用。
英偉達實實在在地推開了AI遊戲時代的大門。
01.
打破遊戲“不可能三角”,
400幀的《賽博朋克2077》到底有多爽?
此次中國合規版RTX 5090 D沒有公版,我們拿到的是七彩虹iGame RTX 5090 D Advanced,七彩虹作為核心AIC廠商之一,此次在顯示卡設計上較為用心。
▲七彩虹iGame RTX 5090 D Advanced
其供電規格較為豪華,顯示卡做工用料紮實,厚度有3槽位厚,其外觀在點亮後極具科技感,還支援燈光同步以及一鍵開啟Turbo模式。
▲七彩虹iGame RTX 5090 D Advanced產品細節
七彩虹作為目前全球第一大顯示卡出貨廠商,在產品的價效比方面一直做的較為極致,此次七彩虹iGame RTX 5090 D Advanced的售價與官方指導價看齊,同為16499元。
▲七彩虹iGame RTX 5090 D Advanced
在測試平臺的CPU配置方面,我們選擇了英偉達官方評測推薦CPU——AMD銳龍7 9800X3D,這也是目前在遊戲玩家中呼聲最高的一款旗艦處理器。根據公開測試資料,9800X3D不僅可以實現較高幀數,在幀率穩定性方面也表現不錯。
▲測試配置
此次我們在遊戲方面的測試重點聚焦於DLSS 4多幀生成功能,這也是一項由AI技術深度加持的功能。
在測試中,RTX 5090 D均開啟DLSS 4多幀生成,RTX 4090 D則開啟DLSS 3單幀生成,測試解析度均為4K,有光追選項的遊戲全部開啟光追,其他畫質設定全部拉滿,DLSS超級解析度開到效能檔位。
在效能測試解禁前,玩家圈曾廣泛議論RTX 50系的純傳統光柵渲染效能提升可能比較有限,但實際上,縱觀當今晶片產業的發展,單純依靠架構、工藝升級,電晶體數量提升、增大核心面積,已經很難實現顛覆性升級,但應用對於硬體的效能需求卻依然在大幅提升。
可以說,透過軟體演算法層面的技術創新去提升晶片在實際應用中的表現,是一個必然的方向,也是行業大勢所趨。
英偉達作為當下AI圈的扛把子,自然深諳此理。
在遊戲領域一直有一個“不可能三角”,其三要素為畫質、幀率和響應速度,在同一個技術中同時提升流暢度、響應速度、畫質,這在過去是很難實現的,要突出其中之一,必然要適當放棄另外兩項。
但今天英偉達用AI徹底打破了這一不可能三角。
1、3A單機衝上240幀,這種絲滑體驗真的“旦用難回”
首先我們來看幀數表現,也就是最核心的流暢度指標。直接說結論,在DLSS 4多幀生成的加持下,過載3A單機大作的幀數表現甚至可以用“顛覆想象”來形容。
▲RTX 5090 D與RTX 4090 D遊戲平均幀表現(4K解析度、有光追選項的均開啟最高檔位、DLSS超解析度為效能檔,其他畫質選項全部為最高,RTX 4090 D開啟DLSS 3單幀生成,RTX 5090 D開啟DLSS 4多幀生成)
像《賽博朋克2077》、《星球大戰:亡命之徒》、《心靈殺手2》這樣的負載極高的典型3A單機大作,都可以輕鬆跑到4K 240幀以上,絲滑流暢。
▲《星球大戰:亡命之徒》(4K最高畫質開啟DLSS 4多幀生成)
要知道,此前這些遊戲幾乎都有這“硬體殺手”的稱號,例如《心靈殺手2》在上代RTX 4090 D上,即使開啟了DLSS 3,幀數都只能艱難破百,最低幀甚至會跌破60,遠達不到電競“144幀”的體驗,但這次RTX 5090 D的幀數直接漲到了原來的2倍還多!
▲《心靈殺手2》(4K最高畫質開啟DLSS 4多幀生成)
什麼概念?240Hz是目前許多電競顯示器的最高重新整理率上限,也就是說,在DLSS 4技術的加持下,英偉達讓玩家可以在過載3A單機大作中直接實現4K電競幀數級的體驗,直接吃滿顯示器上限,將最新4K 240Hz電競顯示器的顯示效果發揮到極致。
▲《賽博朋克2077》 Benchmark成績(4K最高畫質開啟DLSS 4多幀生成)
多位資深遊戲愛好者在瞭解到這一表現後,都覺得是“不敢相信”的。
上代RTX 4090固然效能也十分出色,但在DLSS 3但加持下,同類遊戲基本上只能跑到一半幀數左右,最佳化好的情況下大約可以實現4K 120Hz的遊戲體驗。
在《霍格沃茲之遺》、《龍騰世紀:影障守護者》這類負載中等偏上的3A單機大作中,RTX 5090 D在開啟DLSS 4後的幀數甚至可以飆至400幀左右。
▲《龍騰世紀:影障守護者》(4K最高畫質開啟DLSS 4多幀生成)
《漫威爭鋒》這款新晉熱門第一人稱射擊類競技網遊,對畫質要求較高,但在DLSS 4的加持下也可以直接跑到近400幀左右的平均幀表現。
▲《漫威爭鋒》(4K最高畫質開啟DLSS 4多幀生成)
《賽博朋克2077》的遊戲幀數表現在4K解析度畫質設定拉滿、光追拉滿、DLSS超分開啟超級效能檔,DLSS 4多幀生成開啟下可以直逼400幀大關,而在關閉了DLSS技術後,遊戲幀數僅僅在30-40幀左右,DLSS技術帶來了近10倍的提升。
▲《賽博朋克2077》(4K最高畫質開啟DLSS 4多幀生成)
在效能檔位下,《賽博朋克2077》的幀數可以穩定在4K 240幀上下。
用3DMark的基準測試我們可以更平均地看到DLSS 4給遊戲帶來的提升。
關閉DLSS和開啟DLSS 4,幀數差距達到了8倍以上,不禁令人感嘆,老黃的PPT果然是實實在在的。
▲RTX 5090 D與RTX 4090 D在3DMark DLSS效能基準測試中的幀數表現
值得一提的是,不僅是平均幀有大幅上漲,在DLSS 4的加持下,遊戲的1%Low幀幾乎也都在100幀以上,甚至《星球大戰:亡命之徒》、《賽博朋克2077》和《漫威爭鋒》的1%Low幀都超過了144幀。
▲RTX 5090 D與RTX 4090 D遊戲1% Low幀表現(4K解析度、有光追選項的均開啟最高檔位、DLSS超解析度為效能檔,其他畫質選項全部為最高,RTX 4090 D開啟DLSS 3單幀生成,RTX 5090 D開啟DLSS 4多幀生成)
1%Low幀簡單理解就是遊戲中“最卡頓的那幾幀”(採集最低的1%的幀數並進行平均)。
也就是說,這些3A單機大作在最卡頓、最影響體驗的情況下,幀數都已經邁過了“電競幀數”的門檻。
這種絲滑的體驗,的確是有種“旦用難回”的感覺。
2、開了DLSS 4畫質不降反升,魚和熊掌兼得,新模型立大功
除了流暢度的“翻倍式”暴漲,RTX 5090 D實現如此高幀數,並沒有以犧牲畫質為代價,在所有遊戲中,我們都將畫質設定直接拉滿,光追也全部開啟最高檔位,這是在最高畫質下實現的電競級幀數表現。
畫質不僅沒有犧牲,反而有進步。
▲《賽博朋克2077》畫質設定中可以自由選擇超解析度使用的模型
在Transformer模型的升級之下,很多傳統超解析度、光線重建、DLAA技術中的短板問題都得到了明顯最佳化。比如偽影、閃爍、模糊等情況都有明顯最佳化。水體、鏡面等代表性反射面的效果都更細膩、更真實了。
▲《賽博朋克2077》燈光紋理對比(RTX 4090 D使用傳統CNN模型,RTX 5090 D使用Transformer模型)
最突出的一個感受就是,即便是開了效能檔位,很多遊戲的畫面都給人感覺比較“清爽”,畫面比較乾淨,並沒有一些DLSS開高之後常見的偽影、噪點等問題。
▲《賽博朋克2077》(4K最高畫質開啟DLSS 4多幀生成)
比如在《心靈殺手2》中,以前DLSS 3比較容易翻車的鐵絲網,這次DLSS 4都拿捏的遊刃有餘,畫面中鐵絲網邊緣非常清晰銳利,沒有偽影,與此同時,樹木枝葉的邊緣也比較乾淨銳利,風扇葉片上的重影減少了,電力線上的閃爍也得到了很好的消除,這些都是非常值得肯定的提升。
▲《心靈殺手2》網格清晰度對比(RTX 4090 D使用傳統CNN模型,RTX 5090 D使用Transformer模型)
在《賽博朋克2077》、《龍騰世紀:影障守護者》這兩款遊戲中,我們也重點關注了一些網格、網布、水面、密集線條交錯的場景,在這些場景中,DLSS 4都有不錯的表現。
▲《星球大戰:亡命之徒》遊戲內麻布細節對比(RTX 4090 D使用傳統CNN模型,RTX 5090 D使用Transformer模型)
▲《賽博朋克2077》遊戲內水面反射細節對比(RTX 4090 D使用傳統CNN模型,RTX 5090 D使用Transformer模型)
可以說,AI“猜圖生圖”的水平的確又上了一個新臺階。
3、延遲不升反降,幀生成穩定性亮眼
此前在幀生成技術剛剛出現時,其延遲問題曾受到廣泛關注,此次DLSS 4直接用AI生成3幀,是否會進一步增加延遲?這也是遊戲玩家們非常關心的。從實際遊戲體驗來看,PC延遲不升反降,遊戲響應速度還更快了。
▲RTX 5090 D與RTX 4090 D遊戲延遲表現(4K解析度、有光追選項的均開啟最高檔位、DLSS超解析度為效能檔,其他畫質選項全部為最高,RTX 4090 D開啟DLSS 3單幀生成,RTX 5090 D開啟DLSS 4多幀生成)
即使是在負載最重的《心靈殺手2》中,延遲也僅有45ms左右,在《漫威爭鋒》這種電競類網遊中,延遲只有20ms左右。
▲《漫威爭鋒》(4K最高畫質開啟DLSS 4多幀生成)
在《霍格沃茲之遺》這款3A單機中,DLSS 4在實現420幀左右的平均幀基礎上,延遲還控制在了20ms以內,可以說是畫質、幀率、延遲完美兼顧的典型案例了。
▲《霍格沃茲之遺》(4K最高畫質開啟DLSS 4多幀生成)
當然,在這些遊戲中,能夠開啟英偉達Reflex技術的都已經開啟,根據英偉達的技術解析,Reflex 2技術在響應速度方面再次提升了50%左右,相比原生有著75%的提升。
不僅延遲低,DLSS 4多幀生成的穩定性非常好,這也是很關鍵的,多幀生成的間隔比較穩定,波動很小,反映在遊戲體驗中,就是流暢是“穩定的流暢”,而非“波動流暢”,遊戲跟手性很好。
正如前文所說,綜合幀數、畫質、延遲表現,我們可以很負責任地說,英偉達是實實在在地用AI打破了“遊戲不可能三角”,真正將遊戲體驗帶到了“下一個時代”——3A單機大作都可以擁有電競級流暢體驗的時代。
4、最新黑科技一鍵開啟,便捷性易用性拉滿
最後在遊戲方面我們想重點提及的一點,是DLSS 4以及相關AI技術的易用性。
對於普通玩家們來說,他們不需要了解這些“黑科技”背後的原理,消費者需要做的僅僅是把顯示卡插到機箱裡,並更新到最新版驅動,就可以直接體驗到這些新技術帶來的體驗質變升級。
▲《心靈殺手2》畫質設定
一些即使沒有在遊戲中內建支援DLSS 4的遊戲,也可以透過英偉達官方NVIDIA App直接進行“優設”覆蓋生效,比如《漫威爭鋒》以及《龍騰世紀:影障守護者》,這個使用體驗的確是非常便捷。
▲《漫威爭鋒》透過DLSS優設設定幀生成4x
▲《龍騰世紀:影障守護者》透過DLSS優設設定幀生成4x
在設定的過程中,選項非常明確,我們可以直接設定每一個功能所用到的模型,是CNN模型,還是最新的Transformer模型。我們也可以設定幀生成是3x還是4x。
▲在NVIDIA App中選擇模型
英偉達把多年深耕積累的AI黑科技打包裝進驅動,消費者只需要一鍵升級,就可以直接享受到這些AI技術帶來的紅利。
值得一提的是,根據官方訊息,在RTX 50系列正式開售時,將會有超過75款遊戲和應用支援DLSS 4,近期發售的熱門大作幾乎全部包含在內,英偉達的生態支援完善性還是不錯的。
02.
生產力多項新特性升級,
建模、影片、AI樣樣精通
既然是英偉達的旗艦顯示卡,生產力自然也是不少消費者關注的重點,從3D渲染、影片編解碼到生成式AI能力,RTX 5090 D的表現可圈可點。
RTX 5090的AI峰值算力是3352TOPS。RTX 5090 D在硬體配置上是一樣的,AI算力受合規限制到2375TOPS,比5080高了約32%,是RTX 4090 D的1177TOPS的2倍。
據媒體報道,RTX 5090 D在執行一些敏感受限應用時會受到算力限制。但對於日常生產力應用或者消費級市場中常見的AI推理,比如AI生圖、AI文字生成,影響較小。
在實際測試中,RTX 5090 D的確在日常生產力應用中都有著不錯的提升,相比RTX 4090 D提升幅度多在30%到90%之間,AI應用方面的效能提升幅度最高超過150%。
▲達芬奇測試為RTX 5090 D硬體編碼與14900K CPU軟體編碼對比
比如在主流建築視覺化軟體D5渲染器中,RTX 5090 D就可以實現相當高的場景預覽幀數表現。
▲D5實際場景預覽畫面
在負載極高的一個別墅場景中,平均幀甚至可以來到“電競級”的160幀,相比之下,RTX 4090 D只能跑到87幀左右的預覽成績。
▲D5場景預覽
這種絲滑的場景預覽體驗,無疑可以顯著提升建築師的設計效率以及給客戶展示預覽成果的實際效果。
▲D5渲染器介面
在影片編解碼方面,此次RTX 5090 D增加了對4:2:2 H.264/H.265影片的編碼和解碼支援,上代RTX 40系支援4:2:0和4:4:4的硬體影片編解碼,但不支援4:2:2。
簡單理解,4:2:2的色度取樣模式可以在保留更多顏色資訊與減小檔案大小和頻寬需求之間取得更好的平衡,額外的顏色資訊對於HDR內容創作以及精細顏色校準工作流有很大幫助。
實際上,在顯示卡實現硬體級支援之前,基於軟體的4:2:2編碼會給CPU帶來極高負載,如今RTX 5090 D可以直接從硬體層面實現對H.264/H.265影片格式的4:2:2編碼支援,影片處理效率進一步提升。
▲達芬奇影片匯出設定
根據實際測試,基於RTX 5090 D直接輸出4:2:2編碼的影片,速度比基於CPU的編碼解決方案速度快了10倍以上,接近11倍。
在實際測試中,基於達芬奇,輸出同樣一段4:2:2編碼10bit的高質量4K影片,RTX 5090 D的完成時間在2分半左右,而基於英特爾旗艦CPU 14900K的軟體方案則耗時26分15秒左右。
▲RTX 5090 D與14900K以4:2:2編碼10bit匯出4K影片耗時對比
在常用的GPU渲染效能測試工具V-Ray Benchmark中,RTX 5090 D也跑出了超過15100分的成績,相比RTX 4090 D提升幅度約有36%,還是相當可觀的。
接下來我們看看RTX 5090 D在AI生產力方面的表現。如今AI大模型的複雜度和引數規模都不斷增長,透過端側消費級硬體來執行這些模型其實是有很大挑戰的。
這代RTX 50系增加了對原生FP4的支援,FP4可以更好地壓縮模型的大小,跟當下常見的FP16量化方式相比,FP4的視訊記憶體佔用率不到一半,但效能卻翻了一倍,更低的視訊記憶體佔用也讓更多旗艦之外的中端顯示卡在AI方面有了一戰之力。
▲RTX 5090 D與RTX 4090 D在AI影像生成、AI文字生成等基準測試中的成績對比
在UL Procyon FLUX.1 Dev測試中,RTX 5090 D在FP4下的測試成績是3.9秒左右,而基於FP8的RTX 4090用時大約為9.8秒。
▲RTX 5090 D在UL Procyon FLUX.1 Dev測試中的成績
在AI效能方面,我們基於UL Procyon測試了RTX 5090 D在AI影像生成、AI文字生成等幾個主要應用場景的成績,其相比RTX 4090 D都有比較明顯的提升。
▲UL Procyon程式內的各類AI基準測試
在AI影像生成SDXL FP16測試中,RTX 5090 D有著43%的效能提升,影像生成速度在7秒左右,而RTX 4090 D則需要10秒以上。
▲AI影像生成基準測試,左側成績為RTX 4090 D,右側成績為RTX 5090 D
在AI文字生成方面,我們基於Procyon測試了Phi-3.5-mini、Mistral-7B、Llama-3.1-8B、Llama-2-13B等幾款主流熱門模型,RTX 5090 D的效能總分領先在35%左右。
▲RTX 5090 D AI文字生成基準測試成績
尤其在平均生詞速度上,RTX 5090 D的領先幅度進一步擴大到46%。
MLPerf是目前行業內比較權威和常用的機器學習基準測試,在MLPerf-Client v0.5中,RTX 5090 D在各類推理效能基準測試中也都有不錯的表現。
▲MLPerf測試過程
值得一提的是,根據官方給出的RTX 5090公版測試資料,中國合規版RTX 5090 D在這些日常消費者可以接觸到的AI應用中,效能幾乎沒有差別,可以說對普通消費者的日常使用幾乎沒有影響。
總體來看,RTX 5090 D雖然在AI算力層面受到了一定的限制,但在消費者日常所接觸到的遊戲或生產力場景中,相較上代都有非常直觀的提升,並且與RTX 5090公版的效能幾乎沒有差別,結合其16499元的建議零售價,的確是國內玩家和創作者們的新神器。
03.
結語:計算圖形學“下個時代”到來,
AI顯示卡走入百姓家
DLSS 4實現8倍的幀率提升、神經網路著色器實現更好的畫質、Reflex 2降低高達75%的延遲,RTX 5090 D的諸多技術升級,都令其在遊戲、生產力方面有著令人驚豔的效能提升。
值得一提的是,在如今晶片廠商普遍高舉“能效比”大旗衝鋒的當下,英偉達的桌面消費級顯示卡並沒有一味追求能效比,而是在功耗小幅增長的情況下,將AI技術與硬體深度融合,實現實際效能表現的翻倍式提升。
這樣的發力方向,顯然是廣大PC桌上型電腦遊戲玩家和創作者們所喜聞樂見的。
用英偉達的話來說,神經網路渲染是計算機圖形學的“下個時代”。
神經網路直接深入到圖形渲染的過程當中,進而讓圖形渲染在效能、質量和互動性方面都有真正的飛躍式提升,最終讓遊戲玩家有更沉浸高質量的遊戲體驗,讓創作者們的生產效率進一步提高。
DLSS 4是DLSS技術發展多年來的一個里程碑式的節點,但同時也是一個新的開始——消費級AI顯示卡時代的開始。
在AI手機、AI PC之後,AI顯示卡是真的來了。


相關文章