NVIDIA在CES 2025上正式发布了采用全新Blackwell架构的RTX 50系列GPU,而其中的旗舰RTX 5090 D终于在1月24日迎来了性能解禁。作为NVIDIA的重要合作厂商,技嘉也在第一时间推出了配备RTX 5090 D GPU的AORUS GeForce RTX 5090 D MASTER ICE超级雕(以下简称RTX 5090 D超级雕(白)),为发烧级玩家带来了新一代纯白旗舰显卡之选。
RTX 5090 D超级雕上机实拍
RTX 5090 D更强算力、更高显存带宽皆为AI渲染而生
▲RTX 5090 D在完整的GB202芯片(上图)基础上精简了22个SM单元,因此RT Core和Tensor Core的数量分别为170个和680个
采用Blackwell架构的RTX 5090 D GPU在首发登场的RTX 50系家族中处于顶级旗舰的位置,它使用的GB202芯片芯片面积高达744mm²,相对上代RTX 4090 D的AD202芯片提升了大约22%之多,CUDA单元数量也提升了49%,升级幅度确实相当抢眼。
此外,得益于新的架构设计,RTX 5090 D内置的第四代RT Core和第五代Tensor Core相对上代RTX 4090 D的性能也得到了巨幅升级,提升幅度分别达到了87%和102%,毕竟新架构全面拥抱AI渲染,确实需要更强大的Tensor Core来支持。
纹理单元和光栅单元方面,RTX 5090 D则相对RTX 4090 D分别提升了49%和9%。显存部分,RTX 5090 D率先使用了GDDR7,位宽高达512bit,传输速率达到28Gbps,因此显存带宽相对RTX 4090 D的提升幅度达到了78%,这对于高带宽高容量需求的高分辨率光追游戏、AIGC应用来讲无疑是个针对性很强的升级点。
编解码器部分,RTX 5090 D也进行了大升级,拥有3个第九代编码器和2个第六代解码器,相对RTX 4090 D的2个第八代编码器和1个第五代解码器提升幅度也算是很大了。而且RTX 5090 D增加了H.265/10bit/4:2:2格式的视频编解码,对于视频剪辑师用户来说非常实用。
功率部分,RTX 5090 D官方参考整板功率为575W,采用16Pin辅助供电,而各大显卡厂商生产的OC版基本都会使用600W的功率上限,所以在频率和性能方面的规格会更高。由此也可以理解为什么RTX 50系会彻底拥抱AI渲染,NVIDIA再次为业界指明了GPU的设计方向,不过NVIDIA在AI方面已经领先太多,优势已经无可匹敌。
接下来就让我们一起近距离欣赏来自技嘉的RTX 5090 D超级雕(白)显卡实物。
AORUS GeForce RTX 5090 D MASTER ICE超级雕图赏
RTX 5090 D超级雕(白)采用了全白配色,正面采用分层纹理设计,将力量与优雅完美融合。同时,显卡巨大的体型给人非常霸气的感觉,对于希望打造纯白旗舰游戏主机的玩家来说极具吸引力。
显卡采用了风之力散热系统,配备3个支持正反逆转的仿生风扇,同时还支持在背板上安装一个风扇,组成进气格栅PLUS,不但增强了显卡的散热效果,对整套系统的散热环境也能起到改善的作用。
除了强大的风之力散热系统,显卡还使用了复合金属硅脂,同时具备液态金属和硅脂的特性,提供更好的安全性和导热效果。此外,显卡还配备了新一代导热垫,确保VRAM和MOSFET的散热效果。
DIY设计方面,显卡提供了双BIOS快速切换开关,可以在性能模式和静音模式之间快速切换,满足玩家不同使用环境的需求。显卡配备16pin辅助供电接口,并拥有电源指示灯,可以根据灯光判断供电状态。其中灯光熄灭代表电源连接正常;亮起代表电源线未连接;闪烁代表电源异常。此外,辅助电源接口位置下凹,远离显卡边缘,有效提升了与16Pin供电接头的兼容性和安全性,同时也减少了电源线弯折发生故障的概率。
为了保证显卡的使用安全,它还附带了一个显卡支架,可以自由调节高度,确保超重的显卡在立式机箱中不会倾斜,提供更可靠而稳定的使用体验。
个性化部分,显卡除了支持RGB FUSION灯效同步之外,还在顶部配备了一个LCD显示屏,可以显示自定义视频、图片和动图,打造酷炫的个性MOD。
用料部分,显卡使用了长寿命固态电容、合金电感、2盎司铜PCB与低电阻晶体管,并且采用自动化生产流程,PCB还具备3防涂层,可以防尘、防潮和防腐蚀,大幅提升了显卡的耐用度和寿命。
硬件配置方面,除了RTX 5090 D GPU之外,显卡还配备了32GB GDDR7海量显存,为玩家提供高分辨率下的极致帧率,同时也为AIGC用户提供了当下顶级的显存规格,高分辨率出图更加高效。此外,RTX 5090 D超级雕(白)的GPU加速频率高达2655 MHz,远高于NVIDIA官方参考频率2410 MHz,其功率上限也达到了600W,高于参考标准的575W,因此在性能方面会有更高的表现。
接口部分,显卡提供了一个HDMI 2.1b和三个DP 2.1b接口,足以满足发烧玩家多屏输出的需求。
总的来说,RTX 5090 D超级雕(白)作为RTX 5090 D中的旗舰级代表,拥有顶级的用料和散热设计,完全可以给发烧级玩家带来顶级的游戏体验。
实战测试:游戏/生产力无可匹敌,新王者制霸全场
测试平台
显卡:AORUS GeForce RTX 5090 D MASTER ICE超级雕
处理器:锐龙7 9800X3D
内存:佰维DDR5 6000(C28) 16GB×2
主板:X870E AORUS MASTER
硬盘:WD_BLACK SN850X 2TB
电源:技嘉UD1300GM
操作系统:Windows 11专业版24H2
测试平台部分,我们选择了锐龙7 9800X3D与RTX 5090 D超级雕(白)搭配,将处理器部分的瓶颈效应控制在最小,同时还使用上代的RTX 4090 D与之进行对比。为了保证整板功率600W的RTX 5090 D超级雕(白)能够满载稳定运行,我们还使用了1300W的电源。此外,考虑到RTX 5090 D的旗舰级定位和性能水平,确保它在游戏中能100%发挥性能,我们本次游戏实测都使用4K分辨率。
基准性能测试
先来看看基准性能方面的表现。从3DMark的测试分数可以看到,在常规的DX11和DX12光栅化渲染测试项目中,RTX 5090 D相对RTX 4090 D的优势都超过了35%,在DX12项目中的优势更高,最高甚至可达44%。在DX12U和光追项目(SpeedWay和Port Royal)中,RTX 5090 D的优势更大,最高甚至相对RTX 4090 D提升了57%。综合传统基准性能部分的成绩来看,RTX 5090 D平均领先RTX 4090 D的幅度大约为44%。
而在RTX 50系独享的3DMark DLSS 4测试项目中,拥有最多4×多帧生成的RTX 5090 D领先只有2×帧生成(DLSS 3)的RTX 4090 D的幅度高达162%之多。同时,我们也可以看到,开启4×帧生成之后,RTX 5090 D的帧率相对原生帧率也提升了449%,相对RTX 4090 D的原生帧率提升幅度更是高达714%,可见DLSS 4的多帧生成效果确实非常夸张。
常规游戏性能测试
接下来看看4K极限画质设定下光栅化游戏性能的表现。从测试情况来看,RTX 5090 D相对RTX 4090 D的平均帧率提升幅度从24%到59%不等,平均提升幅度大约为35%,其中《赛博朋克2077》《永劫无间》提升幅度都非常抢眼,分别达到了59%和50%之高。而在考查游戏流畅度的1% Low帧方面,RTX 5090 D的表现也非常出色,在《博德之门3》中甚至领先了60%,综合全部游戏平均领先幅度是34%。
光追与DLSS游戏测试
在打开光追和DLSS(CNN模型)的主流3A游戏中,RTX 5090 D相对RTX 4090 D的平均帧优势从16%~39%不等,平均领先幅度大约为39%。而1% Low帧部分,RTX 5090 D相对RTX 4090 D的领先幅度最高也达到了39%,平均领先21%。所以无论是绝对帧率还是游戏平滑度,RTX 5090 D都是大幅超越上代RTX 4090 D的存在。
生产力性能测试
RTX 5090 D提供了更多的CUDA单元和更为强大的32GB/512bit/GDDR7显存,因此在各种3D设计工具软件中也会提供更高的执行效率。从测试结果来看,RTX 5090 D在Blender中相对RTX 4090 D有32%~45%的提升;在V-Ray GPU RTX渲染中有37%的提升;在SPECView2020V3.1中的平均提升幅度则为12%。由此可见,对于经常要用到3D设计工具的用户来讲,RTX 5090 D相对上代提升巨大,是更加高效的升级选择。此外,RTX 5090 D新增了对4:2:2/10bit格式视频编解码的支持,我们使用Davinci Resolve 19 + Voukoder进行了编码测试对比,确实有明显的提升。
▲RTX 5090 D的两个第六代解码器在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧,而CPU即便拥有16核32线程,在面对这样的解码需求时也会严重卡顿
RTX 5090 D在视频解码方面同样十分强大,它配备的两个第六代解码器在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧。但如果用CPU来解码,就算是拥有16核32线程的锐龙9 9950X,来完成同样的解码工作也会出现严重卡顿,无法流畅预览。可见对于视频剪辑师来说,RTX 5090 D新一代的编解码器确实会带来更高的工作效率。
DLSS 4应用与游戏测试
首发宣布支持DLSS 4的游戏有75款,现在我们可以通过NVIDIA提供的测试代码来激活一些游戏的DLSS 4测试分支版本,更多的游戏将会在晚些时候陆续上线对DLSS 4的支持。在原生支持DLSS 4的游戏中,我们可以选择多帧生成的倍率(4×、3×、2×),而在非原生支持DLSS 4的部分游戏中,我们也可以通过NVIDIA APP来设置使用的模型(新的Transformer或者上代的CNN)与多帧生成倍率。
▲RTX 5090 D在《赛博朋克2077》中启用DLSS 4 + 4×帧生成,4K极限光追画质下也可以能达到300fps左右的帧率
在《赛博朋克2077》的DLSS 4测试分支版本中,我们可以详细比较RTX 5090 D使用Transformer模型的DLSS 4模式不同倍率帧生成设置下的帧率,也可以比较CNN和Transformer模型同在2×帧生成下的效率(使用CNN模型的DLSS 3只支持2×帧生成)。
从测试结果来看,在DLSS 4模式下,启用4×、3×和2×帧生成,RTX 5090 D的帧率相对原生分别提升了746%、571%和、377%,提升幅度可以说是非常夸张了。同时,我们也可以看到,使用Transformer模型实现2×帧生成,相对DLSS 3的CNN模型也有7%的帧率提升,可见新模型的使用确实也进一步提升了DLSS 4的性能。
上代RTX 4090 D在《赛博朋克2077》中只能使用CNN模型加持的DLSS 3模式,因此只支持2×帧生成,而拥有4×帧生成的RTX 5090 D帧率足足是它的260%,相对它的原生帧率更是提升了惊人的1038%。
▲RTX 5090 D在《霍格沃兹之遗》中启用DLSS 4 + 4×帧生成,4K极限光追画质下实时帧率可以轻松达到300fps~400fps+
《霍格沃兹之遗》的DLSS 4测试分支版本中,4×帧生成和3×帧生成使用了新的Transformer模型,不过在2×帧生成模式下,它还是调用的CNN模型。从测试结果来看,RTX 5090 D使用DLSS 4和4×帧生成,相对原生的帧率提升了309%,3×则提升了195%,使用上代的DLSS 3 + 2×帧生成模式,也提升了97%之多。如果和RTX 4090 D的DLSS 3 + 2×帧生成相比,最高提升幅度达到了108%,和RTX 4090 D原生帧率比,则提升幅度最高达到432%。大家可能担心开启4×帧生成会带来更高的延迟,但从我们的测试来看,使用4×帧生成的渲染延迟与平均PC延迟与2×帧生成相比并没有明显变化,可见完全不用担心这个问题。
▲RTX 5090 D在《霍格沃兹之遗》中启用Override模式的DLSS 4 + 4×帧生成,4K极限画质下实时帧率高达400fps+
《漫威争锋》暂时没有原生支持DLSS 4,不过可以在NVIDIA APP中使用Override模式来开启DLSS 4和多帧生成。可以看到,在 4×/3×帧生成模式下,RTX 5090 D的帧率相对于原生分别提升了289%和217%,而同样使用2×帧生成模式,使用Transformer模型相对CNN模型也提升了6%。而RTX 5090 D采用4×帧生成的帧率相对采用DLSS 3 + 2×帧生成的RTX 4090 D则提升了137%,和原生比更是提升了419%。延迟部分,可以看到RTX 5090 D在几种帧生成比例下的渲染延迟与PC延迟差别都很小,所以对于玩家来讲直接启用DLSS 4的4×帧生成无疑是获得高帧率和流畅操作的最佳选择。
▲RTX 5090 D在D5渲染器中使用Override模式开启DLSS 4和4×帧生成,实时预览帧率暴增
除了游戏之外,DLSS 4在3D渲染类生产力软件中也能大显神通,目前D5渲染器也可以通过Override模式来支持DLSS 4和多帧生成,从而提供更流畅、更高效的使用体验。从测试来看,开启DLSS 4和4×帧生成,RTX 5090 D的帧率相比原生(关闭超分辨率、光线重建和帧生成)提升了291%,比仅有DLSS 3和2×帧生成的RTX 4090 D提升了207%,比它的原生帧率提升了561%。可以说这个提升幅度达到了惊人的水平,对于设计师用户来说堪称史诗级的体验升级。
AI性能测试
▲RTX 5090 D在UL Procyon的AI出图测试中使用FLUX.1模型/FP4精度设置,出图速度相对FP8精度提升约70%
前面介绍过,Blackwell架构的一大革新就是内置的第五代Tensor Core支持FP4精度的计算,相对Ada架构的Tensor Core性能提升了一倍。我们这里就使用UL Procyon的AI生图测试来考查RTX 5090 D的在FP8和FP4精度下的AI性能。从测试来看,同样使用FLUX.1模型生成1024×1024的图片,RTX 5090 D在FP4下的出图速度相当于FP8模式下的170%,而RTX 4090 D不支持FP4模式,所以从FP8模式切换到FP4模式出图时间几乎增加了一倍,所以RTX 5090 D在FP4模式下出图速度大约比RTX 4090 D快了413%。由此可见,对于需要快速AI出图、且对精度要求并不苛刻的用户来讲,支持FP4精度的RTX 5090 D无疑是效率远超上代旗舰的神器。
功率与温度表现
▲RTX 5090 D超级雕(白)满载考机整板功率600W,GPU温度不到72℃,风扇噪声小,散热效果出色
▲RTX 5090 D超级雕(白)在游戏中的实时功率从400W~600W不等,视游戏而定
我们使用FurMark对RTX 5090 D超级雕(白)进行满载考机测试,可以看到这时候整板功率达到了600W上限,GPU功率则保持在230W水平。得益于强大的风之力三风扇散热系统,RTX 5090 D超级雕(白)的GPU和显存考机温度都仅有72℃左右,风扇噪声也控制得很好,对于旗舰级显卡来讲,这样的使用体验也是非常突出的,即便玩家长时间玩游戏或进行AI计算,也不用担心过热影响稳定性和使用寿命。
总结:AI渲染时代的新王者,游戏与工作双料神器
最后来简单总结一下。采用全新Blackwell架构的RTX 5090 D首先从硬件层面就完成了从传统渲染时代到AI渲染时代的进化,突破了制造工艺、功率等硬件条件带来的性能升级瓶颈,为业界展示了GPU设计的新方向。可以毫不夸张地说,未来的GPU,完全拥抱AI是必然趋势,而在这方面,NVIDIA是领军者,拥有无可比拟的优势。
在此基础上,RTX 5090 D带来了一系列基于AI技术的新功能,将游戏流畅度和画质水平都提升到了新的高度,为玩家提供了更加极致的游戏体验。RTX 50系GPU还独享采用Transformer新模型的DLSS 4以及多帧生成技术,开启之后可以让游戏帧率暴增数倍,同时还拥有比上代CNN模型加持的DLSS 3更好的画质,这一点可以说是发烧级游戏玩家毫不犹豫升级的首要因素。
对于AI和生产力用户来讲,RTX 5090 D增加了对FP4精度的支持,能够提供更快的AI计算速度(也为AI渲染提供了强大的硬件基础),同时它还拥有当前最高规格的32GB/512bit/GDDR7显存配置,对于AIGC用户来讲无疑是当下最为高效的工具。此外,它还内置了3×第九代编码器和2×第六代解码器,新增支持4:2:2/10bit编解码,对于视频剪辑用户来说也堪称神兵利器。当然,在3D设计工具中,RTX 5090 D也提供了远超上代RTX 4090 D的性能。因此,综合来看,对于追求极致效率的设计师用户来讲,RTX 5090 D也是目前的顶配选择。
而技嘉RTX 5090 D超级雕(白)作为RTX 5090 D中的豪华旗舰,不但拥有600W的性能释放水平,还配备了强大的风之力散热系统,同时在外观颜值方面也达到了顶级旗舰水平,不愧为发烧级玩家和高端设计师用户首选的升级目标。
当然,对于追求性价比的玩家,也可以关注技嘉旗下的风魔系列RTX 5090 D显卡,例如RTX 5090 D风魔,首发价格16499元,它搭配了新一代仿生风扇,有效降低了风阻和噪声,还可将风压提升53.6%、风量提升12.5%。同时它还升级了导热凝胶,配备大型均热板和复合式热管、进气格栅等散热技术,性能输出强劲、而且耐用又超值。
DLSS 4加持的超强猛卡!RTX 5090 D纯白王者登场 AORUS GeForce RTX 5
2025年1月24日 22 : 45 电脑报原创
NVIDIA在CES 2025上正式发布了采用全新Blackwell架构的RTX 50系列GPU,而其中的旗舰RTX 5090 D终于在1月24日迎来了性能解禁。作为NVIDIA的重要合作厂商,技嘉也在第一时间推出了配备RTX 5090 D GPU的AORUS GeForce RTX 5090 D MASTER ICE超级雕(以下简称RTX 5090 D超级雕(白)),为发烧级玩家带来了新一代纯白旗舰显卡之选。
RTX 5090 D超级雕上机实拍
RTX 5090 D更强算力、更高显存带宽皆为AI渲染而生
▲RTX 5090 D在完整的GB202芯片(上图)基础上精简了22个SM单元,因此RT Core和Tensor Core的数量分别为170个和680个
采用Blackwell架构的RTX 5090 D GPU在首发登场的RTX 50系家族中处于顶级旗舰的位置,它使用的GB202芯片芯片面积高达744mm²,相对上代RTX 4090 D的AD202芯片提升了大约22%之多,CUDA单元数量也提升了49%,升级幅度确实相当抢眼。
此外,得益于新的架构设计,RTX 5090 D内置的第四代RT Core和第五代Tensor Core相对上代RTX 4090 D的性能也得到了巨幅升级,提升幅度分别达到了87%和102%,毕竟新架构全面拥抱AI渲染,确实需要更强大的Tensor Core来支持。
纹理单元和光栅单元方面,RTX 5090 D则相对RTX 4090 D分别提升了49%和9%。显存部分,RTX 5090 D率先使用了GDDR7,位宽高达512bit,传输速率达到28Gbps,因此显存带宽相对RTX 4090 D的提升幅度达到了78%,这对于高带宽高容量需求的高分辨率光追游戏、AIGC应用来讲无疑是个针对性很强的升级点。
编解码器部分,RTX 5090 D也进行了大升级,拥有3个第九代编码器和2个第六代解码器,相对RTX 4090 D的2个第八代编码器和1个第五代解码器提升幅度也算是很大了。而且RTX 5090 D增加了H.265/10bit/4:2:2格式的视频编解码,对于视频剪辑师用户来说非常实用。
功率部分,RTX 5090 D官方参考整板功率为575W,采用16Pin辅助供电,而各大显卡厂商生产的OC版基本都会使用600W的功率上限,所以在频率和性能方面的规格会更高。由此也可以理解为什么RTX 50系会彻底拥抱AI渲染,NVIDIA再次为业界指明了GPU的设计方向,不过NVIDIA在AI方面已经领先太多,优势已经无可匹敌。
接下来就让我们一起近距离欣赏来自技嘉的RTX 5090 D超级雕(白)显卡实物。
AORUS GeForce RTX 5090 D MASTER ICE超级雕图赏
RTX 5090 D超级雕(白)采用了全白配色,正面采用分层纹理设计,将力量与优雅完美融合。同时,显卡巨大的体型给人非常霸气的感觉,对于希望打造纯白旗舰游戏主机的玩家来说极具吸引力。
显卡采用了风之力散热系统,配备3个支持正反逆转的仿生风扇,同时还支持在背板上安装一个风扇,组成进气格栅PLUS,不但增强了显卡的散热效果,对整套系统的散热环境也能起到改善的作用。
除了强大的风之力散热系统,显卡还使用了复合金属硅脂,同时具备液态金属和硅脂的特性,提供更好的安全性和导热效果。此外,显卡还配备了新一代导热垫,确保VRAM和MOSFET的散热效果。
DIY设计方面,显卡提供了双BIOS快速切换开关,可以在性能模式和静音模式之间快速切换,满足玩家不同使用环境的需求。显卡配备16pin辅助供电接口,并拥有电源指示灯,可以根据灯光判断供电状态。其中灯光熄灭代表电源连接正常;亮起代表电源线未连接;闪烁代表电源异常。此外,辅助电源接口位置下凹,远离显卡边缘,有效提升了与16Pin供电接头的兼容性和安全性,同时也减少了电源线弯折发生故障的概率。
为了保证显卡的使用安全,它还附带了一个显卡支架,可以自由调节高度,确保超重的显卡在立式机箱中不会倾斜,提供更可靠而稳定的使用体验。
个性化部分,显卡除了支持RGB FUSION灯效同步之外,还在顶部配备了一个LCD显示屏,可以显示自定义视频、图片和动图,打造酷炫的个性MOD。
用料部分,显卡使用了长寿命固态电容、合金电感、2盎司铜PCB与低电阻晶体管,并且采用自动化生产流程,PCB还具备3防涂层,可以防尘、防潮和防腐蚀,大幅提升了显卡的耐用度和寿命。
硬件配置方面,除了RTX 5090 D GPU之外,显卡还配备了32GB GDDR7海量显存,为玩家提供高分辨率下的极致帧率,同时也为AIGC用户提供了当下顶级的显存规格,高分辨率出图更加高效。此外,RTX 5090 D超级雕(白)的GPU加速频率高达2655 MHz,远高于NVIDIA官方参考频率2410 MHz,其功率上限也达到了600W,高于参考标准的575W,因此在性能方面会有更高的表现。
接口部分,显卡提供了一个HDMI 2.1b和三个DP 2.1b接口,足以满足发烧玩家多屏输出的需求。
总的来说,RTX 5090 D超级雕(白)作为RTX 5090 D中的旗舰级代表,拥有顶级的用料和散热设计,完全可以给发烧级玩家带来顶级的游戏体验。
实战测试:游戏/生产力无可匹敌,新王者制霸全场
测试平台
显卡:AORUS GeForce RTX 5090 D MASTER ICE超级雕
处理器:锐龙7 9800X3D
内存:佰维DDR5 6000(C28) 16GB×2
主板:X870E AORUS MASTER
硬盘:WD_BLACK SN850X 2TB
电源:技嘉UD1300GM
操作系统:Windows 11专业版24H2
测试平台部分,我们选择了锐龙7 9800X3D与RTX 5090 D超级雕(白)搭配,将处理器部分的瓶颈效应控制在最小,同时还使用上代的RTX 4090 D与之进行对比。为了保证整板功率600W的RTX 5090 D超级雕(白)能够满载稳定运行,我们还使用了1300W的电源。此外,考虑到RTX 5090 D的旗舰级定位和性能水平,确保它在游戏中能100%发挥性能,我们本次游戏实测都使用4K分辨率。
基准性能测试
先来看看基准性能方面的表现。从3DMark的测试分数可以看到,在常规的DX11和DX12光栅化渲染测试项目中,RTX 5090 D相对RTX 4090 D的优势都超过了35%,在DX12项目中的优势更高,最高甚至可达44%。在DX12U和光追项目(SpeedWay和Port Royal)中,RTX 5090 D的优势更大,最高甚至相对RTX 4090 D提升了57%。综合传统基准性能部分的成绩来看,RTX 5090 D平均领先RTX 4090 D的幅度大约为44%。
而在RTX 50系独享的3DMark DLSS 4测试项目中,拥有最多4×多帧生成的RTX 5090 D领先只有2×帧生成(DLSS 3)的RTX 4090 D的幅度高达162%之多。同时,我们也可以看到,开启4×帧生成之后,RTX 5090 D的帧率相对原生帧率也提升了449%,相对RTX 4090 D的原生帧率提升幅度更是高达714%,可见DLSS 4的多帧生成效果确实非常夸张。
常规游戏性能测试
接下来看看4K极限画质设定下光栅化游戏性能的表现。从测试情况来看,RTX 5090 D相对RTX 4090 D的平均帧率提升幅度从24%到59%不等,平均提升幅度大约为35%,其中《赛博朋克2077》《永劫无间》提升幅度都非常抢眼,分别达到了59%和50%之高。而在考查游戏流畅度的1% Low帧方面,RTX 5090 D的表现也非常出色,在《博德之门3》中甚至领先了60%,综合全部游戏平均领先幅度是34%。
光追与DLSS游戏测试
在打开光追和DLSS(CNN模型)的主流3A游戏中,RTX 5090 D相对RTX 4090 D的平均帧优势从16%~39%不等,平均领先幅度大约为39%。而1% Low帧部分,RTX 5090 D相对RTX 4090 D的领先幅度最高也达到了39%,平均领先21%。所以无论是绝对帧率还是游戏平滑度,RTX 5090 D都是大幅超越上代RTX 4090 D的存在。
生产力性能测试
RTX 5090 D提供了更多的CUDA单元和更为强大的32GB/512bit/GDDR7显存,因此在各种3D设计工具软件中也会提供更高的执行效率。从测试结果来看,RTX 5090 D在Blender中相对RTX 4090 D有32%~45%的提升;在V-Ray GPU RTX渲染中有37%的提升;在SPECView2020V3.1中的平均提升幅度则为12%。由此可见,对于经常要用到3D设计工具的用户来讲,RTX 5090 D相对上代提升巨大,是更加高效的升级选择。此外,RTX 5090 D新增了对4:2:2/10bit格式视频编解码的支持,我们使用Davinci Resolve 19 + Voukoder进行了编码测试对比,确实有明显的提升。
▲RTX 5090 D的两个第六代解码器在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧,而CPU即便拥有16核32线程,在面对这样的解码需求时也会严重卡顿
RTX 5090 D在视频解码方面同样十分强大,它配备的两个第六代解码器在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧。但如果用CPU来解码,就算是拥有16核32线程的锐龙9 9950X,来完成同样的解码工作也会出现严重卡顿,无法流畅预览。可见对于视频剪辑师来说,RTX 5090 D新一代的编解码器确实会带来更高的工作效率。
DLSS 4应用与游戏测试
首发宣布支持DLSS 4的游戏有75款,现在我们可以通过NVIDIA提供的测试代码来激活一些游戏的DLSS 4测试分支版本,更多的游戏将会在晚些时候陆续上线对DLSS 4的支持。在原生支持DLSS 4的游戏中,我们可以选择多帧生成的倍率(4×、3×、2×),而在非原生支持DLSS 4的部分游戏中,我们也可以通过NVIDIA APP来设置使用的模型(新的Transformer或者上代的CNN)与多帧生成倍率。
▲RTX 5090 D在《赛博朋克2077》中启用DLSS 4 + 4×帧生成,4K极限光追画质下也可以能达到300fps左右的帧率
在《赛博朋克2077》的DLSS 4测试分支版本中,我们可以详细比较RTX 5090 D使用Transformer模型的DLSS 4模式不同倍率帧生成设置下的帧率,也可以比较CNN和Transformer模型同在2×帧生成下的效率(使用CNN模型的DLSS 3只支持2×帧生成)。
从测试结果来看,在DLSS 4模式下,启用4×、3×和2×帧生成,RTX 5090 D的帧率相对原生分别提升了746%、571%和、377%,提升幅度可以说是非常夸张了。同时,我们也可以看到,使用Transformer模型实现2×帧生成,相对DLSS 3的CNN模型也有7%的帧率提升,可见新模型的使用确实也进一步提升了DLSS 4的性能。
上代RTX 4090 D在《赛博朋克2077》中只能使用CNN模型加持的DLSS 3模式,因此只支持2×帧生成,而拥有4×帧生成的RTX 5090 D帧率足足是它的260%,相对它的原生帧率更是提升了惊人的1038%。
▲RTX 5090 D在《霍格沃兹之遗》中启用DLSS 4 + 4×帧生成,4K极限光追画质下实时帧率可以轻松达到300fps~400fps+
《霍格沃兹之遗》的DLSS 4测试分支版本中,4×帧生成和3×帧生成使用了新的Transformer模型,不过在2×帧生成模式下,它还是调用的CNN模型。从测试结果来看,RTX 5090 D使用DLSS 4和4×帧生成,相对原生的帧率提升了309%,3×则提升了195%,使用上代的DLSS 3 + 2×帧生成模式,也提升了97%之多。如果和RTX 4090 D的DLSS 3 + 2×帧生成相比,最高提升幅度达到了108%,和RTX 4090 D原生帧率比,则提升幅度最高达到432%。大家可能担心开启4×帧生成会带来更高的延迟,但从我们的测试来看,使用4×帧生成的渲染延迟与平均PC延迟与2×帧生成相比并没有明显变化,可见完全不用担心这个问题。
▲RTX 5090 D在《霍格沃兹之遗》中启用Override模式的DLSS 4 + 4×帧生成,4K极限画质下实时帧率高达400fps+
《漫威争锋》暂时没有原生支持DLSS 4,不过可以在NVIDIA APP中使用Override模式来开启DLSS 4和多帧生成。可以看到,在 4×/3×帧生成模式下,RTX 5090 D的帧率相对于原生分别提升了289%和217%,而同样使用2×帧生成模式,使用Transformer模型相对CNN模型也提升了6%。而RTX 5090 D采用4×帧生成的帧率相对采用DLSS 3 + 2×帧生成的RTX 4090 D则提升了137%,和原生比更是提升了419%。延迟部分,可以看到RTX 5090 D在几种帧生成比例下的渲染延迟与PC延迟差别都很小,所以对于玩家来讲直接启用DLSS 4的4×帧生成无疑是获得高帧率和流畅操作的最佳选择。
▲RTX 5090 D在D5渲染器中使用Override模式开启DLSS 4和4×帧生成,实时预览帧率暴增
除了游戏之外,DLSS 4在3D渲染类生产力软件中也能大显神通,目前D5渲染器也可以通过Override模式来支持DLSS 4和多帧生成,从而提供更流畅、更高效的使用体验。从测试来看,开启DLSS 4和4×帧生成,RTX 5090 D的帧率相比原生(关闭超分辨率、光线重建和帧生成)提升了291%,比仅有DLSS 3和2×帧生成的RTX 4090 D提升了207%,比它的原生帧率提升了561%。可以说这个提升幅度达到了惊人的水平,对于设计师用户来说堪称史诗级的体验升级。
AI性能测试
▲RTX 5090 D在UL Procyon的AI出图测试中使用FLUX.1模型/FP4精度设置,出图速度相对FP8精度提升约70%
前面介绍过,Blackwell架构的一大革新就是内置的第五代Tensor Core支持FP4精度的计算,相对Ada架构的Tensor Core性能提升了一倍。我们这里就使用UL Procyon的AI生图测试来考查RTX 5090 D的在FP8和FP4精度下的AI性能。从测试来看,同样使用FLUX.1模型生成1024×1024的图片,RTX 5090 D在FP4下的出图速度相当于FP8模式下的170%,而RTX 4090 D不支持FP4模式,所以从FP8模式切换到FP4模式出图时间几乎增加了一倍,所以RTX 5090 D在FP4模式下出图速度大约比RTX 4090 D快了413%。由此可见,对于需要快速AI出图、且对精度要求并不苛刻的用户来讲,支持FP4精度的RTX 5090 D无疑是效率远超上代旗舰的神器。
功率与温度表现
▲RTX 5090 D超级雕(白)满载考机整板功率600W,GPU温度不到72℃,风扇噪声小,散热效果出色
▲RTX 5090 D超级雕(白)在游戏中的实时功率从400W~600W不等,视游戏而定
我们使用FurMark对RTX 5090 D超级雕(白)进行满载考机测试,可以看到这时候整板功率达到了600W上限,GPU功率则保持在230W水平。得益于强大的风之力三风扇散热系统,RTX 5090 D超级雕(白)的GPU和显存考机温度都仅有72℃左右,风扇噪声也控制得很好,对于旗舰级显卡来讲,这样的使用体验也是非常突出的,即便玩家长时间玩游戏或进行AI计算,也不用担心过热影响稳定性和使用寿命。
总结:AI渲染时代的新王者,游戏与工作双料神器
最后来简单总结一下。采用全新Blackwell架构的RTX 5090 D首先从硬件层面就完成了从传统渲染时代到AI渲染时代的进化,突破了制造工艺、功率等硬件条件带来的性能升级瓶颈,为业界展示了GPU设计的新方向。可以毫不夸张地说,未来的GPU,完全拥抱AI是必然趋势,而在这方面,NVIDIA是领军者,拥有无可比拟的优势。
在此基础上,RTX 5090 D带来了一系列基于AI技术的新功能,将游戏流畅度和画质水平都提升到了新的高度,为玩家提供了更加极致的游戏体验。RTX 50系GPU还独享采用Transformer新模型的DLSS 4以及多帧生成技术,开启之后可以让游戏帧率暴增数倍,同时还拥有比上代CNN模型加持的DLSS 3更好的画质,这一点可以说是发烧级游戏玩家毫不犹豫升级的首要因素。
对于AI和生产力用户来讲,RTX 5090 D增加了对FP4精度的支持,能够提供更快的AI计算速度(也为AI渲染提供了强大的硬件基础),同时它还拥有当前最高规格的32GB/512bit/GDDR7显存配置,对于AIGC用户来讲无疑是当下最为高效的工具。此外,它还内置了3×第九代编码器和2×第六代解码器,新增支持4:2:2/10bit编解码,对于视频剪辑用户来说也堪称神兵利器。当然,在3D设计工具中,RTX 5090 D也提供了远超上代RTX 4090 D的性能。因此,综合来看,对于追求极致效率的设计师用户来讲,RTX 5090 D也是目前的顶配选择。
而技嘉RTX 5090 D超级雕(白)作为RTX 5090 D中的豪华旗舰,不但拥有600W的性能释放水平,还配备了强大的风之力散热系统,同时在外观颜值方面也达到了顶级旗舰水平,不愧为发烧级玩家和高端设计师用户首选的升级目标。
当然,对于追求性价比的玩家,也可以关注技嘉旗下的风魔系列RTX 5090 D显卡,例如RTX 5090 D风魔,首发价格16499元,它搭配了新一代仿生风扇,有效降低了风阻和噪声,还可将风压提升53.6%、风量提升12.5%。同时它还升级了导热凝胶,配备大型均热板和复合式热管、进气格栅等散热技术,性能输出强劲、而且耐用又超值。
分享到:
评论区(0条)
本文作者
电脑报编辑
认真是一种态度
私信他的更多文章
更多评测