我们前面已经介绍过了多张基于RTX 5080 GPU的产品,而本次评测的这张则是索泰乘着RTX 50系GPU全面更新推出的全新旗舰显卡产品 - 索泰 GeForce RTX 5080 16GB AMP EXTREME INFINITY。当RTX 5080这颗次旗舰GPU配上全新旗舰产品线,究竟能碰撞出怎样的火花呢?不妨随着我们游侠硬件组的脚步一起来看看吧。
无限镜!
我们在之前《黑神话悟空》的索泰专题节目中测试了索泰家族多种不同的显卡方案,彼时笔者就相当欣赏索泰多样的设计风格为用户提供的选择权,而本次的AMP EXTREME INFINITY则是随RTX 50系一道推出的全新旗舰产品线,定位上介于天启和PGF中间,属于货真价实的旗舰定位,也在索泰的产品体系中新增了一套全新的设计语言-无限镜。这套独特而迷人的设计在ARGB灯光的辅助下创造出无限延伸、深邃神秘的空间感,为整机带来颇具超现实主义色彩的风格,在当下的显卡市场中算得上是一股新风。
然而,从正面来看,这张显卡在观感上相当凌厉,但通过金属中框上的线条又有效地降低了这套设计的攻击性,尽管并不突出但仍然相当耐看。正面几乎只有三个新一代环刃风扇,我们在散热部分再去细聊。
事实上,无限镜设计语言的两点并不在正面,而是在显卡的框架上。由于采用了灰色和金色的配色设计,整张显卡的外观相当华贵,中间密集的金属鳍片除了让气流更有效传出之外,在视觉上也分隔开整片金色中框,让整张显卡的配色十分均衡。同时,无论是右下角的ZOTAC GAMING字样还是下方的ARGB灯条都能够在Firestorm 5.0软件中进行细调,体验十分出色。
显卡顶部除了前面提到的散热鳍片与ARGB灯光之外,还有12V-2X6电源接口、BIOS快速切换按键与ARGB同步线,针对12V-2X6线的安全性风险,索泰也是引入了三项新技术:12V-2X6供电安全指示灯、方便理线的反向电源接口以及让接口更稳定的镀金设计,能够有效提升高功耗GPU的安装与理线体验,方便玩家维护自己的作战平台。
显卡右侧是一块完整的镜面面板,这才是无限镜设计的最大亮点。在点亮后,这块面板会显示出ARGB灯光照射的ZOTAC GAMING LOGO,成为空间感的最大功臣。
显卡的背面带有一块高强度合金背板,显著增加了显卡的结构强度,并且由于其镂空线条的特性也能够辅助整体的散热表现,让风能够轻松循环。
在接口上,这张索泰RTX 5080 AMP EXTREME INFINITY也延续了RTX 50系的标准,三组DP 2.1 80Gbps接口+1组HDMI 2.1 48Gbps满血接口,能够轻松应对当下与未来的高端显示器需求。
ICESTORM 3.0
本次索泰RTX 5080 AMP EXTREME INFINITY搭载的散热系统是经过迭代升级的ICESTORM 3.0。除了我们前面看到的三个环刃风扇、中框与背板使用的高强度合金材质之外,ICESTORM 3.0散热系统还引入了巨型VC均热板+镀镍复合热管+密集鳍片阵列的三板斧,能够显著提升显卡的散热效能,即便是满载游玩像赛博朋克2077、黑神话悟空这样的大型游戏也能够保持冷静,全面释放性能,为玩家提供畅快的游戏体验。
在我们的30分钟FurMark压力测试中,显卡稳定在360W的TGP,在25℃室温下GPU温度仅有66℃左右,此时风扇转速仅有50%左右,可以说这套散热系统还有足够的空间可供压榨,表现相当出色。
而在3Dmark Speed Way压力测试中,这张卡的帧率稳定性更是来到了99.3%,也是一个同样令人赞不绝口的成绩。
Firestorm 5.0
索泰旗下的Firestorm超频软件一直都以优秀的体验著称,本次随着RTX 50系GPU一并推出的5.0版本迎来了一次相当可观的大升级。全面革新UI界面,简化用户操作,优化底层逻辑,让性能调优更加简单。
打开Firestorm 5.0,第一个引入眼帘的就是GPU性能页面,用户可以在这里监测GPU的核心参数,并进行频率、电压与功耗/温度墙的优化与调整,并保存三组预设以供切换。
在灯效页面,用户可以针对显卡上三个不同的灯效区进行调整,既可以同步也可以分别适配自己喜欢的颜色,搭配包装箱内的ARGB同步线体验更加出色。
最左侧的状态栏能够允许用户更精密地监控GPU的性能参数,使用直观的折线图让用户更直观地了解现在GPU的运行情况,方便排查故障或监控软件Bug。
在风扇栏,用户可以监控并调整风扇的转速,同时在超频和静音两种VBIOS里进行切换。同时,我们也可以看到,Firestorm 5.0版本在UI语言上与我们今次测试的这张索泰RTX 5080 AMP EXTREME INFINITY十分契合,让人感受到索泰的细节把控相当到位。
图形架构的超级革命
本次RTX 50系游戏GPU搭载了NVIDIA最新锐的Blackwell架构,而基于NVIDIA以历史上有名的各位大神为GPU微架构起名的传统,本次Blackwell也是向著名数学家、统计学家 ,拉奥-布莱克韦尔定理的提出人戴维·哈罗德·布莱克韦尔的致敬。
由于半导体制造工艺以及商业可行的芯片尺寸逐渐逼近物理学极限,摩尔定律的终结已然是摆在台面上的不可忽视的问题。在RTX 50系Blackwell GPU上,NVIDIA引入了一个全新的概念-Neural Shaders神经网络着色器。
从名字上也可以看出来,本次Blackwell GPU的着色单元高度依赖AI算力,每一组Blackwell SM单元均是针对神经网络着色器架构进行特化的产物,与上一代Ada GPU SM单元仅有一半核心拥有INT32能力不同,在Blackwell上,每一组SM单元的着色器核心都能够执行FP32/INT32指令,搭配第五代Tensor Core与改进的乱序执行架构,能够显著提升显卡在运行包括DLSS在内的各种图形/AI负载时的效率。
在实际应用中,基于Blackwell GPU的Neural Shaders,开发者可以在游戏中部署基于神经网络的模型、贴图、材质与体积云等效果。开发者可以通过训练一个基础模型,在用户端进行实时推理的方式实现高质量、高效率且小体积的画面效果。与在本地完整烘焙光照、打包分发相比,采用基于Neural Shaders实现的AI着色同样也能显著提升游戏开发者侧的效率,可以说是让所有人都幸福的解决方案了。
在面向包括DLSS在内的各路AI应用的Tensor Core上,本次Blackwell引入的第五代Tensor Core支持了更低精度的FP4规格数据,这能够进一步压缩负载时的内存压力,在显存池受限的消费级游戏GPU上更是能显著提升如DLSS等技术的效果表现。同时,对于近年来逐渐成为业界焦点的Transformer模型而言,第五代Tensor Core的效果也是相当出彩,这一点在后面讲DLSS 4的时候也会提及。
说到显存,本次RTX 50系GPU全系引入革命性的GDDR7显存。由于采用了PAM-3信号调制技术,GDDR7显存能够在实现更高频率的同时显著降低功耗,且提升幅度十分可观:根据NVIDIA的说法,RTX 50系首发搭载的GDDR7颗粒能够在带来两倍于GDDR6显存的性能同时仅消耗一半的能量,提升幅度相当显著。
大规模GPU的能耗问题在如今愈发显著,而Blackwell架构通过更精细的电压控制与频率切换可以说是大幅优化了这一点。
对于消费级GPU而言,图形输出规格与视频编解码能力也是一个相当重要的参数,在这方面Blackwell自然也是不遑多让。本次RTX 50系GPU全面支持包括DP2.1 80Gbps在内的先进视频输出规格,在消费级GPU中鹤立鸡群。同时,NVENC与NVDEC分别升级到第九代与第六代,支持了AV1 UHQ、MV-HEVC与422规格视频的编解码,而同时基础的H.264解码效率也同样令人啧啧称奇。无论是多屏用户还是多媒体创作者,都能够得益于Blackwell架构带来的显著提升。
更多光线,更快上线
自从RTX 20系Turing架构首次向全世界展示实时光线追踪技术对电子游戏的表现力带来的革命以来,基于光线追踪技术构建游戏几乎成为了3D游戏的缺省选项。随着RTX 50系列的上市,第四代的RT Core也一并上线,与GPU架构的其他部分协作带来了更出彩的光追体验。
第四代RT Core在第三代Ada 光追单元的基础上将三角形引擎拆分成求交与解压引擎,并引入了线性扫描球体引擎,能够大幅提升光追单元的计算效率,配合前文提到的在GPU微架构与显存技术上的提升,提升幅度不可小觑。
在先进的光追单元加持下,本次RTX 50系Blackwell GPU引入了全新的RTX Mega Geometry与硬件加速曲线基元,结合前面架构分析时提到的神经网络着色器能够为开发者提供更多样的可能性,带来革命性的画面表现能力与游戏体验。
DLSS 4:一生二,再生三,再生万物
凭借着高性能的光流加速器与游戏开发商的深度合作,RTX 40系Ada GPU搭载的DLSS 3功能可以说是广受好评,去年推出的DLSS 3.5光线重建技术更是让玩家们在如《赛博朋克:2077》与《心灵杀手2》这样的游戏中享受了数百小时的视觉盛宴,笔者自己就专程为了体验《心灵杀手2》这部Remedy Entertainment十年磨一剑的神作专程组装了一台搭载RTX 4080 SUPER GPU的旗舰台式主机。而随着本次RTX 50系游戏GPU一并发布的全新技术 – DLSS 4更是在现有的帧生成管线上进一步拓宽了上限。
本次DLSS 4的一大亮点就是引入了Transformer模型替换了以往的卷积神经网络模型架构。传统的卷积神经网络模型架构在多年的更新中已经触及了性能极限,而全新的Transformer架构的性能不仅已经在Stable Diffusion等AI图片生成应用、ChatGPT等大语言模型中已经得到一次次的证实,而且它有能力根据画面的上下文进行推理,能够带来更稳定且符合逻辑的画面,减少鬼影、闪烁等现象随着DLSS 4的上线,包括超分辨率、帧生成在内的全套功能都将由更先进的Transformer模型驱动,带来显著提升的画面表现。
在这套截取自《心灵杀手2》亮瀑镇警局后院的对比图中,我们可以看到引入Transformer模型后,DLSS光线重建功能的画面表现得到了显著的提升。由于Transformer模型有能力通过“上下文”实现对画面的整体理解,在栅栏上我们能够明显看到铁丝的质感更为真实,而基于卷积神经网络模型的DLSS光线重建实现则由于它模型依赖卷积核的特性在这类场景中表现并不出色。
即使在像《地平线:西之绝境》这样不支持DLSS光线重建,仅支持DLSS超分辨率的游戏中,我们也能看到类似的改善。埃洛伊背包上的皮革线条在Transformer模型加持的DLSS超分辨率后仍然保持了相当明显的立体感,玩家可以显著的看到这个背包的缝制线条,对于游戏整体画面表现提升十分显著。
除了底层架构的革新之外,DLSS 4的另一大亮点就是它引入了多帧生成功能,允许游戏在DLSS 3帧生成技术的基础上生成更多帧数。同时,由于需要高效生成游戏画面,本次DLSS 4也引入了全新的AI光流算法以替代硬件光流加速器来加速光流场计算。综合而言,这套全新的DLSS 4管线能够带来40%的速度提升,同时还能降低30%的显存占用,可以说是相当强悍了。
在《战锤40K:暗潮》中,DLSS 4多帧生成能够实现最高画质下4K 137帧的游戏体验,提升高达10%,同时显存占用也比DLSS 3降低了0.4GB,为游戏开发者提供了更多空间用于引入高质量的画面技术。
而当我们将DLSS 4多帧生成技术与之前所有DLSS技术放在一起考虑时,我们会发现,目前DLSS技术已经能够做到让每十六个像素点中有15个由AI生成。在传统图形渲染架构革新与制程进化速度不断放缓的今天,依靠AI加速的DLSS而非暴力堆彻硬件规模(尽管NVIDIA在这方面也同样是武林高手)反而能够带来更显著的游戏体验上的提升。
而对于之前已经购买过NVIDIA GeForce RTX GPU的玩家而言,本次DLSS 4在底层架构上的提升也同样能够让诸位受益,正如我们曾经在DLSS 3.5光线重建上见到的一样。
Reflex 2:更低延迟的电竞体验
自从初代NVIDIA Reflex低延迟技术于2020年正式上线以来,这项通过优化游戏图形渲染管线以降低系统延迟的技术就在整个业界广受好评。无论是游戏开发商、外设厂商还是玩家都乐见并广泛接纳了这项极富盛名的技术,日前已有超过百款热门游戏进行支持,其中不乏如《反恐精英2》、《无畏契约》等热门电竞大作,它也是DLSS 3帧生成功能实现高可用性的重要基石。
而随着图形技术复杂度越来越高,NVIDIA Reflex 2也应运而生。它在初版Reflex的基础上引入了全新的Frame Warp技术,能够基于鼠标输入预判下一帧的画面,进一步降低系统延迟。
针对Reflex 2实现首发支持的两款游戏分别将会是The Finals与无畏契约,而这项技术尽管首发支持RTX 50系GPU,将会在未来扩展到全部RTX GPU阵容,让所有现代NVIDIA GeForce GPU的游戏用户体验到次世代的电竞体验。
RTX 5080:完整的GB203
本次我们评测的这颗RTX 5080 GPU基于完整的GB203核心打造,拥有7组GPC单元,42组TPC单元,84组SM单元,共计10752组CUDA核心。尽管仍然基于TSMC的4nm 4N定制工艺打造,但RTX 5080 GPU在前文提到的Tensor Core、RT Core、NVENC/DEC编解码器上都有显著提升,辅以全新的30Gbps GDDR7显存颗粒,在显存位宽保持256bit的前提下将显存带宽从上一代RTX 4080的716.8GB/s提升到960GB/s,在高带宽要求的现代游戏、图形专业应用与AI负载下能够带来十分可观的提升。全面的提升带来了整卡的功耗的小幅上涨,从320W TGP上涨到360W,但考虑到增幅只有40W,现有RTX 4080/4080 SUPER的用户应当可以在不更换任何配件的情况下直接升级。
我们使用如图所示的配置组装了测试平台并进行一些基础测试。
在3DMark的光栅渲染管线测试中,我们看到这张RTX 5080 AMP EXTREME INFINITY显卡在五个项目中都以相当可观的大比分对上一代的RTX 4080 SUPER实现完全超越。
而在两项基于NVIDIA RTX技术的光追测试中,我们也能看到相当可观的性能增幅。考虑到GB203与AD103相比在数字规格上并没有太显著的提升,这样的性能提升几乎完全依赖我们前文提到的Blackwell微架构层面的改进。即使不考虑DLSS相关的进步,光是从传统光栅和光追来看这一代显卡的提升就已经相当不容小觑了。
而DLSS 4的性能提升更是能让人惊掉下巴。NVIDIA为媒体提供了一套支持DLSS 4性能测试的3Dmark副本,我们也使用这套软件进行了一轮测试。可以看到,无论是在哪个模式下,开启DLSS后的性能表现都得到了相当显著的提升,而同样是基于DLSS 3与传统卷积神经网络管线的测试中,RTX 5080的性能仍然显著强于RTX 4080,在开启基于Transformer模型的DLSS 4多帧生成后,即使仍然只生成一帧,也能够进一步提升性能上限,表现实在是令人惊叹。
来吧,甜蜜的游戏时间
RTX 5080的规格与性能如此强大,搭配上DLSS 4多帧生成、全景光线追踪等现金图形技术,它的战场可以说有且只有一个:4K高刷高画质3A游戏体验。尤其是随着高质量的4K 160Hz高刷显示器越来越普及,选择RTX 5080,尤其是这张索泰的GEFORCE RTX 5080 16GB AMP EXTREME INFINITY显卡可以说是相当合理的一个选择。
当然了,前面测试完DLSS多帧生成的性能那么出色,不实际上点游戏看看也不合适。考虑到GPU规模和定位,本次评测将只专注于4K性能,同时,由于卷积神经网络模型与Transformer模型的性能差距并非本次评测的重点,且评测时间确实受限,笔者将不会针对卷积神经网络+DLSS多帧生成或DLSS 3+Transformer的性能进行完整测试与分析,敬请各位谅解。
《心灵杀手2》是首批带来DLSS 4支持的游戏中相当突出的一款,这主要是因为它是首款引入NVIDIA RTX Mega Geometry技术的游戏,这项技术能够智能地集中处理并更新复杂几何,实时进行光线追踪计算,不仅可以降低CPU占用率、提高游戏帧率,还能够降低复杂光线追踪场景下的显存消耗。同时,至少在我们测试使用的开发者预览版中,Remedy开放了选择卷积神经网络或Transformer模型的权限,这使得我们可以更全面的对比几个模式下的性能表现。然而,由于它原生针对DLSS 3.5开发的特性,这也是唯一一款我们在高画面预设+高光线追踪预设下进行测试的游戏。
可以看到,即使不开启多帧生成,完全依赖RTX 5080 GPU本身的架构升级与基于Transformer模型而非卷积神经网络的DLSS管线,心灵杀手也能够在高画面预设+高光追预设下轻松实现1% Low帧都有4K 60帧的表现,而在最高性能的DLSS 4X多帧生成模式下,目前最主流的4K 160Hz显示器都能够成为游戏的瓶颈,这对于心灵杀手2这款游戏来说确实令人震惊。
《赛博朋克2077》作为近几年NVIDIA展示图形技术革新的必备作品,在最新的2.21版本更新中正式引入DLSS 4技术,且同样允许玩家选择使用传统的卷积神经网络模型还是Transformer模型进行游戏,这也为我们提供了一个在实际游戏中探索两者表现的好办法。
在赛博朋克2077中,我们使用光线追踪:超速预设进行测试,而我们也同样能够看到基于Transformer模型而非卷积神经网络的DLSS管线在与高性能的RTX 50系GPU协作下的性能提升:DLSS性能几乎翻倍,从原先平均帧将将超越4K 30帧提升到1% Low帧都能接近4K 60帧,这样的性能提升对2077这样的一款对玩家操作要求颇高的第一人称ARPG游戏而言能够相当显著地感知到,确实是至关重要。
在另外几款首发的DLSS 4游戏作品中,我们也能够看到类似的表现。
如此好卡,不干活可惜了
除了打游戏之外,各类多媒体内容创作、3D建模等工作场景也是高性能GPU大展拳脚的好地方,尤其是索泰GEFORCE RTX 5080 16GB AMP EXTREME INFINITY的外观设计相当内敛,关闭RGB灯光后放在工作场景毫不突出,十分适合追求效率的专业人士选购。
对于工业级AI比较了解的读者一定听说过MLPerf的大名。作为行业标准级别的AI测试套件,我们本次引入了MLPerf Client这一面向端侧应用的AI测试套件。它基于Meta开源的LLaMa 2模型,能够有效测试系统在常见AI负载下的理论性能,我们以Token Generation Rate值为基准进行比较。可以看到,在所有四种负载中,RTX 5080 AMP EXTREME INFINITY都显著超越了作为基准的RTX 4080 SUPER GPU,这意味着在各类AI应用中,这张全新的RTX 5080 AMP EXTREME INFINITY都能够带来更高效能的表现。
除了偏理论的MLPerf Client,我们还能够通过Procyon套件测试RTX 5080 GPU在文生图与LLM应用下的实际性能表现,先来看看文生图。Procyon的文生图测试基于FLUX.1 Dev模型实现,能够分别测试FP4与FP8规格下的性能表现,这张表记录的则是生成一张图所需的平均时间。可以看到,RTX 5080 AMP EXTREME INFINITY在FP4或FP8下都拥有相当可观的性能提升,尤其是在RTX 50系第一次原生支持的FP4格式下,性能提升更是相当显著。对于日常使用的AI负载来说,采用FP4这样的低精度格式能够在不损失实用性的前提下显著提升效率,十分好用。
而在大语言模型测试环节,我们也看到了不可小觑的性能进步,尤其是在显存吞吐量更高的LLaMa大模型里。考虑到目前已经有很多在本地部署像Qwen或DeepSeek这样的大语言对话模型的方案,RTX 5080 AMP EXTREME INFINITY带来的性能提升显然是十分可喜的。
当然,并非所有生产力应用都引入了AI加速,那作为算力基座,这张RTX 5080 AMP EXTREME INFINITY表现如何呢?我们使用同样属于业界标准的SPECviewperf 2020 V3.1进行了全套的性能测试。从结果上可以看到,RTX 5080实现了相当可观且大幅度的领先,尤其是在Maya与Solidworks两项个人用户相当多的测试中提升十分显著。
而Vray6渲染器测试中,我们也看到了相当出色的性能表现。
总结
整套测试跑下来,我们对这张来自索泰的RTX 5080 AMP EXTREME INFINITY显卡十分欣赏。一方面,这套全新的无限镜设计语言可以说是一个同时具有优秀创意与良好执行的正面范例,显卡整体设计上相当和谐,搭配ARGB灯光与无限镜效果确实十分惊艳,但同时又不会在严肃场合显得出戏、突兀。而另一方面,RTX 50系GPU的全套先进特性在这张RTX 5080 AMP EXTREME INFINITY上展现的淋漓尽致,也同样能够让各类用户都感受到明显的体验提升。同时,随着这一代新GPU一并发布的Firestorm 5.0软件也通过革新的UI设计给人耳目一新的感觉。总的来说,这张RTX 5080 AMP EXTREME INFINITY是一张相当值得入手的高规格旗舰GPU。如果你是游戏玩家,或者打算选购一张高性能GPU用于工作场合,那么这张RTX 5080 AMP EXTREME INFINITY绝对是不能错过的。
2025年又一离谱事件发生了。
这下妙手不如举手了
这其实是一部岛国“爱情动作片”,更准确点来说,是一部相当少见的特摄艾薇。