NVIDIA AI与生产力应用
随着CUDA生态、深度学习生态的发展,从前只能在科幻作品中见到的诸多技术也随着新一代GPU的普及成为现实。尤其随着NVIDIA AI与TensorRT等技术栈的发布,诸多先进的生成式AI技术能够在用户的电脑上使用GeForce RTX家族的游戏显卡展开。
例如,在Stable Diffusion中,我们可以使用TensorRT显著加速SDXL大模型图像生成。我们使用官方提供的TensorRT拓展包训练了基于TensorRT的SDXL加速引擎,并使用1024x1024尺寸、采样50步、CFG SCALE 7的配置生成10批单张图片进行性能测试。
可以看到,不启用TensorRT加速时,NVIDIA GeForce RTX 4070 SUPER Founders Edition花了237.4秒才生成图片。毫无疑问,考虑到我们给到的参数,这个成绩也十分值得赞誉,但在开启TensorRT加速后,SDXL的性能更是提升到一个更新的水平:区区118.3秒,近乎腰斩。而随着用户生成的图片数量/参数提升,使用TensorRT能够毫无疑问节约更多的时间和算力。考虑到NVIDIA GeForce RTX 4070 SUPER Founders Edition拥有12GB的VRAM空间,这张GPU十分适合新入行的专业人士作为创作平台。
除了Stable Diffusion之外,还有很多应用也能够使用NVIDIA AI加速。例如,On1 Resize AI 2023就是一款有效使用了NVIDIA AI技术栈的图像无损放大工具。
我们使用这一工具对几张图片进行了尺寸放大,可以看到,在AI技术加持下,画面的细节得到了良好的保留。
而在速度方面,每张图片的生成时间都在十秒以内,表现可以说是优秀了。
当然,除了基于AI、DLSS等技术栈的诸多工具之外,也有很多工具更依赖传统意义上的GPGPU能力。好在,Ada Lovelace家族凭借多年以来在计算机图形学领域的深耕,在这些方面也同样不落下风。
例如,随着RTX 40系推出的新一代NVENC硬件加速视频编解码器对H.264、HEVC/H.265与AV1三大主流视频格式提供了全面的支持,且其性能表现十分可观。我们使用DaVinci Resolve 18软件对一段ProRes 422 HQ格式的视频转码至AV1。
我们使用的素材来自Blender开源电影项目《钢铁之泪》,原素材使用ProRes 422 HQ格式编码,有4K和8K两个分辨率。使用DaVinci Resolve,我们在80000KB/s的码率下分别将两个分辨率的视频片段编码为H.265与AV1两个格式。可以看到,无论是4K还是8K分辨率,我们的NVIDIA GeForce RTX 4070 SUPER Founders Edition GPU凭借最新一代NVENC视频编解码器表现十分优异,能够以极高的效率完成素材编解码。
而在更注重传统工业应用领域(如3D建模、医学图形等)的SPECviewperf 2020中,我们也观测到NVIDIA GeForce RTX 4070 SUPER Founders Edition GPU的表现十分出色,即使是在Game Ready驱动下也能够提供相当优秀的工作站体验。
总结
从我们的测试结果来看,如果说NVIDIA GeForce RTX 4070 SUPER Founders Edition GPU在外观配色上做出的选择还略有争议的话,那么它在性能上的强势就毫无疑虑可言。继承了前辈RTX 4070 2K甜品的定位,它凭借着更巨大的规模能够轻松应对2K分辨率下最具挑战的3A游戏需求,即使是4K分辨率用户也可以在DLSS 3.5等现代图形技术的帮助下获得颇为可观的游戏体验。这张NVIDIA GeForce RTX 4070 SUPER Founders Edition GPU十分适合想要在2K分辨率下体验极限画质游戏的玩家们入手。
同时,伴随着以TensorRT SDK为代表的NVIDIA AI生态与技术栈的演化与更大规模的Ada加速器,我们看到新一代RTX 4070 SUPER GPU凭借着高达568 TOPS的AI算力在AIGC场景下也同样拥有十分强劲的性能表现,也同样十分适合入门级专业生成式AI用户选购.
英伟达GeForce RTX 40 Super系列现已上市,请到京东DIY Super超能年货节上选购GeForce RTX 4070 Super/80 Super 公版和合作伙伴显卡
还能继续膨胀
还得是麦当劳会整活啊。
【游戏导读】有时候,传统与现代文化的碰撞确实能产生意想不到的火花。