DLSS 3加持的2K光追游戏高帧甜品!

2023-04-24 23:34王诚
电脑报 2023年15期
关键词:生产力编码优势

王诚

RTX 4070硬件规格详解

规格方面,RTX 4070采用了和RTX 4070 Ti同样的AD104核心,只是有些许精简。它拥有4 组GPC、23组TPC,SM单元为46个,CUDA核心数量则为5888个。此外,纹理单元、光栅单元、RT Cores、Tensor Cores和二级缓存也对应的有所缩减,因此整体芯片的规模大约为RTX 4070 Ti 的76.7%。GPU频率部分,RTX 4070的最高加速频率也略低于RTX 4070Ti。不过,RTX 4070的显存系统与RTX 4070 Ti是一样的,都是12GB/192bit/GDDR6X,带宽也同为504GB/s。

虽然和上代的两款“70”相比,RTX 4070的GPC、TPC以及RT Cores 和Tensor Cores 并没有数量优势, 但大家不要忘了它是采用的Ada Lovelace 新架构, 不但RT Cores 和Tensor Cores 全都领先一代,还采用了全新的SM 单元设计,效率方面提升非常大,而且GPU 的频率也高出许多,因此综合下来性能反而大幅增加。显存规格方面也是如此,即便RTX 4070配备的是192bit 显存位宽,但容量高达8 倍的二级缓存和更高的显存频率带来了更高的数据交换效率提升,综合下来性能反而大幅增长,由此也更加凸显RTX 40系列高效的特性。官方给RTX4070 的性能定位是2K 分辨率下提供超100fps 的电竞级高帧率游戏体验,从硬件规格来看,RTX 4070 确实能够拥有这样的实力。

RTX 40系列还有一大特色就是高能效。从RTX 40开始,我们并不能简单地以显卡功率输出高低来判定其性能高低,这是因为RTX 40系列大多数时候在达到功率墙之前,就已经跑在极限频率上输出最高性能,所以从实测数据来看,RTX 40系列的游戏功率一般都会小于官方标注的整板功率值。

表格中的数据已经显示RTX 4070平均游戏功率只有186W,这只是RTX 3070 Ti的77.5%,因此它对电源、散热器的要求大大降低,不但降低了玩家的装机成本,更低的风扇噪声也提升了使用体验。由于功率的降低,显卡厂商在生产RTX 4070时可以选择使用16pin辅助供电,也可以选择单8pin 辅助供电,这对于喜欢高性能ITX 小卡的玩家来说是个好消息。

游戏性能测试:2K光追利器,DLSS 3效率惊人

测试平台

光栅化游戏性能

NVIDIA 官方给RTX 4070 的定位是2K 下超过100fps 的游戏体验,不过我们也加入了4K 下的成绩,方便大家参考。综合来看,纯光栅游戏中,RTX 4070 在2K 下相对RTX 3070 Ti 的提升大约为9%~38%,平均提升幅度为19%,4K 下提升14%。和RTX 4070 Ti 相比,2K 和4K 下分别是它的81% 和80%,可以说定位非常精准。

光追+DLSS游戏性能

在開启光追后,RTX 4070 在2K 下相对于RTX 3070 Ti 提升在13%~29% 之间,平均优势为24%;在开启DLSS 2 后,提升在15%~34%,平均为22%。4K 下相对于RTX 3070 Ti 的平均提升则为19%,也非常符合官方的精准定位。

DLSS 3是RTX 40系列的独门绝技,我们也单独进行了对比测试。总体来看,开启DLSS 3 后,RTX 4070确实可以实现“2K百帧”光追游戏体验,可见RTX 40系列独有的光学多帧生成技术在这里的效果显著,相对上代RTX 30的DLSS 2优势非常明显,在《赛博朋克2077》中的帧率甚至是RTX 3070 Ti开DLSS 2的2.23倍。

我们用《瘟疫传说:安魂曲》对DLSS 3 的画质也进行了测评。从截图可以看到,即便是最注重帧率的DLSS 3性能模式,其画面精度也完全不输原生4K,而它的帧率则相当于原生4K 的2.63 倍,等于是画面效果与高帧率兼得,为玩家提供了两全其美的游戏体验。当然,我们也可以从FrameView 的帧率显示看到RTX 4070在DLSS 3的支持下,甚至能在4K 光追设置下达到百帧,可见DLSS 3黑科技的强大。

生产力性能测试:高效又稳定,生态无可匹敌视频剪辑与3D渲染

生产力性能测试

SPECView 包含了大量的工业软件测试项目,在2020V3.1版本中,RTX 4070 相对于RTX 3070 Ti 的提升还是很明显的。其中Energy 能源测试集的提升最大,是RTX 3070 Ti 的1.8 倍。

Blender Benchmark 3.3中,RTX 4070对比RTX 3070 Ti提升也很明显,其中monster 和classroom 的性能是RTX 3070Ti 的1.6 倍和1.5 倍左右,junkshop 则是有23% 的提升。

RTX 4070 在V-Ray 中无论是使用RTX 还是CUDA相对于RTX 3070 Ti 都能实现20% 以上的渲染效率提升,使用RTX的提升会更大一些。而OC 渲染器中的性能提升则是33%~40%。由于RTX 4070 有12GB 显存,所以其3D 渲染类生产力表现比8GB 的RTX 3070 Ti 好不少。

视频剪辑方面,从Premiere Pro 2023来看,RTX 4070 也是强过RTX 3070 Ti 的。而编码输出方面,RTX 4070 新版编码器效率不错,不但支持AV1,而且H.265编码速度也相对RTX3070 Ti 有明显的速度提升。

说到RTX 4070 的AV1 硬件编码,就不得不提同码率下AV1相对H.264 的画质优势。从我们录制的《赛博朋克2077》游戏视频截图对比(都为4K/60fps/10Mbps 码率)来看,AV1 编码画质可以说是好出H.264 几个档次,铁丝网边缘平滑度和整个画面的精度差异都非常明显。可见对于有视频转码需求的用户来讲,支持AV1 硬件编码的RTX 4070 无疑更加值得选择。

AI加速内容创作

AI应用在今年突然井喷,普及速度之快令人吃惊,未来AI必将成为日常工作必须掌握的技能。我们知道NVIDIA很早就开始布局AI 计算,CUDA的生态圈在业界无可匹敌,到了RTX 40 时代,更是成为了AI 应用的必备利器。这里我们就用Stable Diffusion来测试RTX 4070 在AI 出图方面的性能。出图的参数配置如图,从测试成绩可以看到,RTX 4070每分钟可以出图9.1 张,速度是RTX 3070 Ti 的1.32倍,是RTX 4070 Ti 的85%。当然,大家也可以看到,CPU 很显然不适合做这样的并行计算,就算Core i913900K,出图速度也只有RTX 4070的0.9% 不到。此外,如果出图分辨率更高,对显卡显存容量的要求也会更高,这方面12GB显存的RTX 4070 无疑也比8GB 显存的RTX 3070 Ti更有优势。

功耗与温度表现:玩游戏不到200W,散热轻松噪声小

前面已经介绍过,RTX 4070的平均游戏功率可以控制在186W的水平。从我们用NVIDIA FrameView 工具监测的情况来看,6款游戏大作中RTX 4070的游戏功率最高也没达到200W,多数时候都保持在160W~180W之间,可见其能效比确实非常出色。此外,RTX 4070 的GPU 考机温度最高为68℃,可见在散热方面也是没有什么压力的,这也为玩家也提供了一个不错的使用环境。

总结 2K高帧游戏神器,AI时代甜品贵宾券

基于NVIDIA定制4N 工艺打造的新一代NVIDIA AdaLovelace 架构GPU,让RTX 40系列相对上代RTX 30系有了性能上的飞跃, 而第三代RT Cores和第四代TensorCores 也让游戏与生产力应用中的光追与AI 加速提升到了一个新的水平。

RTX 40系列全新加入的光流加速器,带来了DLSS3 技术的AI 光学多帧生成,大幅增加了游戏帧率,最终实现2~4 倍的光追游戏性能提升。同时,DLSS 3 的普及速度是DLSS 2 的7 倍(目前已经有35+ 的游戏支持DLSS 3),83% 的RTX 40 用户都在游戏中开启了光追,这也证明了这一代架构确实是史无前例的优秀,也是玩家全面进入光追+DLSS 游戲时代的最佳方案。

此外,今年由ChatGPT 引发的AI 革命式井喷,让更多的人开始关注并加入到AI 创意设计中来,特别是拥有一款RTX40 GPU 来实现AI 出图已经成为了新的热潮。NVIDIA 在AI计算这方面早已布局多年,软硬件生态已经无可匹敌,RTX 40系列更是拥有第四代Tensor Cores 和强大的CUDA 算力,为AI 用户提供了当下效率最高、兼容性最佳的解决方案。

有了以上这些光环加身,再来看RTX 40 家族第4 位登场的高性能甜品RTX 4070,你就会更加清楚地了解到它的优势了。

游戏性能方面,RTX 4070 相对RTX 3070 Ti 大约有20% 的综合提升,而在开启DLSS 3 之后优势甚至可实现翻倍(例如在《赛博朋克2077》中就是RTX 3070 Ti 开DLSS 2的2.23 倍),考虑到DLSS 3 普及的速度是DLSS 2的7倍,买RTX 4070 也就意味着在以后的游戏大作中能获得翻倍的性能,这也让RTX 4070的性价比显得更加爆棚了。

能效比方面,RTX 4070整板功率仅有200W,平均游戏功率更是只有186W,对电源和散热的要求都更加平易近人,不但降低了玩家的装机成本,也有效提升了使用体验,特别适合RTX 2070 Super老用户升级,也是万元以下游戏装机的最佳方案。

生产力部分,无论是3D 渲染类还是视频剪辑类应用,RTX4070 相对RTX 3070 Ti 都有明显的效率提升, 同时12GB大显存也带来了更多的优势。在眼下火热的AI 应用中,RTX4070 凭借全新的架构也带来了更强悍的生产力效率,对于着眼未来AI 应用的玩家来讲,也确实是一款必备的甜品级高效利器。

总而言之,不管你需要一款能够在2K 分辨率下以100fps以上高帧率畅享光追游戏大作的强力GPU,还是一款能够大幅提升创意设计效率、确保你在AI 时代立于不败之地的生产力工具,RTX 4070 都是目前这个价位上最好的选择。

猜你喜欢
生产力编码优势
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
矮的优势
子带编码在图像压缩编码中的应用
Genome and healthcare
画与话
把“风景”转化成“生产力
人口红利与提高生产力
谈“五老”的五大特殊优势
展望2014:推动科技创新转化为第一生产力