王诚
规格方面,RTX 4070采用了和RTX 4070 Ti同样的AD104核心,只是有些许精简。它拥有4 组GPC、23组TPC,SM单元为46个,CUDA核心数量则为5888个。此外,纹理单元、光栅单元、RT Cores、Tensor Cores和二级缓存也对应的有所缩减,因此整体芯片的规模大约为RTX 4070 Ti 的76.7%。GPU频率部分,RTX 4070的最高加速频率也略低于RTX 4070Ti。不过,RTX 4070的显存系统与RTX 4070 Ti是一样的,都是12GB/192bit/GDDR6X,带宽也同为504GB/s。
虽然和上代的两款“70”相比,RTX 4070的GPC、TPC以及RT Cores 和Tensor Cores 并没有数量优势, 但大家不要忘了它是采用的Ada Lovelace 新架构, 不但RT Cores 和Tensor Cores 全都领先一代,还采用了全新的SM 单元设计,效率方面提升非常大,而且GPU 的频率也高出许多,因此综合下来性能反而大幅增加。显存规格方面也是如此,即便RTX 4070配备的是192bit 显存位宽,但容量高达8 倍的二级缓存和更高的显存频率带来了更高的数据交换效率提升,综合下来性能反而大幅增长,由此也更加凸显RTX 40系列高效的特性。官方给RTX4070 的性能定位是2K 分辨率下提供超100fps 的电竞级高帧率游戏体验,从硬件规格来看,RTX 4070 确实能够拥有这样的实力。
RTX 40系列还有一大特色就是高能效。从RTX 40开始,我们并不能简单地以显卡功率输出高低来判定其性能高低,这是因为RTX 40系列大多数时候在达到功率墙之前,就已经跑在极限频率上输出最高性能,所以从实测数据来看,RTX 40系列的游戏功率一般都会小于官方标注的整板功率值。
表格中的数据已经显示RTX 4070平均游戏功率只有186W,这只是RTX 3070 Ti的77.5%,因此它对电源、散热器的要求大大降低,不但降低了玩家的装机成本,更低的风扇噪声也提升了使用体验。由于功率的降低,显卡厂商在生产RTX 4070时可以选择使用16pin辅助供电,也可以选择单8pin 辅助供电,这对于喜欢高性能ITX 小卡的玩家来说是个好消息。
NVIDIA 官方给RTX 4070 的定位是2K 下超过100fps 的游戏体验,不过我们也加入了4K 下的成绩,方便大家参考。综合来看,纯光栅游戏中,RTX 4070 在2K 下相对RTX 3070 Ti 的提升大约为9%~38%,平均提升幅度为19%,4K 下提升14%。和RTX 4070 Ti 相比,2K 和4K 下分别是它的81% 和80%,可以说定位非常精准。
在開启光追后,RTX 4070 在2K 下相对于RTX 3070 Ti 提升在13%~29% 之间,平均优势为24%;在开启DLSS 2 后,提升在15%~34%,平均为22%。4K 下相对于RTX 3070 Ti 的平均提升则为19%,也非常符合官方的精准定位。
DLSS 3是RTX 40系列的独门绝技,我们也单独进行了对比测试。总体来看,开启DLSS 3 后,RTX 4070确实可以实现“2K百帧”光追游戏体验,可见RTX 40系列独有的光学多帧生成技术在这里的效果显著,相对上代RTX 30的DLSS 2优势非常明显,在《赛博朋克2077》中的帧率甚至是RTX 3070 Ti开DLSS 2的2.23倍。
我们用《瘟疫传说:安魂曲》对DLSS 3 的画质也进行了测评。从截图可以看到,即便是最注重帧率的DLSS 3性能模式,其画面精度也完全不输原生4K,而它的帧率则相当于原生4K 的2.63 倍,等于是画面效果与高帧率兼得,为玩家提供了两全其美的游戏体验。当然,我们也可以从FrameView 的帧率显示看到RTX 4070在DLSS 3的支持下,甚至能在4K 光追设置下达到百帧,可见DLSS 3黑科技的强大。
生产力性能测试
SPECView 包含了大量的工业软件测试项目,在2020V3.1版本中,RTX 4070 相对于RTX 3070 Ti 的提升还是很明显的。其中Energy 能源测试集的提升最大,是RTX 3070 Ti 的1.8 倍。
Blender Benchmark 3.3中,RTX 4070对比RTX 3070 Ti提升也很明显,其中monster 和classroom 的性能是RTX 3070Ti 的1.6 倍和1.5 倍左右,junkshop 则是有23% 的提升。
RTX 4070 在V-Ray 中无论是使用RTX 还是CUDA相对于RTX 3070 Ti 都能实现20% 以上的渲染效率提升,使用RTX的提升会更大一些。而OC 渲染器中的性能提升则是33%~40%。由于RTX 4070 有12GB 显存,所以其3D 渲染类生产力表现比8GB 的RTX 3070 Ti 好不少。
视频剪辑方面,从Premiere Pro 2023来看,RTX 4070 也是强过RTX 3070 Ti 的。而编码输出方面,RTX 4070 新版编码器效率不错,不但支持AV1,而且H.265编码速度也相对RTX3070 Ti 有明显的速度提升。
说到RTX 4070 的AV1 硬件编码,就不得不提同码率下AV1相对H.264 的画质优势。从我们录制的《赛博朋克2077》游戏视频截图对比(都为4K/60fps/10Mbps 码率)来看,AV1 编码画质可以说是好出H.264 几个档次,铁丝网边缘平滑度和整个画面的精度差异都非常明显。可见对于有视频转码需求的用户来讲,支持AV1 硬件编码的RTX 4070 无疑更加值得选择。
AI应用在今年突然井喷,普及速度之快令人吃惊,未来AI必将成为日常工作必须掌握的技能。我们知道NVIDIA很早就开始布局AI 计算,CUDA的生态圈在业界无可匹敌,到了RTX 40 时代,更是成为了AI 应用的必备利器。这里我们就用Stable Diffusion来测试RTX 4070 在AI 出图方面的性能。出图的参数配置如图,从测试成绩可以看到,RTX 4070每分钟可以出图9.1 张,速度是RTX 3070 Ti 的1.32倍,是RTX 4070 Ti 的85%。当然,大家也可以看到,CPU 很显然不适合做这样的并行计算,就算Core i913900K,出图速度也只有RTX 4070的0.9% 不到。此外,如果出图分辨率更高,对显卡显存容量的要求也会更高,这方面12GB显存的RTX 4070 无疑也比8GB 显存的RTX 3070 Ti更有优势。
前面已经介绍过,RTX 4070的平均游戏功率可以控制在186W的水平。从我们用NVIDIA FrameView 工具监测的情况来看,6款游戏大作中RTX 4070的游戏功率最高也没达到200W,多数时候都保持在160W~180W之间,可见其能效比确实非常出色。此外,RTX 4070 的GPU 考机温度最高为68℃,可见在散热方面也是没有什么压力的,这也为玩家也提供了一个不错的使用环境。
基于NVIDIA定制4N 工艺打造的新一代NVIDIA AdaLovelace 架构GPU,让RTX 40系列相对上代RTX 30系有了性能上的飞跃, 而第三代RT Cores和第四代TensorCores 也让游戏与生产力应用中的光追与AI 加速提升到了一个新的水平。
RTX 40系列全新加入的光流加速器,带来了DLSS3 技术的AI 光学多帧生成,大幅增加了游戏帧率,最终实现2~4 倍的光追游戏性能提升。同时,DLSS 3 的普及速度是DLSS 2 的7 倍(目前已经有35+ 的游戏支持DLSS 3),83% 的RTX 40 用户都在游戏中开启了光追,这也证明了这一代架构确实是史无前例的优秀,也是玩家全面进入光追+DLSS 游戲时代的最佳方案。
此外,今年由ChatGPT 引发的AI 革命式井喷,让更多的人开始关注并加入到AI 创意设计中来,特别是拥有一款RTX40 GPU 来实现AI 出图已经成为了新的热潮。NVIDIA 在AI计算这方面早已布局多年,软硬件生态已经无可匹敌,RTX 40系列更是拥有第四代Tensor Cores 和强大的CUDA 算力,为AI 用户提供了当下效率最高、兼容性最佳的解决方案。
有了以上这些光环加身,再来看RTX 40 家族第4 位登场的高性能甜品RTX 4070,你就会更加清楚地了解到它的优势了。
游戏性能方面,RTX 4070 相对RTX 3070 Ti 大约有20% 的综合提升,而在开启DLSS 3 之后优势甚至可实现翻倍(例如在《赛博朋克2077》中就是RTX 3070 Ti 开DLSS 2的2.23 倍),考虑到DLSS 3 普及的速度是DLSS 2的7倍,买RTX 4070 也就意味着在以后的游戏大作中能获得翻倍的性能,这也让RTX 4070的性价比显得更加爆棚了。
能效比方面,RTX 4070整板功率仅有200W,平均游戏功率更是只有186W,对电源和散热的要求都更加平易近人,不但降低了玩家的装机成本,也有效提升了使用体验,特别适合RTX 2070 Super老用户升级,也是万元以下游戏装机的最佳方案。
生产力部分,无论是3D 渲染类还是视频剪辑类应用,RTX4070 相对RTX 3070 Ti 都有明显的效率提升, 同时12GB大显存也带来了更多的优势。在眼下火热的AI 应用中,RTX4070 凭借全新的架构也带来了更强悍的生产力效率,对于着眼未来AI 应用的玩家来讲,也确实是一款必备的甜品级高效利器。
总而言之,不管你需要一款能够在2K 分辨率下以100fps以上高帧率畅享光追游戏大作的强力GPU,还是一款能够大幅提升创意设计效率、确保你在AI 时代立于不败之地的生产力工具,RTX 4070 都是目前这个价位上最好的选择。