鱼慕言 瑾行
标题标题
在英伟达RTX 30系列显卡表现出强大的性能之后,不少人都十分期待作为老对手的AMD会如何应对。10月28日,AMD自信满满地展示了新的RDNA2架构和相应的Radeon RX 6800/6800 XT、6900XT三款显卡,给人留下了很深的印象。随着北京时间11月18日RX6800/RX 6800 XT的正式发售,其相关性能数据也正式曝光,宣布了多年之后,A卡终于又一次可以在高端甚至顶级显卡市场上与对手分庭抗礼了。
作为和新一代游戏主机GPU同一架构的RX 6000系列显卡,其先锋产品RX 6800/RX 6800 XT当然会引起很多玩家的关注,RDNA2究竟是一款怎样的架构,RX 6000显卡又能带给我们怎样的体验呢?
作为AMD新一代顯示核心架构,RDNA2的发布和上市时间其实都早于大部分电脑玩家的认知,它的第一次露面和第一批产品是和新一代游戏主机“捆绑”在一起的。在上半年的XboxSeries X和PS5发布时,其基于RNDA2的显示核心(图1)规格与能力就已经不再是秘密了。
不过在主机的核心中,RNDA2架构GPU是与Zen2架构处理器集成在一起的,加上为了融合而进行的设计,使其与独立的GPU有一些不同,要想了解真正的RNDA2架构,还得看RX6000显卡使用的独立GPU(图2)。
从结构布局上看,前一代的RDNA(图3)显示架构就已经很像是Zen系列处理器架构(图4)了,其核心群(类似处理器里的CCX)位于两侧,中间则部署了几何引擎等附加模块,RNDA2就更有些类似Zen2的使用了远超前辈的内置缓存(图5)。它们均与AMD之前的GPU或英伟达一直持续至今的GPU设计(图6)有明显区别。
在RDNA2架构中,位于核心中央部分的128MB大容量缓存被命名为InfinityCache,这种设计不光提升了内部计算的效率,而且可以实现高速访问和超大位宽,用内部存储的超大带宽弥补RDNA2架构GPU外部带宽较小、显存频率较低的问题(图7)。而其位置从RDNA架构的周边移至整个芯片的中央位置,则更可能与Zen3架构的设计类似,这样InfinityCache就可以作为多个核心群组的统一共享缓存,提升各个核心群组间数据相互调用的效率,也就提升了协作处理能力。
RDNA2的另外一大变化就是内置硬件光线追踪处理能力,使用与核心单元1:1配置的光追处理单元RayAccelerator,可以完整支持DX12终极版(DirectX12Ultimate)包括光线追踪在内的所有特效(图8)。
在对外通信技术上,RDNA2也有所创新,开创了SmartAccessMemory技术,可以让锐龙5000系列处理器直接访问RadeonRX6000系列显卡的全部显存(图9)而非其他显卡的256MB专用空间。这一技术使得处理器可以和显卡直接进行大量数据交换,充分利用AMD消费级平台目前独有的PCIe4.0高带宽总线,不再让PCIe4.0显卡插槽的高带宽变成“摆设”。而且目前这一技术只支持B550/X570平台,也更有利于主板的市场划分。
作为第一批上市的RX6000系列显卡,RX6800和RX6800XT的公版产品从正面看就像是“孪生兄弟”,它们采用银黑配色,安装3个9叶大直径风扇,边框部位的黑色为磨砂材质,有一圈红色条带作为装饰(图10)。其背部均为银色金属加强/散热背板,表面采用磨砂工艺,右下角则有大写的R作为logo。它们的侧面logo有小小的差别:RX6800XT是红色,而RX6800则是白色,分别采用同色灯效,装在机箱中也能清晰地分辨型号(图11)。
两款显卡的长宽都是267mm×120mm,对机箱的尺寸要求显然低于RTX30系列高端显卡。两者在厚度上有明显差别,RX6800XT采用了加强型散热设计,散热片厚度与RTX3080类似(图12),安装需要占用更大的空间。
它们的输出接口部分都采用了DP1.4×2+HDMI2.1+USBType-C的配置(图13),其中USBType-C接口主要是为VR设备和一些未来扩展而准备的,HDMI2.1则可以支持4K高刷新率显示器或8K显示输出。板载辅助电源接口则均为8Pin×2设计(图14),可以更好地兼容较老型号的电源。
RX6800/RX6800XT的报价均高于RTX3070而又明显低于RTX3080。形成了错位竞争,不过因为RTX3070/3080显卡目前均有明显的溢价,所以实际上形成了RTX6800与RTX3070直接对位,RX6800XT则比RTX3080便宜得多的态势。
由于并未采用浮点/整数通用核心,因此RX6800/RX6800XT的核心数量(一般是指浮点核心)比对位的英伟达型号都要少得多。不过考慮到RTX30系列是使用整数核心进行浮点运算来获得核心数量翻倍的效果,所以RTX3070/3080的“专业”浮点核心数量反而是少于RX6800/6800XT的,而整数核心进行浮点运算显然无法达到专业浮点核心的效率,加上RX6800系列的频率远超RTX3070/3080系列的对手,达到了2000MHz以上,甚至在这一基础上还可以通过驱动程序的RageMode(疯狂模式)进一步提升频率,所以在实际性能方面两者还是有得一拼。
最后,在内置InfinityCache的支持下,RX6800/RX6800XT显卡都采用了主流的GDDR6显存和较为保守的显存位宽,这样的设计使得GPU与显卡的成本都更低,增强了价格优势。
RX6800/RX6800XT显卡的规格无疑是十分优秀的,但实际性能表现究竟如何,还不能光看发布会上的数据,需要游戏实测来证明。我们仍采用酷睿i9-10900K处理器、32GB内存等近期的标准测试平台,AMD驱动则是官方提供的测试版产品,并未打开RageMode等特别优化技术和光线追踪等额外特效。为了避免处理器性能不足而影响显卡的发挥,本次测试全部使用更依赖显卡而非处理器性能的2K和4K分辨率。
在3DMark的GPU得分中,RX6800的4项测试成绩均领先于RTX3070且差距十分明显,在FireStrikeExtreme这一项目中甚至超过了RTX3080。而RX6800XT则在与RTX3080的对比中取得“三胜一负”的成绩,但分辨率和负载越高优势越小,在TimeSpyExtreme测试中还被反超,其原因可能是显存能力限制,也可能是驱动优化不足。
在实际游戏测试中,RX6800与RX6800XT在2K分辨率下的游戏帧数差12.60%,4K分辨率下则相差14.11%,比RTX3080/3070之间的差距小得多,非常符合其定价差距。
在与RTX30系列显卡的对比中,RX6800稳稳地战胜了RTX3070。两种分辨率下的领先幅度都在7%以上。而RX6800XT则与RTX3080互有胜负,4K分辨率下则明显略逊一筹,结合RX6800的表现看,除了游戏和驱动的优化外,应该也与两者的显存配置有一定关系。
至于光追测试,目前基于DX12的光追游戏都可以很好地在RX6800系列显卡上运行,不过开启后的帧速下降非常明显,与RTX20/30系列的表现类似。但N卡可以通过DLSS优化技术尽量提升帧速,而AMD类似的超分辨率FSR(FidelityFXSuperResolution)优化技术仍未完成,所以无法通过优化技术来提升帧速。好在RX6000除了PC领域外,还可以借助主机游戏开发平台的经验,应该可以加快针对不同游戏的FSR匹配工作,尽快为光追特效加速,使其更加实用。
RX6800/6800XT为我们带来的RX6000系列显卡首秀非常惊艳,AMD显卡不仅在高端市场上终于可以与对手性能相当,而且在某些型号的应用中还有了一定的优势,不用再一味地主攻中端主流市场、讨论性价比了。而新一代GPU架构引入的InfinityCache、SmartAccessMemory技术更是改变了GPU乃至PC的传统应用模式,意义非常重大。至于在光追优化技术、游戏优化设计等方面,再次崛起的A卡显然还有些欠缺,但它有着游戏主机“兄弟”的支援,相信也能很快弥补这些短板,为我们呈现更加完美的表现。