马宇川
北京时间2020年10月9日零点,本年度最受期待的一场处理器发布会:“WHERE GAMING BEGINS”(游戏从这里开始)终于召开,AMD公司总裁兼CEO苏姿丰博士正式发布了采用新一代Zen 3架构的AMD锐龙5000系列处理器,并带来了一系列好消息:Zen 3核心架构的每时钟周期指令数(IPC)性能比上一代Zen 2产品提升了多达19%;锐龙5000系列处理器的单线程性能得到大幅提升,高端产品的CINEBENCH R20处理器单线程性能突破630pts;锐龙5000系列处理器中的高端产品在游戏性能上已经全面超越现在的游戏处理器旗舰酷睿i9-10900K。那么AMD Zen 3处理器架构是如何实现性能大幅提升的,新一代AMD锐龙5000系列处理器由哪些产品组成,各自有什么特点,它们的价格如何呢?接下来就让我们通过目前AMD所公开的部分资料来先睹为快。
对于AMD处理器而言,Zen架构显然是这3年来最为重要的一款处理器架构。在2017年,正是凭借Zen架构,AMD处理器在技术上实现了质的飞跃,从挖掘机架构到Zen架构高达52%的IPC提升,让AMD处理器在性能上终于能与强劲的竞争对手平分秋色。同时AMD也不断对Zen架构进行升级、改造,保持了高速发展态势:在2018年,AMD发布了性能得到小幅提升的Zen+架构;在2019年IPC性能得到15%提升(与Zen架构对比)的Zen 2架构问世。而在仅仅时隔一年后,AMD就拿出了IPC性能较Zen 2架构提升多达19%的Zen 3架构。那么AMD到底为Zen 3处理器架构施加了什么“魔法”,让它在短期内就能获得如此大的进步呢?
CCX模块采用全新设计
从目前AMD公开的资料来看,zen 3架构最大的改变是CCX(CPU Complex)模块采用了全新设计。从zen架构开始,AMD锐龙处理器都是通过CCX模块来实现多核心配置。CCX是AMD Zen架构最基本的组成单元,ZenB寸代每个CCX模块拥有4颗核心,每个核心拥有自己独立的L1和L2缓存,一个CCX模块共享8MB L3缓存。每个CCX模块还拥有独立的DDR4内存控制器、PCIe控制器等I/O功能元器件。此外Zen时代处理器采用的生产工艺为14nm、12nm,工作频率不算太高,旗舰锐龙7 1800X的加速频率也就4.0GHz左右。
在zen 2时代,为了实现更多的处理器核心数量和更高的运算效率,AMD引入了MCM多芯片封装技术(multi-chip module)。首先,Zen 2架构将处理器的计算核心部分和I/O部分剥离,CCX模块不再具备I/O功能,只由纯粹的处理器计算核心组成。采用分离式设计的优势在于可以灵活配比不同数量的计算核心和I/O模块,以实现不同的规格。AMD为Zen 2设计了一个内置PCIe控制器、DDR4内存控制器、SATA控制器、usB控制器,采用12nm工艺打造的I/O模块。计算核心通过INFINITY FABRIC总线和I/O模块连接。Zen 2的计算核心则采用了更先进的7nm工艺,有助于缩小面积、提高频率、降低功耗。其CCX模块虽然仍是4核心设计,但借助7nm工艺、I/O模块的剥离,每个CCX模块的三级缓存容量翻倍达到16MB。同时在Zen 2上,AMD引入了CCD(Core Chiplet Die)大计算核心这个设计。简单地说,CCD就是将两个CCS模块封装在一个芯片内,彼此同样通过INFINITY FABRIC总线连接。这也就意味着AMDR需增加CCD模块,并与I/O模块连接就能轻松地制造出核心数量多得多的处理器,这也是我们能在Zen 2处理器上看到64核心锐龙Threadripper 3990X处理器的主要原因。
相比英特尔消费级处理器所用的环形总线架构,AMD通过MCM多芯片封装技术的确能更容易地实现多核心设计,但也有它的不足。目前在英特尔主流消费级处理器上,由于核心数不多,其所有核心是通过环状总线和L3缓存绑定在一起的。也就是说,所有处理器核心、缓存都挂靠在统一的总线上,每颗核心都可以快速访问L3缓存,其数据一致性也能通过统一的L3缓存得到保证,这样做的优势在于可以最大限度地提升处理器的性能和缓存的利用率。与此相应的是,Zen、Zen2架构都是独立的CCX 4核心模块化设计,各模块拥有独立的L3缓存,而且每个模块的L3缓存容量并不大,只有8MB(Zen)或16MB(Zen 2)。这就可能出现某核心在模块内缓存查找数据未命中,需要跨CCX到I/O模块中调用数据或到速度更慢的内存中调用的情况。而要执行这两个工作都需要通过INFINITY FABRIC总线去调用数据,这将显著增加延迟,降低处理器运算效率。毕竟从上一代锐龙处理器的数据来看,芯片之间INFINITY FABRIC总线的读取带宽虽然达到了51.2G B/s,写入带宽也有25.6GB,s,但跟传输速度轻松就能达到500GB/s以上的三级缓存相比还是慢了很多,计算核心需要等待待收到数据后才能运算。如果再考虑計算任务有缓存一致性要求(即要求所有L3缓存中的数据必须相同)的话,其实对每颗处理器核心来说最有用的缓存容量就是自己CCX模块内的那16MB(Zen 2)或8MB(Zen)。这也使得之前的锐龙处理器在对处理器核心数要求不太高的应用,如在所需核心数与竞争对手产品规格相近的应用中(注:因为竞争产品的核心数量较少,所以一般体现在游戏这样的消费级应用上),会由于缓存、内存延迟的问题在游戏中的表现要略逊于对手。而在对核心数要求更多的专业应用中,锐龙处理器则能凭借更强的核心运算能力完全掩盖掉这个不足。
因此在Zen 3上,为了提升处理器的游戏运行性能,AMD采用了一个看似简单的办法——扩大CCX规模,将CCX内的计算核心数量提升到8颗,同时把共享三级缓存容量扩大到32MB。8颗处理器核心都能高速、任意地访问这32M B缓存。简单地说,在Zen 3上每颗处理器核心最有用的缓存容量大幅提升到了32MB。对于只需要较少核心参与运行的游戏应用来说,翻倍的缓存容量显然提升了处理器在缓存中查找数据的命中概率,能有效减少跨CCX查找或访问内存的频率,可以明显提升处理器的运行效率。同时单CCX 8核心的设计也可以减少核心之间的通讯频率,降低延迟。对于8核心Zen 3处理器来说,它的所有核心都可以在一块芯片内高速通信,而zen 2的8核心处理器内部则需要跨CCX通过INFINITY FABRIC总线通信。对于16核心Zen 3处理器而言,它的内部则只存在与一个CCX通信的情况,而Zen 216核心处理器锐龙9 3950X内部的每个CCX都有与其他三个CCX进行通信的可能。
总的来看,虽然AMD并没有公开Zen 3 CCX内部是如何连接这8颗计算核心与三级缓存的,但毫无疑问肯定是通过比INFINITY FABRIC总线快得多的高速总线将它们全部捆绑在一起,有可能是与对手类似的环形总线设计,这也为处理器能高效执行那些对核心、线程数要求较少的任务打下了基础。
19%性能提升的“功臣”有六位
不过根据AMD官方描述,CCX架构的改变、缓存性能的提升只是Zen 3处理器获得总共19%性能提升的“功臣”之一,而为这19%性能提升做出贡献的“功臣”总计有六位。它们是:Cache Prefetching(缓存数据预取)贡献了2.7%的力量;Execution Engine(执行引擎)的改進贡献了3.3%;更先进的Branch Predictor(分支预测)贡献了1.3%;Micro-op Cache(微操作缓存)的改进贡献了2.7%;处理器采用了新的Front End前端架构,为性能提升贡献了多达4.6%的力量;在整数运算单元上,Zen 3架构提升了Load/Store(数据载入和存储)带宽,贡献同样高达4.6%。遗憾的是目前AMD并未公开大部分的创新、改进细节,只是表明相对Zen 2,Zen 3是一个完全的全新设计,这也是其性能可以在一年内就获得19%提升的关键所在。
仍是7nm,但是与锐龙XT系列处理器相同的7nm
在生产工艺方面,虽然Zen 3架构处理器仍采用台积电的7nm生产工艺打造,但它采用的是与今年中期发布的锐龙XT系列相同,得到小幅改进的7nm生产工艺。我们知道7nm工艺在去年的Zen 2处理器上就得到了采用,而台积电也在不断改进其工艺技术,因此在Zen 2架构的锐龙XT处理器上,它的工作频率较其他Zen 2处理器得到了小幅提升。在Zen 3架构上,处理器的加速频率更进一步提升到最高4.9GHz,已接近5.0GHz大关。AMD表示,Zen 3处理器的每瓦性能比第一代锐龙处理器提高了2.4倍,对比基于14nm工艺的英特尔Comet Lake酷睿处理器提高了2.8倍。
四款首发产品 覆盖从主流到旗舰
第一批上市的Zen 3处理器有四款,它们是锐龙9 5950X、锐龙95900X、锐龙7 5800X、锐龙5 5600X。其中锐龙9 5950X对应Zen 2旗舰,同样采用16核心、32线程设计的锐龙9 3950X,L3缓存总容量也是64MB,TDP热设计功耗为105W,但最高加速频率从锐龙9 3950X的4.7G Hz提升到了4.9GHz,同时处理器建议零售价为799美元,折合人民币约5365元,中国市场的零售价暂未公布。锐龙95900X则是为了取代锐龙9 3900XT、锐龙9 3900x设计的产品,同样采用12核心、24线程设计,L3缓存总容量仍为64MB,最高加速频率达到4.8GHz,分别比锐龙9 3900XT、锐龙9 3900X高了100MHz、200MHz。尽管其标称加速频率没有锐龙9 5950X高,但在AMD的宣传中却将锐龙95900X称为“目前世界上最好的游戏处理器”,我们分析这是因为锐龙95900X的核心数量少一些,因此发热量、温度相对更低,在实际的游戏运行中更容易达到高频率,带来性能增益。其建议零售价为549美元,折合人民币约3687元。
至于锐龙7 5800X则是为了替换现在的锐龙7 3800XT、锐龙7 3800X。单从规格上看,它与锐龙7 3800XT几乎完全相同,最高加速频率同为4.7GHz,L3缓存容量为32MB,TDP均为105W。当然就像我们在前面讲的那样,它们在内部架构上有大的区别,锐龙7 5800X采用单CCX设计,而锐龙7 3800XT需要两个CCX才能实现8核心、32HB三级缓存的规格。目前锐龙7 5800X的建议零售价为449美元,折合人民币约3015元。
由于定位高端,以上三款处理器上市时都不会附送散热器,用户可以自行为它们购买高端风冷或水冷散热器。作为面向主流用户的锐龙5 5600X则会向用户附送幽灵潜行(Wraith Stealth)65W静音版散热器。幽灵潜行只是一款性能一般的全铝制散热器,锐龙5 5600X之所以只搭配这样的散热器关键在于其TDP不高,仍只有65W。其他方面,作为替换锐龙5 3600X、锐龙5 3600的产品,它也采用了6核心、12线程设计。三级缓存总容量同为32MB,但最高加速频率从锐龙5 3600XT的4.5GHz提升到了4.6GHz。价格方面,相对于其他几款Zen 3产品,这款处理器要便宜不少,建议零售价只有299美元,折合人民币约2008元。所有这四款处理器都将在2020年11月5日上市销售。
性能获得大幅提升
尽管从技术规格来看四款Zen 3锐龙处理器与Zen 2产品相比领先并不多,但根据AMD目前公布的资料,借助新架构,Zen 3锐龙处理器在性能上获得了大幅提升。首先从锐龙9 5950X与锐龙9 3950X的对比来看,在内容创建性能上,它的最大性能领先幅度可达27%,出现在CAD应用《SOLIDWORKS 2019》上。在优势最小的视频编辑软件《ADOBE PREMIERE PRO 14.3.1》中,它也有5%的领先幅度。当然最值得关注的是在分辨率为1080p、高画质设定下的游戏测试中,其较锐龙9 3950X的游戏领先幅度普遍在28%以上,最小也有13%的优势。与酷睿i9-10900K相比,锐龙9 5950X则继续在需要调用多核心运算性能的渲染应用中碾压对手——在V-RAY 4.10的性能测试中领先对手59%;在部分游戏中则能小幅领先或与对手打平。
对于被称为“目前世界上最好的游戏处理器”:锐龙9 5900X,AMD则在资料中重点宣传了它的游戏性能,其游戏测试仍采用1080p分辨率、高画质的设定。相对于锐龙93900X,锐龙9 5900X在《英雄联盟》《绝地求生:大逃杀》《CS:GO》游戏中,分别实现了高达50%、46%、33%的游戏性能提升幅度;在《古墓丽影:暗影》《F1 2019》等多款游戏中也能轻松实现20%以上的性能提升。面对曾经的“游戏性能王者”:酷睿i9-10900K,它依然能在《英雄联盟》《CS:GO》中分别获得21%、19%的优势,在10款游戏对比测试中,锐龙9 5900X赢了9款,仅在《战地5》中小幅落后。能让锐龙9 5900X占据游戏性能宝座的关键就在于它的处理器单线程性能得到了大幅提升——根据AMD公开的资料显示,锐龙9 5900X的CINEBENCH R20处理器单线程性能达到631pts,而酷睿i9-10900K的单线程性能只有545pts左右,优势很大。
至于锐龙7 5800X、锐龙55600X,在AMD目前公开的资料中,AMD只简单地介绍了它们的每美元性能即用户每花一美元所能买到的性能。总的来看,锐龙7 5800X在单线程性能、多线程性能上的每美元性能都比与其对位的8核心、16线程處理器:酷睿i7-10700K要稍强一些,领先幅度在9%~11%左右。在1080p游戏性能测试中,两款处理器打平。而锐龙5 5600X则相对竞争对手有更明显的优势,同与其对位的6核心、12线程处理器:酷睿i5-10600K对比,锐龙5 5600X在单线程、多线程、1080p游戏性能上都全面胜出,领先幅度达13%~20%。
现有500系主板可轻松支持Zen 3处理器,400系主板未来也能用
为了让用户能方便地使用Zen 3处理器,AMD表示现有500系芯片组主板,如X570、B550、A520等主板只需将BIOS中的AGESA(AMD Generic Encapsulated Software Architecture,AMD通用封装软件架构)升级到1.0.8.0版本,就能让Zen 3处理器通过自检、引导。当然如果想获得更好的体验,则需用户将AGESA升级到1.1.0.0或更新的版本。简单一句话,不断升级500系主板的BIOS就是最正确的做法。
当然更激动人心的是,AMD确认X470、B450这类400系主板也能使用Zen 3处理器,目前AMD与主板厂商正在为400系主板联合开发支持Zen 3处理器的BIOS,预计在2021年1月首批BIOS就能上线发布。
11月5日展示Zen 3处理器的真正实力
从AMD目前公开的Zen 3处理器技术资料来看,毫无疑问它是非常诱人的——它具有在多线程性能、单线程性能、游戏性能全面击败竞争对手的实力,这是以往任何一代AMD处理器都没有取得的成绩。当然PPT归PPT,事实又是否如此呢?根据AMD目前透露的信息来看,AMD将在Zen 3处理器上市的当天即2020年11月5日也同步公开Zen 3处理器的第三方评测数据。毫无疑问,作为国内专业的硬件评测媒体,《微型计算机》评测室也将在第一时间对Zen 3处理器展开全面、详细的评测。因此要想了解Zen 3处理器的真实实力,那么就请继续关注《微型计算机》官方微信(微信号:MC-1981)、微博(微博号:微型计算机唐方微博)、今日头条(用户名:微型计算机)等新媒体与杂志平台为您带来的最新报道。