《微型计算机》评测室
第十一代酷睿处理器技术简介
融合两种处理器架构
第十一代酷睿处理器的代号为Rocket Lake- S,其最大更新是终于与使用已久的SkyLake架构说再见,换用全新的CypressCove处理器架构。Cypress Cove实质上是两种英特尔处理器架构的合体,其处理器计算核心部分与Ice Lake处理器使用的Sunny Cove架构非常类似。而Sunny Cove相比第六代酷睿处理器开始采用的Skylake架构(当时英特尔的CPU和微架构代号尚未分开,均称为“Skylake”)有大约18%的IPC提升。
不过有所区别的是,Cypress Cove仍采用14nm+++工藝生产。所以Cypress Cove处理器计算核心的本质是将本来为10nm工艺研发设计的Sunny Cove移植到14nm工艺上,但采用了全新的代号,这也是Cypress Cove的由来。Cypress Cove继承了Sunny Cove核心的所有优势,包括同时提升了通用性能和特殊性能,增加缓存容量、使得核心更宽,并增加了L1带宽等。缓存方面,Sunny Cove核心后端具有48KB L1数据缓存,比通常的32KB缓存增大了50%,理论上L1数据缓存未命中会降低22%。不仅如此,micro- op也就是uOp部分的缓存也较之前的2048- entry有所增加,第二级TLB缓存大小也增加了。增大TLB有助于降低地址数据由于容量不足被删除后重新查找并降低效率的概率,也可以降低延迟并提高性能。在架构设计方面,SunnyCove执行端口从8增加到了10,允许一次从调度指令中获得更多的指令并提交给执行端口,端口连接到循环数据存储后,带宽加倍的同时AGU也翻倍,更大的一级指令缓存也能起到一部分作用。执行端口方面,英特尔为Sunny Cove的整数部分配备了更多的LEA(有效地址载入)单元以帮助进行内存寻址计算,还增加了新的整数除法单元。浮点方面,Sunny Cove增加了重排序资源,带来了AVX- 512单元的设计,支持AVX512、SHA- NI指令集,并加入了512位的FMA单元,在加密解密性能上有非常大的提升。其处理器核心部分的整体性能相对前代产品带来了大约19%的IPC提升,这也是英特尔多年“挤牙膏”以来提升最大的一次。
相比Skylake微架构,Cypress Cove所对应的CPU核心面积比前代产品显著增大,再加上新的基于Xe架构的核芯显卡、新增加的PCIe 4.0通道以及各种控制单元等,因此本代RocketLake- S的处理器核心数量要少一些,最多只有8颗,毕竟处理器的生产工艺仍是14nm级别。此外,Rocket Lake- s处理器的最大改进就是支持PCIe 4.0技术,处理器提供了多达20条PCIe 4.0通道,其中16条可以用于PCIe 4.0显卡,另外4条则用于PCIe 4.0SSD。
显示核心部分,Cypress Cove则采用了在Tiger Lake处理器上使用的锐炬Xe图形核心,这也就是其第二种处理器技术架构的主要来源。不过由于桌面市场对这种集成GPU的性能要求并不高,因此Rocket Lake-S集成的GPU规模有所减少,从之前TigerLake集成的最多96个EU单元降低至目前最多32个EU单元(注:拥有32个EU单元的核芯显卡型号为UHD Graphics 750,拥有24个EU单元的核芯显卡型号为UHD Graphics 730)。即使EU单元数量大幅度降低,但受益于Xe架构本身的性能增幅,新的Rocket Lake- S的GPU性能相比之前的第九代HD核芯显卡依旧提升了最高50%,毕竟像之前HD Graphics 630这类高配版核芯显卡的EU单元也只有24个。
同时新的锐炬Xe图形核心还增加了对10bit AV1、12bitHEVC的硬件解码能力,以及其他Quick Sync Video技术。有关AV-1硬件解码方面,由于AV-1是开源、免费的规范且能相对H.265提供更高的压缩率和近似的画质,因此一经推出就广受欢迎,目前新的处理器支持AV-1的硬件解码也是顺应行业大势。
在AI计算方面,英特尔特别强调本次Rocket Lake- S的DLBoost深度学习加速能力,这个能力借由英特尔新的VNNI指令集实现,能够让CPU在执行有关AI相关计算时效能大幅度提升,尤其是可以使得AVX- 512能够支持INT8计算。英特尔在其他架构处理器上的对比测试显示,VNNI指令集的出现能够带来最高11倍的机器学习性能增益。在具体应用上,VNNI可以高速地执行图像分类、图像目标物体识别,如实现一键抠图、背景模糊及去除等相应的工作。同时,Rocket Lake- S内部也拥有GNA AI加速单元,可以帮助处理器执行语音类的人工智能及相关应用,比如语音的背景噪声消除以及语音的唤醒词识别。
其他方面,Rocket Lake-S还支持最新的Resizable BAR显存读取技术,可以让处理器访问显卡的全部显存,提升约10%左右的游戏性能。同时,处理器也提升了支持高频内存的能力提升,所有第十一代处理器原生就能支持DDR4 3200内存。
临时加入ABT加速技术,全核心频率最高可达5.1GHz
在具体产品方面,英特尔将推出多达19款Rocket Lake- S处理器,从顶级的酷睿i9-11900K到定位最低的酷睿i5-11400T,其中型号后缀有“K”的还是意味着这款处理器可以进行超频;后缀带“F”的,则表示这款处理器没有集成核芯显卡,性价比更高,适合独显平台;后缀带“T”的则表示该产品属于低功耗处理器,TDP热设计功耗只有35W。全系列Rocket Lake-S处理器只覆盖6核心、12线程的酷睿i5到8核心16线程的酷睿i7、酷睿i9处理器。
本次我们将对其中的酷睿i9-11900K,酷睿i5-11600K两款处理器进行测试。它们都支持超频,其中酷睿i9-11900K采用8核心、16线程设计,支持TVB加速技术,最高单核心加速频率为5.3GHz,这与上一代酷睿i9-10900K是完全一致的。但其全核心默认工作频率则从上代产品的4.9GHz下调到4.8GHz。不过可能考虑到核心数减少对处理器的多线程性能影响较大,因此在第十一代酷睿处理器发布前两周,英特尔又为其中的酷睿i9系列产品增加了名为ABT(Adaptive Boost Technology)的自适应加速技术。当处理器侦测到需调用3- 8颗核心同时执行任务时,可以将处理器的全核心工作频率加速到最高5.1GHz,这也让酷睿i9-11900K成为目前全核心频率最高的英特尔处理器。
当然各种加速技术的加入也让酷睿i9-11900K拥有了两套功耗标准,在主要以基础频率工作的PL1功耗标准运行时,它的TDP功耗为125W,但在放开限制,可以充分使用加速技术的PL2功耗标准下运行时,它的默认功耗则高达251W,因此用户在使用酷睿i9-11900K时必须选择优秀的水冷散热器。其他方面,该处理器还内置了拥有32个EU单元的UHD Graphics 750核芯显卡。酷睿i5- 11600K则采用6核心、12线程设计,定位中端,用来替换上代酷睿i5-10600K处理器,最高单核心加速频率为4.9GHz,全核心工作频率为4.6GHz,两个工作频率较酷睿i5-10600K都各增加了100MHz。尽管这款处理器不支持TVB技术、ABT加速技术,但它的功耗指标与酷睿i9-11900K相同,在PL1功耗标准下,功耗为125W,在PL2标准下,为251W。同时该处理器内置的也是UHD Graphics 750核芯显卡。
专为第十一代酷睿打造的500系游戏主板ROG MAXIMUS XⅢ HERO
而在Rocket Lake- s处理器发布的同时,英特尔也发布了专为它量身打造的Z590、B560、H510芯片组。相对于400系芯片组,500系芯片组最大的改变是将连接处理器与主板芯片组的DMI总线带宽从PCIe 3.0 x4提升到PCIe 3.0 x8,带宽达到8GB/s,能更好地对高性能存储设备提供支持。同时500系芯片组还原生支持带宽为20Gbps的USB 3.2 Gen 2x2接口,能把用户的移动存储设备传输速度提升到2000MB/s左右。
在其他接口方面,配合Rocket Lake- S处理器,500系列主板加入了对PCIe 4.0、Thunderbolt 4和Wi- Fi 6E的技术支持。有关Thunderbolt 4,实际上在之前的Tiger Lake上就已经支持了,本次只是将其平移至新的产品而已。在Wi- Fi 6E方面,相比Wi- Fi 6新增了6GHz频段的支持,部分主板也将其纳入本次支持列表。不过新的Wi- Fi 6E也需要相应的设备支持,才能获得性能增益。
对于能进行处理器超频的K系产品与Z590主板,英特尔还加入了AVX2、AVX- 512指令集OFFSET即工作倍频与电压的调节选项。如果处理器在超频后工作不稳定、发热量大,用户可以降低AVX这类不常用的指令集的工作频率,提升超频稳定性。
在本次测试中我们采用了来自ROG的MA XIMUS XⅢHERO Z590主板。这款主板采用14+2相供电设计,每相供电电路的所用MOSFET从支持60A电流的MOSFET升级为支持90A负载的Ti德州仪器CSD95410RRB Power Stages MOSFET。这也就意味着MAXIMUS XⅢ HERO的总计16相供电电路理论上最高可支持1440A的电流,能轻松保证第十一代酷睿处理器的正常工作与超频。此外,MAXIMUS XⅢ HERO主板还搭配了在高电流状态下更稳定、效率更高的MICROFINE合金电感,具备10000小时工作寿命的日系10K固态电容等高规格元器件。
为提升工作稳定性,MAXIMUS XⅢ HERO还加强了散热设计。该主板不仅配备了两块做工精良,通过热管连接的大面积供电散热模块,还在其中的CPU核心供电散热模块上连接了一块大型铝合金制I/O装甲,从而提高主板高发热区域的散热面积。同时MAXIMUS XⅢ HERO的其他区域也贯彻了大面积散热的思想,硕大的散热模块覆盖了所有四个M.2 SSD接口、主板芯片组,这也意味着几乎所有高发热配件都能借助散热片实现高效散热。而Z590芯片组的采用,MAXIMUS XⅢ HERO在技术规格方面也有了大幅提升。首先它可以支持第十一代、第十代两代处理器,给用户宽广的选择空间。同时它还提供了一根PCIe 4.0 x16显卡插槽,以及多达4个NVMe M.2 SSD接口,其中两个接口支持带宽翻倍的PCIe 4.0 x4,另外两个则支持PCIe 3.0 x4规范。
在内存部分,随着对新处理器的支持,MA X IMUS XⅢHERO的内存性能也有了一定提升。该主板加入了Optimem Ⅲ内存优化设计,采用Daisy Chain菊花链拓扑结构连接处理器与内存,并在顶层PCB加入了接地屏蔽、接地环以减少外部信号干扰与横向干扰,使得这款主板的内存频率最高可以达到DDR45333(注:需内存体质同样达到高水准)。
功能上,MAXIMUS X Ⅲ HERO也同步获得了大幅升级,它配备了两颗英特尔I225- V 2.5G网卡芯片,雙有线网卡设计,并搭配了英特尔最新的Wi- Fi 6E AX210+蓝牙5.2无线模块。相对于之前的Wi- Fi 6,Wi- Fi 6E新增了6GHz频段,其频段范围在5925~7125MHz,拥有更多的信道数,容量更大,吞吐量大大提升。
音频方面,MAXIMUS XⅢ HERO主板的SupremeFX 7.1声道音频系统则配备了瑞昱最新推出的Codec:输出信噪比为120dB、提供10条DAC通道的瑞昱ALC4082 7.1 声道Codec,并搭配“谐波失真+ 噪音”仅-115dB的ESS SABRE9018Q2CDAC芯片,尼吉康音频电容,专为防爆音与侦测播放设备阻抗的MOSFET开关芯片,以及LED发光音频插孔等多种高品质元件。
值得一提的是,在以上高品质硬件的基础上,R O GMAXIMUS X Ⅲ HERO主板延续了ROG 主板AI智能化的特性,加入了AI智能超频、AI智能散热、AI智能网络、双向AI降噪四大特性。其中AI智能超频技术利用算法和数据库为系统给出超频设置建议,能实现接近性能极限的高成功率超频。AI智能散热则可更精密地控制风扇和温度,减少系统风扇噪音,降低风扇负载,在更安静的运行环境下却有着更高效的性能体验。AI智能网络能高效优化用户的网络设置,智能调整应用带宽,降低游戏延迟。而全新的双向AI降噪技术,不仅可以降低自身麦克风输入的噪声,还能降低扬声器中来自队友语音中的噪声,在游戏或直播时,让你和队友都可听到更清晰的声音,沟通更顺畅。
内置高速风扇、3.5英寸大屏
ROG RYUJIN龙神 Ⅱ 360水冷散热器助力
考虑到第十一代酷睿处理器在PL2标准下,功耗较高,发热量大,因此为了充分发挥处理器的性能,我们在超频时还使用了ROG RYUJIN龙神Ⅱ 360水冷散热器。相对上代产品,这款产品仍采用了三具高性能的猫头鹰Noctua iPPC 12cm工业级散热风扇,可提供高达71.6CFM的风量,风噪仅29.7DBA。新一代产品最大的升级在水冷头部分,其冷头内部不仅嵌入了一具可加强处理器散热、主板供电散热的6cm高速风扇,还在顶部配备了一个3.5英寸全彩色LCD,可以显示系统信息,如温度,电压,风扇转速或频率等。
排除显示瓶颈
搭配TUF- RTX 3090-24G- GAMING显卡
同样,为了充分展现处理器的游戏性能,避免显卡成为瓶颈,在测试中我们还采用了TUF- RTX 3090-24G- GAMING显卡。这款显卡具备在8K分辨率+最高画质+开启光线追踪和DLSS的设定下,流畅运行多款游戏大作的能力,同时也能让极客玩家在8K分辨率下获得逼真、流畅的游戏体验。还有一点值得点赞,对于拥有强劲性能的TUF- RTX 3090-24G- GAMING来说,能将满载状态下的核心温度控制在64℃实属难得,这也是它拥有高效散热的最好证明。
本次测试的主要目的就是分析第十一代酷睿桌面处理器:酷睿i9-11900K、酷睿i5-11600K处理器在性能上能否狙击它们的对标竞品:12核心、24线程设计的锐龙9 5900X、6核心12线程的锐龙5 5600X,以及这两款新品相对于第十代同级处理器到底有多大的提升,所以在本次测试中我们特别采用锐龙9 5900X、锐龙5 5600X、酷睿i9-10900K、酷睿i5-10600K与它们进行了对比测试。由于时间有限,本次测试我们将着重测试处理器在消费级应用软件、游戏中的表现。
测试点评:显然,以上测试结果充分展示了处理器新架构的威力,在换用Cypress Cove处理器架构后,第十一代酷睿处理器的单核心性能有了很大的提升。如酷睿i9-11900K的CPU-Z单线程性能在默认设置下就突破了710分,相对酷睿i9-10900K的提升幅度達到14.8%,而酷睿i5-11600K的CPU-Z单线程性能也从酷睿i5-10600K的565.7提升到了651.4,提升幅度也达到了15.1%。同时它们的单核心性能也超过了锐龙9 5900X、锐龙5 5600X。在CINEBENCH R20处理器渲染性能测试、GeekBench 5.4处理器性能测试、Per formanceTest 10.1CPU测试中也有类似的结果。
更值得一提的是,在凸显处理器单核心性能的Super Pi一百万位运算测试中,两款第十一代酷睿处理器也一马当先,7秒以内就可完成测试,将其他处理器甩在身后。当然,由于第十一代酷睿处理器核心数量偏少,相对同级产品没有优势,因此在多核心运算性能测试上,它们的表现就缺乏竞争力了—酷睿i5-11600K的多核心性能与锐龙5 5600X相比互有胜负;8核心酷睿i9-11900K与12核心的锐龙9 5900X相比在多核心性能上则有较大差距。
日常使用不逊对手 消费级应用实战测试
测试点评:在日常消费级软件的应用测试中,其结果与处理器性能类似,只要不是需要完全调用所有核心的应用,处理器架构升级的第十一代酷睿处理器就会体现出优势,如在foobar2000 FLAC无损音频转码为MP3音频时,两款第十一代酷睿处理器都分别战胜了锐龙9 59 0 0X、锐龙5 560 0X;在执行色彩转换、添加“调色刀”“海绵”滤镜等15项工作的PhotoShop 2021中,酷睿i9-11900K也拥有最快的执行速度,仅仅74秒的任务消耗时间比酷睿i9-10900K少了足足14秒,显然它在这类工作任务中拥有更高的生产效率。
此外需要注意的是,在集合多个日常应用的PCMark 10中,酷睿i9-11900K以8472分的成绩也夺得头筹,战胜了所有对手。原因就在于并不是所有应用都需要调用所有核心,尤其是在那些可以利用GPU加速的应用中,只需要使用到处理器的一两个线程,这时第十一代酷睿处理器单核心性能强的优势就得以体现。如在PCMark 10的Recalculate Monte Carlo OpenCL(调用GPU执行蒙特卡洛模拟)中,酷睿i9-11900K的耗时只有0.55秒,锐龙9 5900X则需要1.542秒;在Recalculate Energymarket OpenCL(调用GPU计算能源市场)中,酷睿i9-11900K的耗时为0.499秒,锐龙9 5900X则需要1.136秒。
当然,在需要调用多颗处理器核心完成的视频转码、图形渲染、文件压缩解压缩应用中,核心数更多的锐龙9 5900X处理器相对酷睿i9-11900K还是有显著的优势,而酷睿i5-11600K则超越了酷睿i5-10600K,但与同为6核心设计的锐龙5 5600X相比,在文件压缩、视频转码上还有小幅差距。
测试点评:在《全面战争传奇:特洛伊》中,第十一代酷睿处理器的游戏性能获得了很大的提升,如酷睿i9-11900K的平均运行帧数较酷睿i9-10900K提升了多达20fps,提升幅度近16%,帧数位居第一。而酷睿i5-11600K的运行速度也排在第二位,一改酷睿处理器在这款游戏中表现弱势的状态。类似的情况也出现在《银河破裂者》中,两款第十一代酷睿处理器拥有较大的优势,战胜了其他四款参与对比的产品。同时在《赛博朋克2077》《荒野大镖客:救赎2》中,它们也拥有小幅的速度优势。而在《战争机器5》中,虽然酷睿i5-11600K与锐龙5 5600X相比还有小幅差距,但酷睿i9-11900K则以较明显的优势位居第一。
另一方面,在对硬件要求不高的游戏中,特别是如《CS:GO》《绝地求生:大逃杀》《极限竞速:地平线4》《僵尸世界大战:尸潮模式》这些网络、主流游戏中,锐龙处理器还是拥有明显的优势,其运行帧数较第十一代酷睿处理器快不少。我们推测这可能是因为锐龙的处理器架构,以及AMD处理器对这类游戏的优化,让锐龙能在这些游戏中运行得更加流畅。
功耗较高 需做好散热设置
从测试结果来看,由于处理器仍使用14nm+++工艺,又换用了单颗核心面积更大的Cypress Cove核心,并保持较高的工作频率,因此两款产品的功耗、发热量都很高。其中在对比酷睿i5-11600K与酷睿i5-10600K时,我们采用了一款定位中端的360水冷散热器。在同时开启CPU、FPU、CACHE的AIDA64中烤机半小时后,酷睿i5-10600K的CPU封装温度只有67℃,平台满载功耗为190W。
而酷睿i5-11600K如使用默认电压(烤机时工作电压可达到1.35V),则会由于温度上升到90℃以上出现过热降频,但用户可以通过调低电压到1.17V左右将处理器的全核心频率稳定运行在4.6GHz,但即使这样,烤机半小时后处理器的封装温度也有77℃,平台满载功耗达到242W,比第十代酷睿处理器高出不少。
至于酷睿i9-11900K处理器也有类似的问题,烤机时在ROG MAXIMUS XⅢ HERO主板上,它不会开启ABT技术,全核心频率设定在4.8GHz,但默认的核心电压较高,在1.288V左右,易出现过热掉频,而且即使调低电压,如散热器性能不济,则仍会出现掉频的现象。最终我们在换用 ROG RYUJIN龙神 Ⅱ 3 6 0水冷散热器,并将核心電压调低到1.252V左右后,酷睿i9-11900K可以再4.8GHz的频率下稳定通过半小时烤机测试,且CPU封装温度降低到77℃。但不可忽视的是,在4.8GHz下的处理器功耗仍很高,处理器满载时的平台功耗达到了325W。
超频性能初探 多核媲美10核心、单核心性能无人能敌
最后我们还对酷睿i9-11900K的超频能力进行了体验。结果显示,只要玩家采用优秀的散热设备、大功率电源,酷睿i9-11900K仍具备一定的超频能力。如在主板BIOS中上调处理器核心电压,那么我们就能将酷睿i9-11900K的全核心频率超频到5.2GHz,并完成CINEBENCH R20、《鲁大师》处理器性能测试。其CINEBENCH R20测试成绩达到6470pts,《鲁大师》处理器性能为861320分,均超过核心数更多的酷睿i9-10900K。
如果你想在单线程性能上获得更好的成绩,那么酷睿i9-11900K也能带给你惊喜。测试中我们关闭了6颗处理器核心与得益于每相可负载90A的14+2相供电设计,以及内置散热风扇、可对周边元器件进行散热的ROG RYUJIN龙神 Ⅱ 360水冷散热器,在酷睿i9-11900K烤机半小时后,ROG MAXIMUS XⅢ HERO主板供电部分的最高温度只有57℃。如追求单核心成绩,酷睿i9-11900K在普通散热环境下就可以将频率提升到5.6GHz。超线程技术,在只使用两颗核心的情况下,水冷散热环境下就将处理器频率提升到了5.6GHz。
追上了一大步,但技术进步不够大
综合以上测试来看。现在依靠新的Cypress Cove处理器架构,第十一代产品至少能在不少游戏、应用中与Zen 3锐龙处理器做到平分秋色,且这还是在旗舰产品核心数更少的情况下做到的,体现出英特尔的确有效提升了处理器的IPC,两位数的提升幅度让英特尔处理器的性能进了一大步。那么它值得购买吗?
我们认为如果你现在急需新装一台电脑,但不需要太多的处理器核心数量,主要运行日常消费级软件或游戏,那么是可以考虑第十一代酷睿处理器的;反之如果你已经有了第十代酷睿处理器或性能差不多的同级处理器,那么我们还是建议等一等。虽然第十一代酷睿处理器换用了全新的处理器架构,但由于它的生产工艺用的还是14nm+++,这也导致第十一代处理器的功耗、发热量偏大,需要使用优秀的散热器,同时处理器核心数量被限制在8颗以内,高端产品在多核心应用上有所不足。所以如果想获得更全面的升级,那么预计年底发售、采用10nm SuperFin增强版生产工艺,支持DDR5、PCIe 5.0技术的第十二代产品Alder Lake将更值得期待。