Core i7—4770K处理器专题评测:能效再平衡

2013-04-29 21:03
CHIP新电脑 2013年7期
关键词:核芯显示卡线程

在6月4日的Computex上,英特尔终于将Haswell处理器的型号、规格公诸于世。首批发售的型号一共有22款,包括12款桌面产品、10款移动产品。整体和之前Sandy Bridge、Ivy Bridge发布的情况类似,本次Haswell也采用了高端产品先行发售,中低端产品后续补充的方式。本期CHIP将通过对其最高端的Core i7-4770K处理器和与之搭配的Z87主板进行详细的分析与测试,为大家剖析新一代Haswell平台带来的变革。

革新的架构

从宏观方面来讲,Haswell的整体构造与Sandy Bridge较为相似,如使用环形总线与各个CPU核心连接,同时用总线连接的还有LLC、GPU核心以及系统逻辑单元等。英特尔之所以会采用这个构造是因为环形总线可以更容易地实现各个模块的连接,并且可以推出大量衍生产品。

不过新的Haswell架构在指令下行back-end缓存周围与以往产品有很大的不同,其指令发出/执行管线与之前的数代产品(从Nehalem到Sandy Bridge)的架构相比都拥有了极大的变化。首先前几代的产品一直都采用6指令(uOPs)方式运行,而现在则提升为8指令。而且在指令发出端口方面,Haswell指令的发出端口由之前的2个提升为8个,并将整数运算单位和载入/存储管线各增加了1个。因此Haswell可同时执行4个整数运算以及2个载入和1个存储的操作,这可以让Vector单元的峰值运算性能相比之前最高提升两倍。在使用FMA命令时,Haswell的CPU核心浮点运算和SIMD运算性能也将获得两倍的提升。

Haswell还有一些其他的改进,包括内存访问带宽的大幅度提升,如L1缓存的载入带宽由原先的32B/循环提升为64B/循环。而L2和L1缓存的带宽也由之前的256bit提升为512bit,并且L2 TLB(Translation Look-aside Buffer,翻译后援缓冲器)也获得了大幅提升,可以大大提升高工作负载时的性能表现。

新的指令集

经过多年的发展,如今的主流处理器已经达到了4核心4线程、4核心8线程甚至更高的规格,即便是入门的产品也达到了双核心4线程的规格,多线程技术早已融入到普通办公和家庭娱乐环境中,但是在日常应用中,许多时候拥有更多线程的处理器并不能完全体现出其速度的优势,有部分原因是因为软件、游戏开发商对多核优化不足,而且CPU自身也存在着一定的限制导致多线程运行效率的降低。

英特尔在Haswell架构加入了新的TSX扩展功能,简单来说,TSX就是允许程序员指定事务型同步代码空间,使得目前使用粗粒度线程锁定(Coarse-grained thread lock)的程序能更自由地使用细粒度线程锁定(Fine-grained thread lock),进而提高多线程执行的效率和性能。

举个简单的例子,如果用户在编辑Excel表格时,打算同时编辑两份拷贝,Excel就会提示该文件正在编辑,只能以只读方式打开但不能编辑,这种情况就类似粗粒度线程锁定,这种锁定比较简单,很容易实现,但是效率不高,细粒度线程锁定则可以实现自由度更高的数据同步。如果在上个例子中使用细粒度线程锁定的规则,那么每个线程都可以操作不同纵列的数据,这样就可以明显提高CPU的处理效率,让运算速度更快。不过这样做也有更大的风险,特别是多个线程同时向一个区域写入数据时,数据出错的几率更大。在使用了事务性内存和TSX扩展后,部分锁定操作的运算性能可提升1~3倍。如在软件仿真中,传统内存需要10.6s的处理时间,事务性内存仅需要4.6s,性能提升明显。除了TSX扩展之外,在Sandy Bridge架构上首次开始使用的AVX指令集也升级到了AVX 2.0版本,与现在Ivy Bridge处理器所使用的128bit的AVX指令集相比,AVX 2.0采用了256bit的SIMD浮点指令集和SIMD阵列,在理想状况下浮点和整数性能均可以达到上一代产品的两倍。

暴增的GPU规格

在CPU架构稳步升级的同时,Haswell整合的GPU核心自然也不会落后,虽然从Haswell的GPU核心架构上来看,它在一定程度上沿续了Ivy Bridge的设计,但是在规格方面进行了大幅升级。

在规格方面,Haswell拥有3种不同级别的图形核心,与之前Sandy Bridge的HD2000/HD3000和Ivy Bridge的HD2500/HD4000分别各只有两种规格不同,Haswell的GPU核心有3种规格,在命名方面也有了较大变化。按照运算单元的不同,Haswell的GPU核心分为GT1、GT2和GT3共3种,其中GT1定位最低,只有6个EU单元、24个ALU单元、1个曲面细分单元,与目前Ivy Bridge的HD 2500核芯显示卡规格基本相同。GT2核心的EU单元则大幅提高到20个,并且拥有80个ALU单元,2个曲面细分单元,与目前Ivy Bridge最高级别的HD 4000核芯显示卡的16个EU单元相比多了四分之一。而Haswell的GT3核心的EU单元大幅提升至40个,是GT2的两倍,是HD4000的2.5倍。它还拥有160个ALU单元和4个曲面细分单元,如此规模的硬件提升已经让Haswell集成显示核心超越了入门级显示卡的水平,甚至具备叫板中端显示卡的能力,在性能方面已经向AMD的APU产品看齐,这对AMD来说可不是个好消息。不过拥有GT3核心最高规格的处理器只会出现在顶级移动平台上,主流桌面版处理器最高仅配备GT2显示核心,如本次测试中的Core i7-4770K的核芯显示卡即为GT2显示核芯。

更低的功耗

在设备移动趋势越来越明显的情况下,英特尔已经悄然改变了处理器的研发策略,将重点从提升性能转向降低功耗、提高效能方面。新的Haswell虽然不会升级制造工艺,但会从架构和技术上作出努力,特别是会整合稳压器模块(VRM),改进处理器供电的精细度,并在不影响性能的前提下降低功耗。

目前,稳压器和各种供电IC都安置在主板上,而为了加强处理器供电并且增加卖点,主板供电电路相数在不断猛增,制造成本和占用空间也水涨船高,但仍旧都达不到英特尔想要的理想供电水平。为此,英特尔特别在Haswell处理器电路中设计了一个功耗单元(Power Cell),这个内置的供电系统可以独立调节每个内核、显示卡核心、SA系统助手以及内部的I/O总线等各个部分电路的供电,这可以实现高精度的电压调节,并且非常有助于降低处理器的功耗。

作为节能的另一个举措,Haswell还将支持微软在Windows 8中引入的Connected standby(连接状态)节能技术,英特尔定义了不同的节能状态,称为S0ix。相比上一代的处理器,Haswell从S0切换到S3状态只需要毫秒级的时间,而且可以在短时间内频繁切换,这将大大减少处理器在低负载下的功耗。除此之外,Haswell具有新的C节能状态(C7至C10),它可以有效降低待机状态的功耗。这个技术可以将平台功耗降低至0.1W级别的水平,这对于在智能设备领域野心勃勃的英特尔来说是个好消息。

测试平台介绍

本次测试平台中的处理器是Haswell处理器桌面版中最高端的产品,型号是Core i7-4770K.,主板方面我们使用了技嘉GA-Z87X-UD3H主板作为测试平台,该主板采用了8相IR数字供电设计,可以提供更高的供电电流,并能更好地保证供电电压的平稳性,同时具有不俗的超频性能。除了测试处理器集成显示核芯的图形性能外,我们还将对处理器搭配独立显示卡时的游戏性能进行测试。为此在处理器游戏性能测试环节,我们选择了AMD顶级的Radeon HD 7990显示卡作为测试平台。为了保证平台的稳定性,我们使用了海韵SS-850KM 80PLUS金牌电源。

测试结果与总结:

在常规处理器性能测试中我们可以发现,Core i7-4770K在多个项目中都与上代的Core i7-3770K不分伯仲,除了CineBench R11.5的OpenGL项目和MediaCoder转码项目性能提升明显外,其余测试成绩两者之间的差距均在10%以内。综合看来,凭借架构上的优化,Core i7-4770K在多线程应用中比Corei7-3770K平均提升了大约7%,对于追求更高性能处理器的用户来说,Core i7-4770K平台并没有足够的理由来打动我们去升级他们手中的Core i7-3770K+Z77的平台。

在使用独立显示卡的处理器游戏性能测试项目中,Core i7-4770K相对于上代Ivy Bridge核心的 Corei7-3770K的提升也是微乎其微,甚至有数款游戏还败给了Core i7-3770K平台,总体平均下来Core i7-4770K的领先幅度仅为0.5%左右,这对于想要升级新平台的高端游戏玩家来说无疑是一个巨大的打击。

在核芯显示卡性能测试项目中,Core i7-4770K终于凭借更高的硬件规格和更高的核心频率进行了一次蜕变,虽然它只配备了集成20个EU的HD4600显示核心,但是在性能方面的提升立竿见影,综合性能提升约为30%。这种级别的性能提升可以让在上一代核芯显示卡的性能下许多不具备可玩帧数的游戏变得可玩甚至流畅,不过对于这次核芯显示卡性能提升的真正意义主要还是在于移动平台方面,因为如此的性能可以让低端独立显示卡彻底失去活路,而对于使用一颗顶级桌面处理器搭配高端游戏显示卡组建游戏专用平台的用户来说,这种游戏性能的提升却如同隔靴搔痒。

功耗方面,我们分别测试了Core i7-4770K+Z87主板平台和上一代Core i7-3770K+Z77平台的待机、典型游戏状态和处理器满载下的平台功耗,待机状态下Core i7-4770K平台的功耗仅为52W,比上一代的Core i7-3770K平台低了近10W。在典型游戏情况下,两者的功耗几乎相同。而在处理器满载的情况下,Core i7-4770K平台的功耗则反超上一代Ivy Bridge平台,约高出了10W。

如今Core i7-4770K已经在市场上销售,价格在2 350元左右,相比Core i7-3770K贵了200元有余,加上新的8系列主板,一套Core i7-4770K+Z87主板平台的成本至少要比Core i7-3770K+Z77主板的平台多出400~500元左右,由于这一代处理器对于高端独立显示卡平台下的游戏性能提升有限,因此对于游戏用户来说,上一代的Core i7-3770K平台明显要实惠得多。而对于主要工作是3D渲染、视频制作的用户来说,升级Core i7-4770K平台则是非常不错的选择。

声音

Haswell平台为英特尔带来了有史以来最大幅的改善,其搭载的Iris显示卡较此前的产品性能提升2倍,并大幅降低了待机功耗,而这种功耗的降低并不是以牺牲性能为代价的。

—— 施浩德

英特尔公司高级副总裁、PC客户端事业部总经理

猜你喜欢
核芯显示卡线程
核芯互联发布高性能ADC模数转换器
浅谈linux多线程协作
以粗孔微球硅胶为核芯的交联酶聚体的制备
低温高性能
读编往来
焊接电阻升级显示卡
Linux线程实现技术研究
么移动中间件线程池并发机制优化改进
JAVA多线程同步解决生产者—消费者问题