核显进化之旅

2016-05-14 15:56
个人电脑 2016年6期
关键词:转码桌面高性能

若干年之后,图形处理界的知名厂商NVIDIA和AMD都相继推出了高性能的集显芯片组,也就是我们所熟知的C61与690G这类经典产品,让消费者认识到,原来集显也是可以用来玩大型3D游戏的,也就是这些高性能集显成就了当时AMD在低端平台的高性价比美誉。随后,这些iGP就被直接整合到CPU里面了,而整合显卡的主板现在已经十分稀有了。

曾几何时,集成显卡给人的印象还只是提供基本的图像输出,运算处理也只是简单的2D图形,要想玩一些3D游戏那只能是痴人说梦了。若干年之后,图形处理界的知名厂商NVIDIA和AMD都相继推出了高性能的集显芯片组,也就是我们所熟知的C61与690G这类经典产品,让消费者认识到,原来集显也是可以用来玩大型3D游戏的,也就是这些高性能集显成就了当时AMD在低端平台的高性价比美誉。随后,这些iGP就被直接整合到CPU里面了,而整合显卡的主板现在已经十分稀有了。

事实上,在AMD在收购ATI之后,就率先提出了CPU与GPU融合的概念,然而第一个把实际产品做出来的却是其老对手Intel。早在2010年,Intel就推出了第一款整合GPU的CPU,随后Intel的核显每年都会随酷睿系列处理器一同升级一次,现在已经发展到了第六代产品。值得注意的是,GPU的规模如今是越来越大,这就好比以前是买CPU送GPU,现在都快成买GPU送CPU了。

从第一代酷睿处理器Clarkdale到今天的第六代酷睿处理器Skylake,我们见证了集成核显的规模在不断增大,同时,核显的处理性能也是以倍数增加。不过,CPU的每次升级以往都是以提高能耗比为主,而从Sandy Bridge到Skylake,CPU本身的性能提升幅度并不算太突出,GPU性能反而成了每代处理器的性能提升重点。下面我们就来回顾一下,重温Intel核心显卡的进化历程。

首款整合GPU的CPU:Clarkdale

尽管有些人会认为Intel的做法有点“狡猾”,但不可否认的是,2010年推出的Clarkdale处理器的确是首款整合GPU的CPU,这款处理器由32nm制程CPU Die和45nm制程的GPU Die共同封装在一块PCB上组成,两颗芯片使用QPI总线相连。看起来是不是有点复杂?若换用通俗一点的说法,Intel其实就是把CPU和北桥芯片用胶水“粘”在一起了而已。

Clarkdale系列的处理器只推出了双核型号,有Core i5-600和Core i3-500两个型号,当然,在LGA 1156时代的四核处理器是没有整合GPU的。

在当时,Intel把Clarkdale上的GPU统称为“Intel HD Graphics”,这一命名一直沿用到现在。而这个GPU其实就是G45上X4500 HD的升级版,其EU增加了两个达到12个,核心频率最高可以到900MHz,支持Hierarchical Z(层次Z缓存算法)与Fast Z Clear(快速Z清除)技术,支持DX10、SM4.0,支持OpenGL 2.1。另外,移动版处理器的GPU可以通过Turbo Boost动态调整频率,但桌面版无此功能。

真正的核显:Sandy Bridge

Intel在2011年推出的Sandy Bridge架构处理器,则是真正把CPU和GPU做到同一块芯片上的产品。其CPU、GPU、内存控制器、PCI-E控制器全部整合到一个核心里面,它的最大改进在于三级缓存改用了环形总线设计,并且其核心、GFX以及显示/媒体控制器可共享L3高速缓存。

Sandy Bridge的GPU主要包含了指令流处理器、媒体处理器、多格式媒体解码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓冲等等,架构与上一代核显相比有了较大变动。

Sandy Bridge按照型号划分了标准版以及“K”系倍频解锁版本,标准版本GFX命名为HD Graphics 2000,而唯独K系列所拥有的GFX为等级更高的HD Graphics 3000,两者的区别是前者拥有6个EU,而后者则达到了12个EU,该系列全面支持Turbo Boost动态调整频率,最高频率可达1350MHz,支持DX10.1、SM4.1,支持OpenGL 3.0,HD Graphics 3000在性能上比前代产品有了翻倍的增长。

此外,Sandy Bridge核显还增加了Quick Sync转码加速技术,利用内置的编码器可以支持MPEG2、VC1和H.264视频格式的硬件编码。事实上,Sandy Bridge所整合的图形核心已实现了视频解码和编码两部分的硬件加速功能,可为用户在视频转码时节省更多的时间。

迎来DX11时代:Ivy Bridge

在Ivy Bridge上,Intel针对核显的改进还是两个方向,首先是进一步提高GPU的性能,并且让其支持DX11,第二点则是继续提高核显的功能,例如多屏输出、高分辨率支持等等。

Ivy Bridge的GPU增强了几何前端、光栅化、像素后端处理、采样器、寻址单元的并行运算能力,每周期可以执行2个MAC操作,GPU可以直接读取L3缓存中的数据,图形单元新增两个可编程操作以及一个固定功能单元以进行曲面细分计算,并在解码与显示功能上做了升级。

与Sandy Bridge时的情形类似,Ivy Bridge的核显同样也分为两种,分别是有16个EU单元的HD 4000和6个EU单元的的HD 2500,“K”系列处理器用的是HD 4000而其他处理器用的是HD 2500,最高频率与SNB时代一样是1350MHz,支持DX11、SM5.0,支持OpenGL 3.2,在性能方面,HD 4000比上一代的HD 3000提升了67%。

Ivy Bridge支持Quick Sync 2.0编码加速技术,与第一代相比,2.0版不仅速度更快,而且画质也会更高。而视频输出方面也从原来的双屏上升到三屏输出,最大分辨率从原来的2560×1600上升到4k×4k级别。

“锐炬”登场:Haswell

Haswell采用的是Gen7.5核显,从这一代开始,Intel的核显开始了模块化、可扩展的设计。Haswell的显示核心采用了两级EU团簇结构设计,上级的叫Slice,下级的叫Subslice,每个Subslice拥有10个EU,2组Subslice单元组成了1组Slice单元,这一代在GT1和GT2两个级别之上又诞生了GT3核心,从此,Intel就走上了暴力堆砌核显规格之路。

Haswell的GT1、GT2、GT3核显分别拥有10个、20个和40个EU单元,此外还有一个带嵌入式eDRAM的GT3e,核显集成了128MB eDRAM,位宽512bit,带宽可达64GB/s,这个嵌入式eDRAM是作为L4缓存存在的,可以同时提升CPU和GPU性能。

Intel的核显一直以来都用HD Graphics来命名,不过,与NVIDIA的GeForce以及AMD的Radeon相比,这个名字似乎还少点霸气。因此,从Haswell处理器的核芯显卡开始,Intel引入了新的名字“Iris”和“Iris Pro”,中文名为“锐炬”和“锐炬Pro”,分别对应GT3以及GT3e核显,具体型号则是Iris Graphics 5100和Iris Pro Graphics 5200。

这一代的桌面版酷睿处理器基本上都使用的是GT2核显,型号是HD Graphics 4600/4400,后者只用在Core i3-41xx系列处理器上,只有16个EU,对非K系列处理器来说,其核显性能较前代产品有了大幅提升。当然,真正需要高性能核显的也主要是Core i3所对应的用户群,而对于高端处理器,基本上都会另配独立显卡。

奔腾和赛扬处理器搭配的则是GT1核显,而这一代最强的GT3e核显只出现在两款桌面级处理器上,就是Core i7-4770R和Core i5-4670R,然而这两款CPU都不零售,是针对OEM市场的产品。

最强桌面核显:Broadwell

Broadwell主要都是面向移动市场,在桌面零售市场上其实就只有两款CPU,Core i7-5775C和Core i5-5675C,配备Intel目前最强的Iris Pro 6200核显,拥有128MB的eDRAM缓存,另外倍频无锁,可进行超频。

Broadwell上使用的是Gen8图形核心,Intel重新设计了Subslice单元,每组的EU单元从之前的10个下降到了8个,在同样的采样器及调度器下这意味着每个EU单元的效率提升了,而弥补EU数量可以通过提升Subslice单元总数来完成,所以Broadwell的1组Slice单元有3组Subslice单元,EU单元总数是24个,Broadwell的GT1、GT2、GT3核显分别拥有12个、24个和48个EU单元。

桌面零售版那两款CPU配备的Iris Pro 6200属于带eDRAM的GT3e核心,得益于核心规模的大幅提升,Core i7-5775C的核显性能较之前的Core i7-4790K提升了将近80%,而且,鉴于现在的Skylake桌面版只有GT2核心,所以Broadwell架构的这两款处理器自然而然成为目前拥有最强核显的桌面级处理器。不过,这两款处理器在国内还没有正式上市,购买渠道比较难找。

越堆越大的GPU:Skylake

Skylake使用的是Gen9代GPU,其实,它与Gen8有很多地方都是相似的,例如,每组Subslice单元依旧是24个EU,但是最多可以扩展到3组Slice单元,也就是说最多会配备72个EU单元,因此Skylake也多出GT4这个级别的核显。

Skylake的Gen9架构支持DX12、OpenCL 2.x、OpenGL 5.x、Vulkan等图形规范,支持新的编译器堆栈,功耗范围从4W-65W+不等。此外,Gen9还支持HEVC/H.265、AVC、SVC、VP8、MJPG硬件加速,支持摄像头RAW架构。

多媒体方面,Gen9架构支持单一固定功能单元以降低功耗,Quick Sync转码单元也设计了固定功能的编码器以降低功耗、延迟。此外,Gen9的视频解码、转码加速还支持了HEVC(H.265)、VP8、MJPEG等标准。

然而,GT3/GT3e/GT4e这样的高性能核显只使用在移动版处理器上,桌面版的Skylake处理器基本上仍在使用只有24EU的GT2,虽然较桌面版Haswell来说性能还是有所提升,但是幅度只有20%。另外还有两个“P”后续的处理器用的是GT1核显。

Intel这些年来在核显方面确实下了不少功夫,每一代产品间的性能提升幅度相当大,入门级独立显卡基本上快被核显“赶尽杀绝”了。而反观CPU,性能提升的幅度就没那么明显了,降低功耗反而成了重点,毫无疑问,低功耗处理器成就了现在的众多超级本和各种Windows平板,而且,这些年来移动设备的显示分辨率都在不断攀升,这对核显的性能又有了更高的需求,正是市场的变化影响了Intel近年来处理器的发展方向,可以想见,未来Intel的CPU仍会以提升核显性能并降低整体功耗为方向不断前行。

猜你喜欢
转码桌面高性能
桌面舞龙
视频转码技术在广播电视中的应用研究
基于APP在线控制双挤出头FDM桌面3D打印机的研制
桌面云技术在铁路行业中的应用
基于Hadoop的流媒体转码系统设计
基于IPTV点播业务的视频分段式转码方案的研究与应用
一款高性能BGO探测器的研发
高性能砼在桥梁中的应用
基于Hadoop 的分布式视频转码方案
SATA推出全新高性能喷枪SATAjet 5000 B