工艺架构双双逆袭？AMD下代显卡抢先看！

2016-03-29 16:47张一山

微型计算机 2016年4期

张一山

自2011年末公布GCN架构后直到现在，AM D都没有彻底革命性架构的新显卡问世。包括当前旗舰R9 Fury X在内，所有的显示核心都是在第一代GCN架构上修修补补、增加一些新特性得来。而且芯片工艺依1日是多年不变的28nm……近5年之后，AIxAD终于放出下代“Polaris”（北极星）GPU架构将大幅革新的消息。而且这一次，随着半导体新工艺的攻克，新核心将使用先进的14nm工艺。

双重利好究竟能为新GPU带来什么优势？

能否帮助AMD完成性能上相对竞品的逆袭，夺回高端市场份额？

距离新卡发布还有一段时间，但各种消息已经勾起了玩家们对北极星的极大兴趣。所以让我们这就来抢先打探一番，通过现有信息预估一下新核心的特性和性能。

AMD上一次宣布如此重要的产品还是2011年底，当时GCN架构横空出世，一扫AMD此前VLIW架构硬件利用率较低的阴霾，使AMD在GPU架构和产品性能上拥有了将当时称雄的英伟达Fermi架构产品挑于马下的实力。从2012年起，GCN架构不断地通过调整规格、推陈出新，为AMD赢得了市场认可和玩家的青睐。但不得不说的是，自那时起至今，AMD都在吃GCN的老本。最近几代GPU产品在架构方面都没有革命性改进，只是在原来架构的基础上不断地优化，通过增添功能、缩放规模获得产品迭代。有些人说这是迫于工艺原地踏步的无奈，但NVIDIA却能在工艺没升级的情况下，通过架构改进获得能耗比的大幅提升，让AMD相当被动。

其实AMD并不缺乏创新，比如最后一代GCN架构就率先用上了跨时代的HBM显存。作为GCN架构最后的巅峰，去年发布的R9 FuryX已经在芯片面积上达到600平方毫米水平，这是AMD自推崇小核心甜点策略以来，很久没有尝试过的大核心产品了。虽说有HBM显存的增益，但是GCN架构与生俱来的能耗比较低、架构效率不高等问题依旧无法得到彻底改善，甚至都没法完美发挥出HBM的高带宽优势。在R9 Fury X核心面积已经和GTXTITAN X相差无几的情况下，性能却明显落后对手，无法帮助AMD重新夺回高端市场的玩家认可度。很显然，架构换代的需求已经刻不容缓。好在AMD终于在加州举办了图形技术峰会，公布了全新的代号为“Polaris”的GPU产品。宣称要为用户带来一场极其值得期待的史诗级架构革命，希望重拾用户信心。

很显然，AMD敢称史诗级架构革命，那么新显卡的GPU架构势必不再是基于老旧GCN的修补版，即使不是推倒重来的全新设计，也绝对是大刀阔斧式的全新改版。那么该架构是否能帮AMD重新获得竞争优势？让我们这就来看看它都具备哪些特殊设计。

工艺终于提升

了解半导体的玩家应该非常明白，无论是CPU还是GPU或是其他芯片，更优秀的工艺都是性能提高的重要条件。当一个芯片能借助新工艺容纳更多的晶体管时，就能实现更多的功能和更强大的性能。无论架构设计得再合理，缺少优秀工艺都难以发挥芯片应有性能。反之，优秀的工艺却能在很多时候弥补芯片设计上的不足。但无可奈何的是，显示芯片厂商一直以来都采用代工制造模式，工艺水平取决于代工厂TSMC的发展情况，而TSMC近几年来工艺发展并不顺利，近5年都只能提供成熟的28nm产品。导致AMD和NVIDIA的产品换代非常被动。显然，在五年后的今天，28nm工艺已经不能满足GPU发展的需求了，尤其是DirectX，12等技术的出现，推动了整个图形业界的技术再次跃进，GPU也需要全新工艺来满足新架构产品的设计和制造，以带来跨越式的性能和功能改善。因此，无论是AMD还是NVIDIA，都准备在全新一代GPU上采用新工艺。但不同的是，NVIDIA应该还会继续和老伙伴TSMC合作，使用TSMC最新的高性能16nm工艺生产下一代“帕斯卡”架构核心。而AMD则很可能将代工订单转投到GlobaIFoundries和三星。GlobaIFoundries（本文简称GF）大家应该很熟悉，就是从AM D剥离出去的半导体制造厂，是AMD CPU的指定代工厂。三星的加入显得比较意外，实际上没有三星提供的14nm技术支持，GF想给AMD代工GPU都难。

这一次AMD之所以没有再选择和TSMC继续合作，据称是因不满TSMC近年来越来越糟糕的代工服务能力。熟悉行业的玩家应该知道，AM D在GPU工艺升级方面一直比NVIDIA激进。依靠比NVIDIA快半步的工艺优势，赋予芯片更好的特性，常常能在竞争中给NVIDIA带来不少麻烦。但TSMC经常在新工艺启用的过程中给AMD带来麻烦，良率、价格、芯片质量一直是让AMD不满的问题。只是苦于没有别家代工厂有实力或愿意帮助AMD代工高性能GPU，只能勉强维持。但这样的局面在GF获得三星14nmLPP工艺授权后，迅速被打破。那么三星授权给GF的14nm LPP工艺究竟有什么特点，能从TSMC手中抢过代工大单？

14nm FinFET优势何在？

其实在代工的选择上，AMD-直是很谨慎的，TSMC合作了多年，逼不得已AMD并不想换代工r但很显然，在经历了28nm的各种坑之后，TSMC向16nm过渡的情况也并不好，量产时间的推迟让TSMC先后丢掉了高通、博通等大单。虽说TSMC后续补救还算及时，在16nmFinFET（FF）之后，迅速推出了加强版的16nm FFP和针对低功耗的FFC工艺。但争分夺秒的竞争最需要的就是时间上抢先，三星14nm工艺先于TSMC的16nm工艺量产，能为AMD争取到更早的流片和试产时间，可能是AMD放弃TSMC的一个重要原因。再加上在20nm时代，TSMC优先苹果订单，让AMD和NVIDIA不得不憋屈地使用28nm至今，也确实让AMD感到了威胁。所以将生产转回自家的GF可谓水到渠成。至于为何要同时交予三星，很可能是因为GF虽得到技术授权，但是产能估计难以满足AMD需求，需要借助三星保证芯片数量和质量吧。endprint

FinFET，相信大家不再陌生了，其全称是Fin Field-EffectTransistor，鳍式场效应晶体管。这个名词的首次出现还是在英特尔强推22nm工艺的时代，FinFET实际上就是当时英特尔大力宣传的“3D晶体管”。FinFET的目的是为了对抗越来越薄、越来越小的晶体管所拥有的不良物理特性（最重要的就是漏电），并用于根本性改善20nm甚至更高级别制程下晶体管的性能。举例来说，在FinFET出现之前，AMD曾采用过多重电压岛、后偏置、高级时钟门控电路等多重技术，但都没有很好地解决漏电问题，导致芯片能耗比不佳，始终在竞争中受制于对手。从技术角度来看，FinFET将原本扁平、薄而不可靠的漏极和源极之间的连接“竖立”起来，在另一个维度上变相增加了厚度（或者面积），使得晶体管在继续缩小后还能够有比较好的性能表现。在使用了FinFET后，原本比较令人烦恼的漏电电流得到了有效控制，同时还带来了很多优秀特性，比如使用更低电压即可驱动、晶体管可承受电流上限也更高等。

而三星授权给GF用于制造Polaris核心的工艺，是继初代-14nmLow Power Early（LPE）之后的改进版14nm Low Power Plus（LPP）工艺。LPE已经为我们带来过Exynos7420等名满天下的产品，而LPP还将在LPE基础上进一步提升能耗比，减少15%以上漏电率，更利于制造高性能大体积芯片。

AMD在全新的Polaris核心上采用FinFET，有助于降低芯片发热、提高工作频率、降低驱动电流，最终实现提高性能功耗比的目的。根据AMD的介绍，14nm FinFET相比28nm平面工艺，能在晶体管数量翻倍的情况下，还进一步缩小芯片面积。借此获得优秀得多的能耗表现和翻倍的性能。通过测试当前已经用14nm工艺流片成功的PolarisGPU，AMD宣称Polaris架构相比之前的Fiji等核心在能耗比上提升了2倍，也远远超过了当前NVIDIA的Maxwell架构。为此，AMD还特地公布了一段演示视频，视频中AM D使用了相同的软硬件平台，在相同设置下对比了某款Polaris架构GPU和GTX 950的功耗表现。在游戏画面都一样流畅的前提下，其中GTX 950的平台功耗为150W，而Polaris GPU的平台功耗仅为85W，只有前者的56%，整体表现相当令人满意。

旧瓶装新酒的GCN 4.0

我们说过，工艺只是重要的基础，架构是芯片性能的关键。Polaris核心显然不仅有三星的14nm LPP工艺撑腰，更重要的是AMD赋予了它一个全新的高效率架构。AMD在介绍Polaris架构时，提到了第四代GCN架构，也就是俗称的GCN 4.0。别看命名还是GCN，但和之前修修补补的初代GCN差别甚大。首先GCN 4.0架构下，跟执行效率关系紧密的GPU中指令调度器已经被重新设计。当然，跟指令调度器相关的周边模块也是重新设计或进行了大幅改进，以保证计算任务的调度更加高效和智能。不仅有更快的指令处理速度，还能根据负载和任务类型，自动划分指令，将复杂指令和重复性简单指令分别分派，尽可能让计算核心更多时候能处于高效率利用状态，提高整体计算性能。另外，跟计算性能关系最紧密的几何处理器、流处理器核心、二级缓存等也是重新设计的，以进一步解决初代GCN流处理器集群使用效率不佳的问题。避免出现同一集群中，某些流处理器一直满载，而部分单元却无事可做的尴尬。与之匹配的外围显示引擎、显存控制器等也全部都经过了重新设计，能够达到更高的计算性能匹配，提供更小的核心和显存数据存取延迟，让整体性能和性能功耗比大幅度提高。至于显存搭配，并非全为HBM（后文会详细讲解）。在功能方面，此前只有Intel一家在视频编码、解码上独大，而GCN 4.0决定不再让其独美。除GPU计算核心，AMD还重新设计了多媒体协处理核心，全面加入了对H.265的支持，增加了原生的H.265 main10解码能力和H.265@60fps的编码能力。并加强了4K及其以上超高清分辨率硬件编、解码能力。借此，玩家们可以不再依靠高性能处理器，只需用GPU硬件辅助就能完成超高分辨率下的H.265影视流畅播放了。另外，GCN 4.0增加了原语丢弃加速器（Primitive Discard Accelerator）、硬件调度器、指令预取、高效着色器、显存压缩等功能，能够进一步配合DirectX 12 API、驱动等底层软件，提供更高的图形渲染效率。

多媒体输出功能方面，Polaris架构正式开始支持HDM I 2.Oa和DisplayPort 1.3两种最先进的视频接口标准。HDMI 2.Oa的最主要特性在于带宽提升至18Gbps、支持3840×2160分辨率和50fps、60fps刷新率。音频方面能够提供最多32个声道和1536kHz采样率，支持多个用户同时传输音频、视频流，还提供了对HDR传输格式的支持。而DP 1.3的规范则将带宽提升至32.4Gbps，拥有四条通道，实际传输速度高达25.92Gbps，最高能够支持5，120×2880分辨率，也同样支持多显示器。

HBM2、GDR5X：一个都不会不少

显存将是本次产品更新的一个亮点。AMD已经在Rg Fury X上启用了HBM显存，其优势我们就不再赘述，其缺点则是被不少玩家诟病的最大4GB容量问题。别担心，与Pola ris架构搭配的新一代HBM2显存已经将最大容量从此前的单颗1GB提高到了单颗最大8GB。此前4颗HBM总计4GB，HBM2代4颗最大可到32GB。另外，HBM引以为傲的位宽优势继续得到加强，HBM2单颗粒位宽可以达到2048bit，相比HBM的1024bit再次翻倍。当然，受制于高昂的成本，估计只有Polaris架构的旗舰产品能用上HBM2显存，且会有-16G B标配和32GB高配之分。面向中端的Polaris产品则会搭配基于GDDR5改进的GDDR5X显存。GDDR5X相比GDDR5，预取数再次翻倍，从之前的8提升到了16，这样一来带宽又能在GDDR5的基础上继续提升。考虑到GDDR5转换至GDDR5X生产比较容易，成本控制应该也很容易让厂商接受，因此未来很长一段时间里，中端显卡将以搭配GDDR5X显存为主。

Polaris10、Polaris11：具体产品有哪些？

在了解了Polaris架构的一些特性后，大家最关心的应该是产品型号了。根据AMD Radeon事业部Raja Koudri的消息，Polaris家族目前有两款核心，分别被称为Polaris11和Polaris10，两个一大一小，但目前并不知道确切的对应型号。只是说新显卡流片比较顺利，应该会在今年中发布，很可能在6月的台北电脑展上展示。

在CPU市场的持续失利，让AMD长期受困于亏损、裁员、拆分、重组等各种负面影响，甚至影响到了以往表现还不错的图形部门。以至于长达5年时间里，AMD都没有革新GCN架构，而是依靠GCN设计的先进性，先后力战了NVIDIA的Fermi、Kepler、Maxwell等多代架构。在M axwell将GPU的性能功耗比推至28nm下的极限水平后，AMD更是大量丢失图形显卡市场份额。还好，充满激情的AMD还没有倒下，这次不仅公布了新显卡的消息，还公布了阔别已久的CPU架构换代计划。再加上有三星技术支持的GF终于在工艺上赶上了竞争对手的步伐，让AMD有了更大的逆袭资本。下半年好戏一定不会少，AMD很可能在CPU和GPU两个重要的市场上发布重量级产品，重新收拾旧山河，玩家们敬请期待。endprint