PCFAN评测室
Radeon HD7970,28nm工艺下的新旗舰,AMD DirectX 11.1杀手锏,3GB神卡,性能之王……现在对它的溢美之词已经太多了。不过,面对AMD这款新一代顶级产品,我们仍然要怀揣理性。希望通过本次评测让大家全面认识一个真实的Radeon HD7970。
28nm工艺是基础
晶体管数量直接决定了性能,因为更多的晶体管意味着更多流处理器、更多光线/纹理单元、更强的显存控制器……但在空间有限的半导体芯片上,唯有提升制造工艺才能实现晶体管数量提升。所谓的28nm、32nm、40nm代表的都是GPU芯片中相邻逻辑电路间距,工艺提升直接使晶体管密度增加。HD6970到HD7970,制造工艺从40nm提升至28nm(Tahiti显示核心采用了28nm高介电金属栅极工艺),而晶体管数量则从26.4亿提升到43.1亿,提升幅度达到了63.25%。这才有了2048个流处理器、128个纹理单元以及384bit内存控制器,而且核心表面积还再度被缩小。比肩CPU的制造工艺让AMD新款显示核心拥有了有利的基础。
GNC架构改良 大刀阔斧
GNC架构最大的改进来自ALU集群部分。与传统AMD架构的VLIW结构ALU团簇不同,全新架构的ALU集群撤消了来自超长字节指令的限定,所有ALU全部以SIMD的形式来完成吞吐,不再需要打包和解包的过程,大幅度提升了指令运行效率。以Tahiti为例,它拥有两个几何引擎(ACE),各自又下辖16个“GNC QUAD SIMD”,又称为“计算单元”(Compute Unit),当然也可以简单地理解为16个SIMD阵列。每个阵列中有64个流处理器,即拥有2048个流处理器,又称ALU。Tahiti的每个计算单元还单独配有Scalar Unit(纯量计算单元),用于处理整数指令以及特殊函数。这实际上已经非常像是NVIDIA Fermi的设计,独立配置的矢量计算单元将大幅提升核心的通用计算能力,让物理加速等应用变得更加高效。
新版核心共有8个渲染后端,每周期能完成32个色彩操作、128个Z-Stencil操作。同时,AMD也再度提升了计算单元缓存,为每四个计算单元分配有16KB一级指令缓存、32KB一级数据缓存;可读写的二级缓存总容量高达768KB,计算效率得到进一步提升。AMD PowerTune技术和ZeroCore技术配上数字供电解决方案和独立的驱动、配置文件,让电脑进入闲置模式后,GPU核心完全断电并进入0瓦状态。当然产品本身28nm的制造工艺,也让最高端的HD7970显卡热设计功耗不过250W。
新一代的Eyefinity(宽域)2.0实现单GPU多屏、多音轨流的定向输出,同时还支持非标准长宽比的游戏协同工作。而在视频编解码功能上,虽仍然保留UVD3.0,但新加入的“VCE”硬件多视频流编码器,能够实现1080P/60fps以上的硬件H.264视频编码,并支持全硬件固定功能编码和GPU Shader辅助混合编码模式。同时,第二代稳定视频技术Steady Video 2.0,可以利用前面提到的QSAD实现硬件加速,并支持隔行模式视频、提供左右对比模式等。最新的Tahiti显示核心的另一亮点在于它完全支持DirectX 11.1(本期技术沙龙栏目对DirectX 11.1有较为详细的介绍),它也将以更高的通用计算效率和更高的硬件曲面细分执行效率助推新款产品。
HD7970公版解读
接着我们来看看新款产品的整体设计用料。蓝宝HD7970 3G DDR5是一款完全基于AMD公版的产品,虽然较为严谨,但整体用料规格并不算太高。5+1相供电电路对于一款高端产品而言显得中规中矩,没有我们常常提到的类似去耦电容、驱动场效应管等更高档次的元件。不过铜制外壳的场效应管看上去倒是比较给力的,另外产品配备了CHiL8228G PWM数字供电控制芯片,再配上独立的驱动和配置文件,能够更加高效的地对供电状态进行调配,并且大幅减少产品在待机或低负载状态下的功耗。额外的外接供电自然是不可少的,产品配备了8Pin+6Pin双辅助供电接口。
为了让Tahiti显示核心得到更好的保护,AMD专门在它四角套上了金属壳。芯片四周是12颗海力士内存颗粒,共同组成3072MB/384bit的显存架构。为了避免输出信号受到板身大量电路的干扰,AMD仍然保留了各输出接口上的金属保护罩,公版HD7970提供有一个DVI接口和一个HDMI接口以及两个迷你DisplayPort接口。至于散热,公版HD7970仍然采用了纯铜底座配合风道式散热器的设计,风量较大的涡轮式风扇散热效率相当高。
顶级显卡搭配顶级平台
本次测试,我们不仅拥有目前最顶级的显卡。同时,处理器也选用了目前性能最出色的Core i7 3960X Extreme Edition。为了能够进一步展示Radeon HD7970显卡的实力,我们还将Radeon HD6970和GeForece GTX580作为对比测试参照物。3DMark 11、Havean Benchmark 2.5两款软件用作理论性能测试,同时我们也选用了《使命召唤8》、《地铁2033》、《战地3》、《失落星球2》、《孤岛危机2》五款游戏对产品的实际3D游戏效能进行测试。而产品的超频性能和功耗同样是大家关注的重点,因此我们还安排了单独的超频测试,以及待机和满载功耗测试。
综合性能优势明显
理论性能方面,HD7970相对于HD6970和GTX580两款上一代顶级显卡都有非常明显的优势。理论性能基本上在HD6970的基础上增加了50%以上。同时相对于GTX580,HD7970仍然有20%以上的领先优势,尤其在3DMark 11 Extreme模式下,HD7970的测试成绩已经超越了GTX580达到31.2%。而在Havean Benchmark 2.5中,A卡以往在Tessellation硬件曲面细分效果上的劣势也被新款旗舰扫清,同等特效状态开启最高硬件曲面细分效果时,HD7970相对于GTX580有较大的领先优势。
而在游戏测试中,HD7970的优势却并没有理论性能测试中明显,这应该是因为初期驱动程序不完善造成的。虽然在《失落星球2》的测试中出现了意外落后的表现,但HD7970的游戏性能总体上还是以15%左右的优势领先于GTX580。而类似《地铁2033》这样的超级显卡杀手也被HD7970轻松征服,在最高特效和1920×1080分辨率下运行得非常流畅。
功耗合理 超频给力
功耗方面,我们直接使用Furmark来模拟显卡的100%负载工作状态,通过功耗仪器测数查看HD7970的实际功耗情况。待机状态下由于新一代产品在功耗方面使用了众多新技术,此时即便平台上还搭载有Core i7 3960X Extreme Edition,但待机功耗也仅为68.33W。不过进入100%显卡负载状态时,平台的整体功耗则提升到了395.59W,但对于一款顶级显卡来说,不到400W的满载功耗,已经算是比较温和了。而公版HD7970的整体散热状态也还比较不错,加上28nm工艺对功耗和发热的有效控制,让产品的待机温度仅为25.5℃,即便进入满载状态,最高温度也仅为81℃。出色的功耗/发热表现也给产品的超频带来了便利,默认电压下,蓝宝HD7970 3G DDR5和核心/显存频率能够轻松超频至1100M/5900MHz。同时亦可轻松完成3DMark 11测试,进一步证明了产品出色的电气性能。
测试总结
没错,目前看来AMD在GCN架构上的改进的确取得了非常大的成功,Radeon HD7970的表现的确很好,而且随着驱动的升级和加强型设计的非公版产品的问世,还会更好。它强大的性能已经足以在最高特效状态下征服所有的3D游戏,目前已知的对显卡性能要求极高的游戏对于Radeon HD7970而言都不在话下。同时产品的功耗、温度也控制得比较好,28nm制造工艺和AMD全新的节能技术功不可没,目前看来Radeon HD7970已经是比较完美了,绝对是顶级游戏玩家的不二选择。不过,广大玩家对于AMD、对于Radeon HD7970仍有一些疑问。
为何没有512bit
此前大家一直期待的512bit GDDR5显存位宽并未在这代显卡上实现,因为目前看来还没有哪个游戏需要超过300GB/s的超大带宽。对于AMD而言,相比之下提升显存位宽的必要性显然不如改良新一代核心架构。新工艺让AMD的“小核心”装进了43.1亿个晶体管,如果再升级512bit的显存控制器,那么核心表面积肯定会变得更大,随之提升的PCB、供电用料的成本也会更高,因此512bit显存恐怕只能等到下一代显卡了。
HD7970有些抠门
从公版看来,HD7970的用料显得非常一般。其实这并不是AMD抠门,而是使用28nm工艺后,Tahiti显示核心不仅本身电气性能出色,同时对供电环境要求也有所下降。同时AMD管用的招数是新品先行,等到对手同档次新品跟进时再度先发制人,调低价格。所以这也注定了AMD更偏向于“小核心”和价格较低的PCB设计方案。当然AMD也将改良升级的工作交给了厂商们,目前已经有类似华硕、迪兰恒进、讯景等非公版产品面市,PCB设计规格也在公版基础上大幅提高。
关于对手
AMD的对手仍然是非常可怕的。设想一下,28nm工艺如果也让NVIDIA的新款旗舰级显卡在GTX580性能的基础上提升50%,那HD7970不是又会落得完败的局面么?不过目前看来,要想超越HD7970并非易事。而NVIDIA最新的GK104显示核心会拖到今年第二季度,同时它看来也并非是款顶级产品。也就是说NVIDIA要想抢回性能王座,不仅需要再做出高效的架构升级,同时也至少会等到今年下半年才有机会。