进入异构加速时代

2014-04-29 00:44可乐
电脑迷 2014年6期
关键词:推土机压路机解码

可乐

AMD Kaveri APU开创了AMD全新的异构计算时代,为AMD未来的发展铺平了道路。在硬件上,Kaveri APU在GPU和CPU部分都做出了重大改进,全新的压路机CPU架构和强大的GCN GPU架构使得APU在性能上达到了一个巅峰。在软件方面,借助于统一内存寻址技术和HSA异构加速的强大魅力,APU能够以前所未有的态势展现出其在应用程序加速、并行计算等方面的独特优势。

1 全新的CPU和GPU架构

Kaveri APU在硬件上的优势在于全新的硬件架构。它的CPU部分采用了AMD在推土机架构上大幅度加强、重新调整设计的压路机架构。而GPU部分,桌面显卡上流行的GCN架构的加入,使得Kaveri APU成为史上图形性能最强大的处理器产品。

压路机架构:IPC大幅度提升

AMD之前的的推土机架构设计存在些许遗憾。而在Kaveri APU上,AMD经过全新调整推出了压路机架构,总的来看,Kaveri APU的压路机构相比同档次的推土机和打桩机架构,综合性能提升大约15%~20%。

根据AMD官方资料,压路机架构指令部分大幅度加强,指令缓存追踪失败几率降低30%,分支预测失败几率降低20%,每个线程增加了25%的数据调度宽度,为每个整数单元配备了独立的解码单元。在执行部分,压路机增加了5%~10%的调度效能,提升了L1数据缓存的存储性能。此外,压路机还引入了动态调整大小的L2缓存、增加了微解码操作队列,提升了L1和L2缓存的接口,上述改进使得压路机的性能相比之前的推土机有了明显的提升,尤其是额外增加的整数解码单元,使得压路机的整数性能明显提升,在执行日常操作时性能表现更为出色。

GCN架构:史上最强的融合GPU

AMD官方数据显示,新的GCN架构融合独显核心带来了最多30%的GPU性能增加。Kaveri APU完美支持DirectX 11.2、Open GL 4.3等一些新技术,也支持AMD诸多特色技术,如Mantle、TureAudio、UVD等,堪称史上规格最全面、性能最强悍。

Kaveri APU最多可以集成8个CU单元,每个CU单元有64个流处理单元, 最多拥有512个流处理单元,规格堪比目前桌面独立显卡。AMD宣称Kaveri APU的顶级型号A10-7850K可以在1080P分辨率下以中等画质以每秒30~40帧的速度比较流畅地运行《战地4》。此外,AMD还额外强调了两个数据,856GFLOPS和47%的GPU面积。Kaveri APU的计算能力目前最高可达到856GFLOPS,与此相对应的是上一代Richland APU的最高浮点计算能力为779GFLOPS。从数据来看,虽然Kaveri APU只想对Richland的绝对值提升了约10%,但是由于CPU和GPU架构的改进以及统一内存寻址、HSA等技术的引入,Kaveri APU在实际的计算能力上相比前代的Richland还是有更大幅度的进步的。此外,Kaveri APU中GPU部分的面积越来越大,目前已经达到了47%(浮点计算贡献能力约86%)。更大的GPU面积可以提供更强大的浮点计算能力,也能够使得APU在运行图形应用以及有关并行计算时效能表现更为出色。

2 新工艺提升能耗比

在这一代新的Kaveri APU上,AMD采用了全新的28nmSHP工艺。全新的工艺拥有超高的晶体管密度。之前的Richland APU的晶体管数量有13亿个,核心面积为246平方毫米,但是在Kaveri APU上使用了GlobalFoundries新的“半代工艺”后,拥有高达24.1亿晶体管,但是核心面积却只有245平方毫米,晶体管密度几乎提升一倍。

更小的核心面积有助于降低产品的成本。不仅如此,Kaveri APU借助于全新的28nm SHP工艺,功耗表现也非常令人满意,最高功耗仅有95W,最低功耗甚至只有15W。更低的功耗加上更强悍的性能,大幅度提升了APU的性能功耗比,扩展了APU的市场范围。现在AMD可以提供高性能、低功耗以及超低功耗等多个版本的APU产品,各个类型的用户都可以得到自己想要的选择。

3 异构计算魔力初现

对Kaveri APU而言,硬件架构的进步只能说是常规性的。而Kaveri APU对统一内存寻址(Heterogeneous Uniform Memory Access,简称为hUMA)的支持,则完全可以堪称对整个业界尤其是异构计算发展的革命性推动。Kaveri APU是目前全球首款能够支持CPU和GPU统一寻址的处理器,也是AMD未来发展HSA(Heterogeneous System Architecture,异构系统架构)的核心产品。

在传统的理念中,由于巨大的结构差异,CPU和GPU各有所长,将它们融合在一起进行智能调度并发挥各自的优势,一直都极为困难。传统的CPU+GPU的分离式架构通过PCI-E总线调配CPU和GPU中的数据,并且CPU和GPU各自有拥有本地存储,这样就造成了两者之间数据的共享和传输存在瓶颈,还给编程人员和程序编译带来了巨大的困难。

为了解决这样的问题,AMD在Kaveri APU上支持hUMA,使得CPU和GPU能够使用统一的内存空间,数据存放于CPU和GPU公共的空间中,可以被CPU和GPU同时调用和读取,完全没有任何带宽和数据存储上的阻隔,效率相比传统的CPU+GPU分离式设计有了翻天覆地般的提升,同时为异构计算本身的发展打开了大门。为了更进一步发展Kaveri APU统一内存寻址的强大潜力,AMD还专门组建了HSA联盟,并从软件开发和硬件底层两方面下手支持HSA异构计算的发展。根据AMD展示的一些例子,在HSA的支持下,Kaveri APU相比传统CPU,在JPEG解码速度上的提升高达87.3%。此外还有诸如人脸识别、图形加速等强大的功能,在HSA和Kaveri APU的加持下都能获得极为明显的性能提升。

4 奏响APU最强音

从硬件、软件以及架构设计和规格来看,Kaveri APU不愧是目前AMD最强的APU产品。借助于全新的打桩机架构、GCN融合显卡,Kaveri APU实现了性能的飞跃。在软件方面,HSA架构以及相关软件的配合,使得Kaveri APU开启了一扇通向未来异构计算的大门。这也是AMD布局多年后希望得到的结果。总的来说,Kaveri APU是AMD未来发展的核心,也是AMD未来进化的基础。

猜你喜欢
推土机压路机解码
《解码万吨站》
身体压路机
解码eUCP2.0
NAD C368解码/放大器一体机
Quad(国都)Vena解码/放大器一体机
第一台军选民推土机顺利下线
脂肪推土机 Bulldozer “自体脂肪填充”大揭秘!
机械师用3D打印机制作了一如无比真实的推土机
悍马单钢轮压路机318和320——适用于土方工程的高性能20吨位级通用型压路机
履带式推土机行驶系统运动学分析