Dying
大型3D游戏的日益增多以及手机、平板同液晶电视互联互通应用的日益频繁,对手机、平板等移动设备性能要求也越来越高,当我们在讨论平板电脑CPU处理器向四核芯迈进的时候,移动GPU已悄然向八核芯发起了冲击——
图形性能与计算性能的取舍
“消费大众对于智能手机、平板电脑以及智能电视寄予更高的视觉計算标准,希望它毫无缝隙的连接到个人的数字生活与资讯内容。而GPU計算便可达成这项目的,因为它能够扩大移动设备在电池续航能力内可操作的功能。ARM持续地透过整合市场领先的CPU和GPU技术,致力于系统全面优化的实现,促使高性能和低能效同时实现。”
——ARM多媒体处理部门总经理Pete Hutton
同桌面PC使用的GPU显卡一样,随着技术的进步,移动GPU同样面临着图形性能与计算性能间的平衡与取舍。ARM显然注意到了这一点,将最新发布的Mali-T600系列GPU分为两条线,一条追逐更高的图形性能,另外一条则为图形与GPU计算优化。
50%的性能提升
Mali-T600系列开发代号为Midgard,是ARM的首个统一着色器架构。已公布的Mali-T628、Mali-T624、Mali-T604和Mali-T601四款型号都是强调图形性能的,而Mali-T678和Mali-T658两款型号则是为计算而优化的。ARM通过架构增强使得同样的内核面积能提供更高的时钟频率、更高的IPC(每时钟周期指令数)、更高的能效,从而使每个型号的性能都可以提升50%。新的Mali-T600系列不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,而且OpenCL并行计算能力向桌面GPU看齐,不再局限于移动嵌入式的Emebedded Profile,此外还支持Google RenderScript计算语言。而对于一致性的追求,自动将任务分配给合适的模块,实现异构计算系统性能和能效的最大化(有些类似AMD APU了)。
兼顾画面与功耗的ASTC
ARM在Mali-T600系列中加入了一项名为适应性可扩展纹理压缩的纹理压缩技术,该技术由ARM开发,Khronos Group已将其纳入OpenGL ES规范的纹理压缩技术,能在系统级别提高效率,并改进纹理质量和弹性。依靠此技术,开发者能够通过应用程序使用纹理压缩,并且为每个用例选择适合的格式以及比特率。该压缩标准不仅使开发者开发更加容易,而且还能减轻应用程序处理时候的性能消耗,因此也延长了设备的使用时间。
走近Mali-T600
Mali-T624、Mali-T628和Mali-T678是ARM较早发布的三款Mali-T600系列产品,三者的二级缓存都是32-256KB(推荐每核心32KB),内建MMU(内存管理单元)支持虚拟内存,支持4/16x FSAA全屏抗锯齿。Mali-T624是一个基础型号,核心数量1-4个。Mali-T628核心数量4-8个,每个Shader里有两个ALU(算术逻辑单元)、一个LSU(本地存储单元)、一个纹理单元,图形性能最高达Mali-T624的两倍。二者主要面向智能手机、智能电视应用。Mali-T678是旗舰型号,核心数量1-8个,ALU数量翻倍,计算性能可达Mali-T624的四倍,主要用于平板机市场,可满足计算摄影、多视角透视、增强现实等应用。