GeForce GTX 750 Ti/GTX 750 新技术解析

2014-04-29 00:44
CHIP新电脑 2014年4期
关键词:显示卡纹理指令

作为Maxwell GPU的先锋军,由于工艺的限制,GeForce GTX 750 Ti和GTX 750并没有使用20nm的工艺打造,而是较为保守的使用了成熟的28nm工艺。而在架构方面,全新的Maxwell架构经过了全新的设计,计算单元组织方式进化为SMM(Sreaming Multiprocessors Maxwell),降低了SM尺寸,提高了SM数量及调度逻辑单元数量,主打每瓦特性能。

Maxwell架构首发的两个型号产品GeForce GTX 750 Ti和GeForce GTX 750均使用了新的GM107核心。这次新核心产品的发布与之前略有不同,一方面是受20nm工艺拖累,首发的GM107是一颗偏低端的核心,一改之前首发旗舰级核心的做法。另一方面,这两张新架构、新核心的显示卡也没有使用全新的产品序列,仍然和Kepler架构产品一起使用GeForce GTX 700系列的命名,这次英伟达的做法相比之前经常旧瓶装新酒的做法可谓非常厚道。

GeForce GTX 750 Ti和GeForce GTX 750均基于Maxwell架构中低端的GM107核心,其中前者使用的是全规格的核心,拥有640个CUDA处理器,可搭配1GB或2GB的128bit GDDR5显存,预设频率1020~1085/5400MHz,官方TDP仅60W;而后者屏蔽了一组SMM,拥有512个CUDA处理器,搭配1GB 128bit GDDR5显存,预设频率1020~1085/5000MHz,官方TDP仅55W。为了凸显低功耗特性,GeForce GTX 750 Ti和GeForce GTX 750公版显示卡都仅使用了5.75英寸、单槽位的身型,并且更都采用无外接供电设计。

根据英伟达的说明,GeForce GTX 750 Ti和GeForce GTX 750两款新品上市(参考售价999元和799元)后,将会取代GeForce GTX 650 Ti的地位,下承GeForce GTX 650,上接GeForce GTX 660(GeForce GTX 650 Ti Boost将逐渐退市),并与AMD的R7系列多款显示卡展开竞争。

全新的麦克斯韦1.0架构

英伟达表示,Maxwell架构将会有两代,用在GeForce GTX 750 Ti和GeForce GTX 750上的GM107核心和只用于移动版的GM108核心均采用的是第一代的Maxwell 1.0,以28nm工艺制造,主打低功耗。而Maxwell 2.0,或者是第二代,传说将会使用20nm工艺打造,会晚些到来,主打高性能与发烧友市场。

Maxwell 1.0主打的将是能耗比或者是每瓦特性能,通过英伟达之前推出的Tegra处理器和游戏设备SHIELD就可以看出,英伟达在原有的传统游戏PC、工作站及超级计算机领域外,开始拓展一些新的市场。注重低功耗和每瓦特性能的显示卡,可以应用于新晋的、以Mini-ITX为例的小型PC和以Steam Machines为例的游戏主机,在家庭娱乐市场上进一步分一杯羹。

GM107的核心布局与上代相比变化其实并不大,定位偏低的GM107核心拥有一个GPC,两个64bit显存控制器及配套的2组ROP单元(每组8个,共计16个),外加二级高速缓存。GPC里仍旧包含一个光栅引擎(Raster Engine),SM单元的数量增加为5个,组织方式也使用了全新的设计。随着Fermi、Kepler、Maxwell架构的逐步进化,GPC里的SM架构组织方式也从SM变成了SMX,再变为全新的SMM(Sreaming Multiprocessors Maxwell)。

Maxwell架构的SMM,依然和SMX一样,由PolyMorph引擎(2.0)、CUDA核心、Load/Store单元、SFU、Warp调度器和分发单元、Register File、纹理定址/拾取单元、纹理缓存、指令缓存等等组成。最主要的变化是,在PolyMorph引擎(2.0)和指令缓存区之下,Maxwell架构将一个SM分为4个独立的处理块,每个独立的处理块拥有自己的指令缓冲区、调度器、32个CUDA核心,以及Load/Store和SFU单元。之前在Kepler架构一个SMX里的纹理高速缓存和64KB共享显存/一级高速显存组合也发生了变化,由一对处理块共享4个纹理过滤单元和一个纹理高速缓存,然后64KB共享显存成为独立单元,被4个块共享。在SMM外,Maxwell架构还将核心的二级高速缓存配置从GK107(同样是一组GPC、两组显存控制器)的256KB大幅提升到了2 048KB,用以降低显存带宽需求。

除了全新的布局,控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面,Maxwell架构也进行了改进。这样Maxwell架构,一改Kepler架构的SMX主要大量堆CUDA计算核心,架构效率会受到一定程度的影响的做法,核心降低了SM尺寸,提高SM数量及调度逻辑单元数量,以达到简化设计与调度逻辑、节省了面积与功耗、降低计算延迟的目的。

除了架构的革新,Maxwell还有几点新的变化。首先,Maxwell改进了在Kepler上加入的硬件H.264视频编码器NVENC,可以实现更快的编解码速度(英伟达称编码速度可以提升1.5~2倍,解码速度提升8~10倍),以服务于H.264视频编解码和自己的特色功能ShadowPlay,游戏视频实时录制。其次,Maxwell使用了全新的GC5功率状态,能在视频播放等轻载型使用场合降低GPU的功耗。除此之外,英伟达显示卡一直以来的一些特性,比如支持PhysX、TXAA、GPU Boost、G-Sync、GeForce Experience等等,Maxwell核心、GeForce GTX 750 Ti和GeForce GTX 750都全部支持。

我们非常惊喜的看到,Maxwell所采用了的全新设计,一改之前Kepler使用庞大规模ALU设计的SMX,采用新的SMM,让核心可以更有效的利用每一个计算单元,开始走上了追求效率之路。外加Maxwell架构在编译器调度、每时钟周期发出指令条数等方面的改进,以及容量更大的二级缓存等设计,使得每个计算核心的效率和每瓦特性能都有了显著增长。只是受到20nm制程工艺的拖累,我们暂时只能靠一颗偏低端的核心来尝尝鲜。不过对性能有较高要求用户也无须着急,高性能Maxwell 2.0产品的出现只是时间问题。

猜你喜欢
显示卡纹理指令
听我指令:大催眠术
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
ARINC661显控指令快速验证方法
LED照明产品欧盟ErP指令要求解读
TEXTURE ON TEXTURE质地上的纹理
联想发布全新VR工作站能预装Windows 7
消除凹凸纹理有妙招!
读编往来
坐标系旋转指令数控编程应用