金色黎明
随着游戏产业以及技术的发展,游戏本身的画面质量一直在以很快的速度提升着。不知从何时开始,越来越多的游戏相比之前更加的依赖于显卡的性能,对于玩家来说想要流畅的体验 款对性能有着一定要求的游戏就只能掏钱购买性能强劲的显卡产品,特别是旗舰产品的超高价格无疑会让人望而却步,根本不是一般玩家能够承受的起的。所以有着不俗性能,同时价格更加合理的“甜点级”显卡就非常受到欢迎。早在NVIDIA推出基于Kepler的产品GeForce GTX 460的时候,“甜点级”这个词就受到了众多关注,因为它代表着更低的价格和令人满意的性能,这在同样定位为“甜点级”产品的GeForce GTX 760身上得到了很大的证明,GeForce GTX 760的畅销就能够非常充分的说明这点。相比之下旗舰架构所能给我们带来的更多的是崇敬和对高价的仰望。北京时间2015年1月22日晚22时,NVIDIA发布了他们全新的产品——GeForce GTX 960,这款基于Maxwell架构制造的甜点级显卡受到了诸多玩家的关注。我们在第一时间拿到了产品,在发布的同时为玩家们呈现最详细的产品以及性能信息。GeForce GTX 960会否成为追求性价比玩家的新宠呢?
从显卡进入28nm工艺时代开始,AMD的GPU架构升级换代速度就慢了下来,AMD首发GCN架构的HD 7970到现在已经三年了,期间推出的显卡架构大多是量变而非质变。相比之下,NVIDIA在此期间完成了Kepler到Maxwell架构的转变,虽然工艺没变,但Maxwell的两次亮相都让人眼前亮,性能更强的同时功耗、温度反而降下来了。
去年2月份的Maxwell架构首发以后,NVIDIA已经开始了GTX 900系列显卡的产品线布局,3000元+的旗舰级市场有GTX 980了,两千元以上价位有GTX 970了,千元级及以内的市场则有GTX 750 Ti、GTX 750坐阵,现在布局的则是1000-2000元之间的中高端市场,这也就是今天发布的GTX 960显卡的主战场了。
GTX 960显卡Maxwell架构介绍
这次发布的GTX 960显卡使用的是第三种Maxwell核心了,之前GTX 750 Ti、GTX 980上分别使用了GM 107、GM 204核心,它们的内部架构大同小异,我们之前已经介绍过很多次,有兴趣的朋友可以参考;GM204架构解析。
完整的GM204核心拥有16组SMM单元,2048个CUDA核心,四组64bit GDDR5显存控制器,而对GTX 960来说,它的GM206核心可以说是GM204砍掉一半,SMM单元数量降低到了8组,每组128个CUDA核心,总计1024个CUDA核心。
显存位宽也砍半,从256bit降低到了128bit,显存容量降低到了2GB,这也使得它的显存带宽从GM204的224GB/s降低到了112GB/s,低于GTX 760的192GB/s,甚至比GTX 660的144GB/s还要低,这会对性能产生负面影响吗?
这就要提到NVIDIA的色彩压缩技术了,GTX 960支持NVIDIA第三代色彩压缩技术,官方表示该技术使得每帧图像平均可以降低25%的带宽需求,于是NVIDIA狡猾地提出了一个等效带宽的概念——GTX 960实际带宽是112GB/s,在色彩压缩技术的辅助下,等效带宽是112GB/0.75=149GB/s(等效频率则是9.3Gbps),这个指标虽然离GTX 760还有些距离,不过与192bit位宽的GTX 660相比已经略高了。
AMD在R9 285显卡上也用过类似的技术,其显存位宽从384bit降低到了256bit AMD表示该技术可以提升40%的带宽效率,提升幅度比NVIDIA宣传的还要高。
作为普通用户来说,其实没必要纠结于带宽多少,对用户来说最重要的指标依然是性能、功耗、温度及噪音等直接影响用户体验的参数。
除此之外,GTX 960也同样支持Maxwell架构的其他技术,包括VXGI全局光照、MFAA抗锯齿、DSR超级分辨率等等,还有NVIDIA的G-Sync等。
另外值得提的是,NVIDIA不仅是GFE软件支持硬件加速录像,他们还跟国内的直播平台合作,虎牙软件也可以支持NVIDIA的视频录制加速了,这对喜欢直播视频的玩家来说是个小福利。
相比GK104核心阉割出来的GTX 760显卡,GTX 960使用的量身打造的GM206核心,核心面积从294mm2缩减到了227mm2,晶体管数量也减少到了29.4亿个,TDP功耗也从170W直降到120W,低了50w,这意味着GTX 960会在功耗及温度方面将会有喜人的表现。
目前与GTX 960显卡定位差不多的显卡主要有AMD的R9 280(R9 285就先无视吧,市场上都找不到多少卡)和NVIDIA自家的GTX 760,它们主打的都是1500元级的显卡市场。NVIDIA的Maxwell架构已经在高端/旗舰级、千元级市场布局完成,现在GTX 960则要来冲击这个不高也不低的中高端市场了。
散热绝技:低负载停转
GTX 960显卡的TDP降低到了120W,只需要单6Pin供电,后面的测试中这款显卡的功耗也确实更低了,这还有利于降低显卡温度。当大家对温度的关注没这么强烈的时候,显卡的噪音控制显得更重要了,NVIDIA这次也在GTX 960显卡上做了有趣的尝试。
低负载下风扇停转也不是什么新概念了,这一两年来宣传这个功能最多的是华硕的Strix系列,低负载下风扇停转是它最大的卖点之一。微星随后的Twin Fozr V散热器也开始支持这种技术。
在GTX 960显卡上,NVIDIA已经把这种技术普及开来,要求每家显卡厂商都得支持低负载下停转技术,BIOS会根据显卡当前的温度及功耗综合判断,不过NVIDIA并没有具体的定义什么温度、什么功耗下才会提升风扇转速,而是把具体的裁量交给厂商自己判定,因此各家厂商的具体表现会不一样,有的可能是到60℃才会提升转速,有的为了进步降低噪音,到70℃才会提升转速。
此外,不仅是GTX 960显卡会支持这个技术,传闻中的GTX Titan×显卡也会支持低负载下停转技术,后者将是GM200大核心的产品。
视频硬编码技术
在新产品发布的同时加入一些新的技术似乎已经成为了NVIDIA的习惯,同样是除了产品本身之外我们关注的重点之一,例如之前的GeForce GTX 980/970发布的时候NVIDIA给玩家们带来了DSR、MFAA以及VXGl,这三项技术已经逐渐的融入到我们的使用当中,或许MFAA以及VXGl技术的应用还比较少,但NVIDIA已经透露在2015年将有更多给予这两项技术开发的游戏。
GeForce GTX 960的发布同样不例外,除了支持我们上面所说的三项技术之外,还添加了一个基于ShadowPlay核心功能的视频硬编码技术,这项技术可以造福想要进行电竞直播的玩家,NVIDIA与国内领先的电竞直播平台YY的虎牙直播深度合作,将视频硬编码技术潜入YY最新游戏直播客户端中,为NVIDIA游戏玩家带来电竞游戏独有的最佳体验。
目前大多数直播平台需要软编码也就是CPU编码来实现录制视频的编码,这样做对于做直播的玩家来说最大的影响就是其游戏性能,如果在游戏运行过程当中出现大量的卡顿势必要影响其发挥,所以大多数做直播玩家的主机大多为8000元左右的高端主机,视频硬编码技术就是为了解决这样的问题出现,这项技术会大幅度的降低直播时的CPU占用率,提升游戏帧数,让使用酷睿i3/i5处理器的用户都可实现主播梦。未来H.265合作将为Maxwell 2.0架构的GPU用户在有限网络带宽下带来更好的画质,目前视频硬编码技术支持基于Maxwell架构以及Kepler架构的几乎所有产品。
更多GM206新特性一览
NVIDIA还一如既往的为GeForce GTX 960搭载了包括TDCC、DSR、MFAA、保守光栅化、VXGI等等在内的多项新技术,这些技术针对领域不同,但都会对架构效率及游戏画质带来积极的影响。
在GM206当中,NVIDIA为提升有限显存带宽的利用率而列装了改进后的TDCC技术(Third generation Delta Clolr Compression,第三代色彩压缩技木),该项技术可以将相同色彩的像素信息进行压缩,能够时情况不同带来平均20%以上的数据量下降,这等于等效提升了对应比例的显存带宽。值得注意的是,在早些时候发布的Tonga架构当中,AMD同样加入了作用类似的色彩压缩机制,双方不约而同的选择了堆砌硬件规模之外的方式来提升硬件的使用效率,这是一个相当好的现象。
DSR是另 项出现在Maxwell当中的新技术,该项技术允许显卡将游戏画面以4K分辨率进行渲染,然后采样为1080P分辨率输出至屏幕当中。该项技术与早年间在DIY界曾经名骚时并被传为“佳话”的“resizeAA”有异曲同工之妙(有兴趣的朋友们可以自行搜索那段历史),它利用高分辨率渲染结果来进行低分辨率采样并输出至屏幕上,不仅可以利用显卡的闲置性能,规避低分辨率渲染+采样所导致的像素细节丢失问题,而且可以让1080P分辨率的显示器呈现出接近4K超高分辨率的画面效果。对很多老游戏而言,这是项可以再次提升画质的技术。
MFAA是项全新的抗锯齿技术,传统的MSAA等抗锯齿技术采用当前帧复数采样来作为边缘颜色混合的依据,MFAA则将采样范围扩展到了前帧+当前帧两张画面,这可以在取得相近采样效果的前提下大幅降低采样次数。以MSAA为例,4xMSAA需要在当前帧采样4次以获得色差边缘的像素颜色信息并完成混合,且每帧画面皆如此处理,而MFAA则会在前帧(第n-l帧)及当前帧(第n帧)当中分别采样2次来完成颜色信息采集。每当新的帧(第n+l帧)出现时,由于当前帧(第n帧)已经变成了新帧的前帧(第n+l-l帧),之前采样的信息已经存在,所以MFAA无需再次重复采样,仅需再对新帧采样2次即可完成过去需要采样4次才能完成的混合效果。所以理论上,MFAA可以以MSAA一半的性能消耗实现相近的抗锯齿效果。
除上述技术之外,GM206还列装了更多与游戏引擎联动的新技术,比如基于立体像素及光锥追踪的新光照渲染技术VXGl等,但这些技术需要游戏引擎的特别支持,无法在现有游戏及应用当中发挥作用,因此在这里不予赘述。不过,VXGl技术本身确实是光线追踪实用化之前的一次极有意义的尝试,它甚至可以作为光线追踪的前置技术出现,因此在后续的技术解读类文章当中,我们会予以深入介绍。