可用于VR和AI的高速显存

2016-12-03 14:44
CHIP新电脑 2016年11期
关键词:显示卡存储器内存

电脑游戏玩家和高性能电脑对于显示卡的要求很高,尤其是需要快速的显示内存,HBM2和GDDR5X这些新技术将是最新的解决方案。

虚拟现实(Virtual Reality,简称VR)领域,沉浸式的虚拟现实环境需要的图形处理能力是传统3D应用程序和游戏的7倍,而人工智能(Artificial Intelligence,简称AI)领域,深度学习(Deep Learning,机器学习中一种基于对数据进行表征学习的方法)的语音识别软件分析的样品数量增加了10倍,错误率可以下降40%。在VR和AI这两个领域的应用都运行在高度并行的图形处理器上,这需要大量快速的内存来应付不断增长的数据量。同样地,越来越逼真的电脑游戏对于显示内存的容量和速度要求也越来越强。事实上对于台式电脑来说,如果从大型游戏的角度考虑,一直以来显示卡内存再快、再多,也只是处于勉强够用的程度。为了满足4K分辨率的显示需求以及VR和AI的更高要求,第五代的DDR显示内存已经到了极限。需要有新的技术来解决这一问题,而GDDR5X和HBM2这两种新技术是目前最有前途的“接班人”。

进化:GDDR5X

GDDR5继任者GDDR5X的技术规范已经在2016年1月发布。从2016年夏天开始,英伟达的中高端显示卡GeForce GTX 1080已经可以使用GDDR5X内存。GDDR5X通过改善GPU和显存芯片之间的信号通路来适应新的挑战,这使得显示卡的布局有别于传统的布局,因此,该显示卡的基本结构有一些小的改动。而与2008年发展至今的GDDR5相比,GDDR5X的优点主要有以下3点。

16N预取替代8N预取

通过内部数据线的改进,现在每个时钟周期芯片可以读取或写入64字节而不是32字节,这使得GDDR5X不必增加时钟频率带宽也可以翻倍。

工作更有效率

GDDR5X采用现代化的制造工艺和较小结构宽度,操作电压从1.5V降低到1.35V,有效地降低了释放的热量。

单个芯片的容量

在新规范中增加到4GB、6GB、8GB、12GB或16GB(GDDR5:512MB~8GB),其中的6GB和12GB是新增加的,这允许设备制造商根据设备的差异更灵活地进行选择,这对于移动设备来说意义重大。

革命:HBM2

在突破GDDR内存技术局限性的问题上,2013发布的高带宽存储器(High Bandwidth Memory,简称HBM)技术提供了新的方法。它通过堆叠式的存储器芯片和一个非常快速的“插入器”与GPU直接连接,不仅拥有更高的存储密度,还可以提供更高的数据传输通道,拥有更快的传输速率,而且更节能。不过,HBM也并不是没有缺点的,对于第一代HBM来说,重要的缺点是最大容量只有4GB,这对于游戏或者4K分辨率的内容已经有点不足,更难以应付虚拟现实或其他高性能的应用。此外,最高只有500MHz的时钟频率也相对较低。

自2016年开始,第二代HBM2已经逐步地解决了上述问题。通过每个芯片更高的存储密度使更高的内存容量成为可能,并且时钟频率也达到了2GHz。此外,该技术将一个硬件存储器信道虚拟为两个伪通道模式,也可以被类似CPU超线程之类的技术更好地利用。目前,三星已经在批量生产堆叠4层的芯片,而SK海力士也准备开始生产堆叠式的芯片,据说有可能堆叠多达8层,这两家制造商都希望能够在2016年生产8GB容量的HBM2芯片。

这将会是HBM2的第一个产品,用于服务器和高性能计算的英伟达TeslaP100 GPU加速器,配备16GB的内存,在Pascal架构下可以实现720GB的带宽,3倍于英伟达当前Maxwell架构的顶级显示卡。

AMD则计划在2017年的年初推出第一个HBM2显示卡,不过,也有猜测AMD有可能在2016年就会推出被称为“Vega”的新一代显示卡,以应对英伟达的新产品。

最终的获胜者

从技术的角度来看,HBM2可以提供比GDDR5X更高的性能,并且它的芯片采用3D设计,未来进一步发展的潜力很高。然而,它的价格仍然非常高,因而,它将继续被用于昂贵的服务器和高端的游戏显示卡上。

GDDR5X仍然使用常规的平面内存芯片技术,使用这种内存显示卡相对来说更经济实惠。因此,GDDR5X可以很快地应用于最新的高端显示卡,并在维持合理价格的情况下提供极高的性能,将来要适用于VR显示卡。

猜你喜欢
显示卡存储器内存
静态随机存储器在轨自检算法
外部高速缓存与非易失内存结合的混合内存体系结构特性评测
“春夏秋冬”的内存
存储器——安格尔(墨西哥)▲
基于Nand Flash的高速存储器结构设计
基于内存的地理信息访问技术
上网本为什么只有1GB?
一种存储器容错设计方法