要说到DDR5,必须首先明确一个问题。它与目前主流的DDR5显存,即GDDR5并不是一回事虽有一定的血缘关系,但关系已经相当远了。DDR5是从目前主流的DDR4发展而来。但GDDR5却是从DDR3进化而来的。此外还有另一个发展路线上的低功耗产品LPDDR5。虽然技术有些关联,但主要面向移动、集成市场(图1)。
DDR5的规范其实在2016年就开始规划,也就是说DDR4刚刚开始走上正轨。厂商们就在筹划下一代内存了。这一规范主要由三星提出、美光参与。具体性能方面。规划中的DDR5从3.2GHz等效频率起跳,主流频率会达到6.4GHz,容量则为16GB起跳电压1.1V。而从目前公布的一些DDR5颗粒来看。似乎厂商有意直接出货6.4GHz左右的高频产品(图2),与目前已经进入主流价位的DDR 43×00内存拉开档次。
微小的进步和出色的兼容性
总体来看,DDR5其实就是等效频率翻倍的DDR4,而其翻倍的方式也和之前的DDR2、3、4一样,利用了每个时钟周期内电平的不同来触发(图3),在保持基础频率的基础上可以获得数倍的等效运行频率。这样渐进式的发展兼容性更好,是DDR5成为下一代标准的主要原因之,。
当然,DDR5已经需要在一个时钟周期内触发惊人的32次动作,所以需要非常精确地测量时钟脉冲和电平,并且维持非常高的运行速度和稳定性。为此DDR5颗粒和内存条中也增加了一些新模块、电路和算法,比如用来修正时钟相位、减小时钟误差的相位插值/旋转器(PhaseRotator),用来调整均分时间的延迟锁定回路(Delay-Locked Loop),以及注入锁相振荡器(Injection LockedOscillator)和前向反馈均衡电路(FFE)等。很显然,虽然DDR5没有进行架构大改,但更复杂的电路及元件以及早期的良品率问题还是会明显提升成本,所以预计其上市价格将大幅高于DDR4内存。
DDR6紧随其后
作为DDR5最有可能的后继产品,DDR6也已经初露端倪。这次的先行厂商是SK海力士,其开发的DDR6内存预期速率12GHz,即DDR6-12000,正好又是主流DDR5速率的两倍。DDR6还可能采用更高的每周期数据传输能力等技术进一步提升性能,使其成为一次性能跨越较大的内存升级。根据媒体采访透露出的信息,SK海力士预计DDR6将在5年~6年内发展完成,正式进入主流市场。
需要注意的是,SK海力士在研的“后DDR5”产品仍为技术概念,目前成型的主要有两种,其中一种是延续现有的数据传输规范,另一种则是将DRAM与CPU等片上系统的处理技术结合。很显然,后一种其实和目前HBM内存的使用方式很类似。
GDDR显存与LPDDR内存
在内存规范中,很多人经常会被GDDR和LPDDR搞糊涂。其实GDDR基本与同代DDR没有什么关系,而是有着自己的发展路线,只是有时会有一些交叉。比如GDDR2是DDR2内存的优化版本,而GDDR3内存基本上是原封不动照搬了DDR3颗粒,后续的GDDR4、GDDR5(图4)、GDDR5X都是进一步优化的GDDR3(DDR3)。GDDR6(图5)的变化更大一些,每个芯片配置了两条x8/x16通道,而GDDR5仅有一条通道,此外电压下降到1.35V,耗能降低了35%左右,因此获得了和HBM甚至HBM2显存一较高下的能力。同时其针脚数量也比GDDR5X有所减少,生产、使用都更方便。
当然与DDR内存颗粒相比,GDDR还是有一些改变的,比如修改了外部接口,使用更高的集成度,可以用更少的颗粒提供足够的带宽,但在一定程度上牺牲了延迟,R寸也略大一些。GDDR还会尽量提升运行效率,获得更高的等效频率,同时降低功耗。当然这些能力除了对架构、工艺的修改外,也是因为显存利润较高,所以厂商也更倾向于在GDDR颗粒的制造中投入更新的技术、制程。
至于LPDDR系列,则是(Low Power Double DataRate SDRAM,低功耗DDR内存)的简称,它们的技术、架构与同代DDR内存基本相同(图6),但使用非常低的电压,如LPDDR4使用1.1V电压,使其功耗大幅降低。
需要注意的是,LPDDR和低电压DDR内存如DDR3L也不一样,其电压更低,功耗也更小,因此平台定位就完全不同,前者主要用于手机、平板电脑等设备,而后者则和普通DDR内存的应用方式基本相同,主要用于笔记本电脑,也大量用于台式电脑中。
除了DDR5,目前已经很成熟的内存技术还有HBM(高带宽内存),它在高端显卡上的表现也很抢眼。为什么来自CPU大厂AMD,并且早就宣布过要进军PC内存市场的HBM,却迟迟没有真正的动作?它又会不会借着第二代产品HBM2的成熟和本次PC内存的升级进入内存市场呢?要理解这些问题,咱们先得了解HBM内存及其特点。
顾名思义,HBM内存最大的特色就是位宽特别高,可以在较低频率下实现很高的数据传输率。如果以道路进行比喻,那么DDR内存就是通过不斷提高车速来换取更快的数据运输速度,而HBM则是把路尽量拓宽,通过并行更多的车辆来换取更大的数据运输量。HBM的封装构造也和DDR内存完全不同,是多层颗粒层叠放置(图7),所以体积可以做得很小(图8)。
日日M内存的问题也恰恰在于它的工作方式,由于带宽非常大但频率相对较低,所以与核心连接的线路更复杂、对延迟的敏感度更高。要用HBM做PC内存的话,内存插槽与处理器接口间就必须尽量接近,而且线路非常复杂密集;而如果像GPU一样把它直接做在CPU封装内(图9),就要放弃内存插槽,这都需要对主板结构进行大改。
另外的问题来自CPU,HBM能用于GPU的原因是现在GPU显存位宽都很大,主流产品192bit起步,使用HBM内存的Vega 64(010)和Titan V更达到了2048bit和3072bit。但目前主流CPU的内存控制器只能使用128 bit双通道,根本没法充分利用HBM的高带宽,甚至还限制了可用的内存容量。
HBM仍需机会
DDR内存终归是一种改进式产品,速率一直加倍、加倍就需要越来越精细地控制、识别时钟电平,稍微有一点波动就会造成频率不稳,长远看来必然难以为继,这也是为什么在“后DDR5”时代的内存开发中,出现了类似HBM的与CPU集成的方案。
笔者认为,HBM或者更新架构的内存无疑是未来的发展方向,不过这需要处理器、主板甚至整个PC架构大改,因此仍需要等待机会。
目前看来,HBM的机会主要有两种,一是遇到了非常强力的推手,例如支持HBM,同时具有划时代意义的处理器及相应平台。但在目前已知的下一代产品如第三代锐龙、Sunny Cove中,都没有确认会支持HBM,而且它们似乎都没有采用超高内存带宽的设计,应该也无法发挥HBM的能力。
二是DDR模式的渐改方式出现问题,过高的频率和过于精细的分频让DDR内存变得非常不稳定,或者需要添加更多额外的元件、电路,使得成本无限制地上涨。此时HBM或其他类型的内存,以及新的PC架构就会占有成本优势,进而成为新的主流。
目前的内存选购策略
从目前的情况可以判断,两种淘汰DDR内存的机会最近都不会出现,所以DDR内存的生命还是相当长的。对准备装机的用户来说,并未商品化的DDR5也无需等待,从平台支持和自身的成本来看,它大规模取代DDR4内存估计要到2022年了,近期公布的处理器如锐龙300和X570芯片组即使开始支持DDR5,也必然会保留对DDR4的支持,且主流主板肯定也会有DDR4插槽的。
作为目前电脑中的主力通信协议,PCle的历史已经很长了,即使是PCle 3.0也有着近10年的历史。这在电脑设备标准中是比较少见的长寿了。而从PCle 1.0到3.0,虽然每一代的带宽只提升为两倍(图11),但实际体验却有很大的区别。
以显卡为例,一代PCle可以很好地支持早期GPU,PCle 2.0时代可以让显卡配合处理器进行异构运算,PCle3.0足够的带宽让双显卡并联完全可以不用桥接器。另外比如现在流行的高速M.2 SSD,也只有在单通道达到1GB/s的PCle 3.0时代才能拉开与SATA接口的差距。
那么PCle 4.0呢?现在的RTX 2080 Ti已经把PCle 3.0×8的带宽吃得干干净净,实际带宽需求在PCle 3.0×10左右(图12)。所以不用等下一代显卡,现在RTX 2080 Ti SLI(8+8)或者RTX未来的顶级Titan型号就已经需要更大的带宽了。此外使用PCle 4.0的SSD性能也非常强,传输速度已经可达到6.4GB/s级别(PCle 4.0×4),而且已经有用于服务器中的产品(图13)。
然而这些传统应用并不是PCle 4.0带来的最大改变。其实我们计算一下就会发现,PCle4.0×16插槽的带宽已经达到了32GB/s,接近双通道DDR4 2400内存(38.4GB/s)的带宽,完全是内存级别的传输速度。而在其上运行的3D Xpoint产品则拥有极强的潜力,目前已经可以提供远超NAND,更接近内存的传输速度、相应延迟等指标(图14)。
在目前已经大量使用PCle 4.0的服務器领域,英特尔已经推出了一种新形态的存储架构,即将基于3D Xpoint技术的产品作为内存与SSD存储之间的缓冲(图15),可以大幅降低相应元件的压力,同时大幅提升系统整体性能。甚至可以说英特尔最新的服务器芯片,在性能方面的提升已经开始依赖于这种新架构了(图16)。
那么,与PCle 4.0搭配的3D Xpoint技术到底有何神奇之处,用于服务器的3D Xpoint产品与现在大家熟悉的用来加速硬盘的傲腾有什么不同呢?
改变格局的搭档 3D XPoint
3D XPoint是一种由英特尔与美光(Micron)共同开发的存储技术,虽然其具体原理和结构都仍在保密中,不过基本可以确定,它是一种使用电阻来标记数据状态的新型存储技术。由于电阻这种特性无需电荷来维持,所以其存储的数据是“非易失性”的,也就是除非进行主动擦除,否则断电之后数据仍然存在。