何永松 ,秦祖立 ,林 麟 ,吴 凯
(1.上海燧原科技有限公司,上海 200000;2.上海铿腾电子科技有限公司,上海 200000)
高带宽内存(High Bandwidth Memory,HBM)存储系统已成为某些超级计算机中用于高性能图形加速、网络设备以及高性能数据中心的最广泛使用的存储器件。与传统的存储器接口相比,HBM 可实现更高的带宽,同时消耗更少的功耗。HBM 广泛应用于高级封装中,结合中介层基板芯片(Interposer),实现存储器的数据读写。而Interposer的设计随着HBM的速率上升,信号完整性(SI)和电源完整性(PI)带来的挑战越来越大。Interposer的设计人员在初始设计时,为了克服SI 和PI的挑战,需要有效的仿真方法学指导设计。本文从SI 和PI 角度讨论如何设计仿真,并通过实测芯片验证仿真方法学的可靠性。
图1 所示为典型的2.5D 通信系统,HBM 和专用集成电路(ASIC)通过中介层芯片进行数据通信,HBM 单个模块包含了8 个独立的数字通道,每一个通道包含了32 根关键数据信号线,全部通道共包含1 024 根数据信号线,同时包含了地址、时钟等信号,总信号超过1 700根。目前HBM的信号传输速率由HBM2的2.0 GHz~2.4 GHz 上升到HBM3的7.2 GHz。信号经过Interposer 通道,将会遇到以下干扰因素:信号串扰、码间干扰、信号插损、信号回损、电源噪声等等。
图1 HBM 信号通道
设计人员在设计之初需要充分考虑并利用仿真指导优化,以达到上述信号干扰因素的排除或降低影响。
信号通道模型如图2 所示。
图2 信号仿真模型
信号层置于第一层与第三层,而第二层是屏蔽地层。基于此模型,首先仿真了线长S 对于信号眼宽的影响,如图3 所示。
图3 线长对眼宽的影响
图3 表明,当信号线物理线长增加,插入损耗(insertion loss)值变大时,在布局HBM 与ASIC在Interposer 上的位置关系时,需要尽可能降低两者的距离,以确保信号的插损合理可控。除了线长的考虑,还需要考虑线宽与间距的影响。根据实际的HBM 凸点焊球(Bump)的分布得知,预留给HBM 单独通道的物理高度是一定的,这时候需要通过仿真确定线间距与线宽比。
从图4 得知,当线间距与线宽的比值达到3 时,眼宽将会有大的提升,大概有8%的眼宽改善,在影响眼宽的因素中,串扰在3 倍间距后影响会大幅减弱,因此对于速率越来越高的HBM系统,需要充分考虑线间距串扰的影响。除上述因素之外,对设计布局布线的重要SI 考量因素还包括电源和地网络的完备以及硅工艺的特性:包括金属层和过孔层的厚度、介电层的厚度与介电参数等。
图4 线间距线宽比与眼宽百分比
电源网络的供电可靠性对于HBM系统通信是十分重要的考量。当信号从一端经中介层信道发送到接收端时,电源网络会有自身的噪声,对信号传输会有干扰,设计人员在针对自己的产品进行设计,需要充分验证传输通道中的电源噪声的影响,除了电源网络的阻抗指标,对信道的同步开关噪声(SSN)等进行充分验证是十分重要的一步。电源网络供电示意图如图5 所示。
图5 电源网络供电示意图
和传统的存储器件相比,超过1 024 根关键信号线会同时翻转,当信号线上的翻转电流经过供电网络时,经由网络的阻抗会产生波动电压,即为同步开关翻转噪声,对于这种噪声的仿真,目前仿真工具能力的极限无法应对大量传输线的场景。需要新的仿真方法学来替代和覆盖。在此提出倍流流控恒流源方法学(Multiple Current With Current Controlled Current Source,CCCS Method)。图6 展示了CCCS 方案的示意结构图。
图6 CCCS 方法主要方案示意图
首先,将整个HBM 通信模块进行局部的S 参数提取,这部分的电路包含了完整的信号与电源地的组成,其余部分可以视为这部分的复制。其次在使用软件仿真设置时,将这部分的Spice 电路引入流控电流源模块,将电流节点放大到目标倍数。这样就可以用局部准确、全局倍流的方式对电源供电网络(PDN)和全局信号网络进行电源噪声包括同步翻转噪声的预测。
为了验证上述方案的准确性与可靠性,在工具可仿真的范围内做了全仿真与预测式仿真的对比。对比内容包括了电流与眼宽。这里仿真线的数目分别是96、108、120、132、144。而基于12 根线的基础,应用了CCCS 预测式仿真方法,预测了同样数目信号线对应的五组实验。分别得到电流与眼图的对比结果如图7、图8 所示。
图7 CCCS 方案仿真电流与预测电流的比较
图8 CCCS 方案仿真眼宽与预测眼宽的比较
图7 和图8的仿真结果表明在应用了CCCS 预测式仿真方法可靠地将电流倍数到目标数量,并且与全仿真的的结果接近,线性度好。同时也观察到一个现象,当预测式仿真的信号线数量越大,与全仿真的结果误差越小。实验中,预测式仿真基数为12 根线,仿真条件为常温下PRBS 码,提取参数的工具用到了Cadence的XcitePI 和Clarity(3D),电流及眼图仿真工具为Cadence的SystemSI。至此验证了CCCS 预测式仿真的准确性与可靠性。
前述已经阐明了CCCS 仿真方法,可以有效地将局部电源噪声预测到全局的电源噪声,包含SSN的影响。这里,基于工具的仿真能力将基于144 根线的全仿真去预测全局超过1 700 根线的噪声。表1 为选取的144 根线预测式仿真的电流与眼宽的数据趋势。
表1 基于144 根信号线的CCCS 预测式仿真
在相同的仿真环境下,基于144 根线的全仿真进行了预测式的4 组实验,使用的码型为PRBS,可见的是电流的线性增加及眼宽占比的线性下降。预测式的仿真结果表明,基于现有的设计,当同时翻转超过1 700 根信号线时,常温下将会有大约2.2%的眼宽的损失。基于相同的仿真环境,选取和搭建了测试平台,见图9,在此平台上做了信号通道眼宽的扫描。
图9 实验室测试平台
在芯片的通道扫描中设置了两组码型PRBS 和1010,在这两种码型下,分别单独启动HBM 模块的1 到8 个通道(Channel)进行眼宽扫描,得到了图10 和图11的扫描结果。
图10 HBM 模块8 通道启动眼宽损失分布(PRBS 码)
扫描过程中,除去时钟命令和地址信号,同时翻转的关键信号为DQ/DQS/DQSN/DBI/DM/PAR 等,全通道大约1 280 根,从图10 和图11的扫描结果,可以看到单个通道随着全通道的启动,受到了不同的影响。其中PRBS 码测试下,通道3 受到了2 个眼宽单位的损失,这里,每个单位实验室设定为0.78%眼宽。可以看出,PRBS下通道3 最大损失了1.56%眼宽,1010 码型下通道3 损失了2.34%眼宽。
图11 HBM 模块8 通道启动眼宽损失分布(1010 码)
本文讨论了在2.5D 和3D 封装形式下,基于信号完整性与电源完整性的考量,介绍了如何仿真优化HBM系统高速信号通道的设计,特别提出了CCCS 预测式电源噪声的仿真方法,进行了全仿与预测仿的对比,并与实验室芯片实测数据进行对比,验证了仿真数据的合理性和一致性。