史晓蓉
(西安电子科技大学CAD研究所,陕西 西安710071)
眼图[1]是描述高速串接信号质量的常用手段之一,通常使用的方法是使用伪随机码流代表所有可能的位流模式,选用时钟参考点作为触发点进行仿真或测量。从位流中取出接收到的每一个周期去覆盖前一个接收到的周期,许多周期叠加形成的波形,看起来像睁开的眼睛,故称为眼图。
传统的高速信令仿真方法是用随机数向量作为输入,进行时域仿真。可以使用有效的仿真工具实现眼图的期望结果。不幸的是,对于许多高速芯片间通信系统的最坏情况,眼图不能由输入较短的随机数准确地确定。当使用大量的随机数作为输入激励时,仿真时间变得很长。Casper提出的PDA(Peak Distortion Analysis)算法解决了这些难题,使仿真不再依赖于随机数的时域仿真。PDA[2]是对系统互连引起的最大抖动和噪声的估算方法,抖动包括确定性抖动和随机性抖动,由串扰和码间干扰引起的抖动和噪声是确定性的,因此可以用最坏情况值对其做出预算,这种计算最坏情况下值的方法称为最大失真分析法(PDA)。文中将PDA算法应用于实际工程之中,解决了DDR3的数据分析问题,为提高DDR3的传输速度提供了保障。
PDA[2]算法假定系统是线性时不变(LTI)系统,利用LTI系统的可叠加性,将互连上的脉冲在各自的时间点上叠加。如何应用叠加性求出高速信令系统中的最坏情况位模式并生成数据眼图是PDA算法的核心内容。
众所周知,如果系统的输入可以表示为多个输入分量之和,即
根据可叠加性,输出等于各输入分量对应输出之和
LTI的叠加性可以对单个脉冲响应叠加,计算出任何位模式的接收信号波形,互连上的脉冲叠加如图1所示。根据互连上脉冲叠加的原理可以将脉冲响应叠加,如式(3)和式(4)所示
图1 互连上脉冲叠加
其中,WC1表示最坏逻辑1的函数;WC0表示最坏逻辑0的函数;y(t)是接收端的脉冲响应函数;VSS0是低电平驱动时的稳态系统响应;T是符号周期;yi(tkT-ti)为传输线i上接收器的脉冲响应,也就是公共-通道干扰,ti为各个串扰源的相对样本点。
最坏码型[3]是眼图最坏时发送端的输入码流,对于逻辑1,最坏情况是将1电平往下拉;而对于逻辑0,最坏情况是将0电平向上拉,所以当互连上脉冲响应的当前点的值为负时,作用于逻辑1,当前点的值为正时,作用于逻辑0,因此如果脉冲响应的当前点的值为负,对于逻辑1来说,码型为1,对于逻辑0来说,码型为0;如果脉冲响应的当前点的值为正,对于逻辑1来说,码型为0,对于逻辑0来说,码型为1。
DQ(Data Queue)数据包括DQ-Read和DQWrite,读和写的区别在于提取tr0文件的数据时,DQWrite提取的是DIMM(Dual-Inline-Memory-Modules)接收端的数据而DQ-Read提取的是CPU发送端的数据,两者的实现步骤完全相同。文中以DQRead为例实现数据眼图,DQ-Read拓扑结构[4]如图2所示,该拓扑结构中带有两片DIMM,但DQ每次只有一个DIMM工作,对于写数据,在提取数据前要清楚工作的是哪个DIMM,这样可以避免错误提取其他数据。对于读数据,每次提取的都是CPU发送端的数据,如图2中的padg,因此不用考虑是哪个DIMM在工作。
图2 DQ-Read拓扑结构
本例中使用DQ_Read.sp文件,该sp文件采用Inter DDR3的十线结构[4],如图3所示,激励加在g上,s、sn上分别是DQs和DQs#信号,其他线上不加激励,其中受害线是g,在g上分别加3组激励,一组是上升边激励,一组是下降边激励,还有一组为时钟激励,这样在仿真sp文件产生的tr0文件中也将产生3组数据结果,一组为上升沿响应,一组为下降沿响应,另一组为时钟响应。现在要利用PDA算法实现a、b、c、d、e、f、g、h 8根数据线的最坏码型和受害线g的最坏眼图。
之所以在受害线上加激励而不在进攻线上加激励的原因是,传输线间的耦合是对称的,驱动线2在线1上出现的情况,类似于驱动线1在静态线2上看到的串扰脉冲。所以可以利用驱动受害线在进攻线上的串扰响应,来判断受害线上的串扰响应。
图3 十线模型结构
实现数据眼图及码型的流程图如图4所示。
图4 流程图
文中设置单位间隔UI为0.75 ns;分析时长为40 ns;分析步长为10 ns;参考电压为750 mV,其中UI的个数等于分析时长与UI的比值为40 ns/0.75 ns。
按照流程图,可以将实现过程分为4步,分别为提取数据合成脉冲响应、确定光标的位置、计算WC1和WC0、计算码型。
2.1.1 提取数据合成脉冲响应
首先需要为Matlab添加HspiceToolbox工具包,通过该工具包内的loadsig命令可以打开tr0文件,并提取出其中的数据,本例中要提取3组数据,上升沿组数据v_r_pada、v_r_padb、v_r_padc、v_r_padd、v_r_pade、v_r_padf、v_r_padg、v_r_padh;下降沿组数据v_f_pada、v_f_padb、v_f_padc、v_f_padd、v_f_pade、v_f_padf、v_f_padg、v_f_padh;时钟边组数据v_pada、v_padb、v_padc、v_padd、v_pade、v_padf、v_padg、v_padh。提取出这些数据后,按如下步骤实现脉冲响应的合成。
(1)平移数据至0稳态处。上升沿组数据分别减去原上升沿组的稳态值平移到坐标0位置,下降沿分别减去原下降边的稳态值平移到坐标0位置。Matlab仿真得到的受害线g的平移和未平移的上升沿、下降沿如图5所示。
(2)下降沿数据向后平移一个UI单位。上升沿组分别在向量矩阵最后加UI列的零数据,下降沿组在向量矩阵前面加UI列的零数据。
图5 Matlab仿真
(3)合成平移后的下降沿组和上升沿组。将新的上升沿组和下降沿组数据分别对应相加合成8个脉冲,并将每个脉冲向量矩阵最后UI列的数据附空得到新合成的8个脉冲响应,合成受害线g的脉冲如图6所示,合成的进攻线和受害线的脉冲响应如图7所示。
2.1.2 确定光标的位置
找到受害线脉冲响应与参考电压(750 mV)相近的两个点的位置,两个点的中间为光标点位置,然后以光标点为中心分别向左向右平移,UI/2即为左光标起始点和右光标终止点。本案例中的光标点及左光标起始点和右光标终止点位置如图8所示。
2.1.3 计算WC1和WC0
受害线和进攻线的脉冲响应合并平移后<0的部分和>0的部分如图9所示。
画出WC1和WC0,如图10所示,即为PDA算法得到的眼图。
2.1.4 计算码型
计算码型时,利用LTI的叠加性,将各自的时钟线数据与数据线数据进行叠加后翻转180°,重新定位光标点位置,每个UI采5个点进行判断,对于逻辑1,脉冲响应数据值为正,码型为0,脉冲响应数据值为负,码型为1,其中受害线的光标点所在UI的码型始终为1。对于逻辑0,脉冲响应数据值为正,码型为1,脉冲响应数据值为负,码型为0,其中受害线光标点所在UI的码型始终为0。PDA算法中没有提到当脉冲响应数据值为0时,码型应该如何处理,文中对于逻辑1,将脉冲响应数据值为0视为-0,码型为1;对于逻辑0,将脉冲响应数据值为0视为+0,码型为1。对于前后光标不足一个UI的情况,如果能够采到一个点,将其用0补齐一个UI,上述方法判断码型并与之前的码型合并;如果不能采到一个点,则不考虑此情况。
(1)将码型重新作为激励仿真DQ_Read.sp文件,生成DQ_Read.lis数据文件。
(2)将DQ_Read.lis文件导入Cadence中,查看该DQ_Read.sp文件各个节点的波形,受害线g上的波形,如图11所示。
图11 受害线g上波形
(3)在Matlab中用合成的脉冲响应,按计算出的码型叠加该数据的眼图,如图12所示。
图12 计算出的码型叠加数据眼图
(4)将PDA算法得到的眼图轮廓,如图12中的点画线所示,分别与图11和图12中叠加得到的眼图相比较,可以得出PDA算法计算出的眼图轮廓。本例中计算得到最坏情况的码型长度为530,比伪随机码流短。
分析了PDA算法,研究了基于PDA算法在实际DQ数据建模中的应用,实现了DQ-Read数据最坏眼图和最坏情况码型,并对眼图结果进行了分析。结果表明,PDA算法能够快速有效地实现DQ数据的最坏眼图及最坏码型,为分析抖动和BER(Bit Error Rate)等信号完整性问题做了准备。
[1]ERIC B.信号完整性分析[M].李玉山,李丽平,译.北京:电子工业出版社,2008.
[2]BRYAN K C,MATTHEW H,RANDY M.An accurate and efficient analysis method for multi-gb/s chip-to-chip signaling schemes[C].IEEE Conference Publications,VLSI Circuits Digest of Technical Papers,2002:54-57.
[3]Bryan C.Peak distortion ISI analysis[OL].(2011-11-02)[2012-03-05]http://www.intel.com/education/highered/signal/elct865.htm.
[4] 华为技术有限公司.Sandy bridge-EP/EX processor HSPICE*signal integrity[M].深圳:华为技术有限公司,2010.