TD-LTE下行信道估计的DSP实现

2014-11-20 08:19张德民徐雯雯李小文
电视技术 2014年5期
关键词:导频插值端口

张德民,徐雯雯,李小文

(重庆邮电大学通信学院,重庆400065)

在移动通信系统中,信号经过无线信道传播会经历随机衰落,在接收端要想恢复出发送信号就必须对接收到的信号进行必要的补偿,这就要借助信道估计来得到信道状态信息。因此,有效的信道估计技术是提高无线通信性能最重要的因素之一[1]。当前,LTE几乎已经标准化,且正在商业化。TD-LTE基带处理单元的开发不仅是信道估计算法实现的基础,更重要的是,它的成功开发能够让设备商在激烈的市场份额争夺中占据主动,适应通信潮流的发展[2]。

本文根据3GPP 36系列标准,介绍了LTE系统下行信道参考信号的产生过程及资源映射后的时频位置,基于项目要求和硬件性能,给出了采用LS算法进行下行信道估计的DSP具体实现方案。

1 参考信号

在TD-LTE系统中,上行导频信号是按照块状导频结构进行映射的,下行导频信号是按照离散导频结构进行映射的,使其能够更好地进行信道估计。LTE系统下行包括五种不同类型的参考符号:小区专用(Cell-specific)参考信号、用户专用 (UE-specific)参考信号、多播单频(MBSFN)参考信号、位置(Positioning)参考信号[3]和信道状态指示(Channel State Indication,CSI)参考信号[4]。本文研究的是基于CSRS的信道估计,下面分别介绍小区参考信号的生成和资源映射。

1)伪随机序列的生成

伪随机序列定义为长度为31的Gold序列[3]。第2个m序列的初始值由来决定,其数值取决于序列的具体应用。CSRS的初始值定义为

式中:ns为时隙序号;l为OFDM符号序号;为小区标示号;NCP根据循环前缀类型取值为0或1。

2)参考信号序列rl,ns(m)的定义和生成

式中:c(i)从伪随机序列中取值;为下行最大资源块数目,值为110。

3)CSRS资源映射

参考信号rl,ns(m)将会按照如下方式资源映射到复值调制符号,作为时隙ns天线端口p上的参考符号,即

式中:k=6m+(v+vshift)mod6,m=0,1,…,2-1,m'=m+-;l的取值为

变量v和小区专用频移vshift=mod6定义不同参考信号的频域位置,其中V值由以下公式给出。

2 信道估计算法介绍

LTE下行链路的信道估计采用基于导频的方法,其关键技术有:导频设计,包括怎样生成和插入导频序列;信道估计算法,即怎样获得导频位置信道冲激响应值;插值算法,即怎样将获取的导频位置信道冲激响应值应用于整个OFDM系统。常用经典算法有最小二乘(Least Square,LS)和最小均方误差 (Liner Minimum Mean-Square Error,MMSE)。MMSE是最佳信道估计算法,但需计算信道自相关矩阵,并需对一个大矩阵进行求逆运算,复杂度太高,考虑到DSP处理器的性能,本文选用LS算法作为信道估计算法来实现[5]。

LS算法不考虑噪声,从最小二乘角度,代价函数为

式中:Xp为本地参考信道矩阵;Yp为接收到的参考信号矩阵,令=0则有

数据子载波处信道估计采用线性插值方法。OFDM系统信道估计存在二维问题,即信道需进行时频二维估计。若同时进行二维估计,算法复杂度会较大,对估计器的要求较高。对此,一种简单处理方法是先频域后时域信道估计。若倒序会导致后面的OFDM符号解码产生延时[6]。时域插值和频域插值的表达式为

3 设计与实现

DSP是专门针对密集信号处理算法而设计的通用芯片,而且具有很好的可编程性。本文选用的是TI的TMS320C6455作为开发使用的DSP芯片。该芯片属于高速定点DSP,最高时钟频率为1.2 GHz,而且每个时钟周期可执行8条指令,实行高速运算[7]。

3.1 总体实现流程

以子帧为单位进行实现,假设不同子帧之间无相关性。本设计支持1T1R,1T2R,2T1R,2T2R和 4T4R情况。终端接收到一个子帧时,首先要从接收数据中取出参考信号,然后与本地参考信号进行除法就可以得到导频处的信道估计值。要获取数据位置处的信道估计值,需要分别对其进行频域和时域的插值。一个子帧的信道估计实现流程如图1所示。

图1 信道估计实现总体流程图

3.2 关键模块的具体设计和实现

3.2.1 参考信号

由伪随机序列的生成和初始值定义公式知,随机序列中只有-1和+1两种取值,则又由参考信号的生成公式则rl,ns(m)取值只能是 (±1/,±1/)。而这与LTE中QPSK调制得到的值相同,因此参考信号的生成可以转化为直接对伪随机序列进行QPSK调制。具体实现流程图2所示。

图2 小区参考信号的生成流程图

为节省内存,提高效率,参考信号生成时,默认生成端口0和端口1上的CSRS,只有4天线时,才生成端口3和端口4的CSRS,且为后面取导频数据方便,存入同一个数组的后面。另外,式(3)和传统方法[8]处理都是按照110个RB生成长度为440的随机序列,然后根据下行带宽抽取所需长度的序列。以上处理,不仅增加内存占用,且增加了处理复杂度降低处理效率。基于以上问题,基于当前的下行带宽控制伪随机序列生成,QPSK调制模块生成所需长度的CSRS。另外,此时不需要额外的选取数据操作。

在对解参考信号映射模块进行DSP实现时,因为不同天线配置解参考信号映射差异比较大,因此对1T和2T、4T分别调用不同的解参考信号映射函数。1T和2T的情况下调用函数DeCSRS_1(),4T的情况下调用DeCSRS_2()。虽然不同天线配置其调用的函数是不同的,但是其实现思想是相同的。

解参考信号资源映射就是按照映射位置从各个端口接收数据中取出接收导频数据。因为各天线端口的接收数据以行形式存放,这与映射公式二维性不同,所以实现的关键一步是计算导频的位置。CSRS时频映射位置如图3所示。

图3 小区专用参考信号映射图(常规CP)

解参考信号资源映射的DSP实现流程如图4所示。

式中:N_DL_symb表示下行一个时隙中符号数目,取值与CP类型有关;N_RB_sc为子载波个数,取值12;N_DL_RB为下行资源块个数,由下行带宽决定,最大为110;l为符号序号;k为子载波序号。

计算导频位置的设计分为下面几个方面:

1)简化l和v计算。式(5)中v以分段函数形式给出,这需要多次条件判断,计算复杂度高。DSP实现时,一次循环完成1个符号的解资源映射。观察图3,对每个符号,l和v的取值很明确,因此设计将其4个端口取值依次存表l_v_index={.char0,0,4,3,7,0,11,3,0,3,4,0,7,3,11,0,1,0,8,3,1,3,8,0}。

2)简化导频位置pointoffst计算。观察图3,相邻CSRS间隔为6个子载波,传统处理每次内循环利用式(9)来计算位置,需要多次乘法和加法,为简化计算,每次只需利用l和v计算第一个CSRS位置,后面的只需要一次加法运算依次加6即可。

图4 4T4R解参考信号资源映射的DSP实现流程图

3)简化跳直流操作。每个符号都计算直流位置,在2)基础上,只需判断找到第一个过直流的CSRS,进行加1,后面的依次加6即可。与传统方法比,不需要对直流后面的每个CSRS执行加1操作。

3.2.2 解导频处信道估计

式(8)只需一次除法运算,但对于定点处理的复数除法(a+bj)/(c+dj),通常转换为乘法(a+bj)(c+dj)H/(c+dj)(c+dj)H。由上分析知,CSRS的能量为1,则式(7)变为=。则

式(11)前两项为实部,后两项为虚部,结果用32 bit表示,分别放在高16位和低16位。

传统的方法是分别从两项中提取16 bit进行运算,这种方式,在数据比较小时会产生冗余符号位,降低了后面运算结果的精度。为解决这个问题,本文进行了归一化操作。对于每次计算,找出4项中的最大值,最后找出所有值中的最大值,利用NORM指令计算冗余比特位数并进行相应的左移操作。

LS信道估计模块DSP实现流程如图5所示,其算法描述:

1)部分全局变量的提取和参数的计算,设外循环次数为3。同时进行4个接收天线端口估计,一次循环完成4个符号上的信道估计,因此外循环次数A1设置为12/4=3。设置内循环次数为N_DL_RB×2×2。

2)各端口对应的信道估计值存储位置计算。内存开辟时,依次存放端口天线端口0、1、2和3的信道估计值。4个接收天线端口提取参考信号的偏移地址的计算对应本地生成CSRS起始地址的计算。

3)同时从4个接收天线端口提取CSRS,提取出本地生成的CSRS,进行复数相乘,得到32 bit的实部和虚部,并保留最大值,进行N_DL_RB×2×2次循环,即完成了2个符号上导频的LS信道估计。

4)判断外循环是否结束,为真则跳转步骤5),否则跳转步骤2)。

5)根据最大值进行归一化操作,完成信道估计。

图5 4T4R情况信道估计模块DSP实现的流程图

3.2.3 解导频处信道估计

时频插值模块思路类似,为提高运算效率,同样设计了表格。以两天线为例,插值符号存表{.char 0,4,4,7,7,11},插值系数 1/6,2/6,3/6,4/6,5/6 进行Q15 量化后存表{.short5461,10922,16384,21845,27306}。因为此模块比较简单,具体设计在此不赘述。

4 性能分析

本文搭建的链路如图6所示,对于信道估计模块,分别在MATLAB中和DSP中实现,其他模块均在MATLAB中进行[9]。调制方式是QPSK,单码字处理。

图6 下行仿真链路

用DSP处理信道估计模块时,采用C写控制流程,用汇编写主要的处理模块。采用带宽为20 MHz,含有100个资源块,1 200个子载波。4T4R时关键模块cycle数如表1所示。

表1 关键模块运行周期

本文采用的TMS320C6455芯片最高时钟频率为1.2 GHz,则一个子帧1ms内可运行周期为1.2×106。上面计算的关键模块的运行周期约为3.5×105,所以可以满足实时处理的需要。

图7给出了MATLAB、DSP归一化和DSP未归一化处理在信噪比范围0~20 dB的误比特率曲线。由图7可得,DSP处理时进行归一化操作的性能明显优于未进行归一化的情况。因此,本文采用的归一化操作明显提高了计算精度。对比MATLAB和DSP归一化时曲线可知,本文提出的DSP实现方案,定点处理性能接近于浮点处理时的情况。

图7 误比特率对比图(截图)

5 小结

本文介绍了CSRS序列产生过程和资源映后的时频位置。考虑到实现复杂度和代价,给出了一种基于CSRS的下行信道估计DSP实现方案。对于CSRS序列生成,基于QPSK调制和伪随机序列生成,提出了一种节约内存且提高效率的方案。另外,在CSRS位置信道估计模块,给出了一种提高计算精度的具体实现方案。性能分析和BER对比结果表明,本文提出的实现方案,既能满足实时处理的要求,又能提供较好的性能。该方案已经应用于射频一致性测试系统开发中。

[1]沈嘉,索士强,全海洋.3GPP长期演进(LTE)技术原理与系统设计[M].北京:人民邮电出版社,2008.

[2]卫文娟.SCM信道建模与LTE-OFDM信道估计技术研究[D].武汉:武汉理工大学,2010.

[3] 3GPPTS36.211,Evolved universal terrestrial radio access(E-UTRA);Physical channels and modulation.v9.0.0[S].2009.

[4] 3GPPTS 36.211,Evolved universal terrestrial radio access(E-UTRA);Physical channels and modulation.v10.4.0[S].2011.

[5]李小文,潘迪.基于DSP的LTE-TDD上行信道估计实现[J].重庆邮电大学学报:自然科学版,2010,22(1):14-18.

[6]牛慧莹.TD-LTE系统信道估计技术研究[D].西安:西安电子科技大学,2010.

[7] TMS320C64x/C64x+DSPCPU and instruction set reference guide[EB/OL].[2013-02-01].http://wenku.baidu.com/link?url=wkdp0yynqFFrZ6itMFYIFzY3vTw4yETm1z0DJXV7GeHpUuqy7e1RN36h XU4fUQBEiVRlMjSL8xvcN4vmdN1CgrA9DXZg-3fLPnGAMPTEkG_.

[8]李小文,梁琳.TD-LTE下行信道估计的DSP实现[J].电视技术,2011,35,(7):44-48.

[9]熊宇.LTE下行信道估计及 DSP实现[D].北京:北京邮电大学,2012.

猜你喜欢
导频插值端口
一种端口故障的解决方案
基于Sinc插值与相关谱的纵横波速度比扫描方法
端口阻塞与优先级
基于混合导频辅助的大规模MIMO上行链路信道估计
基于混合遗传算法的导频优化
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
基于导频的OFDM信道估计技术
8端口IO-Link参考设计套件加快开发速度
LTE上行块状导频的信道估计研究