李小文,彭德义,王 丹
(重庆邮电大学重庆市移动通信技术重点实验室,重庆 400065)
LTE TDD系统上行采用集中式 DFT-扩展-OFDM机制,使上行具有更低的峰均比[1],在其物理层上行链路接收过程中,需根据上行带宽的分配,对经过信道估计及均衡等流程处理后的数据进行离散傅里叶逆变换(inverse discrete Fourier transform,IDFT)。由于3GPP协议规定一个资源块包含12个子载波,对IDFT的序列长度提出了限制,为12的整数倍[2]。这种限制就导致了IDFT不能采用经典的长度为2的幂的快速反傅里叶变换方法来实现,文献[3]提出一种Cooley-Turky算法,针对非2的整数次幂长度的序列采用质数分解划分-组合法,所述算法性能得到一定的保证,但实现复杂度过高。文献[4]结合信道均衡器和解调器性能,提出一种有效的DFT(discrete Fourier transform)Spread-OFDM接收算法,但是只给出了理论上的推导及复杂度分析,并未给出具体的实现过程。根据文献[5],对非2的整数次幂的序列长度通过添零凑成2的整数次幂,进行IFFT后的输出序列,相当于对未添零的序列进行IDFT后的输出序列进行线性插值。基于此,本文采用基于2-N点FFT算法和线性插值的符号抽选相结合的方法,提出一种解上行传输预编码的实现方案,并在TMS320C64x芯片中进行实现。
在TD-LTE上行发送端,即用户设备(user equipment,UE)端,根据e-NodeB端的资源分配指示,采用集中式资源映射的方式,即DFT产生的频域信号按原有的顺序集中映射到IFFT的输入端。根据3GPP TS36 211标准,将UE端经过物理层处理流程中调制模块之后的复值符号d(0),…,d(Msymb-1)分为组(M是调制模块输出的符号长度),每一组symb对应一个SC-FDMA复值符号。
(2)式中:α2,α3,α5都是非负整数。
在TD-LTE上行接收端,即e-NodeB端,通过接收天线接收一个子帧的数据依次进行解上行基带信号、解资源映射、信道估计及信道均衡等流程处理后,针对一个子帧的每一个SC-FDMA(single-carrier frequency-division multiple access)符号中的子载波对应的复值符号进行傅里叶逆变换,以便于后续的解调及相关的译码等流程处理。本节详细给出上行解传输预编码的算法流程,并对几种上行解预编码算法的性能进行仿真比较。
设X(0),…,X(M-1)为信道均衡模块输出的M点的有限长度序列,即为一个SC-FDMA符号的子载波数目长度,根据公式
可以对输入序列X(0),…,X(M -1)取共轭得到X*(0),…,X*(M -1)之后进行M点的DFT(discrete Fourier transform),再对DFT后的序列取共轭即可。为了能够采用快速傅里叶变换,本文对输入的共轭序列X*(0),…,X*(M -1)添加N-M个零,得到 X*(0),…,X*(M - 1),0,…,0 。然后采用N点的快速傅里叶变换得到序列x(0),…,x(N-1),再对该序列采用线性插值算法进行抽选,抽选公式为
对于上述N点DFT过程,采用快速傅里叶变换(fast Fourier transform,FFT)方法,基于时间抽取(decimation in time,DIT)的基2 复数算法[6-7]。傅立叶变换式如下:
输入为经过倒序后的逆序数据,输出为顺序数据[8]。本文将传统的DIT-FFT算法流程进行一定的变形,根据信号流图的转置定理,将传统DIT-FFT算法信号流图中的所有支路方向倒转或者反向,保持各支路的旋转因子不变,将输入序列和输出序列相互交换,则整个信号网络的系统函数不改变。因此我们就可以在进行蝶形运算时,加法运算过程省去了与旋转因子的相乘,而仅在减法运算过程与旋转因子相乘,从而有效提高了在汇编实现时代码的运行效率。并给出8点的DIT基2FFT算法示意图(如图1所示)。
因此,可以用(6)—(7)式计算DIT基2FFT算法。
(6)—(7)式中:WN为旋转因子;xi(k)表示第i级运算中第k个元素。
图1 8点的DIT基2FFT算法示意图Fig.1 Algorithm graph of 8 point DIT 2-based FFT
根据以上的算法描述,进行计算机仿真,从终端通过射频线直连过来的信号经解基带信号、解资源映射、信道估计及信道均衡等流程得到的12列长度为M的数据(若上行发送了探测参考信号(sounding reference signal,SRS)则为11列)。分别进行不同的解传输预编码算法得到的星座图如图2所示。从图2容易看出,采用非插值算法的性能均劣于其他3种算法,而线性插值和抛物插值算法相比于Cooley-Turkey算法性能稍有些损失,但是并不明显。同时可以看出,采用抛物插值算法比线性插值算法所带来的性能增益也并不明显,但是采用抛物插值将带来比较大的复杂度的提升,所以综合性能和实现复杂度的考虑,本文采用基于线性插值的符号抽选方法。
图2 各种算法仿真星座图Fig.2 Constellation graph of algorithms simulation
TMS320C6000最初主要是为了移动通信基站的信号处理而推出的超级处理芯片,该芯片属于高速定点DSP,最高时钟频率为1 GHz,处理性能达8 000 MIPS,比传统DSPs要快一个数量级,因此在测试仪表的开发领域有广阔的应用前景[9]。C64x系列DSP最主要的特点是在体系结构上采用了甚长指令集(very long instruction word,VLIW),由一个超长的机器指令字来驱动内部的多个功能单元。由于每条指令的字段之间相互独立,故可单周期发射多条指令,从而实现更高的指令级并行效率。CPU采用哈佛结构,程序总线和数据总线分开,取指令与执行指令可并行运行。C64x系列DSP芯片的大容量,高运算能力等这一些优点使其在无线基站、终端等场合广泛应用,特别是运算精度能满足测试仪表的开发条件[10]。
基于上行接收端处理流程及以上算法流程,前端模块处理后的数据是一个复数占据内存空间为一个字的大小(实部和虚部分别占高16位和低16位),根据上行分配的最大带宽为100 MB,同时假设上行未发送探测参考信号,且采用正常循环前缀,则经过均衡后输出的序列长度为100×12×12,即最多占据1 440个字的内存空间。然后针对每一个SC-FDMA符号的子载波序列进行解传输预编码过程,具体的处理流程图如图3所示。
图3 解传输预编码处理流程图Fig.3 Dealing flow chart of transform decoding
e-NodeB端对接收的上行数据以子帧为单位进行处理,其中前端模块包括对射频输入信号的解基带信号、解资源映射、信道估计以及信道均衡等处理流程。由于UE所占据的频域资源是由e-NodeB端分配的,故在进行上行接收时,根据分配的频域资源确定子载波数目,从而也就确定了IDFT的点数M。将信道均衡输出序列分为12列(若上行发送了SRS,则分为11列),每一列占据M个字的内存空间。解上行预编码模块主要工作是对每一列进行相应地处理,包括先对每一列输入序列进行共轭处理,然后在输入序列后面添加一定数目的零,将输入序列长度增加到2 048,再进行相应的FFT。之后从2 048个复值符号中根据线性插值公式抽选M个,并进行共轭处理,如此循环所需的列数次。在本实现方案中用到的变量、具体内存分配情况(按最大分配情况)及相应的说明见表1。
表1 输入输出参数Tab.1 Parameters of input and output
综上所述,本文的上行解预编码实现主要分为以下步骤。
步骤1 取每一列数据进行共轭处理,为了保证FFT处理的精度,在共轭处理模块内部对数据按照最大值进行量化处理。
步骤2 在共轭输出序列后添加一定数目的零,使其长度增加到2 048,例如每一列数据长度为M,则所需添零数目为2 048-M。
步骤3 在基2 DIT-FFT过程中,共进行11级计算,只是在第1级蝶形运算之前,先进行序列的倒序,其他级的蝶形运算完,将所得输出数据立即存储到原输入数据所占用的存储单元。采用这种原位计算方法可以有效的节省内存空间。根据蝶形运算过程中旋转因子的变换规律,本文预先将旋转因子存储成一个表的形式,当进行到该级运算时,只需从表中读取数据进行运算,这样有效地减少了代码空间,使实现程序更加简洁。
步骤4 采用基于线性插值的抽选方法,在FFT输出的2 048个数据中抽选M个。具体实现过程中,首先计算偏移位置,根据偏移位置从输入序列中提取相邻的两个数据data1和data2,并计算相应的权系数coff1和coff2,然后分别进行相乘后相加,判断是否达到输出序列长度,否则返回计算下一偏移位置。
步骤5 对抽选的M个数据进行共轭处理,此处可以直接调用第一步的共轭处理函数。然后判断是否已处理完整个子帧的数据,若未处理完则继续从均衡后的数据中读取下一列进行以上所述处理。
由此,基于DSP的上行解预编码具体实现流程如下图4所示。
图4 解传输预编码实现流程图Fig.4 Implementing flow chart of transform decoding
在进行DSP软件设计时,需要对程序进行优化,尽量减少或者消除程序中的“NOP”指令,特别是循环体内的“NOP”指令。通过在CCS3.3上进行程序的仿真运行。本文采用上行带宽分配为5 MB的模式,即上行子载波数目M为120个。整体及其各子模块实现cycle数如表2所示。
表2 不同模块处理速率Tab.2 dealing velocity of different modulations
TMS320C64x芯片的主频为1 GHz,一个指令周期耗时1 ns,故本文提出上行解预编码算法DSP实现,整体可以达到56.55 Mbit/s的处理速率,且达到一定输出信噪比,满足TD-LTE系统的性能要求。
本文从TD-LTE系统上行解预编码的理论出发,根据TD-LTE综合测试系统的特点,通过链路级仿真比较,综合性能和实现复杂度考虑,采用一种最优的基于2-N点FFT算法和线性插值的符号抽选相结合的算法,提出了一种简单有效的解上行预编码实现方案,并对其在TMS320C64xDSP中进行实现。该实现方案已成功运用于TD-LTE无线综合测试仪器和射频一致性测试系统的上行接收机中。
[1]沈嘉,索士强,全海洋,等.3GPP长期演进(LTE)技术原理与系统设计[M].北京:人民邮电出版社,2008.SHEN Jia,SUO Shi-qiang,QUAN Hai-yang,3GPP Long Term Evolution:Principle and System Design[M].Beijing:Posts&Telecommunications proess,2008.
[2]3GPP.TS 36.211 v8.7.0 Evolved Universal Terrestial Radio Access(E-UTRA)Physical Channels and Modulation[EB/OL].[2009-06-12].http://www.3gpp.org/ftp/specs/2009-09/Rel-8/36_series/
[3]BERNARDINI R,CORTELAZZO G,MIAN G A.A Family of FFT algorithms of complexity intermediate between the MD Cooley-Turkey FFT and the MD prime-factor FFT[J].IEEE Transactions On Circuits and Systems,1993,38(8):746-749.
[4]PRASAD N,WANG Shuang-quan,WANG Xiao-dong.Efficient Receiver Algorithms for DFT-Spread OFDM Systems[J].IEEE Transactions On Wilreless Communication,2009,8(6):3216-3225.
[5]唐恬,赵璨.TD-LTE终端测试仪器的IDFT实现方法及其系统:中国101980494A[P].2011-02-23.TANG Tian,ZHAO Can.IDFT Implementing Method and System of TD-LTE User Equipment Testing Instrument:China 101980494A[P].2011-2-23.
[6]何方白,张德民.数字信号处理[M],北京:高等教育出版社,2009:121-129.HE Fang-bai,ZHANG De-min.Digital Signal Processing[M].Altitude Educational Press,2009:121-129.
[7]BEHESHTI B.On Performance of LTE UE DFT and FFT Implementations in Flexible Soft ware Based Baseband Processors[J]IEEE Transactions On Wilreless Communications,2009,6(4):1-4.
[8]CHANGWei-hsin,TRUONG Q.N On the Fixed-Point Accuracy Analysis of FFT Algorithms[J].IEEE Transactions On Signal Processing,2007,56(10):4176-4182.
[9]田黎育,何佩琨.TMS320C6000系列DSP编程工具与指南[M].北京:清华大学出版社,2006:32-50.TIAN Li-yu,HE Pei-kun.TMS320C600 Series DSP Programming Tools and Guides[M].Beijing:The John Hopkins University Press,2006:32-50.
[10]李小文,潘迪.基于DSP的LTE TDD上行信道估计实现[J].重庆邮电大学学报:自然科学版,2010,22(1):14-18.LI Xiao-wen,PAN Di.Implementation Of LTE-TDD Uplink Uhannel Estimation Based On DSP[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2010,22(1):14-18.