范 靖,彭 涛,王文博
(北京邮电大学泛网无线通信教育部重点实验室,北京100876)
TD-SCDMA是我国通信历史上第一个拥有自主知识产权的3G国际标准,截至2013年4月,TDSCDMA用户数已经达到1.2亿。随着用户的迅速发展壮大,市场对TD-SCDMA终端的需求也成倍增加,同时终端市场正往多模、多核的趋势发展。现阶段有关TD-SCDMA多核手机芯片的实现方案研究符合市场的发展需要。
作为终端开机的第一步,下行同步直接影响了终端的整体性能。下行导频时隙(DwPTS)搜索和载波频偏估计在下行同步中是最关键的问题。文献[1-2]总结和比较了现有的主要DwPTS搜索算法,文献[3]总结和比较了现有的主要载波频偏估计算法。本文首先介绍了下行同步过程[4],然后结合各种主要的DwPTS搜索算法和载波频偏估计算法的比较,设计了快速的非信令下行同步方案,最后根据Tensilica多核DSP芯片的特点充分优化了该方案的实现,给出了同步性能分析。
下行同步包括下行同步捕获和下行同步跟踪两个过程。
同步捕获是指用户开机搜索到驻留到合适的小区的过程,主要包括以下步骤:
(1)考察TDD频带2010~2025 MHz内9个频点的功率,选择最大功率的频点开始搜索;
(2)搜索 DwPTS,实现5 ms子帧同步,找出下行同步码(SYNC_DL)码号;
(3)利用SYNC_DL进行频偏估计,调整初始大频偏;
(4)根据第2步解出的SYNC_DL码与Midamble码组的对应关系找出Midamble码和扰码;
(5)根据Midamble码进行频偏估计,进行频偏精调;
(6)解 SYNC_DL相位,实现传输时间间隔(TTI)同步,解广播信道。根据步骤2~6的结果判断是否返回步骤1更换频点。
2.1.1 DwPTS 搜索算法
DwPTS搜索是指找到子帧中的SYNC_DL位置以及码号,实现5 ms同步。目前已有的DwPTS搜索算法主要有标准时域相关法、标准频域相关法、Alessandro频域改善法、特征窗法以及相应的改进算法、帧结构搜索法等[2]。由于文章篇幅限制,下面只对特征窗法做相应介绍。
设接收到的一个子帧数据为 ri,i=1,2,…,6400。32组长度为64的本地SYNC_DL码调制符号序列为sj
k,k=1,2,…,64;j=1,2,…,32。特征窗法[4]包括DwPTS位置粗搜和SYNC_DL码确认两个步骤。DwPTS位置粗搜是指根据帧结构,64 chip的SYNC_DL码的左边有32 chip的保护间隔(GP),右边有96 chip的GP。由于GP的功率很小,SYNC_DL码的功率较大,利用接收信号的功率形状建立功率“特征窗”的方法来搜索DwPTS的大致位置。计算步骤如下所述。
(1)计算接收信号码片功率
(2)计算特征窗功率比值
其中,step为特征窗移动步长,可以取1、2、4、8 等。
(3)找出Ri的最大值
假设其标号为im,则相对初始帧定时的DwPTS的大致位置为
SYNC_DL码确认是指,从 Pos处开始取128 chip数据 r2,其中第 k个元素表示为 r2,k,k=0,…,127,第 i组复值 SYNC_DL码为 si,其中第 k个元素表示为 si,k,i=0,1,…,31;k=0,1,…,63,计算接收信号与32个SYNC_DL码的复相关功率。先在SYNC_DL码后补64个0,再计算复相关:
找出每个powi,k的最大值pow_maxi,并找出32个pow_maxi的最大值pow_MAXm,则确认SYNC_DL码的编号为m,根据最大值pow_MAXm的位置position可以算出DwPTS的起始位置为Pos+position。
特征窗法的改进算法[2]主要有两个:一是将除法改进为乘法;二是为了降低DwPTS的误判率,引入了平均功率准则。
2.1.2 频偏估计算法
频偏是指由于终端的晶振抖动、老化等因素,导致了接收机本振的频率与基站频率不匹配。频偏会严重影响接收机和同步保持的性能,因此需要对频偏进行估计并调整、补偿。由于终端的非信令模式主要是用于生产测试,采用AWGN信道模拟,用于频偏估计的系统模型如图1所示。
图1 频偏估计系统模型Fig.1 Frequency offset estimation system model
图中:
式中,si为Midamble码或SYNC_DL码序列,N为Midamble码或者SYNC_DL码长度,Tc为码片速率。s(t)经过AWGN信道后得到r(t):
式中,Δf是需要估计的频偏,θ是均匀分布于[0,2π)内的随机相位,τ是时延,n(t)是复加性高斯白噪声,nk=nk,c+jnk,s,{nk,c} 和 { nk,s}是相互独立的零均值高斯白噪声序列,其方差均为σ2/2。由于发送的训练序列已知,即,可以算出用于频偏估计的输入序列
以下是常用的频偏估计算法,由于本文篇幅限制只给出计算公式。
(1)Kay 算法[6]
(2)Fitz算法[7]
(3)L&R 算法[8]
(4)Kay&R 算法
(5)差分相关算法[2]
下行同步跟踪是指在下行捕获成功之后,不断地跟踪检测时偏和频偏,并做出相应的调整。
Tensilica公司能够根据应用需求定制出结合高计算性能、低功耗、高集成度等优点的可扩展Xtensa处理器,为现今高容量嵌入式系统提供最优良的解决方案。本文中的非信令TD-SCDMA物理层框架是基于Tensilica公司Atlas LTE解决方案加Maxim射频芯片设计的。Atlas系统主要包括一个ConnX BSP3核、一个 ConnX SSP16核、一个 ConnX Turbo16MS以及3个ConnX BBE16核,每种DSP核由于设计方法不同分别擅长不同的运算处理,根据各个核擅长的运算设计了如图2所示的物理层框架。
图2 TD-SCDMA物理层整体框图Fig.2 The framework of TD-SCDMA L1
本文实现的下行同步主要用到了图2中的BSP3主控核、BBE16_Rx1核、BBEL2缓存和Maxim射频芯片组。
DwPTS搜索作为下行同步的第一步,需要选择计算量小、搜索成功率高、稳定性好的算法。文献[2]中给出了主要算法性能比较,标准时域相关法和标准频域相关法及其改进算法相较于其他算法运算量都很大,同时考虑到同步建立时间,最佳的Dw-PTS搜索算法就集中于特征窗搜索系列算法。在特征窗搜索算法中,在DSP实现时采用乘法比较相较于除法比较计算更准确,计算开销更小,而平均功率判决的改进能使系统在更低的信噪比下搜索成功。考虑到非信令模式下,终端直连与终测仪,系统信噪比很高,因此综合各种因素,最佳的DwPTS搜索算法为基于乘法比较的特征窗搜索算法。图3给出了DwPTS搜索成功率与信噪比的关系,信道采用AWGN信道模拟。
图3 不同SNR下特征窗法DwPTS搜索成功率Fig.3 The success rate of power window method
由于Midamble码比SYNC_DL码长,采用Midamble码进行频偏估计相较于采用SYNC_DL码进行频偏估计会有2~3 dB的增益。下面针对1 kHz频偏信号给出基于Midamble码的各频偏估计算法的性能比较。根据图4可知,各算法在信噪比大于2 dB时均值都稳定于1000 Hz左右,当信噪比低于0 dB时,Fitz、L&R、差分相关算法的性能优于Kay、Kay&R 算法。
图4 不同SNR下基于Midamble码的频偏估计均值Fig.4 Mean frequency offset estimation with M
根据图5可知,各算法的频偏估计标准差随着信噪比的增加而降低,当信噪比高于0 dB时,Kay&R算法最差,其余各算法性能相近。
图5 不同SNR基于Midamble码的频偏估计标准差Fig.5 MSE of frequency offset estimation with M
从表1比较分析可知,Fitz、Kay&R算法计算量最大,L&R算法计算量稍大,Kay算法计算量较小,差分相关算法计算量最小。
表1 频偏估计算法计算量比较Table 1 The complexity of different frequency offset estimation algorithms
综合以上仿真分析,频偏估计采用基于Midamble码的差分相关算法相比于其他各种算法具有更低的计算复杂度,且性能很好,所以采用相关差分算法实现频偏调整是最优选择。
基于非信令综测仪发送 DwPTS和PCCPCH(Primary Common Control Physical Channel)及DPCH的特点,以及以上算法分析,设计了一种简单可行的下行同步方案,如图6所示。
图6 下行同步方案框图Fig.6 Framework of downlink synchronization
方案主要分为两步,即同步捕获和同步跟踪。同步捕获包括DwPTS同步、确定Midamble码、频偏估计(由于综测仪和终端约定了频点,不会出现非常大的频偏,可以直接利用Midamble码进行频偏精调)、TTI同步;同步跟踪用广播信道的 Midamble码,包括用信道估计峰值跟踪时偏和用相关差分法估计频偏。
在同步捕获成功后,一次性地调整同步调整量T(如图7所示),使当前帧直接与系统帧的TTI开头对齐,这使得同步捕获的处理流程变得简单。
图7 同步捕获成功后时偏调整Fig.7 Time adjustment after sync capture
下行同步算法中主要的运算类型有实数或复数加法、实数或复数乘法、数组求最值位置、实数或复数FFT运算,BBE16_Rx1核的设计非常适合这类数据密集型运算。BBE16_Rx1核支持单指令多数据(Single Instruction Multiple Data,SIMD)技术,这种技术可以使用单一的指令对多个连续的数据进行并发操作,从而成倍地提高运算速度。同时,Tensilica公司提供适合该核特点的高度优化过的信号处理函数库,包括极快的FFT库函数。为了提高数据吞吐量,所有算法用到的数组都以16字节为单位进行内存边界对齐。
对于单一的实数或复数加法、乘法、乘累加运算等,都可以通过合理地设计程序结构和数据组织形式,充分利用SIMD技术和自动向量化技术来提高运算速度。BBE16核区分内存数据类型和寄存器数据类型,用于运算的数据自动进行由内存数据类型到寄存器数据类型的扩展,16 b的内存数据类型被扩展成20 b的寄存器数据类型,32 b的内存数据类型被扩展成40 b的寄存器数据类型,当运算完成时寄存器数据类型经过饱和处理自动转换到内存数据类型。对于实数或复数的加法和乘法运算,通过采用SIMD技术能成倍地降低运算时间。图8为SIMD并行实现4组复数并行乘法示意图。
图8 SIMD并行实现4组复数并行乘法Fig.8 Parallel complex multiplication using SIMD
DwPTS同步过程中的最值位置运算也是影响处理时延的关键运算。最值位置运算通过两两比较得到最值并更新最值位置,经过反复往后迭代即可得到数值中最值位置,由于循环里面有if比较结构,编译器不能进行自动向量化,每次循环只能处理一次比较。由于BBE16提供了向量化的比较运算和数据交换操作,可以一次进行8组16 b实数的比较(图9),大大提高了逻辑运算的吞吐量。
图9 SIMD实现8组16 b实数并行比较Fig.9 Parallel comparison using SIMD
经过以上优化处理,最终同步捕获用时400 μs左右,同步跟踪用时40 μs左右,同步处理时延非常小,尤其同步跟踪响应极快。
图10给出了SNR为10 dB时终端频偏估计均值和标准差的收敛情况。
图10 SNR为10 dB时终端频偏估计均值和标准差不断收敛Fig.10 Mean and MSE of frequency offset estimation when continuing to converge at 10 dB
图10表明了随着系统的运行,频偏估计的均值收敛于10 Hz左右,频偏估计的标准差收敛于32 Hz左右。在这样的同步性能下,接收链路的Raw BER(信道译码前误码率)几乎为0,完全能满足系统要求,因此采用这种非信令模式的下行同步设计能够极大地简化多核终端的生产测试。
本文系统性地总结分析了TD-SCDMA系统下行同步过程,比较了下行同步中的关键问题DwPTS同步和频偏估计的各种算法,根据非信令模式的特点合理地设计了下行同步方案,并根据多核手机芯片的特点充分优化了该方案的实现。最终实现结果表明,该下行同步方案处理时延低,同步捕获成功率为100%,同步跟踪阶段没有发现时间偏移。
[1]任修坤,胡捍英.TD-SCDMA中下行引导时序搜索算法研究与比较[J].信息工程大学学报,2006,7(4):370-372,386.REN Xiu-kun,HU Han-ying.Research on and Comparison of Algorithms of Searching DwPTS in TD-SCDMA[J].Journal of Information Engineering University,2006,7(4):370-372,386.(in Chinese)
[2]赵慧慧,易准,安世全.TD-SCDMA系统下行链路同步技术研究[J].通信技术,2007,40(11):199-201,243.ZHAO Hui-hui,YI Zhun,AN Shi-quan.Analysis on Technologys for Searching DwPTS in TD-SCDMA [J].Communications Technology,2007,40(11):199-201,243.(in Chinese)
[3]任修坤,白晓洛,沈战峰,等.TD-SCDMA系统频偏估计算法[J].光通信研究,2008,34(1):65-70.REN Xiu-kun,BAI Xiao-luo,SHEN Zhan-feng.Frequency offset estimation algorithm for TD-SCDMA systems[J].Study on Optical Communications,2008,34(1):65-70.
[4]简伟,余建国,王琳,等.TD-SCDMA下行小区快速搜索的关键问题研究[J].电信科学,2009,25(1):57-61.JIAN Wei,YU Jian-guo,WANG Lin,et al.Study on Monitoring,Management and Control of Self- organized Network[J].Telecommunication Science,2009,25(1):57-61.(in Chinese)
[5]Ventura A,Hindelng T.A Low Complexity Algorithm for Frame Synchronization in TDD-LCR System[C]//Proceedings of the 13th IEEE International Symposium on Personal,Indoor and Mobile Radio Communications.Lisbon,Portugal:IEEE,2002,75-78.
[6]Kay S.A Fast and Accurate Single Frequency Estimator[J].IEEE Transactions on Acoustic,Speech,and Signal Processing,1989,37(12):1987-1990.
[7]Fitz M P.Further result in the fast estimation of a single frequency[J].IEEE Transactions on Communications,1994,42(2,3,4):862-864.
[8]Luise M,Reggiannini R.Carried frequency recovery in all-digital modems for burst-mode transmissions [J].IEEE Transactions on Communications,1995,43(2,3,4):1169-1178.