赵海军,黄 平,贺春林,蒲 斌,崔梦天
IP电话(Voice over Internet Protocol,VoIP)是全IP蜂窝网络中一个重要的服务单元,因此,人们一直致力于不断提高宽带码分多址(Wideband Code Division Multiple Access,WCDMA)系统中的VoIP容量和服务质量.尽管在第三代合作伙伴计划的版本5和版本6中引入了高速分组接入(High-Speed Packet Access,HSPA),以及在版本7中引入了连续分组连接(Continuous Packet Connectivity,CPC)来稳定地提高WCDMA中的VoIP业务,但仍不能满足日益增长和高质量的VoIP要求.文献[1]表明,基于HSPA的VoIP比电路交换(Circuit-Switched,CS)语音具有相同或更好的性能、质量和覆盖范围.文献[2]研究了诸如控制信道开销降低的CPC特征,如专用物理控制信道(Dedicated Physical Control Channel,DPCCH)选通,以大大提高上行链路的容量.文献[3]针对多天线下行广播信道的多址传输,提出了复杂度较低、性能优异的时间、频率和空域联合编码图样的设计,以及一种采用联合功率域叠加和准正交空时编码的非正交传输方案,并针对无过载的上行非正交多址信道和非正交多址传输的一些关键接收机技术进行了研究.对于上行链路的VoIP,如何利用基站上的多用户检测(Multi User Detection,MUD)来进一步提高VoIP容量和服务质量是非常重要的.MUD非常适合于蜂窝上行链路,因为它利用短传输时间间隔(Transmission Time Interval,TTI)提供的高速上行链路分组接入(High-Speed Uplink Packet Access,HSUPA)并采用时分复用(Time Division Multiplexing,TDM)对VoIP用户进行分离和分组.例如,一个20ms的语音帧可以使用一个2ms的TTI来传输,从而可以得到时分多路复用的10个用户组,即时分复用的水平可以通过在一个2ms的TTI中传输多个语音帧来提高.时分多路复用减少了重叠用户数,从而显著降低了MUD的复杂性,这也是VoIP相对于CS语音的一个关键优势;为了避免最佳联合检测的复杂性[4],通常采用串行干扰消除(Successive Interference Cancellation,SIC)[5]或并行干扰消除(Parallel Interference Cancellation,PIC)检测器[6]作为MUD的次优实现.
近年来,关于SIC的研究引起了广泛的关注.文献[7]和文献[8]研究了复高斯多址信道,发射机以约束功率独立发送信息,在复高斯多址的容量区域中将实现任意速率元组的多用户代码,将解码器限制为具有均衡的连续译码类型.这样,解码器通过前馈和反馈均衡向量参数化,通过最大化每个用户在这些向量上的互信息,获得了最佳串行解码,最大限度地提高了每个用户的信号与干扰比.文献[9]针对采用串行干扰消除算法的无线网络系统如何控制,节点间传输功率使系统效用最大化问题,提出了非合作博弈算法来解决节点间的传输功率控制,以及串行干扰消除算法功率控制的非合作博弈,仿真实验表明,算法可以获得较高的无线网络吞吐量.文献[10]提出在一个多接入信道中,只要对每个接入信号进行适当的速率控制,解码后SIC就可以实现开环容量.
与SIC相似,PIC也可用于MUD.PIC的优点是处理延迟不会随着用户信号数的增加而增加,同时,PIC有利于并行化的硬件结构.文献[11]针对LTE-Advanced上行链路MIMO SC-FDMA系统中的定时同步问题,提出了一种基于QR分解与PIC相结合的定时同步算法.算法通过QR分解检测获得初步的信息估计值,应用PIC方法,将定时偏移所产生的干扰从接收信号中消除.仿真结果表明,该算法可显著提高系统性能.文献[12]针对发射与接收端天线数目相当的大规模多输入多输出系统存在线性检测算法性能较差和检测算法复杂度偏高的问题,提出了一种增强型PIC算法,将搜索空间扩大到噪声增强方向矩阵的正交向量空间,同时利用近似对数似然方程值排序来减小复杂度.仿真结果表明,在误比特率为10-5时,算法所需单位比特噪声功率谱密度比传统MMSE-SIC算法小2dB,复杂度降低了25%,可以较好地实现大规模多输入多输出的上行检测.
SIC和PIC的一个关键因素是再生检测的用户信号,这有几种做法.首先,一个用户信号可以在它解调后(解码前)再生,称之为解码前消除,也可以在解码后生成,称为解码后消除.解码后消除虽然具有更好的性能,但它是以更高的处理延迟为代价的.其次,再生信号可以基于硬判决比特或软判决比特.对此,如何采用能够进行多用户检测的先进基站接收机来提高WCDMA上行链路中IP电话的容量和覆盖,以及避免联合检测的复杂性,本文提出采用多级SIC检测器或PIC检测器作为MUD的实现,为了进一步降低复杂性,采用TDM将用户组及时分离,以便MUD能够集中在少量重叠信号上.在检测另一个用户信号之前,SIC或PIC从接收信号中消除来自于接收信号的许多临时检测到的用户信号.临时检测的用户信号可以基于解调数据或解码数据和基于硬判决值或软判决值再生.对于软消除,采用Turbo译码器的对数似然比(Log-Likelihood Ratios,LLR)设计一种方案来产生比特软值.仿真实验表明,当每个TTI有5个活跃VoIP用户时,对于实现10%的BLER,每个用户所需功率可以减少高达3dB,当有更多的活跃用户时,通过MUD所能实现的功率减少更多.这样的功率减少,意味着系统具有了更高的容量、更好的覆盖,并提高了VoIP用户的通话时间.
式中接收向量r(t)由来自于每个接收天线的单元构成,KT为总的重叠用户信号数,rk(t)为第k个用户信号贡献的接收信号,n(t)为加性白高斯噪声(Additive White Gaussian Noise,AWGN),其协方差为E[n(t)nT(t)]=N0I,这里N0为噪声均值,I为单位阵.每个用户信号通过一个时间色散信道发送,从而得到:
考虑一个TDM调度器,将VoIP用户分割成G个用户组,如图1所示.由于在WCDMA上行链路中缺乏精确的用户同步,以及时间色散信道,故用户组之间的干扰仍然会出现在一个TTI的两侧.然而,重叠部分相比于TTI的长度要小(一般而言,重叠部分大约为256个码片长度,而一个2ms的TTI由7680个码片构成).假设组间干扰相比于同一组中由用户造成的干扰,以及来自于其他蜂窝的其他重叠用户造成的干扰,是微不足道的,因此,接收到的信号可以建模为:
式中gk(l)为信道系数向量,Lk为路径数目,τk(l)为第l条路径的延迟,xk(t)为发送的用户信号.发送的用户信号由许多物理信道构成:
式中Jk为物理信道数目,Ak(j)为第j个信道的振幅,sk,j(i)为编码符号,ck,j,i(n)为扩频序列的第n个码片,Nk(j)为扩频因子,Tc为码片周期,p(t)为码片脉冲形状.
图1 将VoIP用户分割成G个用户组的时分复用
对于HSUPA来说,需要3种类型的物理信道.①增强专用物理数据信道(Enhanced Dedicated Physical Data Channel,E-DPDCH)携带编码后的数据比特.②增强专用物理控制信道(Enhanced Dedicated Physical Control Channel,E-DPCCH)携带与HSUPA操作相关的控制信息.③专用物理控制信道(Dedicated Physical Control Channel,DPCCH)携带功率控制下行链路信号的导频符号和功率控制命令.
本文考虑12.2kbps的语音编码速率,并假设在各种协议层上增加开销之后,到达MAC层的总数据速率为16kbps.为此,需要有效的报头压缩[1].进一步考虑将2个20ms的语音帧捆绑在一个2ms的TTI中传输,这样就得到一个大小为640位的传输块,加入CRC位(作为奇偶校验),通过速率为1/3的Turbo编码被编码成1920位,通过扩频因子为4进行扩频,然后采用一个E-DPDCH发送.在一个2ms的TTI中传输40ms的数据值意味着一个VoIP用户仅需要在每20个TTI中传输1次,不包括HARQ重传,根据图1,这允许20个用户组通过时分复用(G=20)共享信道.3种物理信道的功率分配因子分别为:E-DPDCH(Ak(j)=2)为66.7%,DPCCH和E-DPCCH(Ak(j)=1)为16.67%.
其他无线承载也可用于VoIP配置,如一个20ms的语音帧可以用一个2ms的TTI来传输而不是2个语音帧.这要求用户更频繁地传输,表面上是每10个TTI传输1次而不是20个TTI,这样会导致每个TTI有更多的码分多路复用用户,进而导致更高的MUD复杂性;相反,在一个TTI中将2个或更多个20ms的语音帧打包传输会降低MUD的复杂性,并可能提高性能(由于更好的Turbo码性能).
图2所示为本文提出的一个2级PIC检测器.在第一级,采用一个普通的单用户检测器对信号进行检测,然后再生检测信号;在第二级,其他检测信号在检测感兴趣的信号之前被消除.在每一级,可以并行检测多个期望的信号,因此,多级PIC的处理延迟仅依赖于级的数量,而不是MUD信号的数量;其中的每个单用户检测器实现如图3所示.
图2 多级PIC检测器
图3 单用户检测原理
图4所示为本文提出的一种可用于MUD的2级SIC检测器.在第一级,根据来自于其他用户的干扰信号的出现来检测第一个用户.在检测到第一个用户信号后,从接收信号再生并消除其接收信号的副本,检测器然后继续检测第二个用户信号.重复该过程,直至全部用户信号被检测并从接收信号中消除.通过这样,我们希望最后被检测的用户有最好的性能,而第一个被检测的用户有最差的性能.为了使得过早被检测的用户从干扰消除中获得充分的好处,就要采用第二级SIC过程.由于每个期望信号是在第一级结束时被消除,所以在第2级中检测用户k的信号之前必须加上在第一级过程中再生的用户k的信号.
不管采用PIC还是SIC,信号再生可以基于解调比特(解码前)或解码比特(解码后).在前一种情况下,把解调比特和估计信道响应用于再生一个用户信号,这个过程不包括解码器,因此不需要等待接收器接收整个码字,因而处理延迟可以小于一个TTI;后一种情况需要解码器解码信息比特,然后被重新编码以得到由E-DPDCH携带的信道比特.重编码比特远比解调比特可靠,这是由于速率为1/3的Turbo码的高编码增益,因此再生信号可以更精确,便于更好地消除.
图4 多级SIC检测器
对于解码后干扰消除,可以考虑硬消除和软消除.对于硬消除,是采用硬判决信道比特再生一个用户信号.如前所述,硬判决信道比特是通过重编码检测信息比特而得到的.CRC比特表示在检测信息比特之间是否存在错误,因此,一种方法是仅在CRC校验指示无错误检测时才消除一个用户信号.如果操作的块错误率(Block Error Rate,BLER)很低,则将获得大多数的干扰消除增益;另一种方法是采用重编码信道比特来消除一个用户信号,即使CRC不校验时.
软消除方法旨在获得发送符号sk,j(i)和估计符号sˆk,j(k)之间的最小均方误差(Minimum Mean Square Error,MMSE)MMSE的解是条件平均[13],其中:
式中P(sk,j(i)|r(t))为后验概率,可以采用信道比特的后验对数似然比(Log-Likelihood Ratios,LLR)计算得到.WCDMA的Turbo码产生2种类型的信道比特:系统比特和奇偶校验比特.系统比特基本上是信息比特,因此,系统比特的LLR经过Turbo码译码器后就成为现成可用的.为了获得奇偶校验比特的LLR,需要修改Turbo解码器.根据文献[14],比特LLR可以采用前馈指标αt(m)、反馈指标βt(m)和分支度指标γt(m)计算得到,即:
式中ξi为相应信道比特等于i的状态转换的集合.采用WCDMATurbo码的状态转换如图5所示.
图5 采用WCDMA Turbo码的系统和奇偶校验比特相关联的状态转换
采用网络仿真工具NS2中的链路仿真来评价本文提出的多级SIC和PIC检测器的性能,链路除了AWGN外,还接收多个VoIP信号,每个VoIP信号通过一个色散信道发送.假设全部信道有相同的多径分布,但有各自的衰落系数.考虑多径分布由4个子空间路径构成,平均功率分别为0dB、-3dB、-6dB和-9dB,基站接收机安装2个等增益、不相关接收天线;除此之外,还假设在一个2ms的TTI中有5个活跃的VoIP用户,这对应于在一个WCDMA载波中有200个VoIP用户负载和50%的语音活动,即在将2个语音帧捆绑在一起的情况下,可以为20个用户组服务,当系统中有200个VoIP用户时,每个组有10个用户,采用50%的语音活动,平均每个TTI有5个活跃用户.全部仿真结果是对100个衰落实现求平均值,采用由DPCCH携带的导频符号计算信道系数,并将得到的信道系数用于计算组合权值,以及用于再生被检测用户信号.对于Turbo解码,采用8次迭代.
图6所示为多级解码后软SIC得到的结果.图中C是每个VoIP用户的平均接收功率,N是AWGN功率.从图6可见,正如前面所分析,第1级的性能依赖于检测顺序,随着越来越多的检测信号从接收信号中被消除,后面的检测用户具有更好的性能;还可看到,与第一个用户相比,最后检测的用户有很大的增益,但在第2级,用户性能对检测顺序就不太敏感了.
图6 多级软SIC的性能(每个TTI有5个活跃用户)
图7所示为多级SIC和PIC性能的比较.可以看到,SIC和PIC的性能大致相同.此外,无论是采用SIC还是PIC,多级检测器都迅速收敛.大多数性能增益是在第二级之后获得的.
图7 SIC与PIC的性能比较(每个TTI有5个活跃用户)
图8所示为采用不同MUD方案时的性能比较结果.标有“HARD-CRC”的曲线表示仅在CRC校验时硬消除一个用户信号的情形.可以看到,即使是基于解码前的MUD也能获得明显的增益.在10%的BLER时,基于解码前的MUD相比于没有干扰消除(即普通Rake接收机)获得了2dB的增益.全部基于解码后的检测器优于解码前的SIC大约0.8~1dB.采用软消除可以获得最佳性能,事实上,它的性能非常接近于在信号再生中采用发射比特的性能.
图8 不同方案时2级SIC检测器的比较(每个TTI有5个活跃用户)
本文研究了多级SIC和PIC作为VoIP的有效多用户检测器,提出采用多级SIC检测器或PIC检测器作为MUD的实现,为了进一步降低复杂性,采用TDM将用户组及时分离,以便MUD能够集中在少量重叠信号上.对一个2级检测器的仿真结果表明,全部用户可获得大致相同的性能,当每个TTI有5个活跃VoIP用户时,对于实现10%的BLER,每个用户所需功率的减少可以高达3dB,其中1dB的减少是通过在SIC/PIC过程中消除控制信道干扰实现的,当有更多的活跃用户时,通过MUD所能实现的功率减少量更多,这样的功率减少意味着系统具有了更高的容量、更好的覆盖和为VoIP用户提高了通话时间;比较了解码前相消和解码后相消的性能,发现解码后相消的性能大大优于解码前消除的性能;此外,当活跃用户数变化时,解码后相消能够保持稳定的性能,而解码前相消对负载变化更敏感,采用软相消能获得最佳性能.