基于AMR-WB编解码器的移动网络话音传输抗丢包算法

2016-11-25 06:08王晶刘宝光费泽松张剑寅
北京理工大学学报 2016年10期
关键词:比特编码速率

王晶, 刘宝光, 费泽松, 张剑寅

(1.北京理工大学 信息与电子学院, 北京 100081;2.中国移动通信集团公司研究院, 北京 100053)



基于AMR-WB编解码器的移动网络话音传输抗丢包算法

王晶1, 刘宝光1, 费泽松1, 张剑寅2

(1.北京理工大学 信息与电子学院, 北京 100081;2.中国移动通信集团公司研究院, 北京 100053)

针对移动通信网络中AMR-WB编解码器在话音分组传输中的抗丢包问题,提出了一种与VoLTE系统中语音编码速率相匹配的AMR-WB抗丢包实现方案. 通过实验分析AMR-WB编解码器中经过错误隐藏恢复的各个参数对语音质量的影响,利用多描述编码(multiple description coding,MDC)技术设计了AMR-WB抗丢包方案,并进一步结合删余卷积编码提出了双重差错保护的增强型抗丢包算法,实现了多码率下的差错保护和速率匹配,该方案可兼容原有AMR-WB编码模式下的语音编码速率. 仿真结果表明,提出的新方案能够增强AMR-WB的抗丢包能力,并且不需要增加额外的信令开销,兼容现有系统网络中的多速率语音编码.

AMR-WB;MDC;删余卷积编码;移动网络

自适应多速率宽带语音编解码器(adaptive multi rate-wide band,AMR-WB),凭借其优异的性能在2001年3月被3GPP采纳,成为用于GSM和第三代移动通信WCDMA系统的宽带语音编码器[1]. 由于AMR-WB编码器参数之间具有很强的依赖性,丢失的语音包不但影响本帧语音的解码,还会造成错误传播,影响到随后语音帧的正确解码. 另外AMR-WB自带的差错隐藏模块只在较低的丢包率条件下才能够保证语音质量,所以进一步增强AMR-WB的抗丢包能力是十分必要的.

本文利用MDC技术增强AMR-WB的抗丢包能力,并结合删余卷积编码技术调整编码速率,在此基础上提出了一种与移动网络话音编码速率相融合的新型AMR-WB抗丢包方法. 本文的算法在实际应用中只需要在移动终端中加入两个单独的处理模块,而不需要修改移动网络协议或者增加额外的信令即可增强移动网络的抗丢包能力,实现起来较为方便.

1 AMR-WB编解码器

1.1 AMR-WB简介

AMR-WB编码器所采用的是代数码本激励线性预测编码(algebraic code excited linear prediction,ACELP)结构,如图1所示. 它基于分析-合成结构,从固定码本(代数码本)和自适应码本中分别搜索出最佳码矢量,乘以各自的最佳增益后相加,其和即是ACELP激励信号源. 提取的ACELP模型参数包括两部分:按帧提取的线性预测(linear prediction,LP)系数;以及每子帧提取一次的固定码本,固定码本增益,基音周期和自适应码本增益[2].

1.2 AMR-WB帧结构

AMR-WB编码器共有9种编码模式,每一种编码模式的速率分别为23.85,23.05,19.85,18.25,15.85,14.25,12.65,8.85和6.60 kbit/s[3]. 其中编码速率12.65 kbit/s及以上码率模式都能够提供高质量的宽带语音,专门设计的两个低码率模式6.60和8.85 kbits主要用于恶劣的无线信道环境或者网络拥塞的场合.

如图2所示为AMR-WB一般的帧格式,帧类型占4 bits,表示从0~15共16个数字,其中0~8分别表示9种编码模式,9、14、15分别用于表示AMR-WB静默帧、语音丢失指示、没有数据(没有发送或者接收),10~13用于将来的使用. 在所提出的方案中利用10来指示这一帧信号是否为MDC帧信号,这样就不需要额外的信令信息,只需要利用帧格式中的一个比特来进行判断所传语音信号. 帧质量指示(frame quality indicator,FQI)占用1 bit,FQI为1表示帧无误,FQI为0表示帧信息出现错误.

帖类型4bits帧质量指示1bit帧模式指示4bits模式需求指示4bits校验比特8bitsA类B类

图2 一般的AMR-WB帧格式

Fig.2 General frame format of AMR-WB

A类比特会存放一些对语音质量恢复比较重要的比特数据,如果接收到数据信息以后,检测到A类信息出错,在解码端就会对A类信息进行错误隐藏,对B类信息不需要改变. 以编码模式2为例,表1为AMR-WB在编码速率为12.65 kbit/s时的比特分配,A类比特分布如表2所示,其中因为ISP参数和基音周期都是采用的矢量量化编码,所以A类比特保存了ISP参数和基音周期的高比特位,对低比特位归为B类信息.

表1 AMR-WB 12.65 kbit/s速率模式下的比特分配

表2 AMR-WB 12.65 kbit/s速率模式下的A类比特分布

1.3 AMR-WB各个参数对语音质量的影响

为了测试AMR-WB编解码器中各个参数重要性,采用仿真实验的方法分别测试ISP参数、LTP-filtering长时滤波参数、基音周期、增益、FCB固定码本对语音质量的影响. 测试方法:假设在不同的丢包概率下,只对测试参数进行错误隐藏恢复,其它参数保持正确解码,在测试不同参数时,确保丢包位置一样. 利用宽带PESQ(perceptual evaluation of speech quality)[4]对解码出来的语音信号进行MOS评分. 在每一种丢包概率下每一种参数测试40条标准汉语语料(20条男声,20条女声)的PESQ分数,计算所有语料PESQ分数的平均值. 实验中采用AMR-WB的编码模式2(语音编码速率为12.65 kbit/s),测试结果如图3所示. 丢包模型分别采用Bernoulli模型和Gilbert模型.

从图3中分析7条曲线,得出在AMR-WB编解码器中,Ltp-filtering参数对语音质量影响较小,相对来说影响最不重要,Ltp-filtering占用的比特数也是相对最少;影响最大的是基音周期和增益,固定码本和ISP参数影响程度差不多.

2 MDC技术和卷积编码结合方案

2.1 MDC技术在AMR-WB的应用

分集技术能够利用多径效应来提高无线通信系统性能. 分集思想既可以用来设计信道编码,也可以用来设计信源编码. 当这种思想运用到信源编码时,就产生了多描述编码技术[5]. 如图4所示为一个典型的多描述编码系统. 语音信号首先被分解到同等重要的描述中,每个描述在信道上单独传输.

新一代移动通信TD-LTE系统是基于多载波技术,在每一个子载波上信号可以看作是平稳的,但是每一个子载波的衰落也是不一样的. 在发送信号时可以把每一个子载波看作是不同衰落的信号,各个子载波之间是不同衰落信号,子载波间的丢失也是不相关的,在TD-LTE系统中分组语音业务可以采用MDC技术来增强AMR-WB抗丢包能力.

目前基于AMR-WB的多描述编码有多种实现方法,根据前面分析不同参数对语音质量的影响,可以得到基音周期和增益对语音质量的恢复最为重要,固定码本和ISP参数的重要性相对较小一点. 另外固定码本占用的比特数的比重最大,所以在多描述编码中会考虑不同参数的重要性及各个参数所占用的比特数的比重,来合理进行多描述编码. 而文献[6]中对各个参数重要性的处理满足前面的分析,所以选用文献[6]中多描述编码的实现方法.

以AMR-WB编码模式2编码速率为12.65 kbit/s为例,文献[6]的编码参数在各子帧和两个描述中的比特分配如表3所示.

表3 比特分配方案

其中VAD话音激活检测参数是分布在两个描述中,ISP参数的一级矢量量化分布在两个描述中,而第二级ISP矢量量化索引中,用20比特编码的前三个矢量分配到描述1中,用10个比特编码的后两个矢量分配到描述2中;对于参数LTP-filtering,第1、3子帧放在描述1里面,第2、4子帧放在描述2里面;将基音周期都调整为9 bits表示,对于基音周期和增益都是把1、3子帧的放在描述1里,2、4子帧的放在描述2里面;固定码本中,每子帧中奇数位上的脉冲分解到描述1中,偶数位上的脉冲分解到描述2中,这样当一个描述丢失时,每个子帧仍然有脉冲信息可以恢复. 并且由于采用子帧脉冲交织的算法,所以需要重新计算每一个描述里面的增益,会多传入2个交织码本增益.

2.2 利用删余卷积编码技术调整编码速率

删余卷积编码是文献[7]提出的一种可以实现不同比率的卷积编码方案,本文利用删余卷积编码对不同的编码模式采用不同的卷积编码比率,来实现比特速率匹配. 利用文献[6]实现的MDC方法,对不同的AMR-WB编码模式采用多描述算法时,不同模式下的比特占用如表4所示.

表4 AMR-WB和MDC算法下不同模式占用的比特数

Tab.4 The number of bits occupied by different modes under AMR-WB and MDC algorithm

模式AMR⁃WBMDC013211772162253292328532443173565365639743674618477

采用低模式下的MDC算法来匹配高模式下的AMR-WB编码,例如模式2的MDC算法占用292 bits,来匹配AMR-WB的模式4,这样就不会出现占用比特多的情况,为达到与已有移动通信系统相同的话音编码比特,反而会有多余的比特数据没有得到利用.

本文提出由低模式下的MDC算法来匹配AMR-WB的高模式编码,然后多余的比特数据通过进行删余卷积编码实现不同的码率匹配. 比如AMR-WB模式4占用317 bits,而模式2的MDC技术需要292 bits,这样MDC方法需要补25 bits才会和AMR-WB模式4占用相同的比特资源. 通过对这25 bits数据采取不同码率的卷积编码来实现语音编码速率匹配. 由于多余的比特并不是很多,如果对所有的比特数据都进行保护,码率会比较高,实验结果表明这样做的效果并不好,甚至语音质量还会出现下降的现象. 最终采用不等差错保护方式,对重要的比特数据进行保护,对不重要的比特数据不进行操作. 通过1.3的实验分析可以得到不同参数对语音质量的影响不同,所以最终多余的比特数据只对ISP参数和基音周期进行保护,其它参数不进行保护.

所提方案的整体实现流程如图5所示,在发送端首先会根据CQI(channel quality indicator)值来判断下一步的操作,如果信道质量不好,则会选择AMR-WB编码模式下对应的MDC编码模式,保持语音编码速率和之前的速率一样,如果信道质量较好,则保持编码模式不变. 在接收端会根据帧头指示比特来判断是否经过MDC和删余卷积编码处理,然后再进行下一步操作. 对于实际移动网络,通过在移动终端加入语音编码后处理的模块和语音解码前处理的模块,即可实现语音传输的抗丢包功能,而不需要修改终端中其它部分.

3 仿真实验和结果分析

本文对3种抗丢包算法进行对比,包括AMR-WB本身的丢包隐藏算法,文献[6]中MDC算法,以及本文所提的新方案,其中AMR-WB采用编码模式4,文献[6]中MDC算法对应AMR-WB的编码模式2,本文对参数进行保护的MDC算法也对应AMR-WB的编码模式2. 这样所提算法的语音编码速率与AMR-WB的编码速率一致,而MDC算法的语音编码速率相对低一点. 实验中按照Bernoulli模型和Gilbert模型两种模型来得到丢包数据,测试每一种算法的丢包位置保持一致. 实验中的原始语音文件来自NTT-AT宽带中文语音数据库. 选取的语料数目为40条(20男,20女),每条语料的长度为8 s,采用16 kHz采样和16 bit PCM量化. 对处理后的语音信号采用宽带PESQ来进行测试,对比出各个算法的语音质量.

实验结果如图6所示,在没有丢包的情况下由于AMR-WB的编码模式较高,且没有任何损伤,所以恢复出来的语音质量比另外两种算法相对较好一点. 在本次实验中丢包率大于3%的情况下,AMR-WB的丢包隐藏效果没有另外两种算法的效果好,并且对基音周期和ISP进行保护的MDC算法比单纯的MDC实现的语音质量要好. 这说明当移动网络发生丢包时,本文提出的新的抗丢包方案可发挥较好的作用.

4 结 论

本文提出了一种在不改变原有移动网络系统传输协议的情况下,通过对AMR-WB编码器加入MDC处理和删余卷积编码两个模块实现对丢包的恢复,并保持与原有话音编码速率的匹配,其实现方法简单,算法复杂性较低,且不会产生额外的处理时延. 经过仿真实验与分析,新的抗丢包方法相比于AMR-WB本身的丢包隐藏算法和单纯的MDC算法对语音质量的恢复有所提高,并且不会增加移动网络的信令开销.

[1] 3rd Generation Partnership Project (3GPP). TS 26.190 AMR wideband speech codec: transcoding functions[S]. [S.l.]: 3GPP, 2001.

[2] Schroeder M R, Atal B. Code-excited linear prediction (celp): high quality speech at very low bit rates[C]∥Proceedings of the IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP’85). Tampa, Florida: IEEE, 1985:937-940.

[3] 3rd Generation Partnership Project (3GPP). TS 26.190. AMR wideband speech codec: frame structure[S]. [S.l.]: 3GPP, 2001.

[4] ITU Telecommunication Standardization Sector (ITU-T). Recommendation P.862.3. Application guide for objective quality measurement based on recommendation P.862[S]. [S.l.]: ITUT, 2005.

[5] Goyal V K. Multiple description coding: compression meets the network[J]. Signal Processing Magazine, 2001:74-93.

[6] Lang Yue, Zhao Shenghui, Kuang Jingming. A multiple description speech coder based on AMR-WB[C]∥Proceedings of the IEEE Conference on Information Technology & Applications (ICITA2007). Harbin, China: IEEE, 2007:697-700.

[7] Host S,Johannesson R, Zyablov V V. A first encouter with binary woven convolutional codes[C]∥Proceedings of the 4th Int Symp Communication Theory and Application. U.K:[s.n.],1997:13-18.

(责任编辑:李兵)

The Anti Packet Loss Algorithm for Voice Transmission in the Mobile Network

WANG Jing1, LIU Bao-guang1, FEI Ze-song1, ZHANG Jian-yin2

(1.School of Information and Electronics,Beijing Institute of Technology, Beijing 100081,China;2.Research Institute of China Mobile Communication Corporation, Beijing 100053, China)

In mobile communication network, there exists anti packet loss problem in adaptive multi rate-wide band(AMR-WB) codec when transmitting voice packet. In order to settle the problem, AMR-WB anti packet loss implementation approach matching the rate of speech coding in VoLTE system was proposed. Firstly, the impacts of each parameter in the AMR-WB codec on voice quality after the recovery of error concealment was analyzed through experiment. Then an AMR-WB anti packet loss scheme was designed by taking advantage of MDC(multiple description coding) technology. Furthermore, combing with punctured-convolution coding, an enhanced anti packet algorithm with double error protection was proposed to implement error protection and rate matching under multi-rate situation. The scheme is compatible with the rate of voice coding under the original AMR-WB coding model. Simulation results show that the proposed novel scheme can strengthen anti packet loss capability of AMR-WB without the need of increasing signaling overhead in mobile network, and it is compatible with the multi-rate voice coding in existing mobile network.

adaptive multi rate-wide band; multiple description coding algorithm; punctured-convolution coding; mobile network

2014-04-10

国家自然科学基金资助项目(61571044,11461141004);国家教育部-中国移动科研基金资助项目(MCM201240113)

王晶(1980—),女,博士,副教授,E-mail:wangjing@bit.edu.cn.

TN 911

A

1001-0645(2016)10-1048-05

10.15918/j.tbit1001-0645.2016.10.012

猜你喜欢
比特编码速率
生活中的编码
化学反应的速率和限度考点分析
《全元诗》未编码疑难字考辨十五则
“化学反应的速率与限度”知识与能力提升
子带编码在图像压缩编码中的应用
Genome and healthcare
比特币还能投资吗
比特币分裂
比特币一年涨135%重回5530元
神秘的比特币