刘垚彤
摘要:数字语音有许多模拟语音不可比拟的优点:它便于传输和存储,能够在噪声信道中进行可靠传输,易于交换,能够方便地加密传输。但由于未经任何处理的数字语音数据量很大,若不经过处理,那么在传输和存储时会占用大量的信道资源和存储空间,给系统提出很高的要求,因此数字语音一般都要进行压缩编码。ADPCM采用自适应量化和自适应预测方法,对PCM(脉冲编码调制)语音信号进行再压缩,是一种有效的语音信号波形编码压缩方法。自适应差分脉冲调制技术在语音压缩编码中得到广泛运用。
关键词:语音压缩 自适应脉冲编码调制(ADPCM) G.721 matlab
随着通信、计算机网络等技术的飞速发展,语音压缩编码技术在移动通信、卫星通信、多媒体技术以及电话通信中得到普遍应用,起着举足轻重的作用。为了减少传输码率,降低传输带宽,提高经济效益,在保证一定的通信质量的前提下,国内外对压缩编码的研究非常重视。
语音编码就是将模拟语音信号数字化。如果对语音信号直接采用模/数(A/D)转换技术进行编码,则传输或存储语音的数据量太大,为了降低传输速率或存储容量,就必须对其进行压缩编码。还原时以压缩的相反过程进行解码,再经过数/模(D/A)转换合成近似的模拟语音信号。迄今已有各种各样的语音编解码技术,有脉冲编码调制(PCM)、增量调制(DM)、差分脉码调制(DPCM)和自适应差分脉冲编码调制(ADPCM),它们都属于語音编码压缩技术。
其中公认的较好方法是ADPCM编解码技术。1984年CCITT经过研究比较提出了G.721建议,决定以码率为32kb/s的ADPCM作为语音压缩的国际标准,它兼顾了通信质量和设备的复杂性。该标准并于1986年做了进一步的修改。CCITTG.721建议的ADPCM编解码算法已由法国中央国家通信研究所研制的数字信号处理单元TM32010实现,它把语音传输码率由64kb/s压缩到32kb/s,而且体积小,功耗和成本低,使信道容量增加1倍,是数字通信中的重大突破。
在保证一定的编码语音质量的前提下如何高效率地进行压缩编码,或者在给定信息速率的前提下如何提高编码后的语音质量,是语音编码研究的重点。ADPCM利用了语音信号样点间的相关性,并正对语音信号的非平稳特点,使用了自适应预测和自适应量化,在32kb/s速率上能够给出网络等级语音质量,从而符合进入公用网的要求。自适应差分脉冲调制技术是具有可调参数的语音压缩技术,可根据信号自适应预测和量化,使实际样本值和预测值之间的差值总是最小,这是其他语音编码技术不能做到的。研究自适应差分脉冲调制仿真具有重要意义。
人们把话路速率低于64kbit/s的语音编码方法,称为语音压缩编码技术。常见的语音压缩编码有脉冲编码调制(PCM)、差分脉码编码调制(DPCM)、自适应增量调制(ADM)、自适应差分脉冲编码调制(ADPCM)等。
自适应差分脉冲调制(ADPCM)是用预测编码来压缩数据量。它结合了ADM的差分信号与PCM的二进制码的方法,是一种性能比较好的波形编码。自适应量化的基本思想就是让量化阶距与输入信号幅度变化相匹配,即量化阶距应当随着输入信号幅度变化而增减,从而进一步改善量化效果。
改变量化阶大小的方法有两种:一种称为前向自适应,另一种称为后向自适应。前向自适应是根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息传送到接收端。后向自适应是从量化器刚输出的过去样本中来提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶,所以它不需要传送边信息。
自适应差分脉码调制(ADPCM)就是在相同质量指标的条件下,降低数字化语音数码,压缩数字化语音占用频带,提高数字通信系统的频带利用率。我们在详细分析CCITTG.721标准算法的基础上,充分利用数字信号各种数学运算技巧,尽量压缩指令执行时间,采用计算机模拟标准算法作为调试手段,使之达到运算精度与G.721完全一致,实现ADPCM的调制仿真。
通过对标准算法描述的研究后,可以将其按照ADPCM编码中最重要的两个方面,把算法分为自适应量化和自适应预测两个大的功能算法模块,它们共同作用实现了G.721编码器算法,如图4.2所示。
自适应差分脉冲编码调制(ADPCM)结合了DPCM和ADM,可以理解为在差分算法DPCM的基础上根据自适应增量ADM编码原理进行的算法改进。改进的算法环节有两个:①量化器的量化步长随着输入信号电平的相关变化而随时做出调整,用大的量化步长去量化大的差值,用小的量化步长去量化小的差值。②线性预测滤波器的预测参数是自适应的随时调整的。
以上就是ADPCM的一般编码流程,因为解码过程几乎完全是编码的逆操作,暂不具体具体说明。
通过编写matlab的G.721-ADPCM程序的相关程序,采用的G.721-ADPCM算法,通过matlab软件,导入获取的语音,为了更好体现效果,可采用一小段歌曲,运用未加噪声和加了噪声两种情况演示,通过ADPCM处理后语音波形的对比,得出如下结论:
通过载入语音之后,原语音的波形和经过G.721ADPCM编码之后的语音波形对比,音质没什么差别。放大后可以看出经过ADPCM处理后的波形与原始波形非常接近,仅在振幅上有很微小的差别。加了噪声之后查看仿真波形,并且通过改变不同的信噪比,来对比仿真的波形结果。
通过结果分析可知:ADPCM可以达到较好的编解码效果,解码后信号恢复较好。随着信噪比的增大,原始语音信号与解码后信号的相关系数越来也大,说明恢复的信号与原始信号越来越相近,效果越来越好。在相同比特速率条件下,ADPCM比PCM信噪比也有很大的改善,在改善量化噪声方面优于PCM系统。结合其他语音编码分析可知,经过ADPCM调制后的信号,其传输的比特率要比PCM的低很多,大大降低了码元传输速率和压缩传输带宽,从而增加了通信容量。保持了很高语音编码质量。
ADPCM的根本作用是使语音通信数字化,而语音通信的数字化将使通信技术的水平提高一大步。对于蓬勃兴起的移动通信和个人通信,语音编码技术就是其中非常重要的支撑技术。ADPCM编码作为一种经典的语音编码,算法结构较为简洁,能够很好的压缩语音信号,减小存储空间,提高传输速率,在一般电子通讯系统中有望得到进一步的应用。
参考文献
[1]蒋青,于秀兰.通信原理(第二版)[M].人民邮电出版社.2008: 96-128.
[2]高文,等.《数字视频编码技术原理》.科学出版社.2010.
[3]韩纪庆,张磊,等.语音信号处理[M].清华大学出版社.2004:114-158.
[4]吴力勤,基于语音压缩编码算法的研究与实现[D].四川大学.2006.
[5]景振毅,等.MATLAB7.0实用宝典[M].中国铁道出版社.2009 .
[6]张雄伟,等.现代语音处理技术及应用.机械工业出版社.