一种信号适度失真的宽线性SAEC模型

2013-07-19 08:44冀常鹏姬红红郭伟平

计算机工程与应用 2013年19期

关键词：脉冲响应麦克风声学

冀常鹏，姬红红，郭伟平

1.辽宁工程技术大学研究生院，辽宁葫芦岛 125105

2.辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛 125105

一种信号适度失真的宽线性SAEC模型

冀常鹏1，2，姬红红1，郭伟平1

1.辽宁工程技术大学研究生院，辽宁葫芦岛 125105

2.辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛 125105

1 引言

由于人类的双声道听觉系统，在电话会议系统中，立体声传播能够提供语音的远程呈现和单声道系统所不能提供的音频真实再现[1-2]。立体声声学回声是由两个麦克风和两个扬声器之间的耦合产生的[3]。它为数字网络通信系统引入更多的时延，使回声现象犹为突出。系统中回声抵消器的好坏，直接影响通话质量的优劣。现有的立体声回声抵消器（SAEC）均采用高质量的全双工通信，而且是一个实变量双输入双输出的装置。对于每个SAEC接收端的麦克风来说它是由一个未知的双输入识别系统组成，即形成了两个声学回声路径的并联组合[4]。因此，为了确定从两个扬声器到两个麦克风的回声路径，一个SAEC系统会由四个自适应滤波器组成，其结构复杂且不易实现。

近年来，宽线性模型的思想逐渐受到重视并被广泛应用[5]。可将宽线性模型引入到SAEC中，则一种复变量单输入单输出新系统将代替经典的实变量双输入双输出设计方案。此时，四个实数声学脉冲响应转化成一个复数脉冲响应，其优点是只需处理一个复变量的输出信号。

摒除其内在的相似性，SAEC从根本上有别于单信道回声抵消而且处理难度更大[6]。SAEC所面临的主要问题是两个信道传输的线性相关信号会使自适应算法要求解的方程出现异常[7]。这就意味着，在单信道情况下方程没有唯一解，而是有无限的解[8]。对于这种解不确定问题的唯一解决途径是使输入信号间的相关性降低，在保证没有影响到立体感和音质的前提下，使输入信号适度失真。

2 宽线性模型的SAEC

2.1 经典立体声回声抵消

经典的立体声声学回声抵消器通常是一个实变量双输入双输出系统，即有两个输入或扬声器信号xL(n)和xR(n)，两个输出或麦克风信号dL(n)和dR(n)，n表示时间变量。接收端的麦克风信号可以表示为：

其中，yL(n)和yR(n)是声学回声信号，νL(n)和νR(n)是近端信号。回声信号为：

其中，wt，LL、wt，LR、wt，RL、wt，RR是扬声器到麦克风的L维声学脉冲响应的矢量形式，上标(·)T是矢量或矩阵的转置。XL(n)和XR(n)是扬声器信号的L个抽样值。这种方法的主要目的是估计这四个滤波器的声学脉冲响应，而且扬声器信号和麦克风信号都是实变量。因此，现有的声学回声抵消器物理结构比较复杂。

2.2 宽线性立体声回声抵消新模型

文献[9]和[10]介绍了宽线性模型的基本理论及其复变量的表达形式，文献[11]证明了宽线性模型理论与对偶原理的一致性。在此，通过复变量的形式把宽线性模型应用到立体声回声抵消技术中，并推导宽线性立体声回声抵消模型。

为了引入本文所要介绍的模型，先介绍公式的复数表达式，首先输出信号的复数形式为：

从式（4）～（6）可以看出通过复变量引入的宽线性模型。在这种情况下，要做的是从复数麦克风信号d(n)和复数扬声器信号x(n)估计出长度为2L复数声学脉冲响应Wt。而此时，经典实变量双输入双输出系统已转换成一个复变量单输入单输出系统。因此，回声抵消的物理模型是复数域的单输入单输出宽线性的。

3 输入信号相关性的处理方法

在SAEC中两个输入信号是通过对同一信源进行滤波得到的，即两输入信号线性相关，因此预期的非唯一性问题就出现了。而对远端扬声器信号的预处理是获得解决方案的有效方式。也就是说，为了减小两个输入信号xL(n)和xR(n)之间的相关性需要使输入信号适度失真，这样就可以得到非常逼近的声学脉冲响应估计值。然而这种失真的实现要以不降低信号的质量和立体声效果为前提。

由文献[12]可知，分别对每个信道用正负半波整流器进行整流是能够降低信号的相关性。具体对输入信号的处理公式如下：

其中，αr是用来控制非线性数量的参数，即使αr增大到0.5也不会影响到声音的立体感。

在宽线性模型背景下，复数形式的输入信号表示为：

式中的相位是由半波整流房发展改进而来的，而幅值与原信号的幅值保持一致。

因此，让输入信号适度失真的预处理降低了输入信号间的相关性，避免了因相关性而出现的解不唯一问题，可以根据其幅值相位的表达形式按需要调控音质和立体感。

4 宽线性模型仿射投影算法

仿射投影算法（APA）是回声抵消效果较好的算法之一，其收敛和跟踪速度比归一化最小均方误差（NLMS）快。此外，从算术运算的复杂度方面看，APA要比递归最小二乘（RLS）系列衍生的算法更小。设W(n)=[w0(n)，w1(n)，…，w2L-1(n)]T是长度为2L的自适应滤波器系数，且是Wt的估计值，y′(n)=WH(n-1)X′(n)是自适应滤波器在n时刻的输出信号，误差信号为e(n)=d(n)-y′(n)。

为了导出在本文背景下的APA算法的表达式，先设2L×P维的输入矩阵A(n)=[X′(n)，X′(n-1)，…，X′(n-P+1)]，P是投影阶数。定义P×1维的先验误差的矢量形式为e(n)=d(n)-AT(n)W*(n-1)。根据这种表达方式，APA的更新公式如下：

式中，IP是P×P维的单位矩阵，α是归一化步长参数，δ是正则化因子。由此可知，当P=1时，式（11）转化成NLMS。因为APA算法简单易实现，所以它在实践中非常实用。但是由于滤波器长度较长，输入信号相关性较高，使得它的收敛速度不是很理想。

利用回声路径的稀疏特性，即算法的“成比例”思想[13]，来改善算法的收敛速率，调节与待估计滤波器系数的幅值成比例的自适应步长更新滤波器的每个系数。因此，在所有的滤波器系数中自适应增益是按比例重新分配的，在系数较大时能加快收敛速度，算法的整体收敛速率也将得到提高。在众多改进的成比例算法中[14]，改进的成比例APA（IPAPA）算法是最具吸引力的选择之一，其优势表现在它的简单性和它对回声路径稀疏程度的鲁棒性。在本文所提出SAEC的宽线性模型背景下，IPAPA算法的更新公式可以写成：

其中，k(-1≤k≤1)是用来控制比例数量的参数。

在收敛速度和跟踪速度有所提高的前提下，希望算法的失调误差尽量减小。在滤波系数的估计过程中，为了减少噪声的影响，提出正则化APA（R-APA）优化表达式为：

在本文提出的SAEC模型背景下，可以根据已有的算法推导出更多新算法。其中，APA、IPAPA和R-APA三种基本算法在APA衍生的算法中具有重要的地位，在此先以这三种算法为例分析改进方法的可行性。

5 仿真结果

本文所有的仿真结果是在提出的SAEC模型背景下进行的。设远端声学脉冲响应有1 024个参数，近端脉冲响应（即wt，LL、wt，LR、wt，RL、wt，RR）的长度L为512。自适应滤波器的长度1 024，抽样率为8 000 Hz。远端原信号是IEEE-AP语音库的语音序列。

选择三种算法进行对比，即APA、IPAPA和R-APA算法。所有算法的步长α=0.5，正则化因子是x(n)的方差。在成比例类型的算法（IPAPA）中取k=0。对于算法性能采用如下的三项指标进行估计与分析：（1）收敛快慢的比较，从仿真结果中可直观的看出。（2）均方误差（MSE），为得到平滑的仿真曲线选择的平均点数均超过256点。（3）归一化失调函数（即MIS，单位是dB），其表达式为为二阶范数）。

仿真是在单向通话的情景下进行的，由于此时近端语音信号不存在，近端信号v(n)中只包含背景噪声。因此，可以定义声学回声与噪声之比（SENR），分别为y(n)和v(n)的方差。仿真中，近端的背景噪声是独立的高斯白噪声信号，且SENR=30 dB。

首先，在无失真的输入信号的情况，输入信号经过正负半波整流器后的情况以及本文中提出的输入信号适度失真方法的三种情况下，比较APA算法的性能优劣。其中也将无失真的情况作为一个参照展示，失真参数αr=0.4。其次，分别比较IPAPA和R-APA算法在无失真输入信号和适度失真的输入信号情况下的收敛性能。最后，比较APA、IPAPA和R-APA算法在使输入信号适度失真的方法条件下的性能表现。

由图1可知，在P=8情况下算法的收敛速度和复杂度能达到一个折中状态。由图1（a）可以看出，在失真状态下的APA收敛速度要比整流后的输入信号和无处理的参照输入信号更快且更易达到平稳状态，这就意味着，新SAEC模型的物理结构更简单，处理速度较快。图1（b）和1（c）分别是均方误差和均方误差的局部细节曲线。特别地，从1（c）图的局部细节可知，与正负半波整流器相比较失真方法具有更小的MES，对于归一化失调函数而言，经过半波整流的输入信号的情况失调量略小，但并无很大差别，即对回声信号的抵消效果更好，能够有效地抑制回声的产生，而且抵消情况比较稳定，能够有效且真实地还原语音信号。

图2分别比较IPAPA和R-APA算法在无失真输入信号和适度失真的输入信号情况下的收敛性能。由图可知，对不同算法但相同处理方式时，即R-APA和IPAPA算法分别用这两种方法处理时，前者的收敛速度比后者略快，误差较小；对相同算法但不同处理方式时，即适度失真信号情况下的IPAPA和R-APA算法要比无失真纯粹是输入信号情况下算法的收敛速度快，对输入信号无处理时R-APA算法的误差最大，而对信号进行失真处理时R-APA算法的误差最小，即为不同的结构与处理方法对回声抵消的效果以及效果的稳定性。

图1 在输入信号无失真，半波整流和输入信号失真状态下的函数曲线图

图2 IPAPA和R-APA算法分别在输入信号无失真和适度失真条件下的函数曲线图

图3 在失真方法下的APA、IPAPA和R-APA算法的曲线图

图3显示这三种算法在输入信号失真情况下的性能曲线。图3（a）验证了IPAPA和R-APA算法的整体收敛速度要优于APA算法，R-APA要比IPAPA算法略快且基本同时趋于稳定。因此，在宽线性SAEC模型的条件下，R-APA算法的回声抵消效果更好，得到的语音更接近真实的语音而且立体感增强。图3（b）和图3（c）分别显示了误差曲线和其局部曲线图，相比较可知R-APA算法的误差最小，而且在失真方法下的误差的幅度也减小了。同时，从图3（c）可以看出，在本文的方法下，R-APA算法的失调量最小，即声学系统对声音的处理效果很稳定。

6 结论

基于现有的实变量双输入双输出的SAEC模型，提出了一种复变量单输入单输出的新模型。介绍了适用于SAEC模型的使输入信号失真的新方法。在文中，利用仿射投影算法验证宽线性SAEC的性能。仿真结果表明输入信号适度失真的宽线性模型与算法结合后，提高了算法的收敛速度，降低了失调量和均方误差，从而使SAEC新模型物理结构的复杂度有所减少。而且在外界环境变化很大，即扬声器和麦克风的声耦合更严重时，本文方法的回声抵消效果比较理想，而且可以抑制回声产生，声音的处理效果较稳定，更能满足人们的要求。

[1]成利香，张桂新.基于DSP生回声抵消系统的研究[D].长沙：中南大学，2010.

[2]袁佳能，于凤芹.一种无双端会话检测的回声抵消算法[J].计算机工程与应用，2008，44（15）：33-35.

[3]Chen Qiuying，Wang Xiaomin，Li Mingxuan，et al.Sound field of an electromagnetic acoustic transducer[J].Chinese Journal of Acoustics，2011，30（1）：44-54.

[4]Benesty J，Gaensler T，Morgan D R，et al.Advances in network and acoustic echo cancellation[M].Berlin：Springer-Verlag，2001. [5]Benesty J，Paleologu C，Gänsler T，et al.A perspective on stereophonic acoustic echo cancellation[M].Berlin：Springer-Verlag，2011.

[6]Sondhi M M，Morgan D R，Hall J L.Stereophonic acoustic echo cancellation-an overview of the fundamental problem[J].IEEE Signal Processing Letters，1995，2（8）：148-151.

[7]Benesty J，Morgan D R，Sondhi M M.A better understanding and an improved solution to the specific problems of stereophonicacousticechocancellation[J].IEEETransactionson Speech and Audio Processing，1998，6（2）：156-165.

[8]李跃明，侯楚林.变步长比例放射投影算法及在回声消除中的应用[J].计算机工程与应用，2012，48（35）：126-129.

[9]Picinbono B，Chevalier P.Widely linear estimation with complex data[J].IEEE Transaction on Signal Processing，1995，43（8）：2030-2033.

[10]赵愉，李峰.仿射投影算法中的步长控制[J].计算机工程与应用，2011，47（11）：112-113.

[11]Mandic D P，Still S，Douglas S C.Duality between widely linear and dual channel adaptive filtering[C]//Proceedings of the IEEE International Conference on Acoustics，Speech，and Signal Processing，2009：1729-1732.

[12]Paleologu C，Benesty J，Ciochinǎ S.Sparse adaptive filters for echo cancellation[C]//Proceedings of the Synthesis Lectures on Speech and Audio Processing，2010.

[13]Duttweiler D L.Proportionate normalized least-mean-squares adaptation in echo cancellers[J].IEEE Transactions on Speech and Audio Processing，2000，8（5）：508-518.

[14]Benesty J，Gay S L.An improved PNLMS algorithm[C]// Proceedings of the IEEE International Conference on Acoustics，Speech，and Signal Processing，2002，2：1881-1884.

JI Changpeng1，2,JI Honghong1,GUO Weiping1

1.Institute of Graduate,Liaoning Technical University,Huludao,Liaoning 125105,China
2.School of Electronic and Information Engineering,Liaoning Technical University,Huludao,Liaoning 125105,China

The existing approach of stereophonic acoustic echo cancellation is designed by a two-input/two-output system with real random variables.Its structure appears to be complex and it is difficult to realize.This scheme will be recast as a singleinput/single-output system with complex random variables by approved the widely linear model.The advantage of this method is that instead of handling two real output signals separately,it only handles one complex output signal.Moreover,the perception and quality of the stereo will be modified by the phase and module of the complex input signal,respectively.The coherence can be declined by making the input signal reasonably distorted in order to solve the nonuniqueness problem.The widely linear model and distorted signal are applied in affine projection algorithm to verify the misalignment and convergence.Experimental results indicate that the proposed method has good numerical features of less misalignment and fast convergence,so the SAEC with widely linear model has more advantage.

Stereophonic Acoustic Echo Cancellation（SAEC）;widely linear model;nonlinear distortion;Affine Projection Algorithm（APA）

现有的立体声回声抵消器是一个实变量双输入双输出的装置，其结构复杂不易实现。宽线性模型的引入，提供了一种复变量单输入单输出的装置来替代实变量双输入双输出装置，其优点是只需处理一个复变量的输出信号而不是两个实变量输出信号，而且能通过复变量输入信号的相位和幅值分别调控声音的立体感和音质。利用输入信号适度失真的方法降低两个信号之间的相关性以解决因滤波而产生的非唯一性问题。把宽线性模型和失真信号应用到仿射投影算法中，通过仿真验证改进方法的误差性能和收敛速度。结果表明改进的方法具有误差小和收敛快的特点，因此宽线性SAEC模型更有优势。

立体声声学回声抵消；宽线性模型；非线性失真；仿射投影算法

TN912

10.3778/j.issn.1002-8331.1303-0022

JI Changpeng,JI Honghong,GUO Weiping.Reasonably distorted signal for stereophonic acoustic echo cancellation with widely linear model.Computer Engineering and Applications,2013,49（19）：200-203.

国家自然科学基金（No.50490275）。

冀常鹏（1970—），男，教授，研究方向为通信与网络，信号检测与处理；姬红红（1988—），女，研究生，研究方向为信号检测与处理；郭伟平（1987—），女，研究生，研究方向为信号检测与处理。E-mail：hongji19880610@163.com

2013-03-04

2013-05-17

1002-8331（2013）19-0200-04

CNKI出版日期：2013-06-08http://www.cnki.net/kcms/detail/11.2127.TP.20130608.1001.027.html