基于双微阵列的语音增强算法

2018-08-17 03:00曾庆宁
计算机工程与设计 2018年8期
关键词:旁瓣广义滤波器

毛 维,曾庆宁,龙 超

(桂林电子科技大学 信息与通信学院,广西 桂林 541004)

0 引 言

在手机和助听器等设备中,由于受到周围各类复杂噪声的影响,导致语音质量的性能急剧恶化。而语音增强算法是一种有效处理环境噪声并且获得较好语音质量的方式。传统的单通道语音增强算法有:谱减[1]、维纳滤波[2,3]、最小均方误差估计[4]等,但是其在真实环境有一定的限制同时会带来音乐噪声和语音失真,而基于麦克风阵列的语音增强算法可以利用阵列信号的时空域信息来有效消除噪声信息。常用的多通道语音增强方法有:波束形成技术和广义旁瓣抵消。广义旁瓣抵消器[5](generalized sidelobe canceller,GSC)由Griffiths等提出,因其具有高性能和较低的计算量,在助听器和移动设备中得到了广泛的应用。为了克服传统麦克风小阵列语音增强算法噪声抑制能力有限的问题,杨立春等[6]提出了一种基于相干性滤波器的广义旁瓣抵消器语音增强算法。在多噪声情况[7]下,Kenta Niwa等[8]通过对功率谱密度来估计以减少后置滤波的参数估计误差,在特定环境中取得了较好的效果。

本文以两个微型麦克风阵列为基础,在广义旁瓣抵消器的前端加入一个基于迭代噪声功率谱估计的谱修正滤波器,之后在输出端使用调制域谱减法对残留噪声进一步处理。实验结果表明,该双微阵列语音增强算法优于现有的广义旁瓣抵消器算法和相干滤波广义旁瓣抵消器算法,为此算法更好应用在人工耳蜗和数字助听器提供了更好的语音质量。

1 语音增强

1.1 双微阵列

双微阵列是由2个子阵元个数为M的微型麦克风阵列构成,其中单个子阵列阵元间距大约为1 cm~2 cm,而两个子阵列之间间距一般设置为15 cm~18 cm,本文采用的单个子阵列的阵元间距为2 cm,子阵列之间的间距为16 cm,其中双微阵列中单个子阵列中的阵元个数都为2,组成一个2×2的四元阵。

双微阵列的简易结构,如图1所示。

图1 双微阵列的简易结构

1.2 谱修正滤波器

本文采用的谱修正滤波器的原理是基于迭代噪声功率谱密度的双通道语音增强算法[9-11],利用两个麦克风通道间的语音信号的互功率密度和自功率谱密度来构造一个谱修正滤波器来对含噪语音进行滤波,从而恢复出期望的纯净语音信号,实现通道间语音信号的增强。

谱修正滤波器原理,如图2所示。

图2 谱修正滤波器原理

首先对各通道间的信号进行分帧,并求取每帧的傅里叶变换;第一步,首先引入一个互功率谱减去噪滤波器

(1)

其中,f代表频率点的位置,n代表帧索引的位置,PXiXi(f,n)、PXjXj(f,n)、PXiXj(f,n)分别为第i个通道的含噪语音信号的自功率谱密度、第j个通道的含噪语音信号的自功率谱密度以及第i通道和第j通道的含噪语音信号的互功率谱密度;而PNiNj(f,n)则是需要根据先验知识估计的两个通道间的噪声功率谱密度。第二步,为了减少第一步过程中所引入的音乐噪声和较多的语音失真度,采用先验信噪比和后验信噪比以及直接判决相结合的方法

(2)

其中,SNRCS(f,n)代表着纯净语音的互功率谱密度与噪声信号的比值,PSiSj(f,n)则为通道间纯净语音信号的互功率谱密度

(3)

(4)

其中,RPOST(f,n)和RPRIO(f,n)分别为后验信噪比和先验信噪比,αDD为遗忘因子,一般取值为0.97;第三步,引入了谱修正滤波器,在两个相邻麦克风通道间通过前一帧的数据来使用迭代噪声功率谱密度的方法对噪声进行估计

(5)

(6)

(7)

βn为平滑因子,一般取值为0.9;根据该谱修正滤波器对原始含噪信号进行滤波之后得到重建之后的信号为

(8)

1.3 广义旁瓣抵消器

广义旁瓣抵消器[5](generalized sidelobe canceller,GSC)由两个模块组成,首先将输入信号分为上下两个通道模块:上通道模块是约束部分,主要是作为参考信号,下通道模块则是阻塞矩阵部分。在上通道模块,对接收到的信号通过一个固定波束形成器后按照约束条件进行加权求和;在下通道模块,将接收到的信号通过一个阻塞矩阵,去除目标方向上的信号,只保留非目标声源方向上的信号。图3为广义旁瓣抵消器的简易结构。

图3 广义旁瓣抵消器的简易结构

其中:X′(i)=X(i)*WT,WT=[ω1,ω2,…,ωn],X(i)=[x1(i),x2(i),…,xn(i)],N(i)=X(i)*B(i)。

上式中的n为麦克风采集的通道数量,i为时域信号的索引位置。

1.4 调制域谱减法

经典谱减法由Boll等提出,K.Paliwal等首先提出将调制域谱减法引入语音增强算法中,调制域谱减法[12,13]的基本原理是含噪语音信号x(n)重叠分帧、加窗,经过一次傅里叶变换得到幅度谱X(n,k),对幅度谱再次重叠分帧、加窗,再经过一次傅里叶变换得到调制域幅度谱χ(η,k,m),然后对调制域幅度谱进行傅里叶反变换、重叠相加得到幅度谱,最终将得到的幅度谱再一次进行傅里叶反变换、重叠相加得到增强后的语音信号y(n)。

其中,幅度谱X(n,k)和调制域幅度谱χ(η,k,m)可通过以下公式获得

(9)

(10)

上式幅度谱中的n代表的是帧索引的位置,k是离散频率点的位置,w(n-l)则是窗函数,N表示的是帧长;调制域幅度谱中的η是帧的位置,k是离散频率点的位置,m则是离散调制频率点的位置,v(η-l)是调制窗函数,M是调制帧的长度。

本文采用的是由两个微型麦克风阵列构成的双微阵列,其中通道1、2和通道3、4距离为d,d为2 cm,而由通道1、2和通道3、4构成的子阵列之间的距离为8d;首先利用两个相邻通道间的含噪语音信号的自功率谱密度和互功率谱密度构成谱修正滤波器进行预滤波,滤波后的信号通过广义旁瓣抵消器,最后在广义旁瓣抵消器的输出端使用调制域谱减法进行残留噪声消除。算法结构框架如图4所示。

图4 本文算法结构框架

2 实验结果及分析

本次实验数据采集设备使用的是M-AUDIO多路音频采集器,录制环境为教学楼楼顶空旷的天台,语音和噪声分别在同样的环境下录制,噪声源的位置位于除了声源位置外麦克风正前方的任意角度。本次实验采集由本实验室的20位同学参与录制,其中男生15人,女生5人,每段语音大约3 s,语音以及噪声的采样率都为44.1 KHz,采样精度为24比特,图5给出了-10 dB白噪声情况下,广义旁瓣抵消器、相干滤波广义旁瓣抵消器以及本文算法的增强时域波形图。

图5 -10 dB白噪声情况下各算法的增强时域波形图

为了验证本文算法在各类噪声情况下的优越性,分别从主观上和客观上对增强后的语音质量进行评价,常见的语音质量主观评价方法是平均意见得分(mean opinion score,MOS),MOS得分方法采用五级评分制,从1分到5分,评分越高说明语音质量越好。客观评价方法[14]则有语音质量综合评估(perceptual evaluation of speech quality,PESQ)、对数似然比(loglikelihood ratio,LLR)以及分段信噪比(segmental SNR,SNRseg),这3种语音客观评价方法与语音质量评价的相关系数分别为0.65、0.61、0.31,相关系数越高说明客观评价方法越可靠。因此本次实验采用MOS得分和PESQ得分相结合的方法来评价增强后的语音质量。以下仿真实验分别从white噪声、babble噪声、f16噪声、m109噪声环境下测试GSC、相干滤波GSC以及本文算法的PESQ得分以及MOS得分,如图6~图9和表1、表2所示。

图6 f16噪声情况下的各算法的PESQ得分

如以上仿真图表可知,在f16噪声、m109噪声、white噪声、babble噪声这4类噪声情况下,本文算法相比传统GSC以及相干滤波GSC算法在语音质量方面得到了较大的提升,如在-5 dB噪声情况下,本文算法的MOS得分相比GSC以及相干滤波GSC算法平均多了0.5分,而在10 dB的噪声情况下,本文算法的MOS得分相比GSC算法平均提高了1分,而相比相干滤波GSC也提高了0.5分;在PESQ得分方面,本文算法也要优于GSC以及相干滤波GSC算法。因此通过PESQ得分和MOS得分情况来评价增强后的语音质量可知,本文算法在抑制背景噪声方面优于现有的GSC以及相干滤波GSC算法,同时在语音质量方面也得到了一定的提升。

图7 m109噪声情况下的各算法的PESQ得分

图8 white噪声情况下的各算法的PESQ得分

图9 babble噪声情况下的各算法的PESQ得分

3 结束语

针对复杂噪声情况下的语音质量较差的问题,本文提出了一种改进GSC结构的双微阵列语音增强算法。虽然传统GSC算法对噪声有一定的抑制,但是其去噪性能较差;而相干滤波GSC算法虽能有效去除相干噪声,仍然存在大量非相干噪声以及其它的噪声残留。本文提出的算法通过在广义旁瓣抵消器的前端引入一个谱修正滤波器来滤出通道间的相干噪声和非噪声残留,然后在广义旁瓣抵消其输出端使用调制域谱减法对仍有噪声残留的含噪语音进行增强处理,实验结果验证了本文算法的优越性以及其能提供较好的语音质量。同时,该算法的提出可为在移动互联网平台上的应用提供理论基础,还可用于手机及掌上电脑,为改善语音优听质量提供新方法。

表1 f16噪声和m109噪声情况下的MOS得分

表2 white噪声和babble噪声情况下的MOS得分

猜你喜欢
旁瓣广义滤波器
基于圆柱阵通信系统的广义旁瓣对消算法
Rn中的广义逆Bonnesen型不等式
基于旁瓣光束衍射反演的强激光远场焦斑测量方法
一种基于线性规划的频率编码旁瓣抑制方法
从滤波器理解卷积
从广义心肾不交论治慢性心力衰竭
开关电源EMI滤波器的应用方法探讨
王夫之《说文广义》考订《说文》析论
一种微带交指滤波器的仿真
基于加权积分旁瓣最小化的随机多相码设计