张娓娓 陈乐瑞
(1.河南工业职业技术学院电气工程系,河南 南阳 473000;2.郑州铁路职业技术学院,河南 郑州 450001)
基于PSO-BP的语音增强方法研究
张娓娓1陈乐瑞2
(1.河南工业职业技术学院电气工程系,河南 南阳 473000;2.郑州铁路职业技术学院,河南 郑州 450001)
针对一些常用语音增强方法的特点和不足,本文提出将改进粒子群优化BP网络算法用于语音增强,仿真结果表明:基于PSO-BP神经网络的语音增强方法可以较大幅度的提升带噪语音信号的信噪比,效果明显。
语音增强;带噪语音信号;信噪比
语音增强[1]是指当语音信号受到噪声干扰,从含噪语音中提取尽可能纯净的原始语音的技术。目前,国内外诸多学者对语音增强领域进行了研究,并提出了多种方法,谱减法[2,3]因为其计算量比较小,比较容易实现,应用得也较多。文献[2]提出了小波分层阈值处理法,其对于低信噪比下的处理结果不太理想,为此本文使用改进的粒子群优化神经网络的学习算法对低信噪比下的带噪语音信号进行了进一步处理。
2.1 PSO优化BP网络算法
2.1.1 基本粒子群算法
在允许范围内随机产生粒子的速度和位移,之后根据(1)、(2)式迭代,直到找到满意的解为止。
2.1.2 粒子群算法的改进
2.1.3 改进粒子群优化BP网络步骤
第一步:初始化设置。
第二步:先对每个粒子的适应度值进行计算,然后将计算出来的各个粒子的适应度值进行比较,并对各个粒子的适应度值进行线性排列。
第三步:按照(1)和(2)式更新粒子的位移以及其速度,(1)式中w由w(k)代替。
第四步:计算各个个体的选择概率,之后选择、交叉,使得新一代种群生成。
第五步:若粒子群优化BP网络算法的终止条件被满足,可以求出最优解。如若终止条件没有得到满足,需要转到第二步继续进行。
第六步:确定网络参数,使用相应的训练样本对网络进行分帧训练。
第七步:停止运算。
2.2 仿真结果分析
原始信号的时域波形图,以及在该原始信号上加噪后的时域波形图如图1所示,从图1中可以明显看出,噪声完全淹没了原始的语音信号。针对这样的情况,单靠传统的滤波器没有办法将噪声滤掉,即无法将原始信号从噪声中提炼出来,而神经网络却具备了很好的非线性映射能力,正是利用网络非线性映射能力这一特点,可以对低信噪比下的带噪信号进行增强处理。
图 1 原始语音信号波形图和带噪信号的波形图
图2 使用BP和PSO-BP网络对带噪语音的处理结果
图2是使用BP网络和改进粒子群优化BP网络对同一段带噪语音的处理结果。在处理效果上,与BP网络相比,带噪语音经改进粒子群优化BP网络处理后,其噪声成分有了更大衰减。在主观听觉上,使用改进粒子群优化BP网络算法处理后的语音中仍然有较大噪声存在,但与BP网络的处理结果相比,原始语音可以听得更清楚。
3.1 实录环境
录音环境为一报告厅,可容纳300人,录音时的噪声有脚步声,拿东西和放东西声,窃窃私语声,翻动纸张声等,即报告厅常见噪声。录音软件采用Windows系统自带的录音机软件,量化为16位,采样频率为11025。
3.2 仿真结果分析
实录语音段的内容为:“过程控制系统是实现生产过程自动化的平台,而过程控制仪表与装置是过程控制系统不可缺少的重要组成部分。”使用改进PSO-BP网络对上述带噪语音段进行增强处理,在未进行增强处理时,语音信号被淹没在噪声里,主观听觉上,语音段内容几乎听不到。经语音方法增强后有所改观,但是谱减法的语音增强处理结果和小波分层阈值法语音增强处理结果,效果并不是太明显,平均意见得分也仅在1.5左右。但是经过PSO-BP网络处理后,语音的内容已经基本上能听清楚,语音的质量和可懂度也得到了提高,平均意见得分为2.2。
分别使用谱减法、小波分层阈值法、BP网络、改进PSO-BP方法对同一段信噪比为-9.66dB的带噪语音信号进行增强处理的性能比较如表1所示。
表 1 不同方法的性能
本文提出了改进粒子群优化BP网络算法,并分别用谱减法、小波分层阈值法、BP网络、改进PSO-BP对语音信号进行了仿真处理。仿真结果表明,使用PSO-BP神经网络对带噪语音进行增强处理,可以大幅提高信噪比,效果明显。
图 3 极端噪声环境下不同方法的处理结果
[1]张雄伟,陈亮,杨吉斌.现代语音处理技术及应用[M].北京:机械工业出版社,2003.
[2]靳志强,万红.小波分层阈值处理在语音增强中的应用[J],煤炭技术,2010:54-56.
[3]李季,孙秀霞,李士波,等.基于遗传交叉因子的改进粒子群优化算法[J].计算机工程,2008,34(2):181~183.
[4]韩瑞通,王书明,黄理善,等.交叉粒子群算法在大地电磁反演中的应用[J].工程地球物理学报.2009,6(2):223~228.
[5]Adam Borowicz,Alexandr Petrovsky.Signal subspace ap⁃proach for psy-choacoustically motivated speech enhancement[J]. Speech Communicat-ion.2010(2).
[6]阮兆文.基于声学模型和小波变换的语音增强方法研究[D].合肥:中国科技大学,2009.
[7]李如玮,鲍长春,窦慧晶.基于小波变换的语音增强算法综述[J].数据采集与处理.2009(03).
[8]Stephen So,Kuldip K.Paliwal.Modulationdomain Kal⁃man filtering for single-channel speech enhan-cement[J]. Speech Communication.2011(6).
TN912
A
1671-0037(2014)04-60-1.7