用于自动语音识别系统的切换语音功率谱估计算法

2017-01-13 20:39刘金刚周翊马永保刘宏清

计算机应用 2016年12期

刘金刚+周翊+马永保+刘宏清

摘要：针对语音识别系统在噪声环境下不能保持很好鲁棒性的问题，提出了一种切换语音功率谱估计算法。该算法假设语音的幅度谱服从Chi分布，提出了一种改进的基于最小均方误差（MMSE）的语音功率谱估计算法。然后，结合语音存在的概率（SPP），推导出改进的基于语音存在概率的MMSE估计器。接下来，将改进的MSME估计器与传统的维纳滤波器结合。在噪声干扰比较大时，使用改进的MMSE估计器来估计纯净语音的功率谱，当噪声干扰较小时，改用传统的维纳滤波器以减少计算量，最终得到用于识别系统的切换语音功率谱估计算法。实验结果表明，所提算法相比传统的瑞利分布下的MMSE估计器在各种噪声的情况下识别率平均提高在8个百分点左右，在去除噪声干扰、提高识别系统鲁棒性的同时，减小了语音识别系统的功耗。

关键词：自动语音识别系统；鲁棒性；最小均方误差；语音存在概率；功率谱估计；维纳滤波器

中图分类号： TN912.35

文献标志码：A

文章编号：1001-9081（2016）12-3369-05