赵翠霞 赵玉霞 崔路遥
【摘要】 針对低信噪比条件下,谱减算法在话音增强方面存在着音乐噪声问题和低清晰度问题,本文提出了基于倒谱距离和谱减算法的话音增强算法。该算法不仅使用倒谱距离来区分话音段与噪音段,而且还根据噪声帧与当前帧的倒谱距离来动态地调整功率因子和噪声因子,此外其还使用三种办法来进一步地消除音乐噪声。仿真表明本文所提算法能够有效地抑制噪声,提高信噪比和话音的清晰度,实现话音增强的目的。
【关键字】 倒谱距离 谱减 话音增强
一、引言
在实际应用环境中,话音总会收到各种噪音的干扰,而这种带噪话音会影响话音的使用。为了从带噪话音中还原出原始话音,人们提出了各种各样的话音增强算法。而谱减算法、VAD算法、维纳滤波算法等是最常用的话音增强算法[1]。其中,谱减算法具有复杂度低、实现简单等特点而得到了广泛地使用。但是,在低信噪比条件下,谱减算法存在着音乐噪声问题和低清晰度问题,从而限制了其应用[2]。针对谱减算法的问题,本文提出了基于倒谱距离和谱减算法的话音增强算法(Speech Enhancement based on Cepstral Distance and Spectral Subtraction method,SECDSSM)。
二、相关理论介绍
2.1 谱减算法
(4)消减音乐噪声。谱减后的信号中带有少量的音乐噪声,为了提升语音信号的质量,必须消减音乐噪声。之所以叫音乐噪声,这是因为,谱减后的语音信号中含有未被消除的噪声,并且该噪声的频谱含有随机的尖峰,听起来像有节奏的音乐,所以叫作音乐噪声。为了消减音乐噪声,SECDSSM算法使用了以下三种方法来消减音乐噪声:
1)使用相邻三帧的均值来替换谱减前的信号频谱,已达到消除噪音毛刺以及保持信号连续的目的;2)使用相邻帧的最小值替换谱减后的语音信号的频谱,以消除频谱中的突变点;3)使用滤波器抑制谱减后信号中的音乐噪声。
四、仿真分析
为了验证SECDSSM算法的性能,本文所采用的仿真环境:原始语音信号是在静室中进行采集,而采样频率和采样精度分别为8kHz和16bit,同时原始语音与噪声的信噪比为-5dB,此外,利用汉明窗来对加噪后的语音进行分帧,其中帧长与帧移分别为256点和128点。
五、结论
针对谱减算法在话音增强方面存在的音乐噪声问题和低清晰度问题,本文提出了SECDSSM算法。SECDSSM算法不仅使用倒谱距离来区分话音段与噪音段,而且还根据噪声帧与当前帧的倒谱距离来动态地调整功率因子α和噪声因子β,此外其还使用三种办法来进一步地消除音乐噪声,从而有效地抑制了噪声,提高了信噪比和话音的清晰度,实现了话音增强的目的。
参 考 文 献
[1] Loizou P C. Speech enhancement: theory and practice[M]. CRC press, 2013.
[2]邓利娜. 语音降噪技术的研究与实现[D]. 成都: 电子科技大学, 2011.