梁李鹏 陆永耕
摘 要 在噪声环境下的语音识别率将会受到严重的影响。语音增强是解决噪声污染的有效方法。在语音增强技术中,语音识别和说话人识别是很重要的。因此,识别装置通常工作在环境噪声下。语音增强不仅与信号处理技术相关,并涉及到人的听觉感知和语音认知。由于噪声的来源有很多,在不同的应用场合,其特点也各不相同,因此很难确定一个通用的适用于各种环境噪声的语音增强算法。根据不同的噪声,采用不同的语音增强策略。
关键词 语音识别 语音增强 噪声 算法 信噪比
中图分类号:TN912 文献标识码:A
1语音与噪声的研究现状
在言语交际中,人们不可避免地受周围环境的影响,如传输介质噪声,通信装置内的电噪声,和其他说话人的声音等。由于噪声干扰的存在,接收到的语音不是原来干净的语音信号,因为在嘈杂的语音信号中存在着噪声污染。例如,安装在车辆上,飞机或船上的电话,街道或在战场上的公共电话与机场广播,在强背景噪声下往往会受到噪音干扰,严重影响通信的质量。室内电话会议和语音广播混合各会场的回声,影响收听效果。深海潜水员的演讲会因为佩戴着氦氧气面罩而失真,历史悠久的老唱片与旧磁带会产生噪声,从而引发失真的现象,这些都是语音带噪音的实际例子。
多年来,各种语音增强算法的宽带噪声存在的人。虽然语音增强还没有建立完整的理论体系,但一些语音增强算法已被证明是有效的。常用的语音增强算法大致分为两种:基于语音产生模型参数的增强方法和基于非语音产生模型参数的增强方法。基于语音产生模型参数的方法主要有卡尔曼滤波方法和基于隐马尔可夫模型的方法,他们对语言产生的模型参数和恢复特性做合理的估计。但由于语音生产模型的参数难以被评估,很难得到准确的低信噪比,并且由于迭代和增加算法的复杂度,该算法没有取得实质性的进展。不基于语音生成模型的语音增强方法主要包括自适应噪声滤波方法,谱减算法以及短时谱估计增强算法。这种算法相比于基于语音生成模型的语音增强算法,参数设置简单,信噪比大大提高,在语音增强的实际应用中得到了广泛的应用。在该算法中,谱减算法作为基本算法,简单而易于实现,具有良好的性能和广泛的应用。
在实际的需求下,语音增强技术早就引起了人们的关注,许多工程技术人员与科学家多年来一直锲而不舍进行这方面的研究。随着数字信号处理理论的发展,上世纪七十年代,语音增强技术的研究已经达到了一个高潮,得到了一些基本结果,使语音增强技术成为了数字语音信号处理的一个重要分支。之后,随着大规模集成电路和计算机技术的发展,语音增强算法的仿真技术推动语音增强技术的发展提供了必要的条件,语音增强中的应用研究进入了一个崭新的阶段。
语音增强的目的是提取尽可能多的从带噪语音信号中原始的纯净语音。然而,由于干扰通常是随机的,从带噪语音中提取完全纯粹的语音几乎是不可能的。在这种情况下,语音增强的主要目的有两个:首先是语音质量的改进,消除了背景噪声,使人们愿意接受,不感觉疲劳,这是一个主观的方法,其次是提高信噪比,这是一个客观的测量。这两个目标往往是不相同的。目前有一种针对于低信噪比的语音增强方法,虽然可以显著降低背景噪声,提高语音信号的信噪比,但它会严重降低语音质量。
2语音与噪声的特性
2.1语音的特性
语音是一段非平稳的随机过程,但由于声带和声道的形状在一段相对稳定的时间内是不会产生突變的,因此可以得出结论:语音的特征是不变的,所以语音具有短时谱的相对稳定性。这种平稳的语音可以使用短时谱来进行分析。
清音和浊音是语音的两大分类。浊音在频域中存在一个明显的周期性,在时域中具有共振峰结构,但大部分能量集中在低频段。清音段没有明显的时域和频域特性,类似于白噪声。在语音增强技术中,可以使用具备周期性特征的浊音,使用梳状滤波器来提取语音分量或抑制非语音信号,而清音和宽带噪声则难以区分。
通过对语音信号的统计分析,可以用来描述语音的特征。由于语音是不稳定的,是非遍历随机过程,所以长时域的语音增强技术的统计特性意义不大。随时间变化的幅度统计特性具有短期语音频谱,并且只有当分析帧的长度趋向于无穷大时,才近似可以被认为是具有高斯分布的。在高斯分布模型的基础上可以获得中心极限定理。在宽带噪声污染的语音增强技术中,这种假设可以被认为是分析的前提。
2.2噪声的特性
不同的实际应用中会有不同的噪声特性,并且噪声能发生很大变化。噪声可以是加性的,但也可以是非加性的。一些非加性噪声可以转换为加性噪声。例如,同态乘性噪声通过噪声卷积变换可以成为加性噪声。加性噪声通常分为周期性噪声,脉冲噪声,宽带噪声和语音的干扰噪声和其他非加性噪声,包括混响电路噪声和传输网络噪声。
语音增强要利用到噪声的各种参数,噪声评估的精确度对后续算法具有显著直接的影响,因此预先准确地估算噪声对语音增强的影响是非常重要的。当对噪声进行估计时,通常假设要估计的噪声具有零均值。在许多噪声估计方法中,有检测无声语音信号和有声语音信号的。
参考文献
[1] 张俊.基于谱减算法语音增强的研究[J]. 信息技术,2009(03).
[2] 范立,侯强,吴题,李娟.变噪声环境下语音增强算法性能比较[J]. 武汉理工大学学报(信息与管理工程版),2009(02).