王玲玲 黄垂桂 赵建杨
(海口经济学院,海南 海口 570100)
在当今互联网信息时代快速发展的局面下,数字通信系统得到了广泛的应用,随着人们对信号处理研究的深入和需求的不断提高,信号处理俨然成为通信系统中最重要的一步。在信号科学研究领域,增长速度最快的研究技术就包括消除噪声干扰,可以保证传输的稳定性,并检索原始声音。当原音信号传输时,通信系统会受自身和外界环境因素的干扰。外界噪声形式存在多样化,基本都是随机且无法提前预知的,无论是生活还是军用的通信系统,总会存在各种不同形态的噪声,例如工频干扰、随机噪声等,都将严重影响通信质量。强噪声会给通信系统造成不好的体验,强噪声甚至会危及人类的身心健康,因此剔除噪声已成为数字信号处理中的一个重点问题。
该研究旨在对加入白噪声的音频文件进行降噪滤波,并提取原始音频文件。对音频信号来说,在音频形态下的录制和播放都需要考虑噪声的干扰,音频文件含有噪声就会导致该音频信号很刺耳,无法得到该音频的原声,需要对其进行滤波器处理变换后,才能得到清晰的原音频。如何稳定并高效率地剔除原始音频文件中的噪声信号,并保持原始信号输出的稳定性和准确性,是该研究的重点内容。该研究对所选音频信号添加白噪声,通过MATLAB软件设计3种不同的滤波器进行降噪滤波,提取原始音频,并对比3种不同滤波器对此类音频的滤波效果。
该设计是基于MATLAB的音频降噪滤波器,主要由音频信号、添加噪声文件、设计滤波器以及分析所产生的波形图4个部分组成。首先,对待输入的音频信号进行预处理分析,得到其时域及频域波形图。其次,通过MATLAB函数产生噪声信号,在原始音频信号上进行噪声叠加。最后,设计滤波器,对加入噪声后的音频信号进行滤波降噪,并观察其滤波后波形,以校验针对该音频的滤波器的设计是否最优。其基本工作过程如图1所示。
图1 音频降噪滤波器系统设计流程
图4 椭圆滤波后音频信号频域分析
时域分析和频域分析是对音频信号进行分析的主要类型。
时域分析:处理直观,计算量小。设L表示分帧的帧长,ui(n)表示分帧后得到的第i帧信号中的第n个点的幅度值[1]。短时能量(DSNL)对音频信号进行端点检测,表示其在一个小窗口中的能量总和,如公式(1)所示。
音频信号的时域特性主要是短时能量和短时过零率。它们主要反映了音频信号能量在时域内随时间的变化情况,并能区分具有明显能量差异的音频。一般来说,浑浊段的平均短期能量最高,其次是第二高的浑浊段,无声段最低。
频域分析:音频信号的频域研究可以显示时域无法表达的特性。信号通过频域变换从时域转换到频域[2]。时域中的连续模拟信号被划分为不同的频谱频率,因此可以根据不同的频谱频率对其进行分类。频域能量(PYNLE),即在使用傅里叶变换后频域音频信号的能量,如公式(2)所示。
式中:ω0为采样频率的1/2;Fi(ω)为第i帧信号的傅里叶变换。
频域能量是区分无声和非无声的有效特征。
噪声是对人类休息、学习或工作等正常活动产生干扰的信息。主要有加性噪声、周期噪声和白噪声等。
加性噪声是指噪声和纯语音的影响被描述为2个语音信号在时域的叠加。从加性噪声的定义可以看出,加性噪声和纯净语音在频域内也是叠加的关系。当采用硬件来捕捉语音时,语音的振幅值和声音强度会变成线性关系,因此从能量的角度来看,加性噪声与所获取音频间均存在线性和非线性关系的可能性。
周期噪声是指一种相对规则且有一定节律的噪声。一方面,周期噪声意味频谱图上的声音曲线以一种可预测的方式变化。周期函数可用于产生周期噪声,这种方法在数字信号处理中经常被采用。另一方面,真正的周期噪声不会遵循这种精确的周期,它不会是单一的线状频谱成分,而更多的是一个狭窄的频谱成分,且并不恒定。
白噪声是指在整个大的频率范围内,每个等宽的频段具有相同的噪声功率谱密度的噪声。理论上,理想的白噪声带宽是无限的,因此它的能量也是无限的。在现实中,具有有限带宽的平坦信号有时也被称为白噪声,它在数学分析上更简单。白噪声是系统分析中的一个较好的工具,它在理论实现上相对便捷。通常情况下,当一个噪声过程的频谱宽度比其所影响的系统带宽要宽,而且其频谱密度在这个范围内是不变的,则可以认为其是一个白噪声。其振幅具有高斯分布,但是功率谱类似于白谱,均匀地分散在频率轴上,该研究添加的噪声为白噪声。
滤波器的作用就是过滤波形,这里的滤波不是指在时间上截取某一部分波形,而是指过滤掉不需要的波形成分,即只让需要的波形成分通过。波形成分一般用频率来描述,也可以用模拟角频率和数字角频率来描述。一个理想滤波器的特性就是只允许将某个要求频带范围内的波形成分全部通过,例如将500 Hz~1 000 Hz的波形成分全部输出,并且其形状不能发生任何改变,也就是说原来波形的相位可以线性左移或右移,但是幅值不能改变。对频率小于500 Hz和大于1 000 Hz的波形来说,信号不能输出,幅值为0。虽然滤波器不能完全理想地实现,但是可以构建滤波器并对其性能指标进行设置,以无限接近于其理想特性。
理想滤波器严格地将某个频率点两端的成分分开,这个频率点被称为截止频率。截止频率的一端在幅度保持不变的情况下允许通过,另一端则不允许通过,即幅度值为0。但是实际上做不到这一点,需要放宽部分要求来实现。在截止频率点向左、右分别移动一定距离,可以确定2个新的频率点,这2个新的频率点之间的频率成分就是过渡带。将这2个新的频率点分别称为通带截止频率和阻带截止频率。同样,波形的幅度也不能保证全部恒定不变,在通带范围内的幅度衰减称为通带衰减大小,在阻带范围内的幅度衰减称为阻带衰减大小,幅度的衰减大小一般用分贝表示。假如过渡带中的频率成分出现幅度缓慢衰减、单调下降的情况,是可以接受的,通带和阻带的幅度在一定范围内发生起伏波动也是可以接受的,即可以设计这样的滤波器。
谱减法是一种比较成熟的降噪算法,也是目前常用的降噪算法。在噪声是平滑的前提下,该算法将音频过程中的噪声频谱与无音频间隙时测得的噪声频谱估计值进行替换,与含噪声频频谱相减,得到音频频谱的估计值[3]。谱减法技术被广泛使用,因为它算法简单,操作最少,易于实现,并能实现高输出信噪比。谱减法设计滤波器有假设前提:设定音频中的噪声只有加性噪声,只要加噪声频信号谱减去噪声谱,就可以得到原始音频。前提是噪声信号是平稳的或者变化缓慢的,其频谱在短时间内是稳定的。如公式(3)和公式(4)所示。
式中:Ps(ω)为加入噪声后的频谱;Pn(ω)为估算出噪音的频谱;D(ω)为两者相减得到的频谱差值。
由于相减后可能会出现负值,因此就简单地加上一个判断条件,将负值全部设置为0,将这样得到的结果作为最终输出去噪后音频的频谱P's(ω)。
谱减法滤波后音频信号频域分析图如图2所示。由图2可知,添加白噪音之后的音频信号的频域发生了明显改变,频域图几乎已经不存在原始音频信号频域,噪声也主要集中在±5 000 Hz的地方。执行谱减法滤波之后,噪声明显消除,滤波后较好地还原了±4 000 Hz范围内的音频。
图2 谱减法滤波后音频信号频域分析
切比雪夫滤波器能实现等幅滤波,主要是其频率响应的振幅波纹波动相等,形成了通带或阻带效果。切比雪夫滤波器可以分为Ⅰ型(通带)和II型(阻带),切比雪夫Ⅰ型滤波器在通带上频率响应幅度等波纹波动。其振幅特性平坦性较弱,但是衰减速度较快。切比雪夫滤波器在通带范围内是等幅起伏的,其振幅平方函数|H(jω)|2如公式(5)所示。
式中:N为阶数;ε为与通带波纹有关的参量;CN为N阶切比雪夫多项式;ω为通带波纹频率;ωc为通带截止频率。
切比雪夫Ⅰ型滤波后音频信号频域分析图如图3所示。
由图3可知,经过切比雪夫Ⅰ型滤波器滤波后,从频域波形图可以看出,其音频信号中的白噪声幅度得到削弱,与原始音频信号的频域图相近。但是图中大于4 000 Hz以及小于-4 000 Hz部分的频域缺失;且在±5 000 Hz时还有部分信号集中,其幅值大于0.2。这种滤波方式在一定程度上还原了原始信号。
图3 切比雪夫Ⅰ型滤波后音频信号频域分析
椭圆滤波器是通带和阻带均为等波纹的一种滤波器。与其他类型的滤波器相比,在阶数相同的条件下,其具有最小的通带和阻带波动。从传递函数角度分析来看,椭圆函数的滤波不仅存在一个零点,还存在一个频率相对有限的极点。零极点引起的是一个与通带相等的波形,在阻带中相对有限地进行传输,零点会缩小连接面积,这样可以得到相对陡峭的系数衰减曲线。椭圆滤波后音频信号频域分析图如图4所示。
由图4可知,经过椭圆滤波器滤波后的时域图分布已经较为规律,与原始音频信号的时域图很接近。而频域图中近似大于3 500 Hz和小于-3 500 Hz部分缺失,±5 000 Hz附近有集中部分且幅值小于0.2,但是与原始音频信号的频域图也很接近。
综上所述,该文简要分析了使用谱减法、切比雪夫和椭圆滤波器进行同一段音频加噪处理的结果。从频谱图上来看,谱减法所设计的滤波器抑制了白噪声,尽可能还原了原始音频;切比雪夫Ⅰ型滤波器在0 Hz~2 000 Hz时能尽可能还原音频,在±5 000 Hz时还有部分集中,其幅值大于0.2;椭圆滤波器在±5000Hz附近有部分集中,但是其幅值与切比雪夫Ⅰ型滤波器相比是小于0.2的。由此可得,针对该文所选用的音频信号,谱减法在该设计中更适用,能尽可能地还原音频文件,同时削弱白噪声的干扰。