夏云飞,程子敬,李稚
(北京卫星信息工程研究所,北京 100194)
车辆行驶时产生的声音是一种包含多种声音成分的混合声音,在车型分类中首先需要做的就是特征提取,特征提取过程中如何对声信号进行有效去噪以及如何提取有效特征是两大难点。文献[1-15]大多针对如何利用特征提高识别率,并未过多考虑从源头上进行噪声处理以获得有效特征,而且文献中提出的方法所获取的特征相对比较复杂,计算量也比较大。
文中利用小波软阈值去噪方法和经验模态分解组合实现了燃油车和电动车的频谱分析技术,从频谱的角度直观地区分燃油车和电动车,为车型分类识别提供了一种简单实用的方法。
Donoho 在小波变换的基础上提出了小波阈值去噪方法,一般包括3 个步骤:小波分解、阈值处理和小波重构。首先,通过小波分解信号。然后,通过阈值量化处理每一层的高频系数。最后,对处理后的小波系数进行小波重构,以获得降噪信号。在这3个步骤中,阈值处理对去噪结果有很大影响,并且阈值函数起关键作用。阈值函数主要包括硬阈值函数和软阈值函数[16]。这两种方法的阈值函数表达式如下:
硬阈值函数:
软阈值函数:
其中,wi,k为小波系数;λ为阈值;w′j,k为处理后的小波系数。
1998 年,Norden E.Huang 等人提出了一种信号处理方法,即经验模态分解(Empirical Mode Decomposition,EMD)方法,杨建华等[17]人采用过该方法,该方法可以使信号平稳化并且自适应地将信号分解为不同尺度的波动或变化趋势,形成一系列具有不同尺度特征的数据序列,每个序列称为本征模式函数(Intrinsic Mode Function,IMF),这些反映原始信号的分量可以直接从中提取。IMF 需要满足两个条件:1)极值点和零点的数量必须相等或最多相差一个;2)对于任意一点,由局部最大值定义的包络平均值和由局部最小值定义的包络平均值为零。
IMF 函数的计算过程如下[18]:
对于一个信号m(t),首先确定出m(t)上的极大极小值点,用三次样条曲线分别连接极大值点和极小值点形成上下包络线,m(t)与上下包络线的均值e(t)的差值记为r(t)=m(t)-e(t),根据IMF的两个条件判断r(t),如果m(t)满足IMF的形成条件,则记为IMF1;否则,继续重复上述判定步骤,将剩余项q(t)=m(t)-IMF1 用作新的输入信号,重复上述步骤,直到得到全部的本征模态函数。经过多次分解之后得到的原信号的EMD 分解结果为:
其中,IMFi为第i个IMF 函数,rN为经过N次分解后的剩余项。
该实验采用的数据是SoundCloud 网站上下载的14 个电动车音频和18 个燃油车音频,每段音频长度为5 s,采样频率为48 kHz。
车辆声信号只通过小波软阈值算法去噪得到的结果如图1、图2 所示,从中可以看出,经过小波软阈值去噪前、后幅度谱变化不明显,不能达到理想的去噪效果,还需要进一步细化研究。
图1 燃油车去噪前后的幅度谱
图2 电动车去噪前后的幅度谱
车辆声信号先通过小波软阈值再通过EMD 分解之后得到的固有模态分量及其对应频谱如图3~6所示,从中可以看出,在高阶分量即IMF1、IMF2、IMF3的去噪前频谱成分中含有的噪声成分比较复杂,难以分离出来,IMF1、IMF2、IMF3 去噪后其含有的频谱成分基本上可以清楚地分离出来,由此看出,去噪后的效果非常明显。另外,燃油车声信号去噪后的高阶分量IMF1、IMF2、IMF3的频谱虽然还有一些噪声分量,但是基本上可以得出其频谱成分;相比燃油车声信号去噪后的结果,纯电动车声信号去噪后的高阶分量IMF1、IMF2、IMF3的频谱非常清楚,可以直接得出其频谱成分。
图3 燃油车去噪前固有模态分量及其对应频谱
图4 燃油车去噪后固有模态分量及其对应频谱
图5 电动车去噪前固有模态分量及其对应频谱
图6 电动车去噪后固有模态分量及其对应频谱
采用小波软阈值和经验模态分解对燃油车和电动车声信号去噪之后获得的固有模态分量进行频谱成分分析。表1、表2 分别为电动车和燃油车的各阶频率成分统计结果。
表1 电动车声信号频谱成分
表2 燃油车声信号频谱成分
对统计结果进行分类如下:
1)100 Hz 以内的频率成分
电动车声频谱的成分(单位:Hz):4.8,9.6,14.4,19.2,24,28.8,33.6,38.4,43.2,48,52.8,57.6,67.2,76.8,91.2;72,86.4,96。
燃油车声频谱的成分(单位:Hz):4.8,9.6,14.4,19.2,24,28.8,33.6,43.2,48,52.8,57.6,67.2,76.8,91.2,62.4,81.6。
2)100~300 Hz 以内的频率成分
电动车声频谱的成分(单位:Hz):105.6,115.2,124.8,153.6,158.4,177.6,187.2,206.4,216,220.8,225.6,268.8;148.8,249.6。
燃油车声频谱的成分(单位:Hz):105.6,115.2,124.8,153.6,158.4,177.6,187.2,206.4,216,220.8,225.6,268.8;110.4,120,129.6,134.4,144,182.4,192,196.8,211.2,235.2,254.4,283.2,292.8。
3)300~1 000 Hz的频率成分
电动车声频谱的成分(单位:Hz):451.2,528.1,561.7,580.9,614.5,624.1;312,384,494.4,537.7,542.5,566.5,600.1,643.3,657.7,662.5,691.3,772.9。
燃油车声频谱的成分(单位:Hz):451.2,528.1,561.7,580.9,614.5,624.1;307.2,316.8,336,340.8,345.6,388.8,398.4,441.6,489.6,499.2,513.7,571.3,576.1,585.7,595.3,633.7,652.9,667.3,681.7,696.1,753.7,758.5,768.1,835.3,859.3,969.7,984.1。
4)大于1 000 Hz的频率成分
电动车声频谱的成分(单位:Hz):1 277,1 306;1 219,1 339,1 354,1 498,1 776,2 184,2 285。
燃油车声频谱的成分(单位:Hz):1 277,1 306;1 104,1 114,1 123,1 143,1 176,1 215,1 373,1 378,1 392,1 411,1 455,1 488,1 493,1 555,1 589,1 699,1 992,2 251,2 362。
分析上述统计结果可以得出:
1)燃油车和电动车声信号在0~100 Hz 之内的频率基本相同,除了极个别的频率,如燃油车声频谱的62.4 Hz、81.6 Hz,电动车声频谱的72 Hz、86.4 Hz、96 Hz;
2)燃油车和电动车声信号在100~300 Hz 之间的频率成分关系属于燃油车包含电动车的关系,此外,在这个频率段,燃油车包含的频率成分明显比电动车要多,如110.4 Hz,120 Hz,129.6 Hz,134.4 Hz,144 Hz,182.4 Hz,192 Hz,196.8 Hz,211.2 Hz,235.2 Hz,254.4 Hz,283.2 Hz,292.8 Hz;
3)燃油车和电动车声信号在300~1 000 Hz 和大于1 000 Hz的频率成分都是燃油车更多,电动车的频率成分相对比较分散,而燃油车在某一个频率附近会出现较多附加频率;
4)燃油车的频率成分不仅数量多于电动车,而且最大频率也高于电动车,这也就解释了为什么电动车的噪声比燃油车小很多。
通过小波软阈值去噪和经验模态分解相组合,可以比较明显地滤除掉车辆声信号频谱中多余的噪声频谱成分,得到清晰的频谱成分,从频谱成分分析的角度,为燃油车和电动车的特征提取提供了一种简单实用的方法。