基于小波MFCC与HMM的列车鸣笛识别算法研究

2015-11-05 05:23蒋翠清李天翼
中国管理信息化 2015年6期
关键词:于小波鸣笛特征参数

蒋翠清,李天翼

(合肥工业大学 管理学院,合肥 230009)

基于小波MFCC与HMM的列车鸣笛识别算法研究

蒋翠清,李天翼

(合肥工业大学 管理学院,合肥 230009)

本文提出了一种列车鸣笛识别方法,用更能反映出声音信号特征的梅尔倒谱系数(MFCC)特征作为列车鸣笛识别的参数,同时,用小波变换替代MFCC参数提取过程中的FFT变换,将改进后的MFCC参数与隐马尔可夫模型(HMM)结合,获得比LPCC特征或MFCC特征更好的识别效果,并通过仿真实验对比验证了该算法的有效性和可行性。

列车鸣笛识别;梅尔倒谱系数;小波变换;隐马尔可夫模型

1 引 言

列车鸣笛识别的基本原理是从实时采集的列车声数据中,提取能反映其特征的参数,与列车行进过程中的典型声音(铁轨摩擦声、刹车声等)建立的模型匹配,得出识别结果。利用这种技术可实现列车鸣笛自动检测,以促进列车乘务员加强对列车信号及前方进路的瞭望确认,对列车乘务员是否瞭望确认进行监督。

语音信号识别常用的特征参数有线性预测系数、线性预测倒谱系数(Linear Prediction Cepstral Coefficients,LPCC)和Mel频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)等。其中,MFCC模拟了人耳耳蜗的听觉特性,在语音识别领域得到了广泛应用。文献提取了声音信号的MFCC参数进行声音识别,取得了一定的效果,但列车声信号是不平稳的,MFCC无法很好地反映其特性。小波变换能够精确的表征非平稳信号的变化,并且其特性与人耳耳蜗的生理频率响应特性相似。用小波变换来改进MFCC特征提取,能精确地反映列车声信号的动态特性,因而采用改进后的MFCC作为列车声信号的特征参数更好。

隐马尔科夫模型(Hidden Markov Model,HMM)是一个时间序列模型,一个无记忆的非平稳随机过程,表征时变信号的能力很好,可以处理声音信号中所包含的时序信息和统计信息,已经被广泛应用于语音建模。

文中提出了一种基于小波MFCC参数和HMM模型的列车鸣笛识别方法,选取改进后的MFCC参数作为特征,由实验数据分析证明了该鸣笛识别方法的可行性。

2 声音特征参数选取

声音特征参数提取是指从列车声信号当中获得能够描述音频信号特征的过程。

2.1MFCC参数的提取

MFCC参数在语音信号识别领域运用极为广泛,它结合了语音的产生机制和人耳的听觉感知特性,能够很好地反映语音信号的特性,从而提高算法的识别率。如图 1 所示,在正常提取MFCC参数的过程中对信号要作快速傅里叶变换。

图1 MFCC参数提取流程

2.2离散小波MFCC参数的提取

传统的Mel频率倒谱系数假设声音信号是短时平稳的,用固定窗的傅立叶变换获得。由不确定性原理可知这种假设会使声音的频谱细节特征模糊,丢失一定的信息。并且MFCC无法反映非平稳列车声信号的瞬间变化,因此,传统的MFCC系数在列车鸣笛识别算法中不能收到很好的效果。用离散小波傅里叶变换改进传统MFCC参数提取过程中的快速傅里叶变换,能够较好地解决上述问题。

小波变换采用多分辨力分析的思想,非均匀地划分时频空间,与人耳蜗的频响特性相似。因此,在使用离散小波傅里叶变换的情况下,列车行进声信号在时频域都可获得了较为合适的分辨能力。实验中采用离散的二进制小波,其表示式为:

式中,f(t)为能量有限信号;φm,n(t)为二进制小波,表示式为:

用离散小波傅里叶变换改进传统MFCC系数提取过程,得到新的特征参数——小波MFCC系数(记作WMFCC)。WMFCC系数的提取过程如图2所示。

图2 WMFCC参数提取流程

3 隐马尔可夫模型

隐马尔可夫模型是语音处理中广泛应用的一种统计模型。HMM是一个双内嵌式随机过程,其中,一个随机过程描述状态的转移,另一个随机过程描述观察值和状态之间的统计对应关系。

HMM可以用一个五元数组:λ=(P,Q,a,M,N)描述,其中P为模型中状态数目,Q为每个状态可能的观察值数目,a表示初始状态概率,M表示状态转移概率矩阵,N表示观察概率矩阵。由于在算法识别过程中状态数目和观察值数目不变,HMM也可简写为λ=(a,M,N)。

HMM的常用算法有三种:前向—后向算法、Viterbi算法和Baum-Welch算法。本文中HMM的训练使用Baum-Welch算法,HMM的识别使用Viterbi算法。

Baum-Welch算法可描述为:给定1个观察值序列O = O1,O2,…,OT和一个HMM初始参数λ=(a,M,N),使观察序列O相对于λ的概率P(O|λ)最大。Baum-Welch算法为了得到模型参数的最优解,将新老HMM模型参数的函数进行迭代运算直到P(O|λ)收敛,即HMM模型参数不再变化为止。

Viterbi算法可描述为:给定1个观察值序列O = O1,O2,…,OT和一个初始参数λ=(a,M,N),如何确定未知序列K=K1,K2,…,KT的P(K,O|λ)最大时的最佳状态序列K*=K1*,K2*,…,KT*。对于要识别的声音信号,可算出声音特征通过每个HMM模型的概率P(K,O|λi),其中输出概率最大的模型作为识别结果。HMM模型的原理如图3所示。

图3 HMM模型原理图

4 基于小波MFCC和HMM模型对列车鸣笛的识别

基于小波MFCC和HMM的列车鸣笛识别算法如图4所示。首先,对列车声信号样本进行预处理,提取MFCC和WMFCC,然后一部分样本特征作为训练集,将两个参数分别通过HMM模型进行训练,以得到最优的HMM参数并存储;另一部分样本特征作为测试集,通过训练好的模型识别系统计算,从而判断其类型。

图4 基于小波MFCC和HMM模型的列车鸣笛识别算法

5 实验及分析

本文实验样本均为铁路路口现场录制,样本精度为16bit,采样率为44.1kHz。列车声音分鸣笛和非鸣笛两大类,鸣笛种类为电鸣笛和汽鸣笛,非鸣笛种类为铁轨声、风声、刹车声等。其中,鸣笛类声音有120个样本,非鸣笛类声音样本有200个。

本文分别提取3种参数(LPCC,MFCC,WMFCC)进行对比实验。LPCC参数采用文献的提取方法。MFCC和WMFCC参数的提取的过程中设置如下:信号的分帧长度取为25ms,帧移为8 ms。MFCC参数提取时数字滤波器组选24个,DCT系数为12*24维,对处理过的声音信号进行反离散余弦变换后得12个MFCC系数,再计算其一阶差分12个共24维;其中WMFCC对信号进行6层小波分解,分解后可得7层小波系数。

将实验样本分为训练样本和测试样本:训练样本为样本总数的80%,测试样本为剩余的20%的样本。每组实验做10次,列出每类声音的平均识别率,最后对不同特征组合下声音的识别率及效率进行比较。

表1 不同特征参数识别结果

从表1中可看出,对于相同的样本,选取WMFCC作为特征时的正确率比选取MFCC作为特征的正确率都要高,说明WMFCC更能反映火车声信号的非平稳特性。从鸣笛和非鸣笛的总识别率还可以看出,选取WMFCC作为特征参数时,用HMM模型能准确分辨火车鸣笛跟非鸣笛,说明火车鸣笛与非鸣笛声信号的WMFCC特征有着较大的差异。由以上分析可得出结论:利用小波MFCC和HMM对火车鸣笛进行识别是可行的。

6 结 论

本文将语音识别中常用的特征参数MFCC与小波变换结合,运用到列车鸣笛识别领域。提出了基于小波MFCC参数与HMM模型列车鸣笛识别方法,通过实验的数据分析表明该方法识别率较高,在列车鸣笛等异常声音识别中有良好的应用前景。

如果对算法进行优化,将其移植到C等底层语言中并与硬件结合,不仅能够较大幅度地提高算法运行效率,同时还能实现列车鸣笛的实时识别,从而更好地监督列车乘务员是否瞭望确认,促进火车的安全运行。

主要参考文献

[1]S Chauhan,P Wang,C Sing Lim,et al.A Aomputer-aided MFCC-based HMM System for Automatic Auscultation[J].Computers in Biology and Medicine, 2008, 38(2): 221-233.

[2]成彬彬,张海.基于小波变换的数字耳蜗滤波器组设计与实现[J].电子技术应用,2009(1):135-138.

[3]刘辉,杨俊安,许学忠.基于 MFCC 参数和 HMM 的低空目标声识别方法研究[J].弹箭与制导学报,2008,27(5):217-219.

[4]韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004.

[5]张德丰.MATLAB 小波分析[M].北京:机械工业出版社,2009.

[6]陈韬伟,辛明.基于小波变换的雷达辐射源信号特征提取[J].信息与电子工程,2010,8(4):436-440.

[7]张小玫,张雪英,梁五洲.基于小波 Mel 倒谱系数的抗噪语音识别[J].中国电子科学研究院学报,2008,3(2):187-189.

[8] 何强,何英.MATLAB 扩展编程[M].北京:清华大学出版社,2002:352-371.

[9] 王钟斐,王彪.基于短时能量—LPCC 的语音特征提取方法研究[J].计算机与数字工程,2012,40(11):79-80.

10.3969/j.issn.1673 - 0194.2015.06.053

TN912.34

A

1673-0194(2015)06-0072-02

2015-02-11

猜你喜欢
于小波鸣笛特征参数
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
朋友圈
基于小波去噪的称重雨量数据分析
一种新的基于小波基的时变信道估计
基于小波和Hu 矩的飑线雷达回波识别
基于PSO-VMD的齿轮特征参数提取方法研究
统计特征参数及多分类SVM的局部放电类型识别
基于小波变换的图像去噪技术
加拿大司机很少鸣笛