贺志军,李军霞,张伟,樊文瑞,李振华
(1.太原理工大学机械与运载工程学院,山西太原 030024;2.山西省矿山流体控制工程技术研究中心,山西太原 030024;3.矿山流体控制国家地方联合工程实验室,山西太原 030024;4.立博重工科技股份有限公司,山东泰安 271000)
带式输送机是煤矿和其他一些制造工厂的重要设备之一,尤其是在现代化煤矿企业中,几乎所有的煤矿都是通过带式输送机将矿料输送到装卸站的。带式输送机在工作过程中发生打滑进而引发火灾的事故屡见不鲜,其中大部分是由托辊故障引起的。若能及早发现托辊故障,可以避免故障扩大化,减少经济损失。
基于声音的故障诊断作为一个新兴的领域,具有很好的应用前景。但是由于环境的复杂性,采集的声音信号会含有大量的干扰噪声,所以需要通过相应的处理手段才能掌握原始数据中的故障特性。变分模态分解(Variational Mode Decomposition,VMD)是由 DRAGOMIRETSKIY和ZOSSO提出的一种信号处理方法,该方法克服了传统EMD存在的模态混叠等缺陷,因而广泛运用在故障诊断上。王朝阁等用峭度最大原则选择VMD的参数从而完成行星齿轮箱早期故障的提取,但是却忽略了峭度往往对瞬时冲击比较敏感。任朝晖等将VMD与DBN结合用于托辊故障的诊断。由于托辊运转时存在非平稳性、随机性等问题,仅通过时域分析和频域分析的效果远远不够,而通过倒频谱分析处理非平稳信号效果显著,因此经常应用在信号特征的提取。基于倒频谱发展而来的梅尔频率倒谱对声音的模拟效果与人耳听觉更为相近,在梅尔刻度下信号能量特征能被充分提取。因此应用Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)构成特征向量,可有效降低拾音器对噪声干扰的敏感度。近年来,MFCC开始被研究者应用到故障检测中,狄晓栋等采集变压器工作时的声音信号,然后提取MFCC混合特征,最后完成干式变压器的故障诊断。杨璟等人采用MFCC提取故障特征来实现对轨道电路的故障诊断。在优化SVM方面,周建民等用遗传算法完成对SVM参数的优化,得到良好的分类效果。李怡等人用麻雀搜索算法完成对SVM的优化,最终很好地应用于轴承故障的诊断。石志标和葛春雪通过CS-BBO算法优化SVM得到诊断模型的最优参数,增强SVM的分类能力。
基于此,本文作者提出一种基于MFCC特征和GWO-SVM的托辊诊断方法。首先对采集到的托辊声音信号进行VMD算法分解为若干本征模态分量(Intrinsic Mode Function, IMF),并基于包络谱熵、峭度组成的复合指标优选IMF;然后提取所选IMF的MFCC特征,采用灰狼优化算法(Grey Wolf Optimizer,GWO)优化SVM参数;最后将正常托辊、托辊内圈故障、托辊外圈故障和托辊卡死4种特征集输入模型训练并得到最优参数,从而克服参数选择难题。通过测试数据集来验证该方法在实际生产中的应用,最后通过对比验证所提方法的有效性和优越性。
VMD算法是一种新的时频分析方法,能够有效避免模态混叠和端点效应等问题,它能匹配各模态的最佳中心频率和有限带宽,从而有效分离原始信号。VMD的约束模型如下:
(1)
式中:{}={,…,}是原始信号分解后得到的个IMF;{}={,…,}为所对应的中心频率;∂为对求偏导;*为卷积运算;()为原始信号。
通过引入增广Lagrange 函数乘子()及二次惩罚因子,从而将约束优化问题变为非约束优化问题,进而得到变分问题的最优解:
[(),,()]=
(2)
式中:()为冲击函数。用交替方向乘子算法可求得 Lagrange函数的鞍点,即式(1)的最优解。
通过VMD分解得到模态分量大部分是干扰噪声,只有1-2个模态分量中富含故障特征信息。因此为了能够优选出含有更多故障信息的模态分量,文中基于包络熵和峭度提出一种复合指标。唐贵基和王晓龙提出IMF分量中故障信息越丰富,信号将表现出较大的稀疏特性,包络熵值越小。因此可以用包络熵来选择最优IMF,包络熵的计算公式见参考文献[12]。但包络熵在表现冲击性能方面有一定的缺陷。
峭度则相反,故障信息越丰富,峭度越大。但峭度对瞬态冲击的敏感程度远大于周期冲击,而瞬态冲击往往表现在时域上,在包络谱中突出频率较少。为了避免瞬态冲击的影响,提出时-频加权峭度(),表达式如下:
=02×+08×
(3)
式中:为时域峭度;为包络谱峭度。最终构建的复合指标()为
(4)
Mel倒谱系数(MFCC)是根据人耳的听觉感知特性发展得到的,主要应用在声音信号特征提取,MFCC特征提取主要由以下几步:分别是分帧、预处理、离散傅里叶变换、Mel带通滤波、离散余弦变换等。图1所示为MFCC特征提取流程。
图1 MFCC特征提取流程
物理频率与Mel频率关系如式(5)所示:
=2 595×lg(1+700)
(5)
算法具体步骤如下:
(1)对原始信号进行分帧,预处理(加窗、预加重)加窗使用的是hamming窗;然后对信号进行预加重,设处理之前的信号为(),则预加重后()表示为
()=()-·(-1)
(6)
式中:一般取0.97。
(2)为保证两帧之间的连贯性;信号采用重叠取样,将帧长设为25 ms,帧移为10 ms。
(3)接着对每帧信号作离散傅里叶变换(DFT)。设预处理之前时域信号为(),则经过DFT变换后的频域信号()可表示为
(7)
(4)然后通过求取()的平方进而得到能量谱,再使用个Mel带通滤波器进行滤波操作,其中第个滤波器的传递函数为
(8)
(5)接着计算每个滤波器组的对数能量。其中第个滤波器组的对数能量为
(9)
(6)经离散余弦变换即可得到Mel倒谱系数:
(10)
式中:为Mel滤波器的个数,也是MFCC特征的维数,文中取12。
GWO方法是澳大利亚学者根据灰狼捕食猎物活动而研发的一种优化搜索方法,通过模拟灰狼群体在捕食过程中的跟踪、包围、追捕、攻击猎物等觅食行为进而达到目标优化。该方法中,狼群按照社会等级从高到低依次标记为α、β、δ、ω,下级行为需服从上级领导,并展开群体狩猎行动。GWO方法的具体步骤如下:
(1)包围猎物。在进行捕捉猎物时,狼群会首先包围猎物。这种包围行为的数学建模为
(11)
式中:为当前迭代次数;和为向量系数;为当前猎物位置;为狼群位置。在迭代过程中,参数从2线性下降至0,和为区间[0,1]的随机数。
(2)追捕猎物。为模拟灰狼的捕猎过程,将α、β、δ作为主导进行猎物位置的搜索,其他搜索单位ω作为辅助,进而更新狼群位置。
(12)
SVM是目前常用的一种机器学习分类方法,在小样本问题分类上效果显著,但该方法性能的好坏依赖于对惩罚因子与核函数参数的选择。GWO算法拥有收敛速率快、参数少、寻优能力强等优点。所以,可以将GWO方法用来SVM分类器参数的确定。其中SVM详细介绍见参考文献[16],文中选择径向基核函数(Radial Basic Function,RBF)作为SVM内核函数,GWO-SVM流程如图2所示,具体步骤如下:
图2 GWO-SVM流程
(1)输入SVM的测试集。
(2)通过初始化SVM与GWO参数,利用GWO方法进行全局寻优,从而获取SVM中与的最优值。在此过程中,将每头灰狼的相对位置作为SVM的主要参数加以训练和测试,并将所测试样本的正确识别率视为对该灰狼的适应度值。
(3)将最优值和确定为SVM分类器的参数,并利用训练好的预测模型对测试集进行测试。
综上所述,文中提出了基于MFCC特征和GWO-SVM托辊故障诊断模型,主要包含如下3个步骤:
步骤1,数据预处理。将采集到的信号进行变分模态分解,通过比较各个模态分量的综合指标的大小优选出富含故障信息最多的模态分量,以此作为样本信息。
步骤2,特征提取。文中采集的托辊共有4种声音信号,分别为正常托辊、托辊内圈故障、托辊外圈故障和托辊卡死。将得到的每种信号分为60个样本,40个用来训练,20个用来测试。4种工况共有240个样本,分别对样本求解MFCC特征作为样本特征输入。
步骤3,模式识别。初始化模型参数,然后随机挑选40×4个样本组成训练样本集,输入SVM模型用来训练模型。利用灰狼算法对SVM进行优化,以分类错误率最小为目标函数不断对参数进行优化,最终完成托辊故障识别模型的建立。之后把剩下的20×4个输入集输入模型进行分类测试,最后验证该模型的分类准确性。
其实验流程如图3所示。
图3 实验流程
为验证所提方法的可行性与有效性,此研究以正常托辊、托辊内圈故障、托辊外圈故障和托辊卡死为例。使用线切割加工技术在轴承上加工裂纹,以及人为破坏托辊达到卡死状态,再加上正常托辊共4种工况如图4所示。
图4 正常与故障托辊
在托辊故障模拟实验台上进行托辊正常、托辊轴承内圈故障、托辊轴承外圈故障和托辊卡死等4种工况(标签信息分别定义为0、1、2、3)实验数据的采集,实验平台如图5所示。此次实验中,带式输送机速度设为1 m/s,噪声传感器型号采用CRY2301,采样频率设为44 100 Hz,采样时间为10 s。由于巡检机器人还没有搭建完毕,所以通过测试人员手持传感器获取数据。得到4种工况各60组数据,共计240组数据。
图5 托辊故障模拟实验台
托辊声音信号以1 103个采样点为一帧。4种工况的某一帧声音信号如图6所示。
图6 托辊信号
GWO寻优算法将训练样本的训练误差作为适应度函数,计算最小误差和最优参数。GWO算法的狼群数量设为10,最大迭代次数设为10,2个参数的寻优范围设为[0.01,100]。在每次迭代过程中,计算10匹狼的适应度值,根据平均适应度进行迭代寻优。随着迭代次数的增加与狼群位置的更新,训练误差逐渐下降,参数也逐渐优化。根据灰狼优化算法最终确定SVM惩罚参数=30.00,核参数=0.42,分类如图7所示。
图7 模型分类
由图7可知:分类结果中只有4个样本出现类别误判现象,误判现象均属于托辊内外圈故障上。通过分析可知:托辊内外圈发生故障时具有更加紧密的耦合性,导致内外圈提取的特征具有一定的相似性,进而出现误判现象。但该模型可以很好地识别出正常和卡死托辊,可以有效避免因为托辊卡死造成皮带升温进而引发事故。
为了验证复合指标在选择模态分量上的优势,分别将由包络熵、加权峭度、复合指标优选的IMF提取MFCC特征,然后输入GWO-SVM分类器中取10次结果的平均值对比分类准确率。3种指标的分类结果如表1所示,结果显示由复合指标挑选出的IMF含有的特征信息更为丰富,分类准确率也相应更高。
表1 不同指标优选的IMF诊断结果
为了进一步验证灰狼算法在优化SVM上的优越性,采用不同的优化算法进行准确率和运行时间的对比。将MFCC特征分别输入GA-SVM、CS-SVM、SSA-SVM、GWO-SVM分类器作比较,每种方法取10次准确率的平均值作比较。4种分类器的识别结果如表2所示。结果表明:不论识别准确率还是识别用时方面,GWO-SVM都明显地优于其余三者。
表2 不同分类器的诊断结果
为了验证该模型在变工况条件下的通用性,将带式输送机速度为1.5 m/s时采集到的4种声音数据做相同的处理最后输入GWO-SVM模型,每种工况采集90组数据,其中50组用来训练模型,40组用来测试,4种工况共360组数据。分类结果的混淆矩阵如图8所示,结果显示:在变工况条件下,160种样本只有10个样本发生误判,该模型的准确率依旧保持93.75%,依旧可以很好地检测到卡死的托辊。
图8 分类结果混淆矩阵
通过文中的研究,可以得到以下结论:
(1)文中提出了一种基于灰狼算法优化SVM参数的托辊故障识别方法,该方法克服了SVM人为调参的弊端,可以自适应地得到与分类器匹配的最优参数组合。
(2)文中提出的复合指标有效地克服了单一指标的缺陷,可以更为有效地优选出富含故障特性的IMF;而MFCC特征可以很好地表征故障特征,分类效果较为明显。
(3)文中所提方法可以通过处理采集的声音信号进而完成对托辊故障的识别。但是在强噪声的干扰下,识别效果不够理想。因此通过其他高效降噪方法实现故障信息和无效噪声的分离值得下一步研究。