杜京义,杨宁,荣相
(1.西安科技大学电气与控制工程学院,陕西西安 710054;2.天地(常州)自动化股份有限公司,江苏常州 213015)
异步电机在煤矿行业应用广泛,是起重机、掘进机、采煤机、给水泵、空压机、皮带输送机等旋转机械的主要动力供应设备,电机的正常工作是确保安全连续生产的前提。研究电机故障诊断在生产生活与学术研究方面都具有积极意义。
声音是人类获取信息的重要来源,机器设备声学研究有重大意义。异步电机正常运行时发出的声音具有一定规律性,当出现故障时,其声音特征也会随之改变。因此,可以利用声信号,将提取的音频特征与某一类型的故障联系起来,对异步电机进行故障识别与诊断。文献[7]利用支持向量机的方法检测电机异常声音,但前期声音信号缺乏进一步处理。文献[8]利用音频特征对电气设备进行监测,验证了方法的可行性,但是识别模型泛化能力较弱。文献[9]利用BP算法对机车牵引电机进行了故障诊断,取得了一定结果。文献[10]采用小波包分析法提取微型电机声音信号进行故障诊断,提取信号中的冲击成分,对故障电机进行了判别。随着人工智能的进一步发展,以深度神经网络为代表的智能算法对声音信号的分类已经不断地被引入设备故障监测与维护。目前,对于电气设备领域,深度学习在声信号模式识别领域的研究多集中于变压器,尚未见到将深度学习方法应用于异步电机异常声音检测。
基于此,本文作者搭建3种状态异步电机的检测平台并采集每一种状态的声音,分别提取每一个声音片段的Log-Mel特征、MFCC特征、GFCC特征。建立卷积神经网络(Convolutional Neural Networks,CNN)模型,通过对输入的音频特征进行卷积、池化等操作处理,实现对异步电机的故障分类。
针对异步电机声音信号能量主要分布在低频段的特点,预加重处理可以提升高频分量,使信号频谱变得平坦:
()=()-α(-1)
(1)
其中:0.9≤≤1.0是预加重系数;()为输入的信号;()为预加重后的信号。
考虑到声音信号的时变特性,需要对信号进行短时分析。首先进行预处理,它通常包含分帧与加窗2个步骤。分帧时确保帧长略大于帧间隔。文中取帧长为25 ms、帧间隔为10 ms,保证分帧后的信号不会缺失。
分帧后的信号在帧起点和帧终点处具有高度不连续性,直接进行傅里叶变换,会导致频谱出现局部峰值。因此,采用汉明窗(Hamming)对每个分帧后的信号进行处理以减小失真现象。汉明窗公式如下:
(2)
式中:()为窗函数对应的权重。
加窗后的信号()为
()=()×()
(3)
预处理后,利用离散傅里叶变换算法得到每一帧的频谱,取模平方得信号的功率谱:
(4)
(5)
其中:()为帧信号的频谱;()为帧信号的功率谱。
将()信号通过梅尔滤波器组,梅尔滤波器组由一组等高三角形滤波器组成,如图1所示。滤波器组对得到的功率谱进行滤波处理,放大中低频分量,减小高频分量,实现样本数据的降维和准确的特征提取。其函数()表示为
图1 梅尔滤波器组
(6)
其中:为滤波器组编号;()为三角滤波器的中心频率。
(7)
式中:为信号的总帧数。
对式(6)中的()进行对数运算,得到对数功率谱′()作为Log-Mel特征:
′()=log()
(8)
该方法与Log-Mel特征方法大致相同,在Log-Mel特征参数的基础上进行离散余弦变换(DCT)得到MFCC特征参数:
(9)
式中:为MFCC的阶数;为滤波器的个数。
所得到的MFCC特征仅反映声音信号静态特性,需要求其1阶差分系数和2阶差分系数描述声音信号的动态特性:
(10)
(11)
将MFCC参数、1阶差分系数()和2阶差分系数′()组合成特征向量,提高系统识别的准确性。
MFCC特征提取的主要流程如图2所示。
图2 MFCC特征提取流程
输入信号需要执行相同的预加重和分帧加窗操作,使用离散傅里叶变换后信号()。因异步电机声音信号采集环境存在背景噪声,选用非线性Gammatone滤波器组代替梅尔滤波器组。Gammatone滤波系数计算公式为
()=-1exp(-2π)cos(2π+)()
(12)
式中:为滤波器衰减因子;为中心频率;为滤波器相位;()为阶跃函数。
如图3所示,Gammatone滤波器组的优点是能够模拟人耳的频谱分析,具有很强的抗噪性,在有背景干扰的情况下同样表现良好。
图3 Gammatone滤波器组
结合公式(12),用幂函数=代替log函数校正信号,之后利用DCT,得到GFCC特征参数:
()=
(13)
得到GFCC特征参数,并按公式(10)(11)求其1阶差分和2阶差分系数,组成GFCC特征向量。
GFCC特征提取的主要流程如图4所示。
图4 GFCC特征提取流程
基于3-100L2-4三相异步电机,通过改造正常异步电机转子与外壳口径,使它出现转子断条与气隙偏心2种故障类型。根据GB3806-81的标准和要求对电机进行声学测量,测试模型如图5所示。声传感器距离电机最外侧30 cm,垂直指向电机的轴向,采样频率为48 000 Hz,采样位数为24位,传感器频率响应范围为20~20 000 Hz。数据采集实物如图6所示。
图5 测试模型
图6 数据采集实物
采集后的声音首先划分成1 s的长度并保存为音频文件(.wav),后续作为输入数据进行特征处理。样本包含3种状态异步电机:正常、转子断条和气隙偏心,每种状态异步电机各有2台,样本数如表1所示。
表1 异步电机声音信号信息
图7所示为采集到的音频信号的时域波形图和频谱图。可见:3种状态异步电机的频率成分主要分布在2 000 Hz以内,不同状态的频谱差别较明显。正常异步电机频谱分布集中在0~500 Hz;转子断条异步电机频谱分布在0~1 000 Hz,且有突出的800、900 Hz分量;气隙偏心异步电机频谱集中,突出800 Hz的分量。上述分析表明,声音信号能够作为区分异步电机类型的特征量。
图7 不同异步电机的时域图和频谱图
文中对采集的声音数据分别提取3种特征:Log-Mel特征、MFCC特征、GFCC特征,特征参数的可视化结果按8∶2的比例分为训练集和测试集,训练集输入卷积神经网络进行训练,测试集用来验证训练结果是否过拟合。
按照第1节的方法对采集的数据进行特征提取,特征提取结果尺寸为[39×99],前者代表特征参数的个数,MFCC特征提取和GFCC特征提取过程中分别选取13个特征参数,与其1阶差分系数和2阶差分系数共同组成39个特征参数,为保持维度一致,提取Log-Mel特征时选择39个特征参数;后者代表帧信号划分后的个数,由输入信号决定。3种特征提取方法都有明显的数据降维效果,解决了声音数据量大且复杂的问题。将特征提取的参数可视化作为CNN网络的数据集,特征提取部分结果如图8所示。
图8 特征提取可视化结果
卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,在图像识别领域具有独特的优势。一个完整的卷积神经网络(CNN)一般包含输入层、卷积层、激励层、池化层、全连接层等结构。
输入层的主要作用是对原始数据进行预处理,包括:取平均和归一化。卷积层的作用是对数据进行卷积,提取输入图像的特征。池化层的作用是降低由卷积操作得到的特征图的维数,常见的操作有最大值池化和平均值池化。激活函数是多层神经网络中上层节点的输出与下层节点的输入之间的函数关系。常用的激活函数有sigmoid、tanh和ReLU函数。全连接层的功能是将网络学习到的特征映射到样本的标签空间,将卷积输出的二维特征映射转化为一维向量,并输出分类结果。
根据输入数据的特点,提出一种三层卷积神经网络结构,如表2所示。网络由13层组成,共有11个隐藏层,包括3个卷积层、3个rule层、3个池化层和2个全连接层。卷积层使用的卷积核大小[3×3],卷积后进行批规范化。池化层采用最大池化模式,步长为[2×2]。Dropout函数被添加到全连接层,并根据设置的概率丢弃,以防止过度拟合。输出层由3个神经元组成,代表3种状态的异步电机输入。
表2 异步电机故障识别网络结构
网络迭代100次,每次迭代所有数据被模型学习1次。其中,模型的学习率设定为0.000 1,Dropout为0.5,批尺寸设定为32,选用ADAM优化器与多分类交叉熵损失函数。该模型在Pytorch上建立,在配有GTX 1660 GPU的计算机上运行,网络训练结果如图9所示。
图9 网络训练准确率结果
当训练完成后,保存训练好的模型,计算测试集分类精度,结果如表3所示。其中,Log-Mel-CNN、MFCC-CNN、GFCC-CNN分别表示采用Log-Mel特征、MFCC特征以及GFCC特征的基于CNN的识别系统。
表3 CNN模型的识别精度 单位:%
由表3可知:文中所搭建的神经网络能够很好地识别3种特征参数,对于异步电机的测试样本,采用MFCC和GFCC特征参数的识别系统都具有较高的识别准确率;采用GFCC来表征声音信号并进行训练,平均识别精度最高,达到了95.4%,分别比Log-Mel、MFCC高了7.6%和4.9%。断条故障电机会在构造以及实验采集过程中受到偏心信号的影响,因此Mel滤波器的2种特征识别都不太理想。结果表明:在复杂环境下,GFCC特征提取的鲁棒性能更强。
分别采集了3类异步电机的声音,分析3种状态异步电机声音信号频率分布特点。参考当前区分环境声音的分类方法,将声学特征提取运用到异步电机的故障分类中。分别采用Log-Mel、MFCC、GFCC 3种方法对信号进行特征提取,最后利用卷积神经网络对数据进行了分类识别与比较。结果表明:3种特征提取方法能够有效降低声音样本数据量和复杂程度,其中GFCC特征提取方法更适合于深度卷积神经网络的识别模型,平均识别准确率达到95.4%。