基于双重注意力机制的异步电机故障诊断方法

2023-11-14 05:59施健聪王兴龙
振动与冲击 2023年21期
关键词:异步电机注意力故障诊断

施健聪,王兴龙,张 俊

(福州大学 机械工程及自动化学院,福州 350100)

异步电机作为工业生产系统中的核心驱动部件,其健康状态与整个机电传动系统的性能密切相关[1]。受到恶劣环境和复杂工况的影响,异步电机内部部件会不可避免地发生损伤甚至失效,造成严重经济损失[2]。因此,为了确保整个机电传动系统平稳高效地运行,对异步电机进行故障诊断是具有重要意义的[3]。

对于电机故障诊断来说,电机故障种类繁多,各故障的征兆与表现又极其相似,不同故障产生的原因也错综复杂,这极大的增加了电机故障诊断的难度[4]。例如,故障电机的故障频率多与定转子转差率、转子转频以及电源频率相关,而当电机在稳态运行时,转差率较小,使得故障特征频率和基频十分接近,且故障分量幅值很小,易被基频及环境噪声淹没,使得故障难以被分辨[5]。因此采用传统的故障诊断方法实现异步电机的故障诊断是较为困难的。

随着人工智能的迅猛发展[6],基于深度学习的故障诊断方法为解决上述难题提供了新思路[7-8]。然而,早期基于深度学习的故障诊断大多是基于单一传感器信号展开的。但由于单个传感器信号包含的故障信息比较有限,因而会出现故障诊断存在不确定性大、诊断精度差等问题[9]。为了解决该问题,近来结合多源数据融合与深度学习的电机故障诊断方法受到研究学者的广泛关注。袁媛等先利用电机基座振动信号与定子电流信号进行特征级数据融合,后使用BP(back propagation)神经网络结合D-S(Dempster-Shafer)证据论证方法进行故障分类,从而实现电机故障诊断。赵书涛等[10]联合声音-振动信号,采用重叠数据扩容的方式结合一维卷积神经网络(convolution neural network,CNN),实现大型电机的故障诊断。Yan等[11]提出一种基于振动信号和转子轴心轨迹信号的深度置信网络模型,用于实现异步电机转子不平衡故障诊断。Li等[12]提出基于振动信号与电信号多分辨率特征层融合的方法,先利用一维卷积神经网络分别提取振动信号与声信号数据段中的特征,再实现特征层融合,从而实现异步电机的故障诊断。相比于利用单一信号源数据,使用多传感器数据能够获得更加全面的故障信息,能有效降低无关成分干扰的影响,从而提高诊断的准确率[13]。

然而,基于多源数据融合结合深度学习的故障诊断方法中存在两个不足。第一,为了增强深度学习模型学习特征表示的能力,往往需要设置较多的卷积通道数。然而,并不是所有的通道都包含相应的故障信息[14],某些通道甚至可能学习的是噪声的特征分布[15]。此外,若整段信号中关键故障信息占比较少,则其他无关信息会对所构建的网络模型产生一定的干扰,从而影响识别准确率。第二,基于多源数据融合的模型通常采用简单的融合结构,即通过等比重的方式融合不同源数据的特征。这容易忽略多传感器数据之间有用信息的相关性和互补性[16]。主要原因是在每一批次喂入神经网络的多源数据中,各信号源数据中含有的有用故障信息的比重并不是一定的。因此,该融合方法也会影响所建网络模型的故障识别准确率。

针对第一个问题,学者们给出了相应的解决方案,即通过在深度学习模型中添加通道注意力机制模块[17]以提高有用信息的关注度。如康涛等提出一种融合注意力机制模型,通过多注意力模块对不同通道特征进行自适应赋权的方式,提高模型的抗噪性能,实现轴承的故障诊断。Long等[18]结合电机振动信号、磁信号以及电信号的包络谱数据作为输入数据,实现数据层融合后,再利用注意力机制自适应分配特征权重的方式,结合BP神经网络与改进的Adaboost算法实现电机的故障诊断。作为一种即插即用的模块,通道注意力机制通过对每个通道上的特征施加对应的权重,以达到减少无关信息对所建网络模型的干扰的目的。受此启发,本文所提模型拟在特征提取模块中添加通道注意力机制模块,以达到提高关键故障信息的关注度,抑制无关分量干扰的目的。

对于第二个问题,研究学者多是通过特征工程相关方法进行解决,即通过计算如熵[19-20]、能量[21]等指标以确定不同数据特征的权重。但是这种以统计分析计算的方法需要依赖专家经验,不利于实现非同源数据特征自适应分配权重以及端到端的特征融合网络模型的构建。为了解决这个问题,本文提出了一种多源数据注意力机制模块。该模块通过对多源数据进行“特征压缩-特征拼接-权重计算”操作,以自适应分配不同源数据特征的权重。作为一种即插即用的模块,多源数据注意力机制同时也为解决如何有效进行特征筛选这一问题提供了新思路。

综上所述,为了提高异步电机的故障诊断准确率,本文提出一种基于双重注意力机制的异步电机故障诊断方法。由于声信号具有受电源频率变化影响小[22]、对异步电机故障较为敏感[23]等优点;振动信号稳定性强,受干扰影响较小等优点,故所提方法以声音-振动信号作为神经网络的输入。首先,利用一维卷积神经网络从原始输入信号提取高维特征。其次,为了抑制同源数据中无关分量的影响,采用通道注意力机制自适应调整不同卷积通道特征的权重。然后,在多源数据融合阶段,为了提高不同数据源有用信息的关注度,利用本文所提出的一种多源数据注意力机制对不同信号源数据特征自适应地分配权重。最后,采用Softmax分类器[24]进行分类,从而实现异步电机的故障诊断。

1 相关理论

1.1 一维卷积神经网络

典型的CNN网络通常包含有卷积层、池化层和全连接层[25-27]。但在本文中所用到的1D CNN仅用于特征提取,故只包含卷积层与池化层。在卷积层中,卷积核对输入的数据进行卷积运算,并利用非线性激活函数构造输出特征。每层卷积输出的结果可由式(1)表示

(1)

经过卷积运算后,激活函数将对每次卷积的输出进行非线性变换,目的是增强输出特征的线性可分性。本文采用ReLU函数作为激活函数,其数学表达式如式(2)所示

(2)

为了减少计算量,防止网络过拟合,本文在特征提取阶段采用最大池化操作,并以感知域内的最大值作为输出。最大池化层的数学表达式可由式(3)得

(3)

全连接层将最后一个池化层的输出扩展为一维向量,该向量也作为全连接层的输入,然后在输入和输出之间进行全连接。全连通层可以合并卷积层或池化层的差分局部信息,其数学表达式可由式(4)表示

(4)

1.2 通道注意力机制

为了更加高效地利用不同通道特征的有效信息,抑制无关分量的影响,本文采用康涛等研究中的通道注意力机制对不同通道的特征进行自适应加权操作。为了有效地计算通道注意力,该机制先利用最大池化和平均池化分别对输入特征进行压缩,再由一个参数共享的多层感知机(multi-layer perceptron,MLP)对压缩后的特征进行非线性变换,最后将输出特征进行相加,从而完成自适应赋权操作。该模块的框架可由图1表示。

图1 通道注意力模块框架

不同权重的求值过程可由式(5)表示

(5)

(6)

1.3 多源数据注意力机制

考虑到非同源信号特征对最终识别效果贡献程度不一致,为了避免多源数据特征等比重融合而造成神经网络识别准确率较低的问题,本文提出了一种多源数据注意力机制模块。该模块可在任意以多源数据输入的神经网络中即插即用。以声-振信号输入为例,该模块的框架可由图2表示。

图2 多源数据注意力机制模块框架

图2中特征压缩操作主要由多个MLP完成,其中MLP的个数应当与输入信号源的个数相等。首先,每个MLP将输入特征压缩为1×1的输出。然后,对压缩后的特征进行拼接。再利用归一化指数函数(即Softmax函数)对拼接后的特征进行计算,将每个数据源特征对应的权重映射至区间[0,1],并使两个权重之和等于1。最后将权重与对应的特征相乘,便可得到不同信号的加权特征。该过程的数学原理如式(7)所示

(7)

(8)

式中,PML1(·)和PML2(·)分别为压缩声音和振动特征的多层感知机;a1和a2分别为全体声音特征集合和振动特征集合;s(·)分别为Softmax函数的运算符。

1.4 特征融合

在得到加权的声音信号特征和振动信号特征后,为了提供更加充分的信息,需要对两种加权特征进行特征融合操作。令F1和F2分别为全体加权声音信号特征集合的一维展开序列和加权振动信号特征集合的一维展开序列;g为融合后用于分类的特征。该过程如图3所示。

图3 特征拼接与融合映射过程

上述所示过程可由式(9)表达

g=map[stitch(F1,F2)]

(9)

(10)

2 基于双重注意力机制的异步电机故障诊断模型

为了提高不同通道和不同数据源关键故障信息的关注度,提高异步电机故障识别的准确率,本文创新性地提出了一种基于双重注意力机制的神经网络模型。

该模型包含两个框架相同的特征提取器和一个特征分类器。每个特征提取器由CNN和通道注意力模块组成;特征分类器由一个多源数据注意力模块、特征融合层和一个Softmax分类器组成。在特征提取器中,先利用CNN对输入的原始数据进行特征提取。然后采用通道注意力机制自适应分配不同通道特征的权重,以此降低同源信号内干扰成分的影响。对于提取的多源数据特征,利用提出的多源数据注意力机制模块自适应调整不同源数据特征的权重,以提高关键故障信息的利用率。该模型的框架如图4所示。在完成构建该模型后,采用交叉熵损失函数为所建模型被优化目标函数,该模型的优化目标函数如下式所示

图4 本文所提模型的网络框架

lg[1-q(x)]

(11)

式中:p(x)为目标值;q(x)为Softmax输出的预测值。

3 试验验证

3.1 数据集描述

由于异步电机最常见的故障发生在定子、转子和内置轴承[28]等位置上,因此本节开展了包括健康、定子绕组故障、转子断条和内置轴承故障共4种不同健康状态的故障诊断试验。本次试验的数据均采集于动力传动诊断综合试验台(drivetrain diagnostic simulator,DDS),如图5所示。图6展示4台不同故障的电机,其中故障电机图6(b)中转子断条数为3;故障电机图6(c)故障类型为定子匝间绕组短路故障,短路的量占一匝绕组的10%;故障电机图6(d)内置轴承的型号为SKF6205,故障位置出现于轴承外圈,其相关几何参数如表1所示。

表1 SKF6205轴承几何参数

图5 DDS试验台

(a) 健康

如图7所示,加速度传感器安装在电机的垂直方向上,用于采集振动信号。同时,麦克风放置在电机附近,用于采集声音信号。转速控制器用于调节转速。磁粉制动器通过改变输入电流来调节负载。在输入转速设置为15 Hz,负载电流调节为0.4 A的工况条件下,分别采集健康、转子断条、定子绕组故障和内置轴承故障共4种不同健康状态的异步电机的振动信号及声信号。为了满足奈奎斯特采样定理,本次试验将采样频率设置为12 800 Hz。同时,为了保证所提模型能够对所采集的数据进行充分学习,并满足模型训练和测试对数据长度的要求,本次试验将采样时间设置为24 s。所采集信号的时域波形图,如图8所示。

图7 传感器布置示意图

(a) 健康

在数据分割的过程中,将上述一维原始信号以非重叠采样的形式进行切割。其中,每一类电机故障数据包含2×300个样本,每个样本的数据长度为1 024。其中随机选择2×270个样本进行训练,剩余样本则用于测试。试验数据集由表2所示。

表2 试验数据集信息

3.2 模型设计

所建模型中,每个CNN均由3个卷积层-最大池化层组成。其中加入批归一化层将每一批次数据进行标准化处理,以加快网络训练速度,同时防止网络过拟合。每个通道注意力模块由一个最大池化层,一个平均池化层和两个全连接层组成。每个多源数据注意力模块由两层全连接层组成。具体参数设置如表3所示。此外,喂入神经网络的数据批次大小设置为128,迭代次数设置为150次,并且随机初始化该模型的初始参数。所建网络采用Adam优化器优化目标函数,模型学习率设置为0.001。

表3 所建网络具体参数设置

3.3 试验结果分析

为了验证所提方法的有效性,采用3.2节所提到的试验信号进行验证。本文所提方法在配置为英特尔i7-7700HQ CPU、英伟达GTX 1050显卡 和8 GB运行内存的计算机上运行。模型每一轮次训练的运行时间为0.17 s;模型解析测试数据的时间为3.09×10-6s。为减小随机误差,将所提模型在3.2节所述的训练集与测试集上运行10次,取平均测试准确率为最终的诊断准确率。经过10次运行后,最终的诊断准确率为99.74%。为了更加直观地感受训练与测试的结果,取模型第6次运行结果进行可视化分析。结果如图9所示。

图9 训练与测试准确率曲线

如图9所示,模型收敛速度较快,而且收敛效果较好,训练样本和测试样本的准确率均到达100%。此结果证明了本文所提网络能有效地从不同传感器数据中提取到有用的信息,从而获得较为精确的诊断效果。为进一步展示本文所提方法的诊断效果,采用t-SNE(t-distributed stochastic neighbor embedding)算法对模型最后一层输出特征进行降维可视化。其效果如图10所示。由图9可以直观地看到,不同异步电机的故障特征均能实现有效的聚类,这同时也佐证了本文所提方法的有效性。

图10 t-SNE可视化效果

3.4 对比结果分析

为了验证所提方法的优越性,分别采用声-振传感器数据融合网络(1D-CNN-based vibro-acoustic sensor data fusion algorithm,VAF)[29]、BPNN(back propagation neural network)、深度自编码网络(deep auto-encoder network,DAEN)、随机森林(random forest,RF)和通道注意力机制的特征融合网络(channel-attention fusion network,CAFN)与本文所提方法进行比较。其中,VAF是一种以声-振信号输入的深度特征融合网络,其由两个5层卷积-池化组成的特征提取器和两层全连接层组成。BPNN神经网络由两个特征提取器和一个二层全连接层组成的特征融合-分类器构成。其中,特征提取器中隐藏层的大小分别为[512,256,64],特征融合-分类器中的全连接层的核个数分别为[16,4]。CAFN由两个特征提取器和一个特征融合-分类器组成,其中每个特征提取器的构成与本文所提网络一致,特征融合-分类器由两层全连接层组成,核个数设置为[16,4]。

同样地,为了减小偶然误差的影响,上述对比网络均在3.1节所述的训练样本和测试样本上运行10次,并取平均测试准确率作为最终的诊断准确率。10次运行的试验结果如图11所示。

图11 不同方法10次运行的诊断准确率

不同方法运行10次的平均诊断准确率,如表4所示。为了验证不同方法的稳定性,同时给出了不同方法运行10次所得准确率的标准差。由表3可知,本文所提方法的平均准确率最高,为99.74%。而VAF,BPNN,DEAN,RF和CAFN取得的平均准确率分别为84.68%,81.91%,89.94%,47.80%和91.83%。此对比结果有效地证明了所提方法的优越性。由表3中的标准差结果以及图10可以看出,相比于所提方法,其余对比方法的10次运行的诊断准确率存在一定范围的波动。因此,本文所提方法的稳定性优于其他方法。再者,与不添加任何注意力机制的网络相比,有注意力机制的网络的平均诊断准确率最大可高出51.94%,这表明了注意力机制能有效抑制信号中无关分量的影响。相比于仅采用通道注意力机制的CAFN网络,本文所提方法的平均诊断准确率提高了7.91%,这证明了本文所提的多源数据注意力机制能较好地提取多源异构数据中有利于故障诊断的关键故障信息。

表4 不同方法的平均诊断准确率

为了进一步展现所提网络以及其他对比网络的诊断效果,选择第9次试验的测试结果制作混淆矩阵,结果如图12所示。图12中,横轴和纵轴分别是预测标签和真实标签。从图12可以看出,本文所提方法能准确无误地识别出4类电机故障。而其他对比方法则存在部分故障特征被误分类的情况。因此,在本轮试验中,所提方法的有效性被进一步验证。

(a) 所提方法

3.5 抗噪性能验证

为验证本文所提方法的抗噪性能,试验对比了VAF,BPNN,DAEN和CAFN在不同噪声环境下的故障诊断准确率。在原始信号上通过添加具有不同信噪比的高斯白噪声以模拟不同强度背景噪声。其中,添加噪声的信噪比范围在-4~4 dB。几种网络的其余参数设置均保持一致。试验结果如图13所示。

图13 不同方法在不同信号噪声强度下的诊断准确率

如图13所示,本文所提方法在不同背景噪声强度下都能保持较高的诊断准确率,表现得也更加稳定。而其余4种对比方法的诊断效果受到噪声的影响较大,诊断准确率都出现不同程度的下滑。在这4种对比方法中,相比于CAFN,其他无注意力机制模型的诊断效果在不同噪声强度背景下的稳定性更差。此外,当所添加噪声的信噪比为-4 dB时,本文所提方法的诊断准确率为99.84%,而CFAN为84.84%,VAF为71.41%,DEAN为53.44%,BPNN为43.59%。由此可知,本文所提方法的诊断准确率相比其他对比方法最高提升56.25%,最低提升15%。因此,本文所提方法在本轮试验中体现出来较好的抗噪性能。

4 结 论

本文提出一种基于双重注意力机制模型的异步电机故障诊断方法,所提方法在异步电机故障诊断中表现良好,主要结论如下。

(1) 本文所提的基于双重注意力机制结合深度特征融合的模型诊断效果优于仅含通道注意力机制的模型以及无注意力机制模型。

(2) 多源数据注意力机制模块能够更好地处理多传感数据,进而提升模型整体的诊断性能。该模块的提出能在一定程度上弥补现有方法研究的不足

(3) 本文所提方法具备良好的抗噪性及稳定性,在不同背景噪声的强度下均能取得较高的诊断准确率。

猜你喜欢
异步电机注意力故障诊断
让注意力“飞”回来
户外防腐蚀型防爆三相异步电机设计
大型变频调速异步电机的设计
“扬眼”APP:让注意力“变现”
A Beautiful Way Of Looking At Things
因果图定性分析法及其在故障诊断中的应用
第三方异步电机在MTX micro控制系统中的应用
基于LCD和排列熵的滚动轴承故障诊断
基于KPCA和PSOSVM的异步电机故障诊断
基于WPD-HHT的滚动轴承故障诊断