邢如意,尹洪申
(1.江苏联合职业技术学院徐州财经分院,徐州 221008;2.中国矿业大学物联网(感知矿山)研究中心,徐州 221008)
滚动轴承作为旋转机械的重要组成部分,广泛应用于工业生产的各个领域,而旋转机械的健康运行取决于滚动轴承的健康状况,虽然现有的滚动轴承制造技术已经取得了很大的进步,但是恶劣的运行条件仍然会给轴承带来不同程度的损伤[1]。随着损伤的不断积累,可能会导致严重的事故,因此为了提高滚动轴承的可靠性,保证机械设备的安全运行,发展有效的故障诊断技术具有重要意义[2-3]。
深度学习作为一种有效的特征学习方法,已经广泛应用于滚动轴承的故障诊断[4]。深度信念网络(deep belief network,DBN)可以直接从低层信号中提取特征,形成更具代表性的高层表征,无需研究人员从数据中手动提取特征。谢佳琪等[5]利用改进的DBN处理原始轴承振动信号,实现了轴承故障的自动识别。卷积神经网络(convolutional neural networks,CNN)由于其局部感受野和参数共享的特点可以大大降低故障数据的复杂性。在一维CNN的基础上,康涛等[6]通过多路输入最大化CNN的特征提取能力,有效地提高了模型的准确性和抗干扰能力。虽然深度学习网络表现出良好的性能和稳定性,但这些网络模型方法依赖于两个前提条件:①训练集和测试集的数据必须符合同一概率分布;②在训练网络的过程中需要足够的数据。然而,在机械设备运行过程中,滚动轴承的健康状态会随着时间发生变化。导致故障数据特征在不同时间段的分布不同,这种现象使得训练好的深度网络无法长时间对同一任务保持良好的效果[7]。
为了解决上述问题,域自适应迁移网络被引入到跨域轴承故障诊断任务中。CHEN等[8]提出了一个基于残差联合适应对抗网络的无监督迁移学习框架,该方法在行星齿轮箱数据和滚动轴承数据两个实验中取得了良好的效果,但上述网络只关注了类标签信息和域标签信息而忽略了连接源域与目标域之间的数据结构信息;WEN等[9]使用3层稀疏自动编码器来提取原始数据的特征,并应用最大平均差异(maximum mean discrepancy,MMD)来最小化训练数据和测试数据特征之间的差异惩罚,提升了变工况下轴承故障诊断准确率,但MMD是全局自适应的对齐两域数据分布,没有考虑类别之间特定域的决策边界。
针对以上问题,本文提出了一种基于域对抗图卷积注意力迁移学习的故障诊断方法。利用图卷积网络对实例图进行建模,完善深度网络提取的特征信息,同时利用LMMD度量不同领域的实例图的结构差异,对齐子域和全局域之间的分布,实现变工况场景下的精准故障分类。
常见的SE和CBAM注意力模块只能沿着信道或空间维度提取特征,生成1D或2D权重,限制了它们学习变化的信道和空间注意力权重的灵活性[10-11]。而SimAM注意力模块直接生成三维权重注意模块,利用通道和空间共存机制并共同促进信息数据的选择。并且为了更好地评估每个神经元的重要性,SimAm模块通过导出一个能量函数传递来找寻每个神经元的重要性[12]。
(1)
图1 SimAM模块结构图
域特征分布对齐通过测量空间距离来确保源域和目标域的特征分布应该相似,而域对抗网络(domain-adversarial training of neural networks,DANN)的思想来源于生成对抗网络,通过对抗性训练确保了神经网络可以提取领域不敏感的特征信息[13-14]。DANN主要由特征提取器Gf、域鉴别器Gd和故障分类器Gy组成。DANN网络流程如图2所示,首先源域与目标域数据进入Gf后被映射到一个特征空间中并提取两域特征信息;其次将提取后的源域数据送入Gy中区分正确的数据标签;然后将提取的两域数据经过梯度反转层进入Gd中得到域分类标签。DANN网络的一方面希望Gy能够精准的分类源域数据特征类型,保证故障分类器损失最小;另一方面希望Gd无法准确区分两域数据特征类型,使得域鉴别损失越大,通过这种方式对齐两域之间数据特征分布。
图2 DANN网络模型图
在以往的跨领域故障诊断任务中,基于MMD准则来度量不同领域特征分布的相似性是一种非常有效的方法,然而MMD是全局域特征分布的排列,其忽略了源域和目标域之间的子域关系,考虑到同类样本之间的相关性,本文引入LMMD来对齐同类相关子域之间的分布。
MMD总是通过全局数据来对齐子域之间的分布,容易造成子域类别匹配错误,从而导致域自适应模型性能下降。而LMMD通过深度特征自适应和特征学习来匹配源域和目标域之间的分布,减少了相关子域的差异分布,实现了子域级别细粒度的对比。LMMD的表达式为:
LMMD2(Ds,Dt)Ec
(2)
GCN是CNN的延伸拓展,是一种专门处理无规则数据结构的卷积网络。假设一张图G(A,X),其中A代表它的邻接矩阵,X代表它的节点特征。它的对称归一化图的拉普拉斯矩阵L=IN-D-1/2AD-1/2,其中D是A的对角度矩阵,IN是单位矩阵。图谱滤波器gθ=diag(θ)对输入信号x∈RN进行平滑处理后可以得到新的图卷积定义,其表达式为:
gθ*x=UgθUTx
(3)
式中:θ代表可学习的参数,UTx代表节点x在图中做的傅里叶变换,Ugθ代表将卷积核映射到频域。
但是式(3)的图卷积操作依赖于L的特征分解,因此运算十分复杂,为了解决这个问题,采用特征值对角矩阵的切比雪夫多项式逼近卷积核,得到新的卷积核表达式:
(4)
式中:k是切比雪夫多项式的阶数,Λ是L的特征值对角矩阵。通过重新定义的GCN操作,对k邻距离内的节点信息进行聚合,能够实现图平滑,提升计算速率。
标准的GCN只能在固定的感受野聚集信息,容易忽略中心节点与相邻节点之间的渐变特征差异,从而造成网络特征提取不足的问题。因此本文结合SimAM注意力模块,提出了一种基于多感受野SimAM注意力图卷积网络。首先,将原始轴承信号送入Resnet18网络提取故障特征;其次,在Resnet18网络中加入SimAM注意力机制,提高网络对关键信息特征的敏感度;然后,增加GCN的感受野聚合相邻节点相对于中心节点的渐变特征,通过融合了它们之间的特征差异,提升网络整体的故障特征提取能力,MRF-GCN网络结构参数如图3所示。
图3 MRF-GCN网络结构参数图
为了解决因源域和目标域数据分布差异过大而导致的模型诊断能力不足的问题,将DANN和LMMD相结合,利用DANN网络提升两域数据深度特征的表达一致性,同时利用LMMD对两者高维核空间的数据分布进行约束,减少模型在子域中的分类误差,提升了网络模型在变工况下的故障分类能力。本文提出的DAGRESL故障诊断模型如图4所示。
图4 变工况下DAGRESL故障诊断网络模型图
由图4可知DAGRESL总的损失函数由3部分组成:标签分类损失Lc;LMMD损失LLMMD;域判别损失Ld。DAGRESL损失表达式为:
LDAGRESL=Lc+LLMMD-λLd
(5)
首选,将两域原始轴承数据输入到Resnet18网络中提取轴承故障特征;其次,利用SimAM注意力模块的通道和空间并存机制共同促进关键特征信息数据的选择,从而得到最终的故障特征;然后,将每个特征向量视为一个节点,其值作为节点特征,送入图生成层自动生成图形;同时将获得的图形输入到MRF-GCN,将数据结构信息嵌入到节点特征中。最后,将获得的节点特征用于故障分类和领域对抗训练并完成最终的故障分类。
实验数据通过CT1002LS加速度传感器在8 kHz的采样频率采集了SQI-MFS实验台的轴承振动数据,SQI-MFS实验台如图5所示。实验轴承的型号为NSK的SER205-16,为了更好的验证模型对不同轴承损伤类型的故障分类准确率,用激光分别在内圈、外圈、滚动体加工雕刻了0.05 mm、0.1 mm、0.3 mm的直径缺陷。同时根据电机的转速不同共计采集了900 r/min、1200 r/min、1800 r/min三种转速下的正常轴承数据、内圈损伤数据、外圈损伤数据、滚动体损伤数据,分别记为数据集D1、D2、D3。3种轴承数据集详情数据如表1所示。
表1 SQI-MFS实验台轴承数据
图5 SQI-MFS实验台
为了测试DAGRESL故障诊断网络在变工况下的轴承故障分类准确率,对D1、D2、D3三种数据集进行相互迁移,共计设置了6种工况迁移,并分别与已有的深度迁移学习方法进行比较:MK-MMD[15]、DANN[16]、DSAN[17]。4种方法的实验结果图6所示。
从图6可知,本文提出的DAGRESL模型不仅在各个迁移工况中的故障分类准确率要高于其他3种模型,而且模型的稳定性更好。这是因为其他3种模型仅关注标签分类信息和域标签信息,而忽略了数据结构建模,导致深度网络提取的特征信息并不完整,从而造成变工况故障分类性能下降。
为了证明本文加入的LMMD度量距离和SimAM注意力模块对DAGRESL模型性能的提升,通过消融实验进行了验证。DAGRES与DAGRESL模型相比没有加入LMMD度量距离;DAGREL与DAGRESL模型相比没有加入SimAM注意力模块。消融实验结果如图7所示。
图7 SQI-MFS数据集变工况消融实验结果
从图7可知,在加入LMMD度量距离后,DAGRESL模型兼顾了目标域中不同类别的子领域距离,使特征类间距更小,从而统筹对齐了子域和全局域之间的分布,实现了变工况场景下的精准故障分类;在加入SimAM注意力模块后,特征提取网络利用通道和空间并存机制共同促进信息数据的选择,聚焦更加具有判别力的关键特征信息,从而提高了DAGRESL模型在变工况场景下的故障分类准确率。
为了更加清晰的分析3种方法在各个标签的分类结果,通过混淆矩阵对D2-D1的迁移工况任务进行详细的分析。图8为3种模型混淆矩阵消融实验结果。
(a) DAGRESL (b) DAGRES
从图8可以看出,DAGRESL在各个标签的分类结果都要优于其他两种模型,再次证明了DAGRESL模型设计的合理性。在加入LMMD距离后,DAGRESL模型通过对齐子域和全局域之间的分布,有效减少了两域数据之间的分布差异;在加入SimAM注意模块后,DAGRESL模型对全局关键信息特征赋予更高的权重从而丰富特征提取网络,大大降低了标签错误分类的概率,进一步验证了DAGRESL模型具有较强的变工况故障分类能力。
针对滚动轴承在变工况环境中网络特征提取能力不足的问题,本文提出了一种基于域对抗图卷积注意力迁移学习的故障诊断方法,并在SQI-MFS轴承数据集上进行了验证,通过实验我们可以得出以下结论:
(1)提出的MRF-GCN能够有效聚合相邻节点相对于中心节点的渐变特征,融合它们之间的特征差异,提升网络整体的故障特征提取能力。
(2)利用SimAM注意模块的通道和空间并存机制共同促进特征信息数据的选择,聚焦更加具有判别力的关键特征信息,丰富了故障特征提取网络模型。
(3)将LMMD与域对抗网络相结合能够减少相关子域和全局域之间的结构差异,更好的判断轴承数据所属域。