王玉静, 夏 林, 康守强, 谢金宝, 王庆岩
(1.哈尔滨理工大学 测控技术与通信工程学院,哈尔滨 150080; 2.海南师范大学 物理与电子工程学院,海口 571158)
滚动轴承在工业生产中应用广泛,对其进行故障诊断可预防重大事故发生[1]。滚动轴承规格和工况多变且工作环境恶劣难以拆卸,导致在工业生产中无法获取足够的带标签数据[2]。同时,不同规格和不同工况下滚动轴承数据存在差异,并且在实际应用时,往往拥有多个相似的滚动轴承数据资源。因此,有效利用多个源域振动数据来实现不同规格和工况下滚动轴承的状态识别具有重要的意义。
传统故障诊断方法采用人工提取信号的特征,特征提取的情况会直接决定整个模型的诊断效果[3]。近年来深度学习应用于故障诊断技术并显示出其优越性,通过自适应提取特征,在某种程度上可以避免人工提取故障特征造成的操作误差。文献[4]提出首层多尺度卷积核的深度卷积神经网络,利用不同大小的一维卷积核从轴承原始振动信号中提取多尺度特征,实现轴承健康状态的智能诊断。文献[5]将滚动轴承原始振动信号直接输入到双向长短期记忆网络中,通过双向长短期记忆网络自动提取滚动轴承的故障特征并进行诊断。文献[6]提出一种新的卷积深度置信网络与压缩感知法相结合的故障诊断模型,并取得较好的效果。文献[7]提出一种基于深度学习的多信号故障诊断方法,并在感应电机故障识别方面取得有效的诊断。
上述基于深度学习的方法需要大量的有标签数据训练故障诊断模型,但由于滚动轴承工作条件复杂而无法获取足够有标签数据,因此基于深度学习的故障诊断方法存在局限性。
针对深度学习故障诊断方法存在的问题,迁移学习受到学术界的广泛关注。文献[8]构建深度自动编码器,利用目标域少量样本微调目标域模型提高迁移分类效果,且在不同轴承上验证其有效性。文献[9]提出利用有标记数据的源域来训练改进的卷积神经网络,将训练好的模型参数迁移至目标域网络并微调,在公共数据集上取得较好的分类效果。文献[10]利用格拉姆角差场方法将一维原始振动信号转化为二维图谱输入ResNet-34网络中,通过模型迁移方法实现变速轴承的故障诊断。文献[11]提出一种仿真数据驱动的改进无监督域适应轴承故障诊断新方法,使用两组试验台数据作为目标域对该进行验证,结果表明所提方法能提高无监督跨域场景下的故障诊断精度。
上述方法的源域和目标域模型均使用同一种网络模型,若使用相同网络模型对不同分布数据提取特征,可能会漏掉相关特征信息。并且传统参数传递方法直接固定源域浅层网络迁移至目标域,容易迁移无用知识甚至负样本,导致负迁移。
文献[12]通过不同的自动编码器网络将源域与目标域特征映射到相同的空间,引入域中心距离评估不同域之间分布的相似性,经支持向量机实现轴承故障诊断,具有较好的效果。文献[13]将ResNet-20作为源域模型,ResNet-32作为目标域网络,通过元学习(meta learning,ML)传递模型参数,并在多个数据集上取得了较好的效果。
上述迁移学习均为单个源域的迁移,忽略了多个不同相似数据集作为多源域时对目标域诊断的作用,并且在实际的工业生产中,往往拥有多个相似数据集的带标签数据。为了充分利用多个相似源域数据集资源以提高目标域诊断的准确率,多源域迁移法受到广泛的关注。
文献[14]提出一种基于多源域深度迁移学习的故障诊断方法,通过锚适配器的构建,获得多源域与目标域适配器数据对,再建立深度域适应的迁移学习网络模型获得每个数据对的分类器和预测结构,并在一个滚动轴承数据集上取得良好的效果。文献[15]提出一种多源域迁移学习网络框架,通过将多个部分分布适应子网络和多源域诊断知识融合模块相结合,达到迁移和聚合多源域诊断知识,在两个数据集上获得较好的效果。文献[16]利用核最大均值差异构造多个深度迁移学习网络,实现单个源域目标域自适应,再统一度量作为奖励,提出一种强化学习方法,为多领域多模型提供了有效的集成策略,在多个数据集上验证了方法的有效性。
针对不同规格和工况下滚动轴承故障诊断问题,现有方法大多建立在恒定规格或者不同规格但不涉及工况的条件下,并且在实际工业生产中,往往拥有多个相似的滚动轴承数据集资源,但传统模型迁移学习只有一个源域,忽略多个相似源域数据集对目标域诊断的贡献。因此,针对上述问题提出一种基于多源域异构模型迁移的滚动轴承故障诊断法。该方法利用多个源域提供更多的有效信息,以更好地辅助目标域的诊断工作,并引入基于进化策略的与模型无关元学习(evolution strategies model agnostic meta learning,ES-MAML)实现参数传递策略的改进,提出将目标域网络提取到的特征输入极限学习机(extreme learning machine,ELM)中完成特征融合和分类,最终实现不同规格且不同工况下滚动轴承间故障诊断问题。
针对不同规格且不同工况下滚动轴承振动数据分布差异大的问题,采用不同的网络模型分别提取源域和目标域的特征可以避免遗漏部分关键特征信息。采用异构模型迁移学习实现不同规格且不同工况下滚动轴承的故障诊断,选取ResNet-34深度网络作为源域模型,VGG-16深度网络作为目标域模型。
为提取信号更深层次的特征,深度卷积网络往往会增加网络的层数,即增加模型的深度。在模型深度增加的同时,神经网络中的学习参数也会相应增加,从而导致模型过于复杂,分类效果也受到相应的影响。为解决上述问题,ResNet-34将目标函数与残差梯度结合,可有效解决因模型深度而不易收敛的问题,提升模型的准确率。
假设残差块输入为z,输出为H(z),残差指的是输出值H(z)与输入值z的差值,即
f(z)=H(z)-z
(1)
残差网络的学习对象为残差f(z),在网络训练过程中只需要学习残差块输入输出之间的差别,降低了网络学习的难度。
VGG-16是在AlexNet基础上改进的深度卷积神经网络,其专注构建简洁规整的结构网络,训练简单且高效。
VGG-16采用几个连续的3×3小卷积核代替AlexNet中较大的卷积核(11×11,7×7,5×5),多个3×3卷积核组合可以使网络结构复杂度减小,增加的网络深度也会加深对样本的学习,有利于提高分类精度。
以3×3卷积核代替5×5卷积核为例,如图1所示。
对于两个3×3卷积核,所用的参数总量为2×(3×3)=18,对于5×5的卷积核所用的参数总量为5×5=25,因此,可以减少训练的参数。
ML又称学会学习,是机器学习领域一个重要的研究方向,它解决的是学会如何学习的问题[17]。ML可以在数据与模型之间交互,不断获取新的信息,进行自我更新,适应不断变化的环境,在没有人为干预影响的情况下,模型能自适应数据变化并且不断调整,学会如何处理遇到的新问题。
ES-MAML是一种基于进化策略结合与模型无关元学习(model agnostic meta learning,MAML)的新框架[18]。现有的MAML是基于随机策略梯度的,在随机策略上使用反向传播算法估计二阶导数时,会遇到准确率不高,训练时间长的问题。因此将进化策略应用到与模型无关元学习中,通过进化策略,避免了二阶导数的估计问题,达到提高模型准确率,缩短模型训练时间的目的。
在源域和目标域的网络模型结构完全不同的情况下,传统的直接固定浅层网络加微调深层网络的参数传递方法直接失效,传统参数传递方式如图2所示。文献[19]与文献[20]分别采用知识蒸馏和雅可比矩阵进行参数传递,但是存在传递无用信息和梯度收敛困难的问题。因此,提出一种基于进化策略的与MAML的新型参数传递策略。该方法主要学习传递规则,自动考虑源域网络模型与目标域网络模型结构的差异、源域与目标域任务的差异,无需手动调整参数传递配置,ML会自适应匹配并产生对应权重。
2.1.1 迁移知识的内容
在异构模型迁移过程中,并非所有来自源域的知识都可以辅助目标域进行诊断,盲目迁移可能会迁移无用知识甚至有害知识导致模型训练时间长甚至产生负迁移。因此,使用加权特征匹配损失确定迁移的内容,根据在目标任务上的效果决定迁移什么,加权特征匹配损失定义为
(2)
由于要传递的重要通道可能会因输入图像不同而不同,因此将通道权重设为
(3)
式中,φ为元网络的参数。
迁移知识的内容操作图如图3所示。
图3 迁移知识内容示意图Fig.3 Schematic diagram of knowledge content transform
由图3可知,通过匹配源域第m层和目标域第n层的特征图,得到特征匹配损失,进而指导源域第m层向目标域第n层迁移的知识内容。
2.1.2 迁移知识的层级
(4)
式中,C为候选对,因此训练目标模型的最终损失为
Ltotal(θ│x,y,φ)=Lorg(θ│x,y)+βLwfm(θ│x,φ)
(5)
式中:Lorg为目标网络的交叉熵损失;β为超参数且β>0。
迁移知识的层级操作如图4所示。
图4 迁移知识层级示意图Fig.4 Schematic diagram of knowledge level transform
由图4可知,首先通过源域第m层和目标域第n层进行匹配得出权重矩阵λm,n,再由参数λm,n指导源域哪一层迁移到目标域哪一层,其中源域网络共l层,目标域网络共j层。
ELM是一种全连接网络,由输入层、隐含层和输出层组成。ELM分类器的结构模型如图5所示。
图5 ELM分类器模型Fig.5 ELM classifier model
输入层的输入是经过神经网络提取到的滚动轴承特征x,特征维数是P。隐藏层共有L个神经元,第i个神经元的输入为
g(x,ωi,bi)=g(xωi+bi)
(6)
式中:g为激活函数;ωi为第i个神经元和所有输入节点间的连接权重;bi为第i个神经元的偏置。输入层和隐藏层的连接实际上是P维空间特征映射到L维空间,若输入一个特征向量x,其映射特征向量表示为
h(x)=[g(x,ω1,b1),g(x,ω2,b2),…,g(x,ωL,bL)
(7)
输出层输出为f(x),输出节点的个数为3,表示3种不同诊断结果,每一个输出节点对应一种诊断结果,则第j个输出节点的值表示为
(8)
式中,βi,j为第i个神经元与第j个输出节点之间的输出权重。那么,输入样本x的输出可表示为
f(x)=[f1(x),f2(x),f3(x)]=h(x)β
(9)
其中
基于上述ELM分类器,提出将多个目标域网络提取的特征首尾相接输入其中,此时,ELM中包含来自多个目标域网络提取到的特征,通过融合这些特征信息实现多源域特征融合。
根据图5的ELM分类器模型可知,ELM作为特征融合模型及分类器,其输入为多个目标域网络提取到的特征,特征输入通过隐含层映射到不同维度的特征空间,以进一步提取特征,此处隐含层对特征信息的融合,即为多源域特征融合的核心,最后通过ELM模型输出层得到最终的分类结果。
不同规格且不同工况下基于多源域异构模型迁移方法的滚动轴承故障诊断过程如图6所示。
图6 基于多源域异构模型迁移的滚动轴承故障诊断流程框图Fig.6 Flow chart of rolling bearing fault diagnosis based on multi-source heterogeneous model transform
具体步骤如下所示。
步骤1数据选取及预处理。获取已知某种规格和工况下滚动轴承的所有状态振动信号作为源域一数据。另外一种规格和工况下滚动轴承的所有状态振动信号作为源域二数据。将其他不同规格和工况下的少量已知标签振动信号作为目标域数据。对多个源域与目标域数据作短时傅里叶变换构造多状态二维图像数据集,作为多源域网络和目标域网络的输入。
步骤2构建多源域模型。利用多个相似源域数据迭代训练多个ResNet-34网络构建多源域预训练模型,通过整合多个相似源域数据集中的相关信息来辅助目标域的分类识别任务,从而提升目标域的分类效果。
步骤3模型参数迁移及目标域网络模型训练。多个源域分类模型导出,根据2.2节利用基于ES-MAML传递参数达到模型迁移的目的,通过ES-MAML自适应决定迁移知识的层级及知识的内容到目标域,具体迁移过程见图3和图4。将处理好的目标域数据输入VGG-16网络,通过不断交替更新目标网络模型参数与元网络参数,建立参数迁移后的目标域网络诊断模型。
步骤4特征融合及多状态识别。根据第3章将多个目标域网络模型提取到的特征输入ELM,结合这些特征信息实现特征融合过程,并利用目标域少量带标签数据的特征信息对ELM进行微调,通过ELM分类器输出分类结果,最终建立最优的滚动轴承故障诊断模型。
试验所用的轴承数据采集自轴承试验台,试验台示意图如图7所示。试验台中的驱动端和风扇端分别安装有规格为SKF6205和SKF6203的深沟球滚动轴承,利用加速度传感器采集振动信号,采样频率为12 kHz。试验是在0,0.75 kW,1.50 kW,2.25 kW不同负载下,对不同规格滚动轴承振动信号进行采集,轴承的故障是由电火花机在轴承的内圈(IR)、滚动体(B)、外圈(OR)加工产生的点蚀故障,每个故障位置的损伤直径包括0.177 8 mm,0.355 6 mm,0.533 4 mm 3种,加上正常状态一共可以分为10类。对于工作在正常状态下,并未发生故障的滚动轴承振动信号,用N来表示。为了方便表述,对滚动轴承的故障位置和故障程度进行简化表述,如表1所示。以1 024点为一个样本的长度,每种工作状态选取100个样本数据。
表1 试验数据表示方法Tab.1 Test data representation
图7 轴承试验台示意图Fig.7 Schematic diagram of the test stand
机械故障预防技术学会(mechanical failure prevention technology,MFPT)滚动轴承振动数据,采样频率为48.828 kHz,转速为25 r/s[21]。试验采用内圈故障、外圈故障及正常共3种状态的振动数据,每类状态100个样本。以1 024点为一个样本的长度,每种工作状态选取100个样本数据。
为更方便地表示试验中所用到的数据,本文所使用的数据集与轴承规格、工作工况的对应关系如表2所示。
表2 数据集与轴承规格、工况对应关系Tab.2 Corresponding relationships between data set and bearing type and the load
根据本文所提出的滚动轴承故障诊断问题,试验部分以两个源域为例,共设置了12个迁移任务,各任务所用数据集组成如表3所示。
表3 各任务所用数据集组成Tab.3 Data sets used for each task
以任务1为例,任务1表示源域一为SKF6205规格0工况,源域二为SKF6203规格1工况,目标域为MFPT规格3工况。源域一和源域二有10类状态,每类状态有100个带标签样本,目标域有3类状态,每类状态有5个带标签样本,其中各任务的训练集测试集比例为7∶3。
5.2.1 异构模型迁移与同构模型迁移对比试验
为了验证当源域与目标域数据分布存在差异的情况下,使用异构模型迁移策略(源域模型为ResNet-34,目标域模型为VGG-16)与同构模型迁移策略(源域与目标域模型都为ResNet-34或VGG-16)的分类效果。具体试验结果如图8所示。
图8 同构异构对比结果Fig.8 Comparison results of homogenization and heterogeneous
由图8可知,当源域与目标域数据分布存在差异的情况下,异构模型迁移的平均准确率为97.94%,同构(ResNet-34)平均准确率为94.8%,同构(VGG-16)平均准确率为93.3%。异构模型迁移平均准确率要比同构高3%和4%。尤其在任务1中,异构比同构(VGG-16)准确率高8.7%,在任务5中异构比同构(ResNet-34)准确率高6.8%。因此采用异构模型迁移学习可以避免在数据分布差异大的情况下模型准确率低的问题。
利用t-分布邻域嵌入算法直观证明异构模型迁移学习方法的有效性[22],将异构模型迁移和同构模型迁移的目标域网络最后一层特征提取层的特征进行可视化,结果如图11、图12和图13所示。
由图9~图11可知:采用同构模型迁移方法所提取的特征,经可视化后存在多处错分现象,并且类别边界不明显,在图9的L1~L6区域都存在错分样本,并且在L1区域内出现了多类别的类间重叠现象,类别边界十分模糊;图10中的L1~L6区域同样存在错分样本。采用异构模型迁移方法提取的深层特征可视化后,类别边界清晰,样本混叠较少,错分现象较少,仅在图11的L1区域出现单个的离群样本。故应用所提方法可以很好地提取滚动轴承深层特征,有利于提高故障诊断模型的性能。
图9 同构(ResNet-34)特征可视化结果图Fig.9 Result diagram of isomorphic (ResNet-34) feature visualization
图10 同构(VGG-16)特征可视化结果图Fig.10 Result diagram of isomorphic (VGG-16) feature visualization
图11 异构模型迁移特征可视化结果图Fig.11 Result diagram of feature visualization for heterogeneousmodel transfer
为进一步研究异构模型迁移中,源域与目标域具体网络的结构对试验结果的影响,设置两组对比试验。第一组源域网络结构ResNet-34,目标域网络结构VGG-16,第二组源域网络结构VGG-16,目标域网络结构ResNet-34。以任务1为例绘制准确率和损失值随迭代次数变化图,结果如图12所示。
图12 不同异构网络的准确率和损失值对比图Fig.12 Comparison of accuracy and loss values of different heterogeneous networks
由图12可知,第二组的准确率不随迭代次数的增加而稳定,最终未趋向于100%,损失值上下波动大,无法收敛。第一组的准确率随着迭代次数的增加趋近100%,并且损失值稳定降低直至收敛。故选取源域ResNet-34,目标域VGG-16作为网络模型。究其原因:当异构模型迁移时,在选择源域和目标域网络时,源域网络的层数和参数量需高于目标域网络。因为在参数传递时,需要自适应决定迁移知识的层级和内容,该过程需要源域有足够的网络层数和参数量供目标域匹配。而第一组试验中是34层参数多的ResNet网络迁移至16层参数少的VGG网络,符合上述理论分析。
5.2.2 多源域单源域对比试验
对采用多源域迁移策略和单源域迁移策略进行对比试验。为减少随机初始化训练参数及试验不确定性因素对所提方法诊断结果的影响,分类任务将准确率和损失值作为评价指标。
对比试验数据集设置以迁移任务3为例,多源域试验设置为:源域一SKF6205规格0工况;源域二MFPT规格2工况,目标域为SKF6203规格3工况。单源域试验设置:源域为SKF6205规格0工况,目标域为SKF6203规格3工况。多源域试验设置中,源域一每类状态100个样本,源域二每类状态100个样本;单源域试验设置中,源域每类状态200个训练样本。源域目标域模型均为VGG-16,采用传统固定加微调方式进行参数传递。多源域和单源域对比的试验结果,如图13所示。
图13 多源域和单源域的准确率与损失值对比图Fig.13 Comparison of the accuracy and loss value for multi-source domain and single source domain
由图13可知,当迭代次数为50时多源域准确率为99.8%,单源域准确率为93.5%,此时多源域准确率比单源域高6.3%。并且在迭代过程中,除个别迭代次数时多源域和单源域准确率持平外,其余多源域的准确率都要比单源域高,而且损失函数也更稳定。因此采用多源域迁移学习策略可以集合多个源域的知识,模型准确率明显高于单源域迁移策略,并且模型稳定性高于单源域迁移策略。
为更直观地观察多源域方法在故障诊断问题中的有效性,引入多分类混淆矩阵对诊断结果分析。篇幅所限,仅以任务3的故障诊断结果为例,绘制混淆矩阵如图14和图15所示。
图14 单源域混淆矩阵Fig.14 Confusion matrix of single source domain
图15 多源域混淆矩阵Fig.15 Confusion matrix of multi-source domain
由图14和15中可知,多源域法在1 000个目标域测试集样本中,仅有一个标签出现3个样本诊断错误,为IR14故障被误判为B07故障。而单源域方法存在多处误判。由此可知,本文所采用的多源域方法可以有效解决多个相似数据集利用不充分从而导致模型准确率不高的问题。
将机电一体化技术应用到工程机械设备中,通过该技术的信息控制系统,可对机械的作业过程进行自动化控制,如此一来,极大地提高了作业的精准度。例如,将机电一体化技术应用到沥青的摊铺机中,就可以实现自动找平、自动供料,不仅提高了施工的质量,也提高了施工的效率。可以说,通过机电一体化技术的应用,基本上实现了工程机械的半自动化 操作,进一步降低了人工操作中出现的误差现象,提高了施工作业的精准度,满足了现代工程施工的要求[3]。
5.2.3 不同元学习算法对比试验
为验证引入基于进化策略的与模型无关元学习在自适应参数传递过程中的效果,因此采取不同元学习进行参数传递试验。以任务1为例,试验结果如图16所示。
图16 不同元学习参数传递策略训练时间对比结果Fig.16 Comparison of the training time for different meta learning parameter transfer strategy models
对比图16中的不同元学习参数传递策略可知,在迭代过程中,ES-MAML的模型训练时间一直比MAML短,并且当迭代次数达到50时,ES-MAML比相比MAML缩短了22.1 h。因此,引入ES-MAML可以缩短模型的训练时间。
5.2.4 所提方法在不同迁移任务上的验证试验
为验证所提方法在不同迁移任务上的有效性,将多源域迁移学习和异构模型迁移相结合,并且采用ES-MAML改进参数传递策略进行试验验证。数据集设置如表2和表3所示。试验结果如表4所示。
表4 不同迁移任务的试验结果Tab.4 Test results of different transfer tasks
由表4可知,本文所提方法的平均分类准确率达98.0%以上,充分说明所提方法可以实现不同规格且不同工况下滚动轴承的故障状态识别。
5.2.5 与其他算法对比试验
为验证所提方法在不同规格且不同工况下滚动轴承迁移故障诊断问题上具有更好的效果,本文选择文献[10]、文献[12]、文献[13]、文献[14]方法进行对比试验。试验过程中设置相同的源域及目标域数据集和相同的迁移任务。准确率对比结果如图17所示。
图17 所提方法与其他方法的试验对比结果Fig.17 Test comparison results between the proposed method and other methods
由图17可知,所提方法在12种不同迁移任务的试验中,平均准确率可高达98.0%,且相对于传统模型迁移学习分类、多源域迁移学习分类和其他异构模型迁移方法,准确率提高约5%。因此,本文所提方法可有效实现少量带标签样本下不同规格且不同工况滚动轴承的故障诊断。
(1)针对不同规格且不同工况下滚动轴承数据分布差异大的问题,提出利用异构模型迁移学习分别提取源域和目标域的特征,避免了采用相同网络会遗漏不同规格且不同工况下轴承相关特征信息。经试验验证,异构模型迁移的平均准确率比同构模型迁移的平均准确率高4%,证明了异构模型迁移的有效性。
(2)将ML与深度迁移学习结合,提出利用ES-MAML自适应决定迁移的知识层级和知识内容,避免了传统固定加微调的参数传递方式可能会传递无用知识甚至有害知识,从而导致负迁移的问题。经试验验证,改进后的参数传递方法比传统的固定加微调参数传递方法平均准确率提高3%,证明改进参数传递方法的有效性。
(3)针对多个相似数据集资源利用不充分的问题,提出多源域异构模型迁移学习框架,利用多个相似源域数据集辅助其他规格和工况下滚动轴承的故障诊断。提出将多个目标域网络提取到的特征输入ELM中来实现分类任务。经试验验证,所提方法可以实现少量带标签样本下不同规格和工况的滚动轴承故障诊断。且较所对比的参数迁移方法提升约5%,平均诊断准确率可达98.0%,证明所提方法的有效性。
此外,本文所提方法解决了不同规格且不同工况下滚动轴承间的故障诊断,呈现了滚动轴承迁移诊断的另一种思维方式。