王正奇,谷艳玲,2*,陈长征,2,田 淼,孙鲜明
(1.沈阳工业大学 机械工程学院,辽宁 沈阳 110870;2.辽宁省振动噪声控制工程技术研究中心,辽宁 沈阳 110870;3.宁波坤博测控科技有限公司,浙江 宁波 315200)
风能作为重要的清洁能源之一,近几十年来在全球范围内得到了快速发展。截止2021年底,全球范围内风电机组装机总量达837 GW。预计未来五年内全球装机量将新增557 GW[1,2]。
轴承作为风电机组中的关键零部件,其健康状况直接影响风电机组的正常运行。因此,进行风电机组轴承的故障诊断研究对于降低机组维护成本和延长机组服役时间具有重要意义。
传统的轴承故障诊断流程主要分为故障特征提取和故障分类2部分。近年来,国内外学者对故障特征提取提出了新方法,如增强组合差分形态滤波[3]、基于频域稀疏性的分层算法[4]、时变滤波方法[5]和增强带熵方法[6]等。故障分类则是利用机器学习模型进行诊断[7],如支持向量机(support vector machines, SVM)[8]、随机森林[9]等。
随着深度学习的迅速发展以及注意力机制的提出,该方法因具有快速准确的诊断性能而被广泛应用于轴承故障诊断领域。YU J B等人[10]采用通道注意力机制方法,改善了模型对齿轮箱故障脉冲段的学习能力;但是在强背景噪声下,仅采用通道注意力机制的网络结构不能充分利用注意力机制的性能。陈仁祥等人[11]采用小波变换和注意力机制卷积神经网络模型,对不同转速下滚动轴承的深度特征进行了迁移适配,充分体现了注意机制在深度学习故障诊断中的优势;但在风电机组实际运行过程中,各部件振动信号会发生耦合,且信号存在强背景噪声,使得传统的单传感器数据无法用于精确诊断故障[12]。
杨洁等人[13]采用一维卷积神经网络模型,对航空发动机原始振动信号进行了特征提取,实现了多源信息的特征级融合目的;但其未体现出特征融合相对其他类型融合的优势。CHEN Z Y等人[14]通过对比试验,证实了特征级融合效果优于其他两种,并发现了特征级融合阶段信息的有效性是该类诊断模型的关键;但特征的有效性在深层神经网络中难以得到保证。
普通卷积核难以用于提取更多的有效信息,在特征融合中可能造成信息冗余或者不足[15],不利于提高故障诊断准确性;其次,通过加深网络结构获得深层特征将导致信息量变大,增加模型训练和诊断的时间[16],严重影响诊断效率。
针对上述问题,笔者提出一种基于多源信息融合注意力机制神经网络的风电机组轴承故障诊断模型(MSIF-ACNN)。
首先,笔者采用融合卷积模块,提取输入原始信号的多尺度特征,以保证故障信息的有效性和完整性;其次,采用通道注意力和空间注意力机制方法,用少量数据保留有效信息,提高信息融合的效率及有效性,进行快速、准确的轴承故障诊断。
卷积神经网络(convolutional neural network,CNN)处理二维图像具有出色表现,因此其被广泛应用于图像识别[17]、语音识别[18]等领域。
常规故障诊断模型为适应CNN的二维输入,通常将时序信号转化为时频图或灰度图,再利用卷积操作进行特征提取。然而信号的转换过程会导致部分特征丢失。因此,笔者基于一维CNN对原始时序信号进行特征提取,避免了数据预处理的繁琐操作,最大程度地保留了信号的特征。
一维CNN表达式如下:
(1)
通常卷积神经网络还包括最大池化层(max pooling layer, Maxp)和全连接层(fully connected layer, FC),最大池化层能减少参数和计算量,全连接层对提取的特征进行整合。
其中,最大池化层表达式如下:
(2)
普通卷积的卷积核长度固定,难以提取更多信息,而空洞卷积[19]采用增大扩张率的方法,可以扩大神经网络感受野,获得更加丰富的全局信息。
空洞卷积表达式如下:
(3)
式中:d为空洞卷积扩张率。
由式(1)和式(3)可以得到对原始时序信号的密集提取特征和稀疏提取特征,随后对其进行拼接,可以得到融合特征,并对融合特征结果进行最大池化和批量归一化(batch normalization, BN)降维处理,使每层网络输入保持相同的分布。
具体过程如下:
n=Maxp(BN(y))
(4)
式中:y为融合特征;n为批量归一化和最大池化结果。
融合卷积模块如图1所示。
图1 融合卷积模块
通过结合以上2种卷积,笔者构建了融合卷积模块。融合卷积不仅可以提升模型提取特征的能力,获得输入信号的多尺度特征,而且可以避免空洞卷积随扩张率增大出现的信息丢失问题,保证了全局信息的完整性。
注意力机制最早被应用于自然语言处理,其目的是实现目标检测[20]。随着研究的深入,注意力机制在轴承故障诊断领域的应用也越来越广泛。因此,笔者提出了一种应用于多源信息融合的注意力机制CNN模块。
注意力机制CNN模块如图2所示。
图2 注意力机制CNN模块
由于融合卷积模块可能导致全局信息过载,同时考虑到特征融合中信息的规模和有效性问题,笔者利用通道注意力机制和空间注意力机制为有效特征,赋予较高权重,以提高网络对有效特征的敏感性,同时避免了深度特征提取造成的数据量激增问题,进而提升了对风电机组发电机滚动轴承的故障诊断能力。
在通道特征注意力机制中,首先,笔者将尺寸为W×1×C的X经过1个全局平均池化层(global average pooling layer, GAvgp)及2个分别以ReLU和SoftMax作为激活函数的全连接层,生成通道特征权重的评估向量。
其表达式如下:
z=FC(FC(GAvgp(X),C/r),C)
(5)
式中:z为特征权重的评估向量;X为注意力机制CNN模块输入;r为降维比。
笔者利用特征权重评估向量z对X的权重进行自适应的调整校准和分配。其表达式如下:
Y1=X×z
(6)
式中:Y1为通道权重校准后特征。
为了进一步提升模型对有效特征的敏感性,笔者设置空间特征注意力机制,对X进行卷积核为1,步长为1的卷积运算,并且对其进行最大池化和归一化处理,得到注意力机制空间权重特征y2,最后与通道注意力权重校准后的特征连接。
其表达式如下:
Y=Y1⊕y2
(7)
式中:⊕为拼接操作;Y为注意力机制CNN模块输出;y2为空间权重校准后特征。
最终,对于单个输入信号,笔者利用注意力机制,分别对特征赋予通道权重和空间权重,提高模型有效特征的提取能力。
针对单个传感器在风电机组滚动轴承故障诊断中提供信息有限的问题,笔者提出了一种基于多源信息融合注意力机制卷积神经网络(MSIF-ACNN)的风电机组滚动轴承故障诊断方法。
该轴承故障诊断模型主要分为4个模块:1)融合卷积多尺度特征提取模块;2)注意力机制权重分配模块;3)特征融合模块;4)故障诊断模块。
MSIF-ACNN网络机结构如图3所示。
此外,融合卷积模块中,空洞卷积扩张率为3;在注意力机制中,通道注意力全连接层降维比为3;两层注意力机制除通道数外,结构及参数完全相同;在特征融合中,采用同一Flatten压平层将2个信号的深层特征进行融合;在故障分类中,采用2个全连接层和1个SoftMax的分类层进行分类。
MSIF-ACNN模型故障诊断流程如图4所示。
图4 MSIF-ACNN模型故障诊断流程图
MSIF-ACNN模型故障诊断具体步骤如下:
1)数据集预处理。将原始信号通过切片、归一化、标签化处理,构建一维数据集,并划分出训练集和测试集;
2)MSIF-ACNN模型训练。初始化MSIF-ACNN网络参数,利用预处理后的训练集对模型进行训练,得到风电机组轴承故障诊断模型;
3)故障诊断。利用训练好的MSIF-ACNN模型对测试集进行故障诊断,并输出测试集的轴承故障诊断分类结果。
为了验证该多源信息融合方法的有效性,笔者采用实际风电机组轴承数据进行试验验证。
风电机组滚动故障轴承振动数据来自河北某风场。该发电机型号为湘潭电机DFWG1500/4,轴承型号为SKF6330 M/C3 H。
笔者采用VIB6.140型ICP压电加速度传感器采集发电机驱动端径向和轴向振动信号,采样频率为16 384 Hz,采样时间为20 s。
数据采集过程如图5所示。
图5 数据采集过程
根据风场30台风电机组采集到的发电机驱动端径向和轴向数据,笔者将其划分为4类轴承状态:1)正常状态(normal state,NS);2)外圈故障(outer ring fault, OF);3)内圈故障(inner ring fault, IF);4)保持架故障(cage fault, CF)。
笔者又根据故障特征频率并采用起点随机方式,截取4 096个点作为数据样本,随机选取2 000组作为训练集,500组作为测试集。
故障标签及数据集如表1所示。
表1 故障标签及数据集
不同状态轴承样本振动信号如图6所示。
图6 不同方向和状态的轴承振动信号
该MSIF-ACNN模型超参数如下:Batch Size=36,epoch=200,学习率为0.005。
笔者在全连接层中加入Dropout,以防止过拟合(Dropout=0.5),最终得到了训练集和测试集的准确率、损失值随迭代次数变化关系。
模型准确率和损失曲线分别如图7所示。
图7 模型准确率和损失曲线
图7中的准确率和损失变化直观展示了MSIF-ACNN模型的学习性能。
图7中,在收敛过程中,准确率上升及损失下降趋势明显,收敛速度较快;在分别经历60次和90次迭代后,训练集和测试集的准确率和损失均趋于稳定,准确率分别达到了99.5%和96.7%。
以上结果表明,MSIF-ACNN模型结构及参数设计合理,在风电机组滚动轴承故障诊断中具有良好的效果。
另外,故障分类混淆矩阵如图8所示。
图8 故障分类混淆矩阵
在图8所示的混淆矩阵中,横、纵坐标分别代表预测标签和实际标签。可以看出,MSIF-ACNN对于轴承4类状态的分类准确率分别达到了100%、96.4%、95.4%、95.0%,证明MSIF-ACNN模型能够准确识别4类轴承状态,满足风电机组轴承故障诊断需求。
为验证多源信息融合的有效性,笔者分别以径向振动信号、轴向振动信号和多源信号作为MSIF-ACNN的输入并对比试验结果。每次试验进行10次,将4类轴承状态识别率和整体模型准确率的平均值用于评估模型的有效性。另外,笔者以10次试验准确率的方差作为评估诊断模型不同数据源输入下的稳定性指标。
单信号与多源信号试验结果如表2所示。
表2 单信号与多源信号试验结果
由表2可知:基于轴向振动信号的故障诊断平均准确率为90.55%,方差为1.358,径向振动信号平均准确率为92.00%,方差为0.642,说明了径向信号整体故障诊断效果相对较好。基于轴向信号的外圈和内圈故障的诊断准确率较低,分别为86.80%和82.80%;而径向振动信号在保持架故障诊断准确率较低,为86.00%,证明了传感器在不同位置和方向对不同故障的敏感性存在差异[15]。多源信息融合对4类故障的诊断准确率均达到95.00%以上,平均准确率达到96.70%,方差为0.241,平均准确率相对于径向信号和轴向信号分别提高了4.7%和6.15%,并且稳定性得到了提高,说明MSIF-ACNN能够实现径向信号和轴向信号之间的特征互补,证明了通过合理有效利用多传感器信息,能够提高故障诊断准确性。
为了验证MSIF-ACNN在多源信息融合上的优越性,笔者将该方法与常用于风电机组滚动轴承故障诊断的5种方法进行对比。这5种方法为:SVM、Alex net、基于宽内核的神经网络(wavelet decomposition convolutional neural network, WDCNN)[21]、长短时记忆卷积神经网络(long short-term memory convolutional neural network, LSTM-CNN)和注意力机制CNN(attention mechanism convolutional neural network, ACNN)。
笔者利用上述5种方法并结合该特征融合方法对多源信号进行融合,将其作为对比故障诊断模型。
对比试验结果如图9所示。
图9 对比试验结果
由图9可知:MSIF-ACNN模型的平均准确率为96.7%,效果最好;SVM的平均准确率为76.1%,效果最差,这是由于机器学习对特征极度依赖所导致的;ACNN和LSTM-CNN的平均准确率分别为93.2%和91.7%,明显高于平均准确率为84.9%、88.2%的Alex net和WDCNN,说明了注意力机制和长短时记忆模块能够有效筛选重要信息,且注意力机制效果更好。
另外,从10次试验结果曲线来看,MSIF-ACNN的方差较小、稳定性好。
为了更加直观地分析不同模型的多源信息融合效果,笔者利用t-SNE算法对6种模型的分类情况进行分析。
对比试验聚类图如图10所示。
由图10可以看出:MSIF-ACNN边界区分明显,轴承状态分类效果明显优于其他5种;SVM中4类数据之间相互混杂,不能准确地区分故障类型;Alex net虽然相对机器学习SVM有了较好的改善,但各类故障间仍有重叠;同样,即使WDCNN在增大了普通卷积神经网络感受野情况下,仍无法实现多源信息的有效融合;LSTM-CNN和ACNN的内圈故障和正常状态边界模糊,均出现了内圈故障的误判,但实现了相对较好的分类效果[22-24]。
综上所述,在多源信息融合中,MSIF-ACNN的性能优于其他5种方法。
针对单个传感器在风电机组滚动轴承故障诊断中提供信息有限的问题,笔者提出了MSIF-ACNN结构,通过风电机组滚动轴承径向和轴向振动信号的融合,实现了多源信息特征互补目的,提高了故障诊断的准确性。
主要结论如下:
1)提出了MSIF-ACNN风电机组滚动轴承故障诊断模型,采用融合卷积和注意力机制CNN模块,实现了多源信息的特征级融合目的。单传感器信息和多源信息对比试验结果表明,不同位置和方向传感器对不同故障敏感性存在差异,证明了多源信息融合的必要性,MSIF-ACNN有效实现了多源信息的融合,满足风电机组滚动轴承故障诊断的需求;
2)通过试验对比其他滚动轴承故障诊断模型在信息融合上的效果,结果表明MSIF-ACNN能够更好地利用多源信息的互补特征,诊断结果优于其他机器学习和深度学习模型,证明该方法克服了多源信息特征级融合中特征信息有效性不足的问题,促进了多源信息融合在轴承故障诊断领域的应用。
在后续的研究中,笔者将对异源信息融合进行深入研究,如基于声振融合的故障诊断模型,并提出相应的多源信息融合方案,以进一步提高故障诊断效率和准确率。