基于卷积自编码器的直升机轴承退化特征提取

2023-01-09 12:32陈浩,邓鹏

黑龙江大学自然科学学报 2022年3期

陈浩, 邓鹏

(1.国防科技大学智能科学学院, 长沙 410005; 2.国防科技大学信息通信学院, 西安 710100)

0 引言

军用直升机在现代军事中已经成为一种不可或缺的武器装备，直升机安全可靠性的研究成为一个重要课题[1]。直升机传动系统故障的机械部件一般没有冗余结构，一旦出现故障，将会发生严重的安全事故[2-3]。飞行过程中,直升机传动系统中的轴承受到长期的摩擦和疲劳应力，极易产生性能退化和故障失效，对直升机轴承进行退化特征提取和故障预测，有利于提前预警，化险为夷[4-5]。传统方法中，通过提取机械振动信号中的统计特征如均方根(Root mean square, RMS)和峭度等能较好地观察零部件的性能退化特征[6-10]。而直升机轴承振动信号中含有大量环境噪声，传统方法提取出的特征性能较差，难以提取出轴承的准确退化特征。卷积自编码器(Convolutional autoencoder, CAE)是深度自编码器的一种变体，具有较强的无监督特征学习能力和降噪功能，主要用于图像降噪，较少应用于机械振动信号研究[11]。本文创新性地将CAE应用于轴承振动信号的自适应多维退化特征提取，结果证明该方法非常适合轴承的退化特征提取。

1 基于卷积自编码器的深度学习模型

卷积自编码器借鉴了自编码器无监督学习的特点，以卷积神经网络(Convolutional neural network, CNN)中的卷积层和池化层代替自编码器中的全连接层，通过较少的网络参数可以实现特征提取[12-13]。卷积自编码器的结构及训练流程简图，如图1所示。卷积自编码器中的卷积核相当于滤波器，可以用来提取数据的局部区域特征。池化层一般用来进行特征选择，保留显著特征，减少参数量。

图1 卷积自编码器的结构及训练流程

以一维卷积为例，介绍卷积运算和池化运算。

(1)卷积

定义w1,w2,…,wm为一组卷积核，深度学习里的卷积实现大部分都是互相关运算，即卷积核不进行翻转操作。一维数据序列x与卷积核w的卷积操作定义为：

(1)

式中m表示卷积核长度，一般卷积核尺寸m远远小于数据序列尺寸n。因此，卷积相当于卷积核在数据序列上求移动平均。

(2)池化

池化是下采样方法的一种，主要是对特征进行聚合降维。一般地，在经过卷积层之后输入，虽然网络连接数量大幅减少，但是经过不同卷积核特征映射后的网络连接总量依旧很多，特征维度很高，所以在卷积之后需引入池化对特征进行降维，这样能够有效避免过拟合，减少网络参数量，提高计算速度。

池化运算将数据划分为若干个子区域，以子区域数据的统计特征作为子区域的输出。常见的池化运算有均值池化(Mean pooling)和最大池化(Maximum pooling)，两种池化运算的数学表达式为：

均值池化：

(2)

最大池化：

(3)

式中：x表示池化运算前输入；yj,m表示第j个特征映射第m个子区域的池化输出；s表示移动步长；r表示子区域尺寸大小。通过调整移动步长s和子区域尺寸r的数值，子区域可以重叠，也可以不重叠。

对于输入数据x，卷积自编码器第k个卷积核的特征映射输出可以表示为：

hk=s(x*Wk+bk)

(4)

式中：*表示卷积运算；Wk和bk分别表示第k个卷积核的权重矩阵和网络偏置。

通过卷积后，接下来对输出hk进行下采样得到：

(5)

通过编码—解码过程后，最后的反卷积层重构输出为：

卷积自编码器的训练过程一般是通过最小化损失函数对卷积核权重矩阵W和偏置b进行寻优求解，利用误差反向传播(Back propagation, BP)算法进行参数学习调整，梯度下降算法更新网络参数，这与常用经典自编码器的训练过程基本一致。

2 基于卷积自编码器的最优退化特征提取方法

2.1 方法流程

基于卷积自编码器的最优退化特征提取方法主要思想为：将采集的原始振动数据按监测周期裁剪成多个样本，依次输入到卷积自编码器中，利用卷积和池化运算,自适应提取多组编码特征作为候选退化特征，基于退化特征评估指标进行评估，从中挑选评估结果最优的候选退化特征作为最终的退化特征。

基于卷积自编码器的最优退化特征提取流程如图2所示,主要有以下几个步骤：

图2 基于卷积自编码器的最优退化特征提取方法流程

(1)数据采集：通过在实验设备上安装加速度传感器采集振动信号，设定好采样率、采样间隔、每次采样时长及停机条件，从而获得预测对象的全寿命数据。

(2)构建数据集：对步骤1中数据取绝对值，根据单监测周期内采样点数，将数据裁剪成等长样本数据，样本内数据点数即单监测周期内采样点数。由于是无监督训练学习，所有数据集样本数据均为训练集，训练集输入与标签均为原始数据，数据格式为(原始数据，原始数据)。

(3)网络模型搭建及训练：根据数据集样本数目及样本内数据点数设定CAE网络模型参数，包括网络层数、每层卷积核数量及尺寸和池化区域尺寸等。网络训练方式采用批量训练，批量训练尺寸在计算内存允许的情况下可以适当取较大值。通过事先设定迭代次数或者损失函数的阈值来判断网络模型是否完成训练。初次设定的网络模型参数可能达不到要求，需要根据损失函数的收敛情况来逐步调整网络参数，从而获得较好的网络模型。

(4)输出候选退化特征：输入数据集样本数据，待网络模型完成训练之后，通过编码器输出得到多组候选退化特征。

(5)特征评估及选择：基于退化特征评估指标，对步骤4中得到的多组候选退化特征进行量化评价，从中选择评价结果最好的作为最优退化特征。

2.2 特征评估及最优退化特征提取

基于退化特征评估指标进行量化评价选出最优退化特征，采用的评价指标为常用的单调性(Monotonicity)、相关性(Correlation)和鲁棒性(Robustness)三个指标的加权平均[14]，由于单调性是退化特征较为关键的属性，设置三者权重比例为0.5∶0.25∶0.25。评估计算式为：

(7)

式中Score值越大，表明退化特征的综合评估结果越好。

实验数据来源为PHM 2012数据挑战赛提供的轴承加速退化全寿命数据集[15]，数据由轴承垂直方向和水平方向加速度计采集，传感器采样频率为25.6 kHz，监测周期为10 s，每个检测周期采样0.1 s，因此，每个样本包含2 560个数据点。实验定义：轴承振动信号超过20 g，即认为轴承出现故障失效。经分析，轴承水平方向振动信号时域波形普遍比垂直方向振动信号时域波形趋势性更好，波动性更小。因此，退化特征提取仅使用轴承的水平方向振动信号。

进行特征提取的CAE网络模型基本设计原则为：

(1)第一层卷积核尺寸可以适当取大。设定为32、48和64等，这样可以获得更大的感受野区域，使得较深层网络仍能保留输入数据的原始信息。

(2)其余层卷积核尺寸不宜过大。一般设为3或者5，在一维卷积中小尺寸卷积核能够更有效地平滑信号噪声。

(3)下采样区域尺寸不宜过大。避免过度损失数据中的原始信息。

针对网络层数、下采样区域尺寸设计了多种不同的CAE网络结构，卷积核和采样层区域移动步长均设为1，最终提取出最优退化特征，其CAE网络结构模型参数如表1所示。

表1 CAE最优退化特征提取方法的网络结构模型参数

该模型所提取的CAE最优退化特征实验结果如图3所示，特征结果进行了归一化处理。可以看出，本文所提取的退化特征具有明显的退化趋势。

(a)轴承1-1 (b)轴承1-2

3 实验对比及加噪仿真验证

为了验证CAE最优退化特征方法的有效性，基于单调性等特征评估指标，将本文得到的CAE最优退化特征与RMS特征、自组织映射融合特征进行对比。其中，RMS是一种常用的表征信号能量的特征，能较好地表征机械零部件的退化过程，但在大噪声工况下早期趋势不明显，效果较差[16]。RMS的数学表达式为：

(8)

式中：n表示信号长度；xi表示振动信号的幅值。

CAE-SOM融合特征是指在数据样本输入CAE网络模型后得到n条候选退化特征曲线，将这些候选退化特征输入SOM网络进行降维融合，计算输入特征数据x与最佳匹配单元(Best matching unit, BMU)间的最小量化误差(Minimum quantization error, MQE)，最小量化误差即为得到的CAE-SOM融合特征[17]。最小量化误差的表达式为：

(9)

根据经验，SOM网络拓扑层神经元总数设为4×30，迭代次数设为100，初始学习率和学习率参数分别为0.6和1 000。

4组轴承数据的3种特征性能归一化评估结果如表2所示，表中Mon、Corr和Rob分别表示单调性、相关性和鲁棒性指标，按照0.5∶0.25∶0.25的权重比值得到综合评价值Score。评估结果表明，通过CAE网络模型提取出来的退化特征的单调性和鲁棒性更好，综合评价值也更高。

表2 3种特征的特征性能评估结果

进一步对噪声环境下的轴承数据进行了仿真，在原始数据上添加了高斯白噪声，加噪信号构造方法为：

Nosie_data =Data+Noise_factor×Randn(n)

(10)

式中：Nosie_date表示加噪仿真信号；Date表示原始振动信号；Noise_factor为高斯白噪声的信号幅值，本文取1；Rand(n)是信号序列长度为n，均值为0，方差为1的高斯随机序列。

对加噪仿真信号分别提取RMS特征、CAE-SOM融合特征和CAE最优特征，并采用特征性能评估指标对其性能进行对比评估，结果如表3所示。可以看到，CAE-SOM和CAE最优退化特征的单调性和鲁棒性都明显优于RMS特征，这表明卷积具有较好的滤波作用。其中，CAE-SOM和CAE最优退化特征的区别在于CAE-SOM是将数据输入CAE模型后,得到的n条候选退化特征曲线进行降维融合，并计算MQE得到的数据，而CAE最优退化特征是从n条候选退化特征曲线中去提取最优退化特征。表中CAE-SOM融合特征在某些组数据表现较差，这是因为通过CAE网络模型得到的多组候选退化特征里有些特征并不具备表征轴承退化过程的能力，融合特征里掺杂了这些较差的特征，从而导致融合特征的评价结果较差。因此，在综合评分上，CAE最优退化特征性能是最优的，本文所提取的最优退化特征具有良好的特征表征效果，具备较好的特征性能。

表3 加噪下3种特征的特征性能评估结果

4 结论

针对轴承加速退化振动数据，应用卷积自编码器开展退化特征提取方法研究，本方法提取的轴承最优退化特征经实验对比验证和加噪仿真对比，表现出良好的特征表征效果。该方法能够自适应提取单调性更好和更加平滑的退化特征，为状态监测及后续的预测工作提供帮助。