李卓漫 王海瑞
(昆明理工大学信息工程与自动化学院)
滚动轴承作为旋转机械设备的重要部件之一,在进行剩余寿命预测时,如果预测不准确,会导致无法在机械设备出现问题前及时采取预防措施,进而产生相当程度的经济损失,因此对它进行准确的寿命预测对于设备维护、提高生产效率都有相当重要的意义[1,2]。 近年来,基于状态监测的轴承剩余寿命预测方法成为国内外研究的热点,同时由于循环神经网络(RNN)在时间序列处理方面具有优越性而在滚动轴承剩余寿命预测方面得到广泛应用。 文献[3]中提出了一种基于循环神经网络的健康指标,用于轴承剩余寿命的预测。 文献[4]中使用具有时序功能的长短期记忆网络构建网络模型,并进行剩余寿命预测。由于RNN在训练中会出现长期依赖、 梯度爆炸和消失的问题, 为此提出了长短期记忆网络(Long Short-Term Memory,LSTM)。 LSTM通过设计遗忘门、输入门和输出门结构,有效地利用了长距离的时序信息[5],提高了预测效果。 与此同时,LSTM神经网络的预测效果很大程度上依赖于参数的设置。模型使用不同参数会使其性能有所不同。且通过人为设置参数,可能导致预测效果不稳定。因此笔者采用粒子群算法(PSO)对LSTM网络的部分需人为设定的参数进行优化, 实验中选择批处理大小和隐藏层单元数目,从而构建PSO-LSTM模型对滚动轴承的剩余寿命进行预测。
LSTM以RNN为基础加入了遗忘门、输出门和输入门和3种特殊结构[6],本质是使用sigmoid激活函数,使全连接层的输出值取值范围在[0,1],该值表示信息量通过的比例。 遗忘门表示上一时刻输出信息量的遗忘比例, 输入门表示当前时刻输入信息量的保留比例,两者共同更新状态值,输出门则表示新状态输出比例。 文献中最常见的LSTM网络结构最初是由Graves A和Schmidhuber J[7]提出的,结构如图1所示,其中x(t)为当前输入,h(t-1)为上一时刻输出值,h(t)为当前输出值,c(t)为新状态值,c(t-1)为上一时刻的状态值。
图1 LSTM网络结构
遗忘门是通过读取h(t-1)和x(t)输出介于0~1之间的一个数f(t),通过这个数来决定c(t-1)的保留程度,计算公式为:
输入门是决定h(t-1)和x(t)中将会有哪些新的信息被传输给细胞状态,具体的数据处理由两部分组成, 一是通过使用tanh激活函数输出a(t)增加到细胞状态中,二是通过使用sigmoid激活函数确定更新哪些值,计算公式为:
更新当前状态为:
输出门的数据处理同样由两部分组成,一部分包括O(t)和激活函数tanh,另一部分包括h(t-1)、x(t)和激活函数sigmoid,计算公式为:
式中 b——偏置值;
U——循环权重;
W——输入的权值矩阵;
σ——sigmoid激活函数。
由此可见,LSTM的关键是状态值c(t),它在t时刻保持单元状态的记忆,通过遗忘门f(t)和输入门i(t)进行调节。
粒子群算法是模拟鸟类迷失的一种进化计算方法[8],其数学模型为:设粒子群的搜索空间是D维,粒子个数为n,文中取n=30。 第i个粒子在搜索过程中最优解对应的表达式为P(i)=[P(i1),P(i2),…,P(iD)],其中设第g个粒子搜索过程中的最优位置P(g)为所有局部最优解P(i)(i=1,2,…,n)中的最优解[9];第i个粒子的速度V(i)=[V(i1),V(i2),…,V(iD)]。 每个粒子的速度和位置变化可以用下式表达:
其中,t为迭代次数, 文中取t=500;c1、c2为影响因子, 分别表示粒子和全局对它的影响程度,取值范围通常为[0,2],文中取c1+c2=2;r1、r2用于避免陷入局部最优,是取值为[0,1]之间的随机常数;w定义为惯性常数,作用是保持个体原有的属性,其取值范围为[0,1][2],文中取w=0.7。PSO算法中需对粒子的位置和速度设置合理范围,当粒子迭代次数达到t或适应度值达到设定的要求时,停止迭代。
为了更准确地预测滚动轴承的剩余寿命,笔者以擅长处理时间序列的LSTM模型为基础,构建滚动轴承剩余寿命预测模型。 与此同时,为了使预测模型与不同工况下的滚动轴承剩余寿命退化数据特征更加匹配, 笔者采用了PSO算法对LSTM模型进行优化,构建了PSO-LSTM模型,以获得较优的参数组合。
模型首先将批处理大小和隐藏层单元数目在给定范围内随机初始化,以此作为LSTM模型的初始参数,通过划分好的训练数据和验证数据分别对初始模型和训练后的模型进行训练和预测,并将预测结果的平均绝对百分比误差作为适应度函数f。 适应度函数f的定义为:
所谓评估准则,是对评估基本准则和评估执业准则、职业道德准则的统称。其中,评估基本准则由国务院有关评估行政管理部门组织制定,评估执业准则、职业道德准则由评估行业协会依据评估基本准则制定。本项规定还提出了评估专业人员 “勤勉谨慎从事业务”的要求,这也是中介服务行业立法通常会有的要求,其重要表现在于评估专业人员应当认真履行必要情况下的现场调查等调查职责,在独立分析估算基础上编制评估报告。
其中,y^m是第m个标签值,ym是第m个预测值,N是样本数量。
此时PSO算法中的粒子就对应于所优化的超参数,通过式(7)、(8)更新粒子的速度和位置,迭代寻优直至找到最优值。以最优超参数作为LSTM模型的批处理大小和隐藏层单元数目,从而完成LSTM模型的优化。再通过原数据集完成剩余寿命预测。 PSO算法优化LSTM的流程如图2所示。
图2 PSO算法优化LSTM的流程
实验数据集采用PHM2012挑战赛的滚动轴承数据集[4],该数据集包括3种不同工况下17个轴承的运行数据,每个轴承都包含水平和垂直两个方向的振动加速度数据, 数据采样间隔为10s,单次采样时长为0.1s,采样频率为25.6kHz。 笔者分别采用训练集和测试集的水平方向振动加速度数据展开实验。
首先,根据原始数据提取时域特征,笔者综合提取10个常用时域特征,分别为均值、峰值、偏斜度、均方根值、峰度、最大值、最小值、峰峰值、方差和标准差。 同时对时域特征进行最值归一化。 将剩余寿命的模型设置为一元一次函数,把数据集中各全寿命数据的数据组数作为每个轴承的初始状态剩余寿命值,随着工作周期数的增加,剩余寿命值逐渐递减,直至工作到最后一个周期时,轴承剩余寿命值减至零。 分别以此作为轴承各个周期的剩余使用寿命值。
将提取的时域特征作为LSTM的输入, 根据PSO优化流程, 首先将数据划分为训练数据和测试数据, 训练数据训练需要优化的LSTM模型,训练过程中,通过计算粒子适应度函数,同时更新粒子位置,以得到优化后的LSTM模型。 笔者采用Adam算法进行优化, 并使用多层LSTM堆叠的结构,首层LSTM在每个时间步输出结果,将返回的时间序列输入第2层LSTM, 该层只返回最后时间步结果,在LSTM层后添加全连接,使输出的特征维度为一维。 为防止模型过拟合,在模型中加入了随机丢弃层,丢弃概率设置为0.2。 笔者根据轴承寿命数据实际情况,设定批处理大小的取值范围为[10,50],隐藏层单元数目的取值范围为[50,100]。 在不同工况条件下分别选取了轴承1-1、2-1和3-1作为训练数据, 训练数据真实值与预测值对比如图3a、c、e所示;选取轴承1-5、2-6和3-3作为测试数据进行测试,测试数据真实值与预测值对比如图3b、d、f所示。 PSO优化后参数批处理大小为37,两层隐藏层单元数目分别为72、83。
从图3中可以看出,对于不同的轴承,该模型也可以对预设的轴承寿命曲线有较好的拟合效果,预测寿命在轴承退化后期,基本吻合轴承寿命曲线,也说明了模型对于复杂工况的适应性较好,训练好的模型也有较好的普适性。
图3 不同工况下的训练和预测效果
与此同时,为了验证模型的有效性,使用均方根误差RMSE和相关指数R2作为评价预测性能的指标,以此对实验进行结果分析,并将实验结果与其他模型的最优效果进行对比。
均方根误差公式如下:
从式(10)可以看出,RMSE可以反映预测值和真实值之间的偏差,但对于差值的正负不做区分,仅凭RMSE对预测效果进行评价不够全面。 因此,对于各个模型预测结果与轴承剩余寿命曲线的拟合程度用相关指数R2来评估,R2的值在0~1之间,其值越大,表明模型拟合效果越好。 R2定义如下:
表1 PSO-LSTM与其他4种模型的预测性能对比
通过以上分析可以看出, 笔者采用的PSOLSTM模型在RMSE和R2评价指标上都取得了较好成绩,对轴承寿命预测效果较好,尤其是轴承退化后期,预测值基本与实际值吻合,因此可以通过提取时域特征, 再将数据输入到PSO-LSTM模型中进行预测以得到剩余寿命的预估值。
笔者针对滚动轴承剩余寿命预测,首先对数据集提取时域特征, 并将它作为LSTM网络的输入,为了使网络模型与数据更契合,更加符合数据特点,同时采用PSO算法对LSTM网络的批处理大小和隐藏层单元数目进行优化,再使用优化后的LSTM网络模型进行训练,最后实现轴承剩余寿命的预测工作。 通过实验证明了该模型的可用性。