基于改进GWOLSTM的船舶主机性能预测模型

2022-06-26 22:46石彪王海燕焦品博
上海海事大学学报 2022年2期
关键词:灰狼矩阵向量

石彪 王海燕 焦品博

摘要:为提高船舶主机性能预测的精度,更好地帮助轮机员制定主机的维修保养计划,提出一種利用改进灰狼优化算法(grey wolf optimizer, GWO)对长短期记忆网络(long shortterm memory network, LSTM)进行优化的船舶主机性能预测模型,简称为改进的GWOLSTM模型。基于Metropolis接受准则的思想,在传统GWO中引入一种随机搜索机制来解决传统GWO前期收敛速度慢和后期易陷入局部最优的问题。分别建立单步预测模型和多步预测模型。与GWOLSTM和传统LSTM的预测结果进行对比,结果表明,改进GWOLSTM单步预测的均方根误差分别降低了3236%和5038%,多步预测的均方根误差分别降低了2616%和3557%。

关键词:  Metropolis接受准则; 长短期记忆网络(LSTM); 灰狼优化算法(GWO); 性能预测

中图分类号:  U6641211文献标志码:  A

Prediction model of marine main engine performance

based on improved GWOLSTM

Abstract: In order to improve the prediction accuracy of marine main engine performance and help engineers make better maintenance plan of main engines, a prediction model of marine main engine performance is proposed, where the improved grey wolf optimizer (GWO) is used to optimize the long shortterm memory network (LSTM). The model is called a modified GWOLSTM for short. Based on the idea of Metropolis acceptance criterion, a random search mechanism is introduced to the traditional GWO to solve the problem of slow convergence speed in the early stage and being easy to fall into the local optimum in the later stage of the traditional GWO. The onestep prediction model and the multistep prediction model are established, respectively. Compared with the GWOLSTM and the traditional LSTM, the results show that, the root mean square error of the onestep prediction of the improved GWOLSTM is reduced by 3236% and 5038%, respectively, and the root mean square error of the multistep prediction of the improved GWOLSTM is reduced by 2616% and 3557%, respectively.

Key words: Metropolis acceptance criterion; long shortterm memory network (LSTM); grey wolf optimizer (GWO); performance prediction

引言

船舶主机作为船舶的心脏,长期处于复杂多变的工作环境中,运行时间越长其工作性能就越差。掌握主机性能变化趋势,有助于轮机员制订维修保养计划[1],不仅可以预防故障的发生,还能减少停机、停航时间,节约成本。

船舶主机性能受多种因素影响,对船舶主机性能变化的预测是一种复杂且不稳定的非线性问题。目前,主机性能趋势的预测方法由基于模型驱动逐渐转变为基于数据驱动。基于模型驱动的方法过于复杂,且泛化性能较差,很难处理非线性问题。在基于数据驱动的方法中,循环神经网络(recurrent neural network,RNN)因其具有特殊的网络结构而适合处理这种非线性问题,并且由于RNN还引入了时序的概念,它能更好地分析主机性能变化趋势。1997年HOCHREITER等[2]对RNN的结构做了进一步的改进,提出了长短期记忆网络(long shortterm memory,LSTM),不仅有效地缓解了RNN中梯度爆炸和梯度消失的问题,而且解决了RNN的长时依赖的问题。

近年来,LSTM在船舶设备性能、寿命等方面的评估中得到了广泛的应用。王子铭等[3]使用LSTM建立了船舶主机油耗实时预测模型,结果表明该模型预测结果可靠、误差较小。易文海等[4]使用LSTM建立波浪与船舶的因果关系模型,对随机横浪中船舶的横摇运动进行短期预测,结果表明此方法可行。QIAO等[5]使用LSTM实时预测动态系泊线响应,结果表明该方法预测精度较高。SHI等[6]利用LSTM对船舶柴油机的整体性能做了预测,结果表明该方法可以用于船舶性能的短期预测和长期预测。

LSTM在训练数据时普遍使用随时间反向传播(back propogation through time,BPTT)算法,但该算法因复杂度较高、学习效率低而效率低下。灰狼优化算法(grey wolf optimizer,GWO)作为启发式算法的一种,相比于其他启发式算法具有结构简单、容易实现和需要人为调整的超参数较少的优点[78],适合用于本文的研究。基于此,本文提出用GWO代替BPTT算法寻优的思路,针对传统GWO前期收敛速度慢和后期易陷入局部最优的缺点,利用Metropolis接受准则思想提出随机搜索机制,对GWO的结构进行改进。使用改进后的GWO来优化LSTM,提高船舶主机性能预测精度。

1主机性能指标

1.1监测参数与数据来源

本文研究数据采集于上海海事大学自动化机舱实验室,采集对象是MAN B&W 6S35MEB9型号的主机,该主机的主要技术参数见表1。

综合信息系统通过传感器收集监测参数,参数经过处理后保存至数据库。传感器采样间隔时间为1 min。柴油机的转速和功率信号通过磁电式测试仪采集,温度信号由pt100温度传感器采集,压力信号由压力变送器采集。

1.2性能参数选择

影响船舶主机性能的热力参数众多,合理选择热力参数是预测船舶主机性能的前提。本文的主机监测数据均是在实验室固定环境下采集的,因此环境温度、环境压力、环境湿度等外界参数可以视为固定不变。本文选取的主机性能参数见表2。

表2本文选取的主机性能参数性能参数选择原因功率、转速反映主机的动力性[910]扫气压力、扫气温度反映主机的换气性能冷却滑油温度、滑油入口温度、

本文参数的选择基于两个方面的原因:一是便于采集,不需要加装额外的传感器;二是轮机员也依靠这些参数来判断主机的性能状况。

1.3性能指标

采集该主机运行1745 h的性能数据作为数据源,对数据处理后,选取50%负荷、转速稳定在114 r/min下的数据作为观测样本,观测样本共1 009个,每个样本均含有20个性能数据。以主机出厂试车数据中50%负荷试车工况(见表3)下的100组试车样本数据作为初始性能样本,计算观测样本到初始性能样本的马氏距离。马氏距离可以描述两个样本之间的偏离程度。柴油机的性能参数具有量纲不同、变化不一和相关性强的特点,通过直接观测多个性能参数判断柴油机的工作状态容易产生混乱,特别是在某些性能参数的变化与柴油机的整体性能变化不一致甚至趋势相反时。马氏距离的优势在于:(1)马氏距离的计算中包括样本总体协方差的计算,它考虑了样本的总体分布,消除了各变量之间的相关性;(2)马氏距离不受数据量纲的影响,即两点之间的马氏距离与原始数据的测量单位无关。因此,本文用马氏距离来表示柴油机性能的退化程度。马氏距离越大,说明主机性能退化得越严重。马氏距离数学表达式如下:(1)式中:DM为观测样本到初始样本的马氏距離;x为观测样本矩阵;u为初始样本的均值矩阵;S-1为初始样本的协方差矩阵。

为了较直观地描述主机性能的退化过程,将马氏距离归一化成性能指标。性能指标值越小,说明主机性能退化越严重,其数学表达式如下:(2)式中:α为调节因子。α的计算式为(3)式中:P0为主机工作初期的性能指标值;DM,0为主机工作初期性能的马氏距离。

根据式(1)计算观测样本到初始样本的马氏距离。从图1可以看出,随着运行时间的增加,马氏距离越来越大。在0号样本处,DM为529×105,说明此时主机的整体性能已经远远偏离初始性能,且处于退化加剧期。柴油机性能退化过程主要有两个阶段:一是缓慢退化期,此阶段柴油机性能接近其出厂性能,马氏距离较小;二是退化加剧期,此阶段柴油机性能退化速度加剧,马氏距离较大。

根据式(3)确定式(2)中的α值,再根据式(2)将不同时刻的DM归一化成P。当α=1.2时,P均匀分布在0与1之间。由图2可以看出,主机性能曲线整体上呈下降趋势,表示主机性能逐渐退化。

将前80%的观测样本作为训练样本进行模型训练和参数调整,后20%的观测样本作为测试样本进行模型评估和预测结果分析。

2预测模型

本文首先对传统GWO的结构进行改进,然后在改进GWO的基础上建立改进GWOLSTM船舶主机性能预测模型。

2.1LSTM

LSTM与RNN最大的不同在于,LSTM神经元中具有3个“控制门”和2种状态,见图3。在这种结构下,LSTM的细胞状态可以随时间进行信息传递,并通过“门”增删信息,使得LSTM具有记忆功能[13]。

首先,遗忘门进行信息筛选,剔除掉部分信息,公式如下:(4)式中:ft为t时刻神经元的遗忘门矩阵;Wf为遗忘门权重矩阵;Xt为t时刻神经元的输入矩阵;ht-1为t-1时刻神经元的隐藏状态输出矩阵;bf为遗忘门偏置矩阵。

其次,输入门决定细胞状态的哪些信息被保留,表达式如下:(5)

(6)

(7)式中:It为t时刻神经元的输入门矩阵;C~t为t时刻神经元的细胞候选状态矩阵;Ct为t时刻神经元的细胞状态矩阵;WI为输入门权重矩阵;bI为输入门偏置矩阵;Wc为细胞候选状态权重矩阵;bc为细胞候选状态偏置矩阵;⊙为矩阵的点乘。

最后,输出门决定当前时刻神经元的输出,表达式如下:(8)

(9)式中:ot为t时刻神经元的输出门矩阵;Wo为输出门权重矩阵;bo为输出门偏置矩阵;ht为t时刻神经元的隐藏状态输出矩阵。

2.2GWO

2014年,MIRJALILI等[14]提出一种新的群体智能优化算法——GWO。GWO通过模拟狼群中的等级制度,将狼群中的狼分为由高到低4个等级:Alpha、Beta、Delta和Omega。Alpha狼是狼群中唯一的领导者,领导着种群捕猎。捕猎分为3个阶段:

(1)包围。在Alpha狼的带领下,狼群先包围猎物,数学模型如下:(10)

(11)式中:下标i为迭代次数,i=0,1,…,n;D为灰狼与猎物之间的距离;Xp,i为迭代次数为i时的猎物位置向量;Xi为迭代次数为i时的灰狼位置向量;Xi+1为迭代次数为i+1时的灰狼位置向量;A和C为系数向量。A和C表达式为(12)

(13)式中:r1和r2为元素取值在区间[0,1]内的随机向量;a为控制参数,随迭代次数的增加从2线性减少至0。

(2)猎捕。狼群包围猎物后,Alpha狼、Beta狼、Delta狼离猎物的距离最近,狼群将在Alpha狼、Beta狼和Delta狼的带领下向猎物逼近,Omega狼的位置更新如下:(14)

(15)

(16)

(17)

(18)

(19)

(20)式中:Dα、Dβ、Dδ分别为当前Omega狼与Alpha狼、Beta狼、Delta狼之间的距离;Xα、Xβ、Xδ分别为Alpha狼、Beta狼、Delta狼的位置向量。

(3)进攻。该阶段的目标是捕获猎物,即获得最优解。GWO通过减小a的值模拟逼近猎物的过程。当a逐渐减小时,A的元素取值也在[-a,a]区间内。当A<1时,狼群能够攻击到猎物;当A>1时狼群会向四周散去,导致狼群失去最优位置,这也是GWO容易陷入局部最优的原因[15]。

2.3改进GWO

GWO的缺点是前期收敛速度慢和后期易陷入局部最优[16]。本文借鉴模拟退火的Metropolis接受准则思想,对GWO的不足进行改进。Metropolis接受准则是指以一定的概率接受新状态,从而使算法有能力跳出局部极值和避免过早收敛。接受新状态的概率为

(21)

式中:p(ON)为从状态O转移为状态N的概率;f(N)和f(O)分别为状态O和状态N的目标函数值;c为控制参数。

基于Metropolis接受准则思想,本文提出随机搜索机制,即在灰狼种群围捕猎物的过程中,赋予每只灰狼在自身一定范围内的随机搜索能力,当灰狼到达新位置时,对灰狼的新位置进行适应度值计算,然后与旧位置的适应度值进行比较。若新位置的适应度值小于旧位置的适应度值,灰狼将留在新位置;否则,灰狼返回旧位置。数学模型如下:(22)

(23)式中:f(Xi)为灰狼原位置的适应度值;f(Xi,new)为灰狼新位置的适应度值;vmax和vmin分别为解空间的上限和下限;r为随机向量,其元素取值在[-1,1]区间内;w为随机搜索因子。w由下式进行更新:

(24)

式中:inow和imax分别为当前迭代次数和最大迭代次数;wmax为最大搜索因子,设置为0.01;wmin为最小搜索因子,设置为0.001。

图4搜索因子随迭代次数的变化w的值随迭代次数的增加非线性递减,见图4。当w的值较大时,灰狼随机搜索的范围较大,可以更好地尋找全局最优解;当w的值较小时,灰狼进行随机搜索的范围变小,能精确地找到局部最优解。

2.4改进GWOLSTM船舶主机性能预测模型

2.4.1模型优化

使用改进GWO来优化LSTM,其优化参数为LSTM中的权重和偏置。使用向量J来表示LSTM所有的权重和偏置参数,公式如下:(25)式中:J=(J1,J2,…,JK);fre(·)为可以将矩阵转换成列向量的函数;W为LSTM的各权重矩阵;b为LSTM的各偏置矩阵。

优化目标是使测试样本的预测值与实际值之间的差值最小。目标函数如下:min f(Y′,Y)

(26)式中:Y′为预测值;Y为实际值。

本文使用均方根误差(root mean square error,RMSE)函数作为3种智能算法优化的目标函数,数学表达式为f(Y′,Y)=1nni=1(Y′i-Yi)2(27)式中:n为样本数。

2.4.2模型预测流程

模型预测流程见图5,具体步骤如下:

步骤1根据权重和偏置取值范围随机初始化灰狼的位置向量,数学表达式为X0=(r(1),r(2),…,r(K))(28)式中:X0为当前灰狼的初始位置向量;r(1),r(2),…,r(K)均为0与1之间的随机数。

步骤2将灰狼的初始位置向量赋值给LSTM中的权重和偏置(数学表达式如式(28)),利用训练样本对模型进行训练,以RMSE为适应度函数,将RMSE值中最低的3只灰狼分别作为Alpha狼、Beta狼和Delta狼。(29)步骤3更新灰狼的位置,并计算各灰狼的适应度值,选出新的Alpha狼、Beta狼和Delta狼。

步骤4判断是否达到最大迭代次数,若未达到则返回步骤3,否则将Alpha狼的位置向量赋值给LSTM中的权重和偏置,数学表达式为(30)式中:Xα,max为经历了最大次数的迭代后Alpha狼的位置向量。

步骤5输入测试样本进行预测。

3实验与结果

基于.NET 45.2平台使用C#编程语言分别建立LSTM、GWOLSTM、改进GWOLSTM的单步预测模型和多步预测模型,并利用MATLAB绘制预测结果。单步预测是指以固定长度的历史序列预测下一步的序列值;多步预测是指根据固定长度的历史序列预测未来连续多个时间步的值。使用第1.3节的样本分别训练预测3次,然后对预测结果进行对比分析。

3.1模型评价标准

通过输入测试样本得到预测结果的RMSE和平均绝对值误差(mean absolute error,MAE)作为模型的评价指标。预测结果的RMSE和MAE越低,表示模型预测值与实际值的偏差越小,预测精度越高,模型的预测效果越好。MAE的数学表达式为(31)

3.2模型参数设置

该改进GWOLSTM模型由输入层、1层LSTM层和输出层组成,输入维数为1,输出维数为1,灰狼种群数为30,迭代次数为500。隐藏层节点数一般依靠经验设定,先根据输入维数和输出维数确定隐藏层节点数范围,然后根据实验选定单步预测模型的隐藏层节点数为5,输入层节点数为5,输出层节点数为1。

3.3单步预测

改进GWOLSTM模型、GWOLSTM模型和LSTM模型的预测结果见图6。各模型评价指标对比见表4和5。由图6、表4和表5可以看出,在3组实验中,改进GWOLSTM模型的预测值曲线与真实值曲线最为吻合,其RMSE和MAE均比其他模型的低。改进GWOLSTM模型的RMSE值比LSTM模型、GWOLSTM模型的分别低了5038%、3236%。这说明改进GWOLSTM模型在船舶主机性能单步预测方面,预测效果最好,预测精度最高。

3.4多步预测

多步预测主要有两种策略:递归多步策略(又叫迭代多步策略)和直接多步策略[17]。递归多步策略先训练出一个单步模型,使用该模型预测下一个时间步的值,然后将该预测值作为输入预测下一个时间步的值,逐渐循环,直到预测到第b步为止。该方法使用预测值代替真实值,因此该方法会累积预测误差,导致预测结果的偏差较大,且该模型的性能会随着时间的增加而急剧下降。直接多步策略是直接训练出一个b步预测模型,该模型使用a-h至a时间步的时间序列作为输入,预测a+1至a+b时间步的值。因此本文采取直接多步策略进行预测。先训练一个五步预测模型,每个时间步的长度为1 min;该模型的隐藏层节点数为10,输入层节点数为5,输出层节点数为5。

根据预测结果,计算这3种模型的评价指标,结果见表6和7。从表6、表7和图7(各模型多步预测结果比较)可以看出,3组数据中,改进GWOLSTM模型的预测值与实际值最为贴近,其RMSE和MAE也比其他模型的低。改进GWOLSTM模型预测结果的RMSE值比LSTM模型、GWOLSTM模型的分别低了3557%、2616%。这说明改进GWOLSTM模型在船舶主机性能多步预测方面,仍具有最好的预測精度和预测效果。

4结论

为提高对船舶主机性能的预测精度,在传统灰狼优化算法(GWO)中增加一种随机搜索机制,用改进的GWO代替随时间反向传播(BPTT)算法优化长短期记忆网络(LSTM)。分别用改进GWOLSTM模型、GWOLSTM模型和LSTM模型对船舶主机性

能进行预测,结果表明:改进GWOLSTM模型相对于GWOLSTM模型和LSTM模型,单步预测的RMSE值分别低了3236%和5038%,MAE值分别低了3513%和522%;多步预测的RMSE值分别低了2616%和3557%,MAE值分别降低了3049%和4301%。参考文献:

[1]刘伊凡. 营运船舶主机性能退化和健康管理方法研究[D]. 大连: 大连海事大学, 2018.

[2]HOCHREITER S, SCHMIDHUBER J. Long shortterm memory[J]. Neural Computation, 1997, 9(8): 17351780. DOI: 101162/neco.19979.81735.

[3]王子铭, 陈顺怀. 基于LSTM神经网络的船舶主机油耗实时预报[J]. 武汉理工大学学报(交通科学与工程版), 2020, 44(5): 923927. DOI: 103963/j.issn.20953844202005030.

[4]易文海, 高志亮. 基于LSTM神经网络的随机横浪中船舶横摇运动极短期预报[J/OL]. 武汉理工大学学报(交通科学与工程版), 2021, 45(6): 11131117. DOI: 103963/j.issn.20953844202106020.

[5]QIAO D S, LI P, MA G, et al. Realtime prediction of dynamic mooring lines responses with LSTM neural network model[J]. Ocean Engineering, 2021, 219: 108368. DOI: 101016/j.oceaneng.2020108368.

[6]SHI B J, SHI H J, WANG H Y. Performance prediction of marine diesel engine based on long shortterm memory network[C]∥Proceedings of the 2nd International Conference on Artificial Intelligence and Computer Science. Journal of Physics: Conference Series, 2020: 1631(1): 012135.

[7]HU P, PAN J S, CHU S C. Improved binary grey wolf optimizer and its application for feature selection[J]. KnowledgeBased Systems, 2020, 195: 105746. DOI: 101016/j.knosys.2020105746.

[8]张新明, 姜云, 刘尚旺, 等. 灰狼与郊狼混合优化算法及其聚类优化[J/OL]. (20200326)[20210518]. 自动化学报: 117. DOI: 1016383/j.aas.c190617.

[9]刘世元, 杜润生, 杨叔子. 利用转速波动信号诊断内燃机失火故障的研究(1): 诊断模型方法[J]. 内燃机学报, 2000, 18(3): 315319. DOI: 1016236/j.cnki.nrjxb.200003020.

[10]孙秀成, 谭亲明, 曾向明, 等. 基于油耗率的船用低速柴油机燃烧故障诊断[J]. 中国航海, 2018, 41(4): 2327.

[11]张博, 张萍, 郭旭, 等. 基于试验设计遗传算法的船用柴油机冷却系统多目标优化[J]. 推进技术, 2020, 41(11): 25182529. DOI: 1013675/j.cnki.tjjs.200317.

[12]夏洪永. 船舶主机冷却水出口温度控制系统[J]. 舰船科学技术, 2018, 40(12): 121123. DOI: 103404/j.issn.1672764920186A.041.

[13]LIU J Q, PAN C L, LEI F, et al. Fault prediction of bearings based on LSTM and statistical process analysis[J]. Reliability Engineering & System Safety, 2021, 214: 107646. DOI: 101016/j.ress.2021107646.

[14]MIRJALILI S, MIRJALILI S M, LEWIS A. Grey wolf optimizer[J]. Advances in Engineering Software, 2014, 69: 4661. DOI: 101016/j.advengsoft.201312007.

[15]張晓凤, 王秀英. 灰狼优化算法研究综述[J]. 计算机科学, 2019, 46(3): 3038. DOI: 1011896/j.issn.1002137X.201903004.

[16]龙文, 蔡绍洪, 焦建军, 等. 一种改进的灰狼优化算法[J]. 电子学报, 2019, 47(1): 169175. DOI: 103969/j.issn.03722112201901022.

[17]TAIEB S B, ATIYA A F. A bias and variance analysis for multistepahead time series forecasting[J]. IEEE Transactions on Neural Networks and Learning Systems, 2016, 27(1): 6276. DOI: 101109/TNNLS.20152411629.

(编辑贾裙平)

收稿日期: 20210511修回日期: 20210926

基金项目: 上海市科技计划(20DZ2252300)

作者简介: 石彪(1997—),男,山东菏泽人,硕士研究生,研究方向为轮机自动化、船舶主机性能预测,(Email)18800205042@163.com;

王海燕(1976—),男,河北平山人,副教授,博士,研究方向为轮机自动化、船舶动力装置仿真,(Email)wanghaiyan@shmtu.edu.cn

猜你喜欢
灰狼矩阵向量
向量的分解
灰狼和山羊
谷谷鸡和小灰狼
灰狼的大大喷嚏
多项式理论在矩阵求逆中的应用
灰狼照相
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
矩阵
矩阵