魏强强,李 欣,李新超,卢文月
(1. 上海交通大学 海洋工程国家重点实验室,上海 200240; 2. 上海交通大学 三亚崖州湾深海科技研究院,海南 三亚 572024; 3. 海洋石油工程股份有限公司,天津 300461)
近年来,随着海洋工程逐步向深海进发,半潜平台作业环境变得越来越恶劣,平台的耦合运动响应特性变得十分复杂,这种平台运动的不规则性和随机性对平台作业、栈桥(Gangway)控制以及直升机起落等造成极大的不确定和未知风险,对半潜平台的运动响应预报可有效规避这些风险,具有重要的工程意义[1-3]。
对浮体运动响应的极短期预报国内外都做了一定的研究工作[2-3],概括起来有流体力学方法、时间序列分析法和基于神经网络的预测模型。对于流体力学方法,一般需要假设波浪运动和平台运动是各态历经的平稳随机过程,且浮体为线性系统,基本适用于小振幅波浪引起的运动响应,对非线性效应明显的深水半潜平台运动响应的预测效果不太理想。与之相比,统计学方法仅需要平台本身运动响应的历史数据进行分析寻求规律并进行预报。
1949年,Wiener[4]提出了一种平稳的统计预报方法,但该方法需要知道预报信号的功率谱,实际应用中有诸多限制。Kaplan[5]提出利用卷积法对舰船运动进行预报。但由于缺少合适的核函数,因此实际应用中效果较差。
1994年,Broome等[6]采用ARMA方法对海试数据进行预报,对横摇的有效预报时间达到10 s。彭秀艳[7]提出递推最小二乘法对AR模型参数进行自适应估计,有效预报时间达10 s。Wei等[8]基于ARMA模型对舰载直升机平台升沉位移进行多步预测。杨震[9]采用基于改进支持向量机(SVR)的方法对船舶横摇运动姿态进行预报,提升了预报模型的自适应性。吴爽等[10]提出了基于小波变换的递推最小二乘的估计算法对舰船横摇运动进行预报,很好地解决了横摇运动在线自适应预报问题。唐刚等[11]提出Newton-ARMA模型提高了船舶升沉运动的预测精度。
丰雁等[12]采用对角回归神经网络模型对船舶纵摇进行预报。盖晓娜等[13]提出了复合的小波_SVR组合方法应用于平台运动的极短期预报,对非平稳时间序列进行分解。刘煜城[14]结合LSTM神经网络提出基于自相关函数的定阶方法对船舶升沉数据做出了有效预测。
从频谱分析可以知晓纵荡和横荡响应以低频的自振周期的频率为主,而波频的运动响应成分较少。而垂荡、横摇和纵摇运动响应周期与波浪相近,低频的运动响应成分较少,属于波频运动[15-16]。但在波浪作用下会发生垂荡、纵摇和横摇的非线性耦合效应,特别是当波浪频率接近垂荡和纵摇固有频率之和时,会引起平台较强的非线性耦合运动,而且平台浮力和恢复力的周期性变化也会引起平台的非线性响应[17]。因此半潜平台运动响应具有较高的时间相关性和较强的非线性。为了解决运动响应的复杂特性和复杂的频域信息,信号分解必不可少,而上述文献中的方法没有很好地处理这个问题,因此采用经验模态分解(EMD)[18]算法将复杂的非线性时间序列分解为平稳的不同分量,再结合长短时记忆网络(LSTM)[19]处理长时间序列的能力,提出一种复合的EMD-LSTM预报方法,对在水池模型试验的半潜平台运动响应数据进行仿真预报,并通过对比证明该方法的有效性。
经验模态分解(empirical mode decomposition,简称EMD)[20]算法是一种新的信号处理时频分析方法,尤其适用于非线性、非平稳性时间序列的处理。不同于傅里叶变化和小波变化,EMD算法可以在不需要知道任何先验知识的情况下,依据自身时间尺度特征来进行信号分解处理,EMD被认为是对以线性和平稳假设为基础的傅立叶分析和小波变换等传统时频分析方法的重大突破[21]。EMD算法可将时间序列分解成有限个本征模函数(intrinsic mode function,简称IMF)和一个趋势项(残差),分解出的IMF分量反映了原时间序列的不同时间尺度的波动信息。
EMD的分解过程是:对给定的时间序列x(t),先确定所有极值点,再分别对极大值点和极小值点通过插值拟合得到上下包络线xmax和xmint,其均值记为m(t),将原时间序列减去该平均值,得到一个新的时间序列h(t):
h(t)=x(t)-m(t)
(1)
如果h(t)满足IMF分量的两个条件:一是信号零点数和极值点数相同或最多相差一个;二是信号是零均值,则h(t)是IMF分量,否则用h(t)代替原时间序列继续筛选,直到满足两个约束条件。每得到一个IMF分量就从原时间序列中移去,重复以上筛选步骤,直到得到单调序列或者常值序列Rn,则EMD分解过程结束。原时间序列x(t)的EMD分解表达式为:
(2)
长短期记忆(long short-term memory,简称LSTM)[19-22]神经网络是一种特殊的循环神经网络,解决了传统循环神经网络的梯度消失和爆炸问题,对时间序列具有较强的学习能力,因此,长短期记忆(LSTM)神经网络可以处理复杂的非线性长时间序列[23-24]。在LSTM体系结构中,有三种特殊的结构赋予了其在长时间序列中处理相关性的能力,它们分别是“遗忘门”“输入门”和“输出门”。以一个记忆单元为例,LSTM模型的结构示意如图1。
图1 长短时记忆单元(LSTM)结构示意Fig. 1 LSTM structure diagram
在LSTM神经网络是记忆单元中,“遗忘门”ft可控制上一记忆单元状态Ct-1被遗忘的程度,“遗忘门”ft由上单元的输出ht-1与本单元的输入xt经激活函数得到,其值域为[0,1],“0”表示完全遗忘,“1”表示完全保留。“遗忘门”ft表示为:
ft=σ(Wxfxt+Whfht-1+bf)
(3)
式中:Wxf、Whf为“遗忘门”的权重系数,bf为“遗忘门”的偏置系数,σ为“sigmoid”激活函数。
it=σ(Wxixt+Whiht-1+bi)
(4)
(5)
(6)
式中:W为权重系数,b为偏置系数,σ为“sigmoid”激活函数,符号“·”表示点乘积。
在LSTM神经网络是记忆单元中,“输出门”可控制记忆单元的输出,记忆单元的最终输出由tanh函数激活更新后的单元状态Ct,并通过“输出门”,用数学表达式如下:
Ot=σ(Wxoxt+Whoht-1+bo)
(7)
ht=Ot·tanh(Ct)
(8)
式中:Wxo、Who为“输出门”的权重系数,bo为“输出门”的偏置系数,σ为“sigmoid”激活函数,符号“·”表示点乘积。
海面平台在复杂的海洋环境下,由于波浪力和其他干扰力的存在,平台运动姿态的时间序列普遍具有复杂特性,对于这种非平稳、非线性预报问题,通过对EMD算法和LSTM模型的研究,提出了基于EMD-LSTM的预测模型[25],用以实现平台的极短期预报,整体的流程图如图2。
图2 EMD-LSTM模型流程图Fig. 2 EMD-LSTM flow chart
基于EMD-LSTM模型的预测步骤:
步骤一:先将待分析的时间序列进行预处理,即降低原始数据的采样频率,减少数据量,选取合适大小的数据集,在保证预测精度的前提下,降低训练时间;
步骤二:将处理过的时间序列通过EMD分解算法,分解得到n个本征模函数(IMF1,IMF2,……,IMFn)和残差(Rn);
步骤三:对所有的IMF分量和残差分别建立LSTM模型,对所有分量进行预测,将预测结果累加得到最终预测结果。
陵水17-2半潜式平台位于南海北部西部大陆架琼东南盆地北部,作业水深为1 220 m到1 560 m,为了研究陵水17-2半潜平台的性能,在深水试验池中完成模型试验。选定模型缩尺比为1∶60,模型示意如图3,平台主尺度如表1。
图3 陵水17-2半潜平台模型示意Fig. 3 Sketch of the LS17-2 semi-submersible platform model
表1 平台主尺度
深水试验池尺寸为50 m×40 m×10 m(长×宽×深),模型的系泊锚链超过水池最大长度,因此采用等效截断系泊系统代替原型,模型实物图如图4所示。试验中采用电阻式浪高仪测量波浪波高、周期以及波面相对升高,采用非接触式光学六自由度运动测量系统测量平台模型重心处的六自由度运动。在波浪试验过程中,为了避免瞬态效应,数据采集系统在模型运动达到稳态后才开始采集所需的数据信号,稳态后的采样持续时间大于23.24分钟(对应实际3小时),采样频率为60 Hz[26]。试验内容包括:静水衰减试验;白噪声不规则波试验;不规则波风浪流试验。选取陵水17-2半潜平台在4种不同波浪条件(如表2)下的垂荡运动数据进行分析预测。
图4 陵水17-2半潜平台模型Fig. 4 LS17-2 semi-submersible platform model
表2 波浪条件
模型试验中获得的初始数据采样频率为60 Hz,根据采样定理[27]在完整保留信号的情况下降低采样频率至12 Hz,处理后的数据换算成实船的采样时间间隔为0.65 s,选取垂荡数据中10 000个数据点,并预测之后的50个时间步,即预测之后的32 s,在Matlab中利用经验模态分解(EMD)算法将时间序列分为4个IMF分量和一个残差分量,选取1号工况部分数据进行分解结果展示,如图5。
图5 经验模态分解结果Fig. 5 Empirical modal decomposition results
每个工况都选取预处理后的垂荡时间序列数据中的10 000个数据点,对经过分解的所有的IMF分量和残差分别建立LSTM模型,因此,每个LSTM模型的数据集为10 000个数据点,共计20个数据集。所有IMF分量和残差的LSTM模型训练集和测试集按4∶1划分,每个训练集为8 000个数据点,测试集为2 000个数据点。隐藏层维度设置为250,迭代次数为100。
预测方法采用滑窗预测,用前50个数据点预测后一个,再用预测出的数据代替第一个数据,即用xt-50、xt-49、……、xt-1预测xt,再用xt-49、xt-48、……、xt-1和预测出的xt预测xt+1,并依次向后滑动预测。将预测结果累加得到最终预测结果,将所提出的EMD-LSTM模型的预测结果同LSTM模型和EMD-BP模型的预测结果进行比较,比较结果如图6。
图6 不同模型预测结果对比Fig. 6 Comparison of prediction results of different models
从图6中可以看到EMD-LSTM模型的预测曲线与实际值的变化趋势基本相同,较其他模型预测误差小,可以看出所提出模型的优越性。从预测结果图形上看,EMD-LSTM模型的有效预测时间达20 s,相比之下,LSTM模型和EMD-BP模型有效预测时间大概为5~10 s,所以在处理极短期运动响应的预测问题上,EMD-LSTM模型有较好的效果。
对传统的LSTM模型预测结果通常使用两个评价标准,即均方根误差(RMSE)和平均绝对百分比误差(MAPE),其中均方根误差衡量的是预测结果和事实的平均误差,而平均绝对百分比误差直观的表示了误差的百分比,其计算公式分别为:
(9)
(10)
由于此次使用的试验数据为平台模型的垂荡数据,实际值存在零点,所以无法使用平均绝对百分比误差(MAPE),即采用均方根误差(RMSE)作为预测结果的整体评价标准。同时实际工程中对极值也是十分关心,而预报模型一般预测都偏保守,即对极值预测的绝对值都偏小,因此对极值预测结果的评价有利于判断预测模型的好坏,本文采用均方根误差(RMSE)和绝对百分比误差(MAPE)对极值预测结果进行评估。
计算不同方法的均方根误差随预测时间变化,得到如图7的结果。计算各模型的5 s、10 s和20 s处的均方根误差,加粗为每组最优值,结果如表3所示。分别计算不同预测方法的前三个极值的均方根误差和绝对百分比误差,加粗为每组最优值,结果如表4所示。
图7 不同模型的均方根误差Fig. 7 Root mean square error of different models
从图7、表3和表4可以十分明显地看出,提出的EMD-LSTM模型预测精度最高。分析结果表明:
1) 比较表3中EMD-LSTM和LSTM模型在各工况5 s、10 s和20 s处的均方根误差,可以看出EMD-LSTM模型的预测误差一直小于LSTM模型,这表明在LSTM直接预测中,由于运动响应数据包含复杂的频域信息,难以提取足够多的信息,而EMD分解算法将组成原始信号的各尺度分量不断从高频到低频进行提取,有助于减轻原始时间序列的噪声,平稳的信号分量更有利于LSTM模型去预测,从而获得更好地预测效果。
2) 由表3中EMD-LSTM和EMD-BP模型在各工况5 s、10 s和20 s处的均方根误差,可以看出除4号工况外,EMD-BP模型只在前10个时间步(5~10 s)预测效果尚可,但之后误差陡增,这是BP网络无法将信息在时间维度上从前往后的传递和积累,而LSTM网络可以处理长时间序列,完成时间维度上的长期记忆问题。
表3 不同模型均方根误差比较
3) 在实际工程中十分关心的极值的预测,从表4可以看出在预测前三个极值时,EMD-LSTM模型也表现得最好。EMD-LSTM模型在各工况下的预测结果平均绝对百分比误差(MAPE)分别为5.03%、3.47%、11.94%、5.80%,在每个工况下表现都为最优;EMD-LSTM模型在各工况下的预测结果均方根误差(RMSE)分别为0.1876、0.1968 、0.0427、0.0189,在每个工况都远好于另两种模型,其中在1号工况下表现最为优异,均方根误差是LSTM模型预测结果的53%,是EMD-BP模型预测结果的13%。
表4 不同模型极值误差比较
采用EMD分解算法将复杂的、非线性的平台垂荡运动响应时间序列分解成平稳的信号分量,隔离了不同尺度的垂荡运动响应数据之间的相互影响,而LSTM模型不同于以往的循环神经网络,其处理长时间序列的能力十分突出,利用LSTM模型对不同分量分别建立预测模型,最后将各序列预测结果相加,得到最终预测。对比结果表明,将EMD算法和LSTM模型结合起来的复合方法大大提高了模型的预测能力与预测精度,相较于单一的LSTM模型、处理长时间序列能力较弱的EMD-BP模型,对处理复杂的非平稳非线性时间序列具有更好的效果,并且预测速度较快,具有实际工程意义。EMD-LSTM模型可以成功预测,本质上利用了运动的连续性和运动不会突变的性质,因此可以对运动响应时间序列的历史数据进行训练,然后完成极短期预测。目前仅对试验模型数据进行预报,下一步,将利用原型数据进行预报比较误差;同时从提取信号关键特征入手,提高预测模型的可靠性,进一步优化对非线性效应明显的情况下的运动响应预测,并继续研究属于低频运动的纵荡和横荡,对其进行分析预测。