朱大鹏 俞孟蕻 苏 贞
(1.江苏科技大学电子信息学院 镇江 212100)(2.江苏科技大学海洋装备研究院 镇江 212003)
在形式各异的疏浚工程船舶中,耙吸挖泥船由于具有独立工作能力和很强的环境适应能力而在挖泥船中占有重要地位,是全球疏浚领域的主力军[1~5]。预测耙吸挖泥船的产量对于提升挖泥船的疏浚效率具有明显的帮助,通过耙吸挖泥船产量的预测,可以在施工过程中选择挖泥船的最优施工参数,从而提升挖泥船的疏浚效率和工程效益。
耙吸挖泥船的产量受到船舶航行速度、耙头对地角度、泥泵吸入真空、溢流堰高度、船舱参数、砂土特性等因素的影响,因此耙吸挖泥船的生产过程是一个复杂的、高难度的过程。Wangli[6]则通过把装舱过程分为无溢流阶段、恒体积阶段和恒载重阶段对装舱指标进行评估分析。王培胜[7]从疏浚机理出发,对挖泥船的装舱过程进行动态建模,对溢流密度与溢流流量进行了预测。王湘[8]通过使用遗传算法优化疏浚模型,表明改变施工参数可以有效提高挖泥船的疏浚效率。孙健[9]通过使用遗传算法对BP神经网络进行优化,以此来预测干土方生产率。
耙吸挖泥船的施工数据是基于时间序列的数据,数据之间存在时间滞后的问题,而这些方法大多没有考虑时间序列之间的滞后、依赖问题,且并未涉及未来时刻的目标参数的预测。因此采用了基于时间序列的循环神经网络进行产量预测模型的建立。与传统的机器学习相比,循环神经网络引入了“记忆”的概念,从内部结构上建立了输入变量随时间的变化关系,对于数据滞后、长期依赖、多步预测的情况有较好的预测效果。
循环神经网络对于时间序列的数据具有很好的处理能力,对非线性、多步预测问题可以取得很好的预测效果,因此采用循环神经网络对耙吸挖泥船进行产量预测模型的构建[10]。GRU神经网络是循环神经网络的一个变种,它通过使用同一个门控单元——更新门来同时进行信息的遗忘和记忆,从而使计算更加便捷,提高训练效率[11]。
GRU神经网络引入了两个门函数,分别是更新门和重置门,其结构如图1所示[12]。
由图1可知,GRU网络的前向传播公式如下所示:
在上述公式中,Xt、Ht分别为隐含层的输入和输出,Yt为输出层的输出,而Rt、Zt和H~t则分别是隐含层结构中重置门输出、更新门输出和候选记忆单元输出[13]。在对GRU网络结构的学习中,首先通过上一个时刻的输出Ht-1和当前时刻的输入Xt来获取两个门控状态——重置门Rt和更新门Zt,两者均输出一个值域为[0,1]的值。参数Wℎr、Wxr、Wℎz、Wxz、Wℎℎ~、Wxℎ~、Wℎy、br、bz、bℎ~的学习更新过程是一个误差反向传播的过程,其中t-1时刻隐含层的输出的偏导是由t时刻各个门的输入的偏导所组成:
式中δℎ,t、δℎ~,t、δz,t、δr,t分别为t时刻网络的隐含层、候选记忆单元、更新门和重置门的偏导。
在进行预测模型搭建之前需要先对施工数据进行处理。首先通过填补、消噪等方法对数据进行预处理,消除数据采集过程中因设备原因而产生的疏漏与噪声,并通过归一化的方式消除不同数据间的量纲影响。然后通过滑动窗口的方式将n行输入数据转化为一行输入数据,其转换方式如图2所示。
图2 数据转换方式
当n=3时,将每3行数据合并转化为新的行数据,在新的行数据中末端数据为预测输出值Y。
近几年来,注意力机制在深度学习领域有着广泛的应用,常被用来进行图像处理、自然语言处理、目标检测、语音识别等任务[14]。注意力机制没有严格的数学定义,它根据目标任务的不同,进行方向和加权模型的调整,从而加强对重要信息的关注和对不重要信息的弱化[15~16]。自注意力机制是注意力机制的改进,它减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,对输出结果贡献大的数据赋予较大的权重,使其对输出的影响加强。
自注意力机制优化的GRU神经网络(Self-attention GRU,SGRU)其结构如图3所示,该网络结构由四部分构成:第一部分为输入层,第二部分为堆叠式GRU层,第三部分为自注意力层,第四部分为输出层。
由图3可知,数据由输入层输入后先经过GRU层处理得到输出Ht,然后由GRU层输出Ht转置后作为自注意力层的输入进行自注意力系数s的计算。
图3 自注意力GRU结构图
然后将GRU层的输出Ht与自注意力系数s一一对应后进行相乘得出自注意力层的输出Z。
最后自注意力层的输出Z经过输出层的激励函数得到整个网络的最终输出Y。
式中,Wsy和by分别为输出层的权值和阈值。
耙吸挖泥船产量预测模型的数据来自于2016年4月“新海虎8”号耙吸挖泥船在厦门港进行作业时的施工数据。施工数据包括挖泥船航速、耙头对地角度、泥泵吸入真空、泥泵流速、波浪补偿器压力、溢流堰高度、装舱体积以及装舱质量这些参数数据,并按照4∶1的比例将数据集划分为训练集和测试集。
模型通过对过去10个时刻样本数据的学习来对当前时刻以及未来2个时刻的挖泥船装舱质量与装舱体积进行预测,并与未优化的GRU神经网络预测模型进行比较。
图4、图5分别是当前t时刻、t+1时刻、t+2时刻的装舱质量与装舱体积的两个模型预测曲线与真实值曲线对比图。图6、图7分别是三个时刻的装舱质量与装舱体积的两个模型预测值与真实值之间的绝对值误差曲线图。由图中可看出经过自注意力机制优化的GRU预测模型与未优化的GRU预测模型相比其预测结果更接近真实值。
图4 装舱质量预测图
图5 装舱体积预测图
图6 装舱质量误差图
图7 装舱体积误差图
为进一步验证SGRU预测模型的优越性,文章采用均方根误差(RMSE)和平均百分比误差(MAPE)作为指标来进行模型之间的比较,RMSE与MAPE的值越大表明预测效果越差。
表2 t+1时刻挖泥船产量预测误差
表3 t+2时刻挖泥船产量预测误差
表1、2、3通过比较两种模型之间的均方根误差和平均百分比误差可以清晰地看出经过SGRU预测模型的误差更小,预测效果更为精确。
表1 t时刻挖泥船产量预测误差
实验表明,使用自注意力机制对GRU模型进行优化可以有效地降低模型的预测误差,较好的对耙吸挖泥船的产量进行预测。预测模型通过对过去数据的分析与学习,成功预测了耙吸挖泥船的当前时刻以及未来时刻产量,更好地构建了挖泥船装舱产量预测模型。