基于数据驱动的船舶油耗预测模型研究

2020-05-05 02:01尹石军林召凯高海波廖林豪
江苏船舶 2020年1期
关键词:黑箱油耗平均值

尹石军,林召凯,高海波,廖林豪

(1.招商局重工(江苏)有限公司,江苏 南通 226100;2.武汉理工大学 能源与动力工程学院,湖北 武汉 430063)

0 引言

在全球贸易前所未有的高度发达体系下,整个航运业的运营船舶排放大约占据当前全球二氧化碳排放量的3%、氮氧化物的15%、硫氧化物的4%~9%[1-2]。船舶排放的根本原因在于工作中使用的燃料:船用重油和轻柴油,所以降低船舶的油耗就是降低排放。同时,船舶的燃料消耗也与船舶运营成本直接相关,伴随着国际油价的持续上涨,燃油消耗的成本也越来越高,带给航运企业的压力也越来越大。

油耗模型的研究有许多方法,可大致分为三类:第一类是以分析船舶内部各物理量关系为基础建立的白箱模型,如HOLTROP等[4]给出的回归模型,但该模型仅在船舶设计阶段用于分析船舶内部物理量关系有很好的效果;第二类是直接通过数据关系建模的黑箱模型,如叶睿等[5-6]建立多层感知机网络的黑箱模型,但需要对网络设置大量的结构参数;第三类是将以上两者结合的灰箱模型,如LEIFSSON等[7]通过前馈神经网络建立的灰箱模型,也可对船舶油耗进行较准确的预测,但不具有普适性。本文将采用深度学习方法建立黑箱模型。

深度学习是一种受大脑结构和功能启发的算法(称为人工神经网络),通过使用反向传播算法来发现大型数据集当中的复杂结构,以指示机器应如何更改其内部参数,并根据前一图层的数据计算后面图层中的数据。它与传统机器学习技术的不同之处在于,它们可以自动从数据(如图像、视频或文本)中学习,而无需引入手动编码规则或人类领域知识[3]。本研究正是基于上述背景,将长短期记忆神经网络(Long Short-Term Memory,LSTM)运用到船舶油耗预测建模中来。以某客滚轮实船采集的数据为基础,分析航行中各种参数与油耗数据相关度的大小,量化之间的权重关系,预测燃油消耗。

1 LSTM 神经网络

本文选取基于循环神经网络(Recurrent Neural Network,RNN)的变种LSTM神经网络来建立黑箱模型进行油耗的预测。RNN与普通的神经网络结构和原理并不相同,RNN结构见图1[8]。图中:X表示当前节点状态下的输入,h为当前节点状态下的输出,A表示神经网络节点。

图1 RNN结构

RNN结构可以看作是一个链式结构,其本质是可以像人脑一样拥有对数据特征的记忆能力。神经网络会对前面输入的信息进行记忆并将其应用于当前信息的计算中。但RNN的不足在于无法学习太长的序列特征,即在数据过于庞大时无法长时间地对所需要的信息进行有效的记忆,LSTM神经网络应运而生。LSTM神经网络核心思想在于,在神经网络中引入了一个叫做细胞状态的连接,这个细胞状态用来存放想要记忆的东西,同时加入了3个“门”。图2为“门”结构。图中:σ表示sigmoid激活函数,用于控制输入信息X的通过。

图2 LSTM“门”结构

在LSTM神经网络中这3个“门”分别是:

(1)忘记门:决定什么时候需要把以前的状态忘记。

(2)输入门:决定什么时候加入新的状态。

(3)输出门:决定什么时候需要把状态和输入放在一起输出。

在简单的循环神经网络中,仅仅把上一次的状态当作本次的输入,而LSTM在状态的更新和状态是否参与输入的过程中都做了灵活的选择,这就使得LSTM神经网络避免了RNN无法学习太长的序列特征问题[8]。

基于对数据的采集是按时间顺序进行的特点和考虑到数据量的大小,本文决定采用LSTM神经网络建立对油耗进行预测的黑箱模型。

2 数据预处理及分析

MS Smyril号是运营于法罗群岛首府托尔斯港至苏德岛航线的客滚轮,单程航行时间约1.92 h,每日往返两地2~3次。本文采用该船于2010年2月至4月共246次航行中所采集并公布于网络的数据[9]。这些数据包括13类参数,分别是:船舶对水航速、船舶对地航速、船舶纵倾、船舶横倾、左桨螺距、右桨螺距、左舷吃水、右舷吃水、船首风速、船侧风速、左舷舵角、右舷舵角和船舶油耗,每类数据的总量都为1 048 576条。

2.1 数据预处理

在利用收集到的原始数据建模之前,需要对数据进行预处理。采样数据可表示为包含NR个数据点的三元数组。

T={(i1,t1,v1),(i2,t2,v2),…,(in,tn,vn),…,(iNR,tNR,vNR)}

(1)

式中:T为采集的数据集;in为输入参数;tn为时间戳,即采样数据的时间;vn为所采样的值。

在数据采样的过程中,绝大多数设备都会将数据直接传递给收集系统,而忽略了对采样时间的控制。由于不同的传感器采样的参数在频率和幅度上都不同,并且异步数据序列在任何时候都不一定具有相应的值。因此在数据分析之前,必须执行频率降低和特征提取以使得数据的格式统一。对此,建立一个可以处理这些异步数据的框架,使得模型变得更加灵活。将所有传感器采集数据的时间长度定为3 min,每个时间段为一个数据采样窗口,即在t1

Wt1,t2,j={(in,tn,vn)∣t1≤tn≤t2,in=j}

(2)

式中:Wt1,t2,j为该窗口内采样的合集;j为参数类型。

当任何传感器在部分或全部航程中的窗口某一项参数采样完全缺失时,该窗口中所有数据将被视为无效数据并从样本中剔除[10]。

另外,系统收集的数据可能有时会突然出现与其他数据点有明显偏差的异常值,这可能是设备中的异常造成的。在数据分析的过程中为了保证数据的准确性,需要指定数据范围,并将超出此范围的数据点去掉。

在经过上述预处理过程后得到可用于建立油耗模型的148 961个数据。每个窗口中所采样的数据经过以下计算来提取平均值、方差和平均差分这3个特征值[5-6]:

平均值:

(3)

方差:

(4)

平均差分:

(5)

式(3)~ 式(5)中:u为数据类型;I为数据在时间段内数据点的个数;Δt为时间间隔;xi为在该段时间内的第i个数据。

2.2 输入参数的选定

通常在船舶运营过程中会有许多因素影响船舶的油耗,各个因素对船舶油耗影响的权重是不同的,在此通过斯皮尔曼等级相关(Spearman Rank Correlation)方法[11]来分析各因素与船舶油耗的相关性。斯皮尔曼等级相关公式如下:

(6)

式中:ρ为相关系数;n为等级个数;d为二列成对变量的等级差数;di为对油耗产生影响的各个因素。

斯皮尔曼等级相关分析结果见图3。

图3 相关性分析

从图3中可以看出,船舶航行时其油耗受到左舷螺距、右舷螺距、对水航速、对地航速、船舶纵倾、船首风速、左舷舵角和右舷舵角的影响较大。

在选定输入参数的过程中,首先要分析船舶油耗与拟输入参数的相关性。相关性有高有低,选用相关性高的参数输入有利于体现数据特征;反之,选用相关度低的参数会增加数据序列中的复杂程度。另一方面对于神经网络来说,系统输入维度过大会出现梯度爆炸现象;输入维度过小则会容易出现模型过拟合现象,因此选择相关度高的参数和合适的输入维度是非常必要的。

本模型中每类参数只选择一种特征值输入黑箱模型,这样可以避免重复输入某相关度高的参数的不同特征值使得模型精度偏离实际。经过相关性分析之后,剔除4类与油耗相关度不大的参数,包括船舶左右舷吃水、船舶横倾和船侧风速。选取8类参数作为模型的输入参数,即左舷螺距的平均值、右舷螺距的平均值、对水航速的平均值、对地航速的平均值、纵倾的平均值、船首风速的平均值、左舷舵角的平均值和右舷舵角的平均值。选取油耗作为黑箱模型的输出参数。整个黑箱模型具体结构见图4。

在选定好输入参数和完成数据预处理之后,开始建立模型,然后进行训练。

3 试验结果分析

本文运用Python代码和深度学习框架Tensorflow建立LSTM神经网络,对完成预处理的数据进行学习,确定神经网络参数及权值,使用Adam优化算法训练模型,学习率为0.001。选取样本数量80%作为训练集训练网络,20%作为测试集用于验证模型精度,得到的训练误差与测试误差见图5。

由图5可知,网络在训练与测试过程中误差均下降较快,具有很好的泛化能力。

在完成训练之后,选取测试集中的500个样本数据作为预测结果展示,见图6。图中,“+”为油耗真实值,“*”为相同输入情况下的预测值。由图可知,两者吻合度较好,其预测的相对误差仅为2.11%。

图6 LSTM神经网络预测结果

为了证明LSTM神经网络具有良好的精度,将同样的数据经过BP神经网络和支持向量机(SVM)训练得出的预测结果分别见图7、图8。

图7 BP神经网络预测结果

图8 SVM预测结果

上述3种算法的预测相对误差见表1。

表1 算法相对误差对比

由图6、图7、图8与表1看出,BP 神经网络具有训练时间短的优点,但是其预测精度相对较低。SVM算法不仅精度低,并且在处理大量训练样本时所耗费的时间多。相比上述两种算法, LSTM神经网络耗时较少,且预测精度较高。综合上述原因表明,LSTM神经网络更适用于船舶的油耗预测。

4 结语

本文通过分析船舶航行各因素的影响,筛选出对地与对水航速、左右舷螺距、船舶纵倾、船首风速和左右舷舵角8类与船舶油耗相关度高的输入数据。采用LSTM神经网络建立油耗模型,通过对比实验进行模型参数优化,得到的模型预测精度较高,具有较高的可信度。本文采用深度学习方法所建立的黑箱模型可以用于油耗预测,可为船舶运营人员提供一定参考,合理制定运营计划,提高航运能效。

猜你喜欢
黑箱油耗平均值
拒绝黑箱
失踪的黑箱
巧用1mol物质作标准 快速确定混合物组成
变力做功时运用F=F1+F2/2的条件
哪款汽车更省油?——百款汽车真是油耗数据对比
平面图形中构造调和平均值几例
这道电学黑箱题有误吗?
2007/2008年度桑蚕干茧质量分析报告
汽车冬季油耗为何会增加?
电学黑箱问题例析