基于机器学习的集装箱船舶运行轨迹与到港时间预测

2023-09-25 03:26RogerLloretBatlle郭杰群

物流技术 2023年8期

Roger Lloret-Batlle，林森，郭杰群

（宁波（中国）供应链创新学院，浙江宁波 315832）

0 引言

供应链全球化已成为当今世界经济发展的重要趋势,是全球生产力与科技发展的重要推动力。在此趋势下，国际贸易成为全球化核心组成部分。然而，随着物流服务地理范围的不断扩大，跨区域贸易增加了物流成本与复杂度。国际物流不仅必须高效完成不同国家与地区以及各类环境中的作业，还需应对国际环境所带来的不确定性。

海洋运输是国际货物贸易的最主要方式。根据联合国贸易和发展会议统计数据，70%～80%的全球货物贸易都通过海运完成[1]。在激烈的市场竞争中，海洋运输流程的透明度对于运输公司提升效率和获取客户至关重要。提高透明度的一个重要方式是对货运准确到达目的地港口的时间预测，通常称为预计到达时间(Estimated Time of Arrival，ETA)。ETA也是集装箱码头制定生产作业计划的重要依据[2]。此外，众多业务相关方也需根据船舶到达特定港口的时间做出业务决策，这些相关者包括但不限于港口当局、港口运营商、燃料供应商和物流服务商等。码头运营商需要对船舶ETA进行估计，以便准确地确定每个班次的日常需求；物流服务商需要根据船舶ETA来满足客户的交付期望。因此，对船舶ETA进行可靠的预测是上述业务方关注的一个关键问题。然而，由于运输方式的不同，海上运输有别于飞机和火车运输，面临着更多不确定性因素。对于长距离海洋运输而言，物流容易受天气、港口拥堵程度、季节、路线选择、突发状况等一系列因素影响。通常，飞机或火车的ETA可精确到分钟甚至是秒，而集装箱船舶ETA一般只能精确到小时甚至是天，因而在多式联运中，海运也成为最难把控的运输风险点。由此，按时运输和交付大型、长周期订单是一项挑战。在实际运营中，船舶运营商经常不得不修改ETA，导致实际到达时间(Actual Time of Arrival，ATA)与最初船期表平均误差高达30～40h[3]。船舶ATA的不确定性降低了计划规则的可靠性，降低了内陆运输运营商的生产力水平和消费者体验。此外，因需要更高的库存以避免生产过程中断,船舶到达的延迟既增加了船舶运营成本，也增加了供应链成本。

本研究以中美航线为例，探讨集装箱船舶ETA预测问题。这是一项具有挑战性的课题，因为长距离的跨太平洋航运相比短距离航运周期性长，且具有更多不确定性因素，这使得ETA的预测复杂化。实际上，此项课题包括两个问题：船舶轨迹预测（船舶下一个将停靠在哪个港口）以及到达该港口的船舶ETA。为解决这些问题，我们基于机器学习提出了一个模型，以对船舶运行轨迹和ETA进行预测。准确的船舶轨迹预测对海上交通控制和管理至关重要，除了避免碰撞外，还有助于规划航行路线，缩短航行距离，提高航行效率。准确的ETA将有助于制定有效的物流计划，提升运营效率，降低运营和供应链成本，并减少供应链中断的风险。

由于缺乏基准模型来描述船舶到达时间和引发其变化的因素之间的关系，我们采用了多层感知器(MLP)网络，并使用AIS历史数据和其他已知信息建立模型。机器学习能够识别数据中的趋势和模式，从已有数据中提取有用见解，因此在预测分析方面是高效的。目前机器学习已被广泛用于交通领域的数据分析之中,包括空运ETA、陆运ETA、海运ETA等[4-6]。

1 相关研究及文献

1.1 船舶轨迹预测研究

准确的船舶轨迹预测能够保证海运的安全性、智能性与高效性。Zhang，等[7]对船舶轨迹预测相关文献进行了梳理，研究结果表明船舶轨迹预测相关研究主要包括评估碰撞风险提升海上交通安全、路径规划、海上交通管理、提升码头运营效率、目的地以及船舶到港时间预测等方面。学者们还采用不同的方法对于船舶轨迹预测进行了研究，如仿真方法、基于概率统计方法、机器学习方法、深度学习方法等。

仿真方法通常是通过创建一个数字模型以模拟现实世界中的船舶运动。例如Last，等[8]基于AIS数据建立了一种无加速度的基本船舶运动模型。然而，当AIS数据点之间的时间间隔太大时，不确定性通常会随着时间推移而增加，因此预测的准确性较低。

基于概率统计的轨迹预测方法假设历史轨迹数据和预测轨迹数据两者之间存在一定相关性，通过历史轨迹数据建立相对应的数学模型，并通过参数估计和曲线拟合对轨迹进行预测[9]。常见的基于概率统计方法包括隐马尔可夫模型[8]、贝叶斯网络[10]、高斯混合模型[11]等。

随着人工神经网络（ANN）的不断发展，一些学者开始使用人工神经网络对船舶轨迹进行预测。例如Gan，等[12]首先采用k 均值聚类算法对于历史轨迹进行分类，随后利用上述聚类结果与其他已知因素(即船舶速度、载重、自重、最大功率和水位)建立人工神经网络（ANN），通过反向传播算法（BP 算法）预测船舶轨迹。研究结果表明所建立的模型与实际数据吻合较好，准确率达70%以上。不过，该研究是针对短距离长江流域船舶轨迹建模。Volkova，等[13]采用Levenberg-Marquardt作为训练算法，在训练人工神经网络模型的同时更新参数，实现了梯度下降。

深度学习是在神经网络的基础上发展而来，通过建立更加大而复杂的神经网络获得更精准的结果。因此，深度学习在轨迹预测和交通管理方面也引起了极大的关注。循环神经网络(RNN)模型是一个典型的深度学习模型，通常应用于轨迹预测。其中，长短期记忆网络（LSTM）模型（循环神经网络的一种）是最常用的船舶轨迹预测方法。例如Liu，等[14]使用LSTM模型对天津港船舶轨迹进行预测。实验结果表明，该模型能准确预测船舶轨迹，并适用于自主导航系统。Tang，等[15]建立了用于天津港船舶轨迹预测的LSTM模型，该模型由2层神经网络叠加而成，可以用来观察船舶前10min 的状态，并预测船舶在第20min 的位置。Fortis，等[16]探索了基于LSTM的神经序列模型，用以捕获序列AIS数据的长期时间依赖性并提高整体预测能力。此外，作为LSTM模型的拓展，双向时间递归神经网络(BiLSTM)模型使用了输入序列的正向和反向信息，此模型也被用来预测船舶轨迹[17]，因为此模型可以增强历史和未来时间序列数据之间的相关性，一些研究表明其有助于提高预测准确性[18-19]。

综上所述，多种方法可用于预测船舶的轨迹。其中，仿真方法较为简单，但准确性较低，很少被用于船舶轨迹预测。而隐马尔可夫模型虽能较好预测轨迹过程，但通常需要人为设定参数，容易引起误差，并且模型的鲁棒性和计算精度往往受到限制。高斯混合模型能够准确预测短期轨迹，但极易受到数据复杂度影响，实用性较低。贝叶斯网络较为高效且易于训练，但在实际运用中其预测效果也存在一定的局限性。神经网络自适应能力强，但存在收敛速度较慢、局部最小化等问题。而深度学习具有准确率高、实时性强等特点，但缺点在于模型训练时间通常较长。

1.2 船舶ETA预测研究

准确预计船舶ETA有助于提升运营效率并降低运输风险，因此备受学界和业界的关注。学者使用不同的方法对船舶ETA进行预测。其中，基于数据的方法主要使用传统的统计方法，如多元线性回归、逻辑回归、时间序列分析和贝叶斯网络[20]。然而，这些方法在复杂系统中通常会导致较差的结果，因为它们只能解释非常少的变量，从而过度简化了复杂的关系。而机器学习方法能够有效解决该问题，并已被一些学者应用于研究中。机器学习通过学习历史数据来建立预测模型，常见的机器学习包括神经网络模型、分类与回归树、随机森林等。通过机器学习，预测问题可分为回归任务或是分类任务。回归任务试图用于预测船舶提前到达或延迟到达的时间、中转时间或是到达目的港所需的航行时间，而分类任务则基于提前到达或延迟到达提供一个定性的估计[21]。

此外，应用机器学习研究预测船舶ETA可分为静态预测和动态预测两种。在静态预测中，主要基于由码头操作系统(TOS)或物流公司等提供的具有静态特征的船舶和航次历史海事数据进行预测。Fancello，等[22]首次将基于神经网络的动态学习预测算法用于预测船舶到港时间区间，并结合资源分配优化算法优化码头人力资源调度。研究结果表明该模型可以减少船舶到达港口时间的不确定性区间，将港口到达时间的不确定性从4h下降到2h40min左右，提高了需求预测的准确性。这项研究与本研究相近，然而它只考虑了24h 的时间范围并采用静态预测。相似地，Pani，等[23]使用新的变量和更大的数据集与分类和回归树方法探索了相同的情况。Pani，等[24]使用逻辑回归、分类和回归树以及随机森林进行分类预测，并在关键轨迹点之间引入天气数据。

与静态预测模型不同，动态预测模型通过提取AIS数据中的船舶动态特征，如位置和速度，来预测船舶全程航行中的ETA。Jahn，等[25]通过神经网络模型针对德国北部和波罗的海海上交通状况特别是船舶航行位置和船舶到达时间进行预测。此外，Kim，等[26]将实时AIS船舶跟踪数据与历史航运数据相结合，提出了一种以数据驱动的船舶延误早期检测方法（CBR），对船舶航行状态和到港时间进行预测，并对于延迟原因作出分析。Parolas[27]使用支持向量机（SVM）和神经网络模型获得了类似的结果，在他的研究中，SVM始终优于神经网络模型。采用支持向量机的平均绝对误差(MAE)在到达前5天为5小时，在到达前20h降至2.6h，而采用神经网络的MAE在到达前5天为6.3h，在到达前20h下降到3.6h。

综上所述，诸多学者从不同的角度研究船舶轨迹预测以及ETA预测。多数研究都聚焦于短距离或是局部船舶轨迹以及到港时间，少有研究采用动态预测模型对于长距离船舶轨迹和ETA进行预测。基于此，本文通过机器学习对长距离船舶轨迹以及船舶ETA进行预测具有重要的实践意义。

2 影响船舶轨迹和ETA的因素

与公路或铁路运输不同，影响船舶航行轨迹和船舶ETA的原因非常复杂，见表1。

表1 影响船舶轨迹和ETA的因素

3 研究方法

船舶轨迹和ETA主要受船舶自身因素影响，因此在本研究中，我们主要考虑船舶自身因素，并采用机器学习对于船舶运行轨迹（目的地）和ETA进行预测，具体研究方法如图1所示。

图1 研究方法流程图

3.1 机器学习

机器学习被广泛用于解决交通预测问题，其主要通过学习历史数据来建立预测模型。另一方面预测问题可以表示为一个回归或分类任务。通常回归任务用于预测实值输出，而分类任务则试图预测分配一个特定的类别。在船舶目的地预测和ETA研究中，分类任务被用于提供一个定性估计即下一目的地的预测。而在回归任务中，目标则是船舶到达目的港所需的旅行时间。

3.2 人工神经网络

作为机器学习技术之一的神经网络是一种模仿生物神经网络结构和功能的数学模型或计算模型，是解决现实生活中复杂问题的理想方法。尽管多元线性回归通常也被作为预测的方法之一并能给出良好的预测结果，但其只适用于当输入变量和输出变量之间为线性关系的时候。然而，海上航行速度通常会受众多因素影响而不断变化，输入变量和输出变量之间的关系并非一直呈线性。而神经网络则可以描述输入变量和输出变量之间的非线性函数，因为它们能够使用多个神经元进行计算。神经网络能够通过使用算法，对原始数据中的隐藏模式和相关性进行识别，对其进行回归和分类。

在本研究中，我们从港口参与者需要频繁更新船舶实时状态和到达时间的角度考虑船舶ETA 问题。通过给定船舶的当前航次等相关信息，我们希望作为分类任务预测船舶的目的港以及作为回归任务预测到达该目的港的航行时间。首先从AIS、船舶资料和港口等来源收集相关静态和动态数据。其中静态数据主要为船舶资料，包含了国际海事组织(IMO)号、海上实时移动服务标识(MMSI)号、船名、呼号、长度、船型(货轮、油轮、客轮等)等数据。动态数据包含经度、纬度、呼号、真实航向、对地航速（实际航速）和对地航向等一系列动态AIS数据，时间窗口为3h左右。不同来源收集的信息将被合并为一个单一和统一的数据集，并通过数据预处理以提高数据质量，将其转换为适合的格式(见表2)。通过训练模型获得最终的模型，并对船舶的目的港及ETA做出预测。

表2 输入数据特征

研究使用了文献中使用最广泛的前向结构人工神经网络即多层感知器（Cross-sectional Multi-Layer Perception，MLP）模型[28]。如图2所示，多层感知器一般由输入层、隐藏层和输出层构成。神经网络包含一个或多个节点（神经元），分布在一个或多个隐藏层中。在这个模型中，不同层的节点通过单向链路连接。这意味着神经网络中的信息单方面地从一个层次的单位传播到下一个层次，输出不能用作输入。每个链路中的权重应用于输入值。随后将这些输入值的加权之和插入到节点中的激活函数中，以激活节点。相似地，当前节点将构成下一隐藏层或输出层中的输入[29-30]。最后输出h(k)，可以表示为式(1):

图2 人工神经网络模型

其中h(k-1)为前一层的输出，g(.) 为激活函数，W(k)为权重矩阵，b(k)为向量偏差。此外，寻找网络的参数是一个被称为拟合或学习模型的优化问题。在回归任务中，学习模型是通过最小化预测值和真实目标之间的损失函数来实现。在训练阶段，神经网络对来自输入空间的每个数据进行前向传递处理以获得预测值，然后将预测输出与真实目标y 进行比较。通过利用梯度下降优化算法不断迭代更新权值，直到达到最小损失，从而使训练误差最小化。

我们使用均方误差(MSE)来训练网络，通过计算预测值和实际值之间距离（即误差）的平方来衡量模型优劣。MSE的表达式为：

其中n为样本个数，yi为观测值，为第i个样本的预测值。我们使用平均绝对误差(MAE)表示目标单位内的误差。MAE通常被用于衡量预测或预测与最终结果的接近程度。它是所有平均预测误差的平均值，与被测量的数据在同一尺度上。这意味着，在这种情况下，它表示预测值（船舶ETA）与实际值（船舶ATA）的平均误差小时数。MAE的表达式为：

MSE和MAE值越低，表明模型的精确度越高。

为降低训练集和验证集所导致的偶然性，研究采用十折交叉验证法（10-fold cross-validation method），利用现有的数据进行多次划分以测试模型的准确性。具体而言，原数据集随机被分为10份子集数据；此后依次将1份子集数据留作验证集，剩下9份子集数据作为训练集，对模型进行训练与验证。在此过程中，超参数被保持一致（即保持隐藏层层数和每层神经元个数相同）。重复流程，再根据模型的平方误差损失（MSE）和平均绝对误差（MAE），对超参数进行衡量并取得最优超参数。随后，将原数据集作为训练数据，用最优超参数训练获得最终的模型。

此外，在机器学习分类实验中，通常根据数据集的分类预测情况衡量分类的效果。基于混淆矩阵（confusion matrix）的分类评价体系是一种常用的计算指标之一[31-32]。

4 案例分析：中美航线船舶目的地预测及ETA预测

跨太平洋海运航线是全球海运航线中最重要的一部分，连接着两个全球最大的经济区域。根据Statista数据显示，跨太平洋航线是载货量最大的航运区（如图3）。因此，本研究以中美航线为例，选取中国至美国洛杉矶港和长滩港的航线。洛杉矶港与长滩港相距10km，为美国最繁忙的2个集装箱港，也都是北美国际贸易的首要门户。以长滩港为例，该港口每年处理价值2 000亿美元的贸易，是美国为数不多的可以停泊当今最大船只的港口之一，服务175条航线，连接世界各地的217个海港。

图3 2022年全球主要贸易路线上的集装箱货运量[33]

4.1 数据收集

本研究中使用的数据均来自于准时达以及Fleet-Mon（船舶跟踪服务提供商）所提供的AIS数据。AIS系统通过VHF通信机、GPS定位仪和船载显示器及传感器等通信控制器获取的GPS信息。AIS信息每隔几分钟就会更新一次，并与附近AIS站交换船舶的静态和动态数据(如海上移动服务标识(MMSI)、船舶名称、船舶类型、船舶尺寸、航行状态、转向率、对地速度、经度、纬度、呼号、真实航向等)重要信息。我们对2022年10月1日至2022年10月31日从中国多个港口抵达洛杉矶港和长滩港的船舶进行了分析，共包含66个航次，具体如图4所示。

图4 中美航线集装箱船舶轨迹

4.2 数据处理

AIS主要依赖传感器和人工输入，其准确性通常受到人为错误、设备故障、编程错误等影响。由于AIS数据的高冗余性和从原始AIS数据中提取船舶运动模式的复杂性，必须对数据进行预处理。我们通过异常值删除、填补缺失值以及数据标准化等方法对数据进行清洗和处理。以PONA 号集装箱船（MMSI 为636092984）2022年10月的某航次为例，表3列出了用于预测该集装箱船舶目的地和到达时间的输入数据。该集装箱船舶于上海港起航，途径韩国釜山港，最终到达美国长滩港。

表3 PONA号集装箱船相关数据

4.3 船舶目的地预测

我们采用Pytorch(一种神经网络库)构建和训练模型。神经网络的输出是由预测问题决定的，在本研究中是预测集装箱船舶的目的地。因此，神经网络的输出层由单个节点组成，该节点将集装箱船舶的预测目的地作为输出，目标是使输出尽可能接近实际到达的目的地。神经网络的输入是每个航次的特征。在此模型中，神经网络有4个输入变量，根据这些输入变量对船舶的目的地进行预测。本研究采用2层隐藏层，原因在于采用更深层次的神经网络能够提高性能。此外，选择隐藏层中的神经元数量是至关重要的，选择过多或过少神经元会导致欠拟合或过拟合。通过不同网络模型的仿真模拟，我们选择误差最低的网络模型。本研究在第一层隐藏层采用30个神经元节点，第二层隐藏层采用15个神经元节点。

从模型运行结果中读取预测标签与实际标签，并将读取的标签信息传入Python sklearn库中的混淆矩阵函数，最终得到了归一化混淆矩阵并进行了可视化（如图5所示）。该混淆矩阵展示了模型的预测结果，其中对角线元素代表了正确预测目的地的程度。以香港港为例，模型显示正确预测到达香港港的概率为91%。由于测试集中港口数量很多，我们只显示11个港口或海域的结果。研究结果显示该预测模型的平均准确率约为80%，表明神经网络模型能较好地对于船舶目的地进行预测。

图5 目的地预测混淆矩阵

4.4 船舶预计到达目的地时间预测

采用Keras(一种高层神经网络库)构建和训练模型。与船舶目的地预测模型相似，在船舶预计到达目的地时间的预测模型中，神经网络输出层的单个节点将船舶ETA 作为输出，目标是使输出尽可能接近ATA。神经网络的输入是每个航次的特征。在此模型中，神经网络有4个输入变量，根据这些输入变量对ETA进行预测。本研究采用2层隐藏层，在第一层隐藏层采用40个神经元节点，第二层隐藏层采用10个神经元节点。模型需要搭配适当的激活函数以表示任意精度的任意决策边界，并且可以拟合任何精度的任何平滑映射。在此模型中，ReLu函数被作为激活函数。

如上文所述，ETA 任务的目标是最小化ETA 和ATA 的差距，通常采用平均绝对误差（MAE）进行衡量。表4展示了在中美航线（起始港距离目的港（长滩港/洛杉矶港）大于5 000 海里）检测本模型预测ETA结果的准确率。由表4可知，随着离目的港的距离不断缩小，应用人工神经网络模型预测ETA 的MAE 不断收缩，当距离约1 000 海里时，MAE 仅为4h。这一结果表明人工神经网络模型预测ETA 的MAE 较低，因此，本模型能够有效预测中美航线中集装箱船舶的ETA。

表4 人工神经网络模型所对应的平均绝对误差（MAE）

4.5 具体航线案例分析

本研究所使用的人工神经网络模型已通过众多航线验证了其有效性。以PONA 号集装箱船（MMSI为636092984）为例，表5展示了基于人工神经网络模型预测该船舶目的地和ETA的结果。当船舶距下一目的港300海里时，模型预测下一目的港为韩国釜山港，此时基于人工神经网络模型所预测的ETA 与ATA 相差3h 之内。当船舶经过釜山港后，距下一目的港1 000海里时，模型预测下一目的港为美国长滩港，与实际目的港一致。此时基于人工神经网络模型所预测的ETA与ATA相差4h左右。

表5 PONA号集装箱船舶目的地及其ETA预测

5 结语

准确的集装箱船舶ETA是保证港口作业管理高效的重要信息。船舶到达时间的变动会对港口运营工作产生一定的影响，甚至会导致海运供应链的中断。因此，需要通过智能系统准确预测船舶的ETA。本文提出了一种基于人工神经网络的预测模型，结合AIS数据，对集装箱船舶在长距离海运中的目的地和ETA进行预测。

在国际海运中，运输距离通常较长，运输情况复杂，运输时间容易受到众多因素影响。此外，由于国际贸易中的物品通常运输量较大，运输的延迟或将导致产品价格波动，造成损失。我们所提出的预测模型有助于改善港口运营规划，特别是针对长距离海运，能够有效管理多式联运中的航运风险，提升海运贸易分析的准确性。具体而言，针对船舶目的地和ETA的有效预测有助于有效规划和调度港口业务。一方面，工作人员可以对于长途航行中的船舶提前干预，减少在港口的等待时间甚至避免港口拥堵。另一方面，船舶和卡车的周转时间将会减少，码头的装卸作业效率或将提高，同时也避免了闲置泊位，减少资源浪费。对于货主而言，提前知道船舶ETA同样至关重要，这将有助于其作出相关决策以减少风险。例如，货主可根据船舶ETA判断是否调整运营策略，以减少延误或提前到达所造成的损失。此外，改善运营规划或将减少船舶碳排放量，减少污染。尽管机器学习方法有利于构建高效的预测模型，但它们的训练需要大量的数据集和时间。由于时间限制，本研究采用了有限数量的数据集。随着数据库中的AIS数据量不断更新和增多，未来将进一步优化模型并提高模型准确性，从而获得更好的预测结果。同时，还可以将更多因素纳入考虑范围，将该方法推广到其他不同船舶类型和不同航线，例如将天气因素纳入模型并考虑比较不同类型船舶的预测模型等。