刘剑平 杜佳欣 罗子云 尚麟
摘 要:自2005年建港以来,洋山深水港已迅速成为中国最关键的国际集装箱枢纽港。小洋山北作业区建设规划将会在小洋山岛东侧设立新的航道,增加锚地,因而需要提前对结合小洋山北作业区因素的洋山港主航道交通流量进行预测与分析。本文采用LSTM神经网络模型,对规划航道交通流量进行预测,以预判规划投产后主航道交通流总体水平。研究结果显示,规划投产初期平均交通流量约为43艘/天,交通流量水平在41~46艘/天之间波动。这一结果对海事管理部门有重要意义,有助于制定有效的航道管理和资源分配策略,为保障洋山深水港高质量发展提供良好的水上交通环境。
关键词:LSTM模型;交通流量预测;洋山深水港;小洋山北作业区
0 引 言
上海港位于长江下游入海口,东海之滨,被誉为全球最繁忙的港口之一[1]。上海港自然条件复杂,船舶种类多样,船舶流量庞大,是国际贸易的重要纽带。在2001年上海市城市总体规划中,明确了建设上海国际航运中心的发展目标[2]。2010年,上海港集装箱吞吐量首次超越新加坡港成为了世界第一之后持续保持领先地位[3]。洋山深水港作为中国首个在海岛建设的港口[4],位于杭州湾口,自2005年开港以来,其集装箱吞吐量逐年增长,在上海港连续13年集装箱吞吐量排名第一中发挥着重要作用[5]。
2016年12月,上海市人民政府与浙江省人民政府签署了《关于共同推进小洋山区域开发等重大合作事项的框架协议》,旨在共同推进小洋山进一步综合开发。根据小洋山北作业区总体规划,将在小洋山岛东侧,洋山警戒区北侧位置新设航道和锚地。为提前掌握规划投产后主航道交通流水平,制定符合实际的交通组织方案,需要结合规划航道对主航道交通流量进行预测。
LSTM神经网络以其能够处理长期依赖性、防止梯度问题、灵活性和广泛的应用领域等优点,成为深度学习领域的重要模型之一,特别适用于时间序列和序列数据建模任务,在时间序列预测方面具有广泛应用。童建[6]等人构建LSTM神经网络模型对浙江奉化衡山水库的日来水量进行预测,并分析了不同的输入变量组合情况下预测结果的精度。丁腾腾[7]利用LSTM模型,预测船闸位移,为船闸的安全预警提供参考。张潇潇[8]等人基于沪渝高速公路历史数据,建立LSTM模型,对短时交通流进行预测,结果表明该模型对高速公路短时交通流具有良好的适用性。赵洪绪[9]等人对注水井分层注水量数据构建LSTM模型,预测产液量和含水量,为分层注水的优化奠定基础。
LSTM神经网络模型能够捕捉复杂的时空依赖关系,有效解决长期依赖性问题,能够更加准确地预测船舶流量,为有关部门制定有效的监管措施提供基础。因此,本文利用LSTM神经网络模型,对小洋山北作业区投产初期进出港船舶交通流量进行预测,为船舶交通安全组织管理提供参考。
1 研究區域概况与数据来源
1.1 研究区域
本文的研究区域为包含小洋山北作业区规划航道在内的洋山港主航道,如图1所示,在原主航道的基础上,小洋山北作业区规划东向航道、西向支航道和港内航道。东向航道(进出港主航道)总里程约19.3 km,航道宽度450 m,满足7万吨级集装箱船双向乘潮通航;西向支航道(分流部分进长江小型船舶)航程约为12.2 km,航道宽度320 m,最小水深8 m,利用自然水深主要通航5 000吨级及以下船舶;港内航道东段宽度435 m,设计底高程近期-13.7 m,远期-15.5 m,满足7万吨级集装箱船双向全潮通航要求;港内航道西段宽度210 m,设计底高程-11.80 m,满足2万吨级集装箱双向全潮通航要求。
1.2 数据来源
基于规划航道的地理位置、气象水文条件,以及专家的经验知识,本文将主航道的交通流量预测分为两部分。第一部分为现有码头条件下对于主航道内船舶交通流以天为单位进行预测,第二部分则参考盛东国际集装箱码头开港初期的单日平均船舶流量作为修正值,在第一部分预测的基础上进行适当修正作为规划投产初期洋山港进出港船舶流量的预测值。
经分析发现,2023年疫情管控放开以来,船舶交通流的变化与疫情前相差不大,因此本文收集了2020年5月31日至2023年5月31日的数据,由于部分数据缺失,共采集1 092天的交通流量数据。
2 时序特征与聚类
如图2所示,2020年5月31日至2023年5月31日船舶交通流随时间的变化情况。从图中可以看出,船舶交通流呈现出一定的周期性变化。船舶交通流在每年的波动范围较为类似,主要分布在28~51艘/天,峰值达到了82艘/天,日交通流量超过51艘每天的时段有86天,约占7.8%,交通流量波动的周期性受到多种因素的影响。其中,季节性因素可能是造成周期性波动的重要原因,例如每年的节假日、天气季节变化、海上贸易旺季等。此外,经济活动的周期性变化也可能在一定程度上影响船舶交通流量的波动。除了周期性特征,还可以注意到在图中有一些局部的峰值和谷值。这些波动可能是由于特定事件或因素引起的,比如大型活动、交通管制、港口运营调整等。
本文利用k-means聚类方法对2020年5月31日-2023年5月31日船舶交通流量进行聚类,k-means聚类方法的执行过程如下:
1)初始化:随机选择K个数据点,将其充当初始聚类中心,这些聚类中心代表各个簇的中心点。
2)分配数据点:计算每个数据点与K个聚类中心的距离,并将数据点分配至最近的聚类中心所对应的簇中。
3)更新聚类中心:计算每个簇所有数据点的平均值,将该平均值作为新的聚类中心。
4)重复步骤2和步骤3:重复进行数据点的分配和聚类中心的更新,直到簇的中心点不再发生显著变化。
5)完成聚类:当停止条件满足时,k-means算法结束,得到K个簇,并将数据点划分到这些簇中。
利用k-means聚类得到的结果见表1。
根据聚类结果显示,船舶交通流主要集中在每天约39、51、28艘左右。在涵盖2020年5月31日至2023年5月31日的时间段内,交通流量约为39艘/天的占比最大,共计566天,约占51.86%;交通流量约为51艘/天的时段有261天,占比23.90%;而交通流量约为28艘/天的时段有265天,占比24.27%。
3 神经网络预测模型构建
3.1 LSTM神经网络模型
神经网络预测模型是机器学习中的一种强大工具[10],它的设计灵感源自人脑神经系统的运作原理。这个模型具备对输入数据进行预测和分类的能力,其核心原理包含了神经元、权重、层级结构、前向传播和反向传播等重要概念。
神经网络模型的基本构建单元是神经元,它扮演着模型的基石角色[11]。神经元接收输入数据,通过与之相关联的权重进行加权求和。这些权重可以被看作是模型学习到的参数,它们决定了每个输入在模型中的重要性。加权求和的结果随后经过一个激活函数的非线性转换,将其映射为神经元的输出。激活函数的作用在于引入非线性因素,从而使得神经网络能够更好地处理复杂的数据模式。
神经网络由多个层级组成,典型地包括输入层、隐藏层和输出层。输入层接收原始数据,而隐藏层和输出层用于进行信息处理和预测。隐藏层通常包含多个神经元[12],而且可以有多个隐藏层,这样的结构提高了模型对输入数据的抽象和表示能力,使其能够更好地发现复杂的模式和关联。
在进行预测时,输入数据通过前向传播的方式在神经网络中传递。数据从输入层开始,逐层经过每个神经元的加权求和和激活函数处理,一直传递至输出层。每个神经元接收来自前一层神经元的输出,将其加权求和,并经过激活函数的处理传递给下一层的神经元。这个过程一直持续到达输出层,输出层的神经元生成最终的预测结果。
在训练神经网络模型时,需要确定最优的权重参数,以使模型的预测结果与真实值尽可能接近。这个过程被称为反向传播,它使用损失函数来度量预测结果与真实值之间的差异,并根据这个差异来更新权重参数。通过反复迭代前向传播和反向传播的过程,神经网络模型逐渐调整权重参数,提高预测的准确性。神经网络预测模型之所以强大,在于它具备非线性建模能力,能够捕捉复杂数据模式[13]。通过调整神经网络的结构、神经元数量和权重参数,可以构建出适应各种复杂任务和数据的预测模型。
LSTM神经网络预测模型在由循环神经网络(RNN)的基础上改进而来[14],通过在循环神经网络的基础上加入遗忘门、输入门和输出门,从而实现即使是早期输入的信息也可贯穿到最后的输出中。其网络结构如图3所示。
遗忘门数学表达式如式(1)所示,遗忘门的作用是挑选出有用的信息。其模值在0到1之间,0代表完全遗忘,1则代表全部记忆。
式中:ft为t时刻遗忘门的输出值,Wfh,Wfx为权值;ht-1为t-1时刻隐藏层的输出值;xt为t时刻输入值;bf为偏置项。
输入门的第一步与遗忘门相同,如式(2)所示,将有用信息保留下来。第二步如式(3)所示,产生一个新的候选向量gt。
式中:it,gt为t时刻输入门的2个输出值;Wih,Wix, Wgh,Wgx为权值;bi,bg为偏置项。
当完成遗忘门与输入门后,需要重新更新细胞状态,其数学表达式如(4)所示,这一步的目的是记住在这一时刻需要记住的信息,完成这两步后的结果则是在这个时刻下的细胞状态。
式中: 是t时刻的细胞状态; 是t-1时刻的细胞状态。
当更新完细胞状态后,则可以通过输出门得到输出值,输出门的数学表达式如式(5)、(6)所示:其中式(5)的作用是确定细胞状态 中的哪些信息需要输出,最后通过式(6)得到最终的隐藏层输出值ht,而真正得到的输出值yt如式(7)所示。
式中:ot为t时刻输出门的输出值;Woh,Wox为权值; bo,by为偏置项; 为t时刻的隐藏层输出值;yt为t时刻实际输出值。
3.2 模型设计
本节考虑船舶交通流特性,采用长短期记忆(LSTM)神经网络模型对船舶交通流量进行预测。为了捕捉时间序列的长期依赖性,本文将LSTM的时间序列维度设置为90天,即每次训练提取前一个季度(90天)的船舶交通流数据作为训练特征。为了增强模型的表达能力,本文使用不同的隐藏层(神经元个数设置为80)对模型进行训练。
LSTM模型的训练过程中,输出结果通常通过两种判定模式来决定。一种是达到最小损失值,即模型在训练过程中逐渐减小损失函数的值。另一种是达到预设的迭代次数,即模型在经过一定次数的迭代后停止训练。考虑到船舶交通流受季节、气象、水文等因素的影响较大,模型很可能会陷入局部最优解,无法代表最优的训练结果。因此,本节参考已有研究,将模型的训练迭代次数设定为300次,以确保模型有足够的训练机会来学习数据的复杂模式。此外,为了减少模型的复杂度和过拟合的风险,将隐藏层节点数设为10。采用Adam優化器作为优化算法,它结合了自适应学习率和动量的优点,可以更有效地更新模型的参数。同时,将批量处理值(batch size)设置为32,用以在每次迭代中同时处理32个样本,提高训练效率。
基于LSTM长短时记忆神经网络的训练算法流程图如图4所示。首先,需要对数据进行预处理,将交通流数据特征变量进行数值化、归一化处理。再将数据集分为训练集和测试集,本文中训练集与测试集的划分比例为8:2。训练集用于训练LSTM模型的参数和权重。通过提供历史的交通数据和对应的实际流量情况,使模型能够学习到数据中的模式和趋势。测试集用于评估已训练模型的性能和泛化能力。通过在测试集上进行预测,并与测试集中的真实值进行比较,可以评估模型对未来数据预测的准确性。接着构建LSTM层,初始化隐藏层节点个数。再以均方误差值最小为标准,对LSTM网络进行优化,得到最优的LSTM神经网络模型,进而利用最优模型对所需数据进行预测。
4 结果与分析
基于训练得到的LSTM神经网络模型,对船舶交通流进行预测,预测结果与真实值的趋势如图5所示,蓝色的曲线为预测值,橙色的曲线为真实值。从图中可以看出,预测值与真实值的变化趋势较为一致,且两者之间的差异较小。因此,所构建的LSTM模型能够较好地捕捉交通流动态特征,对交通流状况的拟合效果较为良好,可以用于后续预测。
由于目前北侧一期开港的码头规模与盛东码头规模接近,但北侧运营船型尚未明确,所以对于开港初期的北侧船舶流量,本文采用盛东码头开港初期的船舶流量作为修正值,来预测北侧一期开港之后的总体交通流量。2006年,洋山深水港安全进出国际航行集装箱船舶2 251艘次,平均每天约6艘次,故本文修正值为6,利用LSTM神经网络模型对规划航道未来30天的交通流量进行预测,并将预测值与修正值相加得到最终的预测结果,见表2。从表中可发现,规划航道的交通流量平均约为37+6艘/天。这一平均值意味着未来规划航道船舶流量的基本水平,为航道规划和资源分配提供重要的参考。
为了更好地展示交通流量的变化趋势,进一步绘制了规划航道船舶交通流量未来30天内的趋势图,如图6所示。从图中可以观察到,船舶交通流量随着时间的变化呈现出一定的波动。在观察期内,交通流量大致在41~46艘/天之间波动。此外,在月初、月中以及月末这些时间点,船舶交通流量达到低点,这一现象可能与航道使用模式、航行计划或其他因素有关。
5 结论
新的规划方案将在小洋山北作业区新建航道与锚地,为提前掌握与了解规划航道交通流概况,本文考虑到规划航道的地理位置、气象水文条件以及专家的经验知识,将交通流量预测分为两个关键部分。第一部分根据现有码头条件,以天为单位对主航道内的船舶交通流量进行预测。第二部分参考盛东国际集装箱码头在开港初期的单日平均船舶流量作为修正值,在第一部分预测的基础上进行适当修正作为规划投产后洋山港进出港船舶流量的预测值。
研究结果显示,小洋山北作业区投产初期,洋山港主航道平均交通流量预计约为43艘/天,交通流量水平在41~46艘/天之间波动。这一发现对于海事管理部门具有重要意义,有助于制定有效的航道管理和资源分配策略,以确保洋山深水港船舶安全航行。
参考文献
[1] 赵一飞.上海国际航运中心洋山深水港区国际中转业务的新里程碑[J].集装箱化,2021,32(12):1-2+19.DOI:10.13340/j.cont.2021.12.001.
[2] 洋山深水港区四期工程上海国际航运中心[J].城乡建设,2021(18):72-73.
[3] 王桂英.发展国际集装箱水水中转助推上海国际航运中心建设——以洋山港为例[J].物流工程与管理,2012,34(05):1-2+7.
[4] 陈炜俊.上海港洋山深水港区发展对策[J].集装箱化,2012,23(02):16-19.
[5] 黄少卿.洋山港——名副其实的东方大港[J].港口经济,2016(07):53-55.
[6] 童建,游林,孙武等.基于LSTM网络的横山水库日来水量预测[J].水土保持应用技术,2023(05):1-4.
[7] 丁腾腾.基于LSTM的船闸位移预测模型研究[J].现代信息科技,2023,7(16):155-158.DOI:10.19850/j.cnki.2096-4706.2023.16.034.
[8] 张潇潇,龚龑.基于LSTM的沪渝高速公路短时交通流预测研究[J].中国交通信息化,2022(09):133-137.DOI:10.13439/j.cnki.itsc.2022.09.012.
[9] 趙洪绪,柴世超,毛敏等.基于长短期记忆神经网络模型的分层注水优化方法[J].中国海上油气,2023,35(04):127-137.
[10] 金毅,谢辉煌,尹君等.基于LSTM-MPC的粮食干燥机智能控制方法研究[J/OL].粮油食品科技:1-11[2023-09-11].https://doi.org/10.16210/j.cnki.1007-7561.2023.05.004.
[11] 丁梓琼,汤广李,张波涛等.基于改进的长短期记忆神经网络交通流预测[J].网络安全与数据治理,2023,42(08):52-58.DOI:10.19358/j.issn.2097-1788.2023.08.009.
[12] 诸鑫,林孝先,刘庆红等.基于神经网络模型的绵阳市空气质量指数预测[J].绵阳师范学院学报,2023,42(08):112-118.DOI:10.16276/j.cnki.cn51-1670/g.2023.08.016.
[13] 徐为海.基于BP神经网络的镇江地区土层剪切波速预测[J].山西建筑,2023,49(18):77-80.DOI:10.13719/j.cnki.1009-6825.2023.18.020.
[14] 丁梓琼,汤广李,张波涛等.基于改进的长短期记忆神经网络交通流预测[J].网络安全与数据治理,2023,42(08):52-58.DOI:10.19358/j.issn.2097-1788.2023.08.009.