基于ES-Markov模型的港口集装箱季度吞吐量分析与预测

2019-02-24 05:30王振振苌道方朱宗良

中国航海 2019年4期

王振振，苌道方，朱宗良，罗天

(上海海事大学物流科学与工程研究院，上海 201306)

随着“一带一路”新型经济带的提出，我国海运业发展日益蓬勃，集装箱运输方式已成为海洋运输的标志。与此同时港口作为“一带一路”的重要节点，在“一带一路”建设中有着举足轻重的作用，港口集装箱吞吐量不仅是港口地区经济发展的晴雨表，更标志着一个港口在国际经济贸易中的地位。[1]因此，利用有效的数学方法对港口集装箱吞吐量进行精准预测，是对港口未来的规划发展做出科学决策的重要前提。

自20世纪80年代起，关于港口集装箱吞吐量预测方面的研究很多，国内外学者提出多种预测方法，如时间序列预测法[2-3]、TEI@I方法论[4]、灰色模型法[5-6]、支持向量回归机法[7]、神经网络法[8]和组合模型法[9-11]等。一方面大部分单一模型的预测精度较低，而组合模型建模求解过程较复杂，在实际应用中难以发挥理想效果；另一方面，大部分文献集中于研究年度集装箱吞吐量预测，没有对季度数据进行统计分析，无法准确地掌握港口集装箱吞吐量的季度发展规律，仅有少量文献考虑月度数据，但没有深入分析各月份吞吐量对总体吞吐量的影响程度。与以往的研究相比，本文的做法：首先用加权灰色关联分析对各季度影响总体吞吐量的程度进行排序；然后利用三次指数平滑法对该港口集装箱季度吞吐量进行初值预测，并结合马尔科夫模型修正初值，改善其对转折点的不适应所造成的误差，提高预测精度；最后与传统三次指数平滑法和灰色模型法的预测结果进行对比，充分证明所提组合模型的预测效果更好，可为港口经营发展提供决策支持。

1 加权灰色关联分析

1.1 加权灰色关联分析的基本原理

设X={xσ|σ=0,1,2,…,m}为序列关联因子集，X0为参考函数，Xi为比较函数，xσ(k)为xσ在第k点的值，其中k=1,2,3,…,n。

设x=(x(1),x(2),x(3),…，x(n))的累减生成序列为

x′=(x′(1),x′(2),x′(3),…,x′(n))

(1)

其计算方法为

x′(1)=x(1)，x′(k)=x(k)-x(k-1),k=2,3,…,n

(2)

对于x0、xi

令

(3)

式(3)中：ζi(k)为关联系数，即第k时刻比较曲线xi对于参考曲线x0的相对差值；两个层级的最大差为maxi∈mmaxk∈n|x0(k)-xi(k)|；ε为分辨系数；λ1为位移加权系数；λ2为变化率加权系数，均取0.5。ε取值过大或过小都可能导致相关参数产生误差，最终影响模型的准确度。许多文献表明:ε较为合理的取值为0.5或0.6，此时不仅计算简单，而且可信度较高，本文取ε= 0.5。[12]

xi对于x0的加权灰色关联度γi为

(4)

式(4)中:βk为因子k常态化的权重系数，通过白化权函数来确定[12]，过程如下：

设白化权函数为

f(x)=xe1-x+(1-x)ex-1

(5)

已知序列为

xi(k)=(xi(1),…,xi(2),…,xi(k),xi(n)),

i=1,2,…,n

(6)

1) 求各序列中属性因子总和为

(7)

2) 求因子熵为

(8)

3) 求熵总和为

(9)

4) 求相对权重为

(10)

5) 利用正规化法求各因子权重为

(11)

1.2 港口集装箱季度吞吐量加权关联分析

选取深圳港2012—2017年各季度集装箱吞吐量数据见表1，对其进行季度灰色加权关联分析，旨在找出该港口集装箱季度吞吐量发展变化规律。

设该港口每年的集装箱吞吐量为参考序列如下：

x0=(2 101.69，2 096.70，2 401.77，2 369.78，

2 283.23，2 460.49)

(12)

不同季度对应的集装箱吞吐量为比较序列xi(i=1,2,3,4)，由式(3)可得每年度集装箱吞吐量总数与各季度吞吐量的关联系数矩阵为

(13)

式(13)中:ξ1、ξ2、ξ3、ξ4分别为第一、第二、第三、第四季度的关联系数。

通过上述白化权函数求得各因子权重为β1=0.172、β2=0.172、β3=0.162、β4=0.163、β5=0.166、β6=0.165，由式(2)可得每年度集装箱吞吐量总数与各季度吞吐量的加权关联度为

表1 深圳港2012—2017各季度集装箱吞吐量万TEU

(14)

式(14)中：γ1、γ2、γ3、γ4分别为第一、第二、第三、第四季度的关联度。

由式(14)可知：γ3>γ4>γ2>γ1，即第三季度与年度总数的关联度最大，其次是第四季度、第二季度，这两个季度的影响度接近，关联度最低的是第一季度。这与直观对数据分析的结果一致，表明每年从第一季度开始深圳港集装箱吞吐量逐渐递增，在第三季度达到峰值，第四季度稍稍回落到与第二季度接近的水平，而来年第一季度吞吐量又迅速降低。根据量化结果，深圳港在未来的规划发展中应依据此规律，制定有效计划，合理规划交通、资源配置等问题。

2 ES-Markov模型构建

2.1 三次指数平滑法预测模型

指数平滑法是特殊的移动平均法，其特点在于对过去的观测值分配不一样的权重，新数据给予较大的权重，旧数据给予较小的权重，预测值是以前观测值的加权和。指数平滑预测法包括3种，其中:一次指数平滑法适合无趋势的平稳时间序列;二次指数平滑法适合呈线性趋势的时间序列;三次指数平滑预测法适用于不规则、呈非线性趋势的时间序列。港口集装箱吞吐量受国家政策、周边经济发展状况和自然环境等因素影响，导致其具有明显的非线性特征。因此，使用三次指数平滑法来对其进行初值预测。三次指数平滑公式[13]为

(15)

第t+m期的预测值为

(16)

式(16)中：m为预测步长，取正整数1，2，3，…。其中预测参数为

(17)

一般情况下确定平滑初值有两种方式：

1) 当数据量较多时，应取

(18)

2) 当数据量较少时，一般选取最初三期的平均数作为初值，即

(19)

另外，选取合适的平滑系数对于建立平滑模型非常关键。若数据波动较大，为提高预测精度，应将α值取大一些，以增加近期数据的权重；若数据波动平稳，则α值应取小一些。

当数据量较多时，可编制通用化程序，计算动态平滑系数；当数据量较少时，一般采用试算法确定α值，即先根据自身数据变化趋势来大致确定取值范围，再根据取值范围选取不同的α值进行试算，将预测误差平方和最小的α选为最终参数。误差平方和最小公式为

(20)

2.2 ES-Markov模型的建立

ES-Markov模型结合三次指数平滑法与马尔科夫模型，首先利用三次指数平滑法得出初始预测值，再用马尔科夫原理得到状态转移矩阵，修正初始预测值，以此提高预测精度。以下为具体步骤。

2.2.1计算精确度[14]

精确度为实际值与三次指数平滑预测初值之比，即

(21)

2.2.2状态区间划分

通过简单层次聚类将精确度划分为n个状态，其状态区间表示为Ei=[Ei1,Ei2]，其中：Ei1、Ei2分别为状态Ei的上下限，总的精确度集合为E= (E1,E2,…,En)。

2.2.3构建状态转移概率矩阵

状态转移概率Pij(k)计算为

(22)

式(22)中：Pij(k)为客观事物经一种状态转移至另一种状态发生的概率，其中Mi为Ei状态的原始数据数量；Mij(k)为Ei经过k步转移至状态Ej的原始数据数量，处于样本序列末尾的Mi不计入算式。

状态转移矩阵由状态转移概率组成，其代表着客观事物在t时刻所处状态转变为(t+1)时刻所处状态时的条件概率矩阵，其表达式为

(23)

2.2.4确定预测时刻转移状态

马尔科夫链具有无后效性，即转移的发生只与当前状态有关，假设预测对象处于Ei状态，则仅考察当前状态转移概率矩阵第i行状态向量P(t)，若第j列概率值最大，则预测对象下一时刻最有可能转向Ej状态。

2.2.5修正预测初值

超声波模块固定在小车的正前方，用来检测正前方的障碍物。在这里笔者选用的型号是US-100，其测距范围为2cm-450cm，自带温度传感器可以自动对测试结果进行校正，具有电平输出和UART输出两种输出方式，小车使用的是电平输出。该模块具有五个端子，1号端子接VCC电源；4号和5号端子接外部电路的地；2号端子为 Trig端；3号端子为 Echo端。需要测距时，单片机会从Trig管脚输入一个10微秒以上的高电平，系统会发出8个40KHz的超声波脉冲，然后检测回波信号，经过温度校正后，将结果通过Echo管脚输出[3]。

首先确定预测对象下一步转移到状态Ei，然后结合三次指数平滑法所得初值和所处状态确定组合预测优化值yt。

(24)

2.3 模型精度检验指标

设置以下3个检验精度的指标：

1) 将t时刻实际值与预测值的相对误差记为δ(t)，其表达式为

(25)

2) 将所有时刻的平均绝对百分误差记为(Mean Absolute Percentage Error, MAPE)，其表达式为

(26)

3) 将所有时刻的均方根误差记(Root Mean Square Error, RMSE)，其表达式为

(27)

3 港口集装箱吞吐量预测

以2012—2016年深圳港集装箱季度吞吐量作为原始数据，如表1所示。首先使用三次指数平滑法、组合预测优化模型分别对数据进行拟合，再预测2017年4个季度的集装箱吞吐量，并将预测值与实际值进行对比。

3.1 三次指数平滑法初步预测

首先确定平滑初值，由于本文数据量只有20个，而初始值对预测值影响较大，因此，采用前3个数据的平均数作为初始值，即

(28)

本文利用MATLAB，首先选取几个大致区间临界值代入进行试算，找出误差平方和最小的区间，再从该区间内找到使误差平方和最小的α值，经过计算，确定α=0.1时预测误差最小。

通过三次指数平滑模型得出预测结果，由于篇幅所限，各季度对应的平滑值与参数无法全部展示。主要预测2016年之后的集装箱吞吐量，因此,取t=20，根据式(16)可得a20=598.140 1,b20=3.81,c20=0.042 7，根据式(16)得到三次平滑预测式为

(29)

由式(29)得出2017年4个季度的3次平滑预测初值分别为601.99万TEU、605.93万TEU、609.95万TEU、614.06万TEU。

3.2 Markov模型修正

3.2.1划分状态区间

根据三次指数平滑法的初步预测结果，可得到预测初值的精确度序列，通过简单层次聚类，将精确度序列划分为(0.854 2，0.939)、(0.939，1.032 8)、(1.032 8，1.126 6)、(1.126 6，1.220 4)等4个状态，各季度集装箱吞吐量所处状态见表2。

表2 各预测模型拟合精度对比与状态划分

3.2.2预测状态向量及预测值计算

通过式(24)得到由Markov优化后的2012—2016年吞吐量组合预测值如表2所示。根据马尔科夫预测原理，得到1步转移矩阵P1为

(30)

由于2016年第四季度处于状态E3，由P1可知2017年第一季度预测状态向量P(1)=(1/5，2/5，1/5，1/5)，则2017年第一季度集装箱吞吐量最有可能处于状态E2，求出组合预测值为593.50万TEU；此时再求出二步转移矩阵P2=(P1)2，得到2017年第二季度预测状态向量P(2)=(21/160，169/320，9/40，37/320)，则2017年第二季度集装箱吞吐量最有可能处于状态E2，求出组合预测值为597.39万TEU；同理，2017年第三季度预测状态向P(3)=(390/2 203，950/2 753，587/1 600，646/5 819)，则2017年第三季度集装箱吞吐量最有可能处于状态E3，求出组合预测值为658.57万TEU；同理，2017年第四季度预测状态向量P(4)=(860/4 879，167/464，583/1 678，287/2 466)，则该港口2017年第四季度集装箱吞吐量最有可能处于状态E2，求出组合预测值为605.40万TEU。

3.3 精度检验

由表2可知:相比传统的三次指数平滑模型、灰色预测模型，组合优化模型使相对误差都降至5%以下，再计算出各模型的平均相对百分误差及均方根误差，见表3。

表3 各模型精度检验结果

由表3可知:组合模型所得平均相对百分误差(MAPE)相比灰色模型降低4.21%，比三次指数平滑模型降低4.97%；组合模型所得均方根误差(RMSE)相比灰色模型降低29.56，比三次指数平滑模型降低36.55，预测精度大幅提高。2012—2017年的实际值与3种模型的预测值对比见图1，可看出相对于传统的三次指数平滑模型和灰色预测模型，组合模型的预测曲线与实际值曲线更加吻合，模型效果更优。

图1 3种模型预测结果对比图

4 结束语

本文使用加权灰色关联分析和ES-Markov组合模型，对深圳港2012—2017年集装箱季度吞吐量数据进行定量研究，结果表明：港口集装箱吞吐量存在季节性波动，组合预测模型能很好地适应其发展变化规律，且预测精度和拟合度较高，同时建模相对简单、易于实现，可为港口未来的决策规划提供新思路。