王振振, 苌道方, 朱宗良, 罗 天
(上海海事大学 物流科学与工程研究院, 上海 201306)
随着“一带一路”新型经济带的提出,我国海运业发展日益蓬勃,集装箱运输方式已成为海洋运输的标志。与此同时港口作为“一带一路”的重要节点,在“一带一路”建设中有着举足轻重的作用,港口集装箱吞吐量不仅是港口地区经济发展的晴雨表,更标志着一个港口在国际经济贸易中的地位。[1]因此,利用有效的数学方法对港口集装箱吞吐量进行精准预测,是对港口未来的规划发展做出科学决策的重要前提。
自20世纪80年代起,关于港口集装箱吞吐量预测方面的研究很多,国内外学者提出多种预测方法,如时间序列预测法[2-3]、TEI@I方法论[4]、灰色模型法[5-6]、支持向量回归机法[7]、神经网络法[8]和组合模型法[9-11]等。一方面大部分单一模型的预测精度较低,而组合模型建模求解过程较复杂,在实际应用中难以发挥理想效果;另一方面,大部分文献集中于研究年度集装箱吞吐量预测,没有对季度数据进行统计分析,无法准确地掌握港口集装箱吞吐量的季度发展规律,仅有少量文献考虑月度数据,但没有深入分析各月份吞吐量对总体吞吐量的影响程度。与以往的研究相比,本文的做法:首先用加权灰色关联分析对各季度影响总体吞吐量的程度进行排序;然后利用三次指数平滑法对该港口集装箱季度吞吐量进行初值预测,并结合马尔科夫模型修正初值,改善其对转折点的不适应所造成的误差,提高预测精度;最后与传统三次指数平滑法和灰色模型法的预测结果进行对比,充分证明所提组合模型的预测效果更好,可为港口经营发展提供决策支持。
设X={xσ|σ=0,1,2,…,m}为序列关联因子集,X0为参考函数,Xi为比较函数,xσ(k)为xσ在第k点的值,其中k=1,2,3,…,n。
设x=(x(1),x(2),x(3),…,x(n))的累减生成序列为
x′=(x′(1),x′(2),x′(3),…,x′(n))
(1)
其计算方法为
x′(1)=x(1),x′(k)=x(k)-x(k-1),k=2,3,…,n
(2)
对于x0、xi
令
(3)
式(3)中:ζi(k)为关联系数,即第k时刻比较曲线xi对于参考曲线x0的相对差值;两个层级的最大差为maxi∈mmaxk∈n|x0(k)-xi(k)|;ε为分辨系数;λ1为位移加权系数;λ2为变化率加权系数,均取0.5。ε取值过大或过小都可能导致相关参数产生误差,最终影响模型的准确度。许多文献表明:ε较为合理的取值为0.5或0.6,此时不仅计算简单,而且可信度较高,本文取ε= 0.5。[12]
xi对于x0的加权灰色关联度γi为
(4)
式(4)中:βk为因子k常态化的权重系数,通过白化权函数来确定[12],过程如下:
设白化权函数为
f(x)=xe1-x+(1-x)ex-1
(5)
已知序列为
xi(k)=(xi(1),…,xi(2),…,xi(k),xi(n)),
i=1,2,…,n
(6)
1) 求各序列中属性因子总和为
(7)
2) 求因子熵为
(8)
3) 求熵总和为
(9)
4) 求相对权重为
(10)
5) 利用正规化法求各因子权重为
(11)
选取深圳港2012—2017年各季度集装箱吞吐量数据见表1,对其进行季度灰色加权关联分析,旨在找出该港口集装箱季度吞吐量发展变化规律。
设该港口每年的集装箱吞吐量为参考序列如下:
x0=(2 101.69,2 096.70,2 401.77,2 369.78,
2 283.23,2 460.49)
(12)
不同季度对应的集装箱吞吐量为比较序列xi(i=1,2,3,4),由式(3)可得每年度集装箱吞吐量总数与各季度吞吐量的关联系数矩阵为
(13)
式(13)中:ξ1、ξ2、ξ3、ξ4分别为第一、第二、第三、第四季度的关联系数。
通过上述白化权函数求得各因子权重为β1=0.172、β2=0.172、β3=0.162、β4=0.163、β5=0.166、β6=0.165,由式(2)可得每年度集装箱吞吐量总数与各季度吞吐量的加权关联度为
表1 深圳港2012—2017各季度集装箱吞吐量 万TEU
(14)
式(14)中:γ1、γ2、γ3、γ4分别为第一、第二、第三、第四季度的关联度。
由式(14)可知:γ3>γ4>γ2>γ1,即第三季度与年度总数的关联度最大,其次是第四季度、第二季度,这两个季度的影响度接近,关联度最低的是第一季度。这与直观对数据分析的结果一致,表明每年从第一季度开始深圳港集装箱吞吐量逐渐递增,在第三季度达到峰值,第四季度稍稍回落到与第二季度接近的水平,而来年第一季度吞吐量又迅速降低。根据量化结果,深圳港在未来的规划发展中应依据此规律,制定有效计划,合理规划交通、资源配置等问题。
指数平滑法是特殊的移动平均法,其特点在于对过去的观测值分配不一样的权重,新数据给予较大的权重,旧数据给予较小的权重,预测值是以前观测值的加权和。指数平滑预测法包括3种,其中:一次指数平滑法适合无趋势的平稳时间序列;二次指数平滑法适合呈线性趋势的时间序列;三次指数平滑预测法适用于不规则、呈非线性趋势的时间序列。港口集装箱吞吐量受国家政策、周边经济发展状况和自然环境等因素影响,导致其具有明显的非线性特征。因此,使用三次指数平滑法来对其进行初值预测。三次指数平滑公式[13]为
(15)
第t+m期的预测值为
(16)
式(16)中:m为预测步长,取正整数1,2,3,…。其中预测参数为
(17)
一般情况下确定平滑初值有两种方式:
1) 当数据量较多时,应取
(18)
2) 当数据量较少时,一般选取最初三期的平均数作为初值,即
(19)
另外,选取合适的平滑系数对于建立平滑模型非常关键。若数据波动较大,为提高预测精度,应将α值取大一些,以增加近期数据的权重;若数据波动平稳,则α值应取小一些。
当数据量较多时,可编制通用化程序,计算动态平滑系数;当数据量较少时,一般采用试算法确定α值,即先根据自身数据变化趋势来大致确定取值范围,再根据取值范围选取不同的α值进行试算,将预测误差平方和最小的α选为最终参数。误差平方和最小公式为
(20)
ES-Markov模型结合三次指数平滑法与马尔科夫模型,首先利用三次指数平滑法得出初始预测值,再用马尔科夫原理得到状态转移矩阵,修正初始预测值,以此提高预测精度。以下为具体步骤。
2.2.1计算精确度[14]
精确度为实际值与三次指数平滑预测初值之比,即
(21)
2.2.2状态区间划分
通过简单层次聚类将精确度划分为n个状态,其状态区间表示为Ei=[Ei1,Ei2],其中:Ei1、Ei2分别为状态Ei的上下限,总的精确度集合为E= (E1,E2,…,En)。
2.2.3构建状态转移概率矩阵
状态转移概率Pij(k)计算为
(22)
式(22)中:Pij(k)为客观事物经一种状态转移至另一种状态发生的概率,其中Mi为Ei状态的原始数据数量;Mij(k)为Ei经过k步转移至状态Ej的原始数据数量,处于样本序列末尾的Mi不计入算式。
状态转移矩阵由状态转移概率组成,其代表着客观事物在t时刻所处状态转变为(t+1)时刻所处状态时的条件概率矩阵,其表达式为
(23)
2.2.4确定预测时刻转移状态
马尔科夫链具有无后效性,即转移的发生只与当前状态有关,假设预测对象处于Ei状态,则仅考察当前状态转移概率矩阵第i行状态向量P(t),若第j列概率值最大,则预测对象下一时刻最有可能转向Ej状态。
2.2.5修正预测初值
超声波模块固定在小车的正前方,用来检测正前方的障碍物。在这里笔者选用的型号是US-100,其测距范围为2cm-450cm,自带温度传感器可以自动对测试结果进行校正,具有电平输出和UART输出两种输出方式,小车使用的是电平输出。该模块具有五个端子,1号端子接VCC电源;4号和5号端子接外部电路的地;2号端子为 Trig端;3号端子为 Echo端。需要测距时,单片机会从Trig管脚输入一个10微秒以上的高电平,系统会发出8个40KHz的超声波脉冲,然后检测回波信号,经过温度校正后,将结果通过Echo管脚输出[3]。
首先确定预测对象下一步转移到状态Ei,然后结合三次指数平滑法所得初值和所处状态确定组合预测优化值yt。
(24)
设置以下3个检验精度的指标:
1) 将t时刻实际值与预测值的相对误差记为δ(t),其表达式为
(25)
2) 将所有时刻的平均绝对百分误差记为(Mean Absolute Percentage Error, MAPE),其表达式为
(26)
3) 将所有时刻的均方根误差记(Root Mean Square Error, RMSE),其表达式为
(27)
以2012—2016年深圳港集装箱季度吞吐量作为原始数据,如表1所示。首先使用三次指数平滑法、组合预测优化模型分别对数据进行拟合,再预测2017年4个季度的集装箱吞吐量,并将预测值与实际值进行对比。
首先确定平滑初值,由于本文数据量只有20个,而初始值对预测值影响较大,因此,采用前3个数据的平均数作为初始值,即
(28)
本文利用MATLAB,首先选取几个大致区间临界值代入进行试算,找出误差平方和最小的区间,再从该区间内找到使误差平方和最小的α值,经过计算,确定α=0.1时预测误差最小。
通过三次指数平滑模型得出预测结果,由于篇幅所限,各季度对应的平滑值与参数无法全部展示。主要预测2016年之后的集装箱吞吐量,因此,取t=20,根据式(16)可得a20=598.140 1,b20=3.81,c20=0.042 7,根据式(16)得到三次平滑预测式为
(29)
由式(29)得出2017年4个季度的3次平滑预测初值分别为601.99万TEU、605.93万TEU、609.95万TEU、614.06万TEU。
3.2.1划分状态区间
根据三次指数平滑法的初步预测结果,可得到预测初值的精确度序列,通过简单层次聚类,将精确度序列划分为(0.854 2,0.939)、(0.939,1.032 8)、(1.032 8,1.126 6)、(1.126 6,1.220 4)等4个状态,各季度集装箱吞吐量所处状态见表2。
表2 各预测模型拟合精度对比与状态划分
3.2.2预测状态向量及预测值计算
通过式(24)得到由Markov优化后的2012—2016年吞吐量组合预测值如表2所示。根据马尔科夫预测原理,得到1步转移矩阵P1为
(30)
由于2016年第四季度处于状态E3,由P1可知2017年第一季度预测状态向量P(1)=(1/5,2/5,1/5,1/5),则2017年第一季度集装箱吞吐量最有可能处于状态E2,求出组合预测值为593.50万TEU;此时再求出二步转移矩阵P2=(P1)2,得到2017年第二季度预测状态向量P(2)=(21/160,169/320,9/40,37/320),则2017年第二季度集装箱吞吐量最有可能处于状态E2,求出组合预测值为597.39万TEU;同理,2017年第三季度预测状态向P(3)=(390/2 203,950/2 753,587/1 600,646/5 819),则2017年第三季度集装箱吞吐量最有可能处于状态E3,求出组合预测值为658.57万TEU;同理,2017年第四季度预测状态向量P(4)=(860/4 879,167/464,583/1 678,287/2 466),则该港口2017年第四季度集装箱吞吐量最有可能处于状态E2,求出组合预测值为605.40万TEU。
由表2可知:相比传统的三次指数平滑模型、灰色预测模型,组合优化模型使相对误差都降至5%以下,再计算出各模型的平均相对百分误差及均方根误差,见表3。
表3 各模型精度检验结果
由表3可知:组合模型所得平均相对百分误差(MAPE)相比灰色模型降低4.21%,比三次指数平滑模型降低4.97%;组合模型所得均方根误差(RMSE)相比灰色模型降低29.56,比三次指数平滑模型降低36.55,预测精度大幅提高。2012—2017年的实际值与3种模型的预测值对比见图1,可看出相对于传统的三次指数平滑模型和灰色预测模型,组合模型的预测曲线与实际值曲线更加吻合,模型效果更优。
图1 3种模型预测结果对比图
本文使用加权灰色关联分析和ES-Markov组合模型,对深圳港2012—2017年集装箱季度吞吐量数据进行定量研究,结果表明:港口集装箱吞吐量存在季节性波动,组合预测模型能很好地适应其发展变化规律,且预测精度和拟合度较高,同时建模相对简单、易于实现,可为港口未来的决策规划提供新思路。