基于ES-Markov模型的港口集装箱季度吞吐量分析与预测

2019-02-24 05:30王振振苌道方朱宗良
中国航海 2019年4期
关键词:初值预测值吞吐量

王振振, 苌道方, 朱宗良, 罗 天

(上海海事大学 物流科学与工程研究院, 上海 201306)

随着“一带一路”新型经济带的提出,我国海运业发展日益蓬勃,集装箱运输方式已成为海洋运输的标志。与此同时港口作为“一带一路”的重要节点,在“一带一路”建设中有着举足轻重的作用,港口集装箱吞吐量不仅是港口地区经济发展的晴雨表,更标志着一个港口在国际经济贸易中的地位。[1]因此,利用有效的数学方法对港口集装箱吞吐量进行精准预测,是对港口未来的规划发展做出科学决策的重要前提。

自20世纪80年代起,关于港口集装箱吞吐量预测方面的研究很多,国内外学者提出多种预测方法,如时间序列预测法[2-3]、TEI@I方法论[4]、灰色模型法[5-6]、支持向量回归机法[7]、神经网络法[8]和组合模型法[9-11]等。一方面大部分单一模型的预测精度较低,而组合模型建模求解过程较复杂,在实际应用中难以发挥理想效果;另一方面,大部分文献集中于研究年度集装箱吞吐量预测,没有对季度数据进行统计分析,无法准确地掌握港口集装箱吞吐量的季度发展规律,仅有少量文献考虑月度数据,但没有深入分析各月份吞吐量对总体吞吐量的影响程度。与以往的研究相比,本文的做法:首先用加权灰色关联分析对各季度影响总体吞吐量的程度进行排序;然后利用三次指数平滑法对该港口集装箱季度吞吐量进行初值预测,并结合马尔科夫模型修正初值,改善其对转折点的不适应所造成的误差,提高预测精度;最后与传统三次指数平滑法和灰色模型法的预测结果进行对比,充分证明所提组合模型的预测效果更好,可为港口经营发展提供决策支持。

1 加权灰色关联分析

1.1 加权灰色关联分析的基本原理

设X={xσ|σ=0,1,2,…,m}为序列关联因子集,X0为参考函数,Xi为比较函数,xσ(k)为xσ在第k点的值,其中k=1,2,3,…,n。

设x=(x(1),x(2),x(3),…,x(n))的累减生成序列为

x′=(x′(1),x′(2),x′(3),…,x′(n))

(1)

其计算方法为

x′(1)=x(1),x′(k)=x(k)-x(k-1),k=2,3,…,n

(2)

对于x0、xi

(3)

式(3)中:ζi(k)为关联系数,即第k时刻比较曲线xi对于参考曲线x0的相对差值;两个层级的最大差为maxi∈mmaxk∈n|x0(k)-xi(k)|;ε为分辨系数;λ1为位移加权系数;λ2为变化率加权系数,均取0.5。ε取值过大或过小都可能导致相关参数产生误差,最终影响模型的准确度。许多文献表明:ε较为合理的取值为0.5或0.6,此时不仅计算简单,而且可信度较高,本文取ε= 0.5。[12]

xi对于x0的加权灰色关联度γi为

(4)

式(4)中:βk为因子k常态化的权重系数,通过白化权函数来确定[12],过程如下:

设白化权函数为

f(x)=xe1-x+(1-x)ex-1

(5)

已知序列为

xi(k)=(xi(1),…,xi(2),…,xi(k),xi(n)),

i=1,2,…,n

(6)

1) 求各序列中属性因子总和为

(7)

2) 求因子熵为

(8)

3) 求熵总和为

(9)

4) 求相对权重为

(10)

5) 利用正规化法求各因子权重为

(11)

1.2 港口集装箱季度吞吐量加权关联分析

选取深圳港2012—2017年各季度集装箱吞吐量数据见表1,对其进行季度灰色加权关联分析,旨在找出该港口集装箱季度吞吐量发展变化规律。

设该港口每年的集装箱吞吐量为参考序列如下:

x0=(2 101.69,2 096.70,2 401.77,2 369.78,

2 283.23,2 460.49)

(12)

不同季度对应的集装箱吞吐量为比较序列xi(i=1,2,3,4),由式(3)可得每年度集装箱吞吐量总数与各季度吞吐量的关联系数矩阵为

(13)

式(13)中:ξ1、ξ2、ξ3、ξ4分别为第一、第二、第三、第四季度的关联系数。

通过上述白化权函数求得各因子权重为β1=0.172、β2=0.172、β3=0.162、β4=0.163、β5=0.166、β6=0.165,由式(2)可得每年度集装箱吞吐量总数与各季度吞吐量的加权关联度为

表1 深圳港2012—2017各季度集装箱吞吐量 万TEU

(14)

式(14)中:γ1、γ2、γ3、γ4分别为第一、第二、第三、第四季度的关联度。

由式(14)可知:γ3>γ4>γ2>γ1,即第三季度与年度总数的关联度最大,其次是第四季度、第二季度,这两个季度的影响度接近,关联度最低的是第一季度。这与直观对数据分析的结果一致,表明每年从第一季度开始深圳港集装箱吞吐量逐渐递增,在第三季度达到峰值,第四季度稍稍回落到与第二季度接近的水平,而来年第一季度吞吐量又迅速降低。根据量化结果,深圳港在未来的规划发展中应依据此规律,制定有效计划,合理规划交通、资源配置等问题。

2 ES-Markov模型构建

2.1 三次指数平滑法预测模型

指数平滑法是特殊的移动平均法,其特点在于对过去的观测值分配不一样的权重,新数据给予较大的权重,旧数据给予较小的权重,预测值是以前观测值的加权和。指数平滑预测法包括3种,其中:一次指数平滑法适合无趋势的平稳时间序列;二次指数平滑法适合呈线性趋势的时间序列;三次指数平滑预测法适用于不规则、呈非线性趋势的时间序列。港口集装箱吞吐量受国家政策、周边经济发展状况和自然环境等因素影响,导致其具有明显的非线性特征。因此,使用三次指数平滑法来对其进行初值预测。三次指数平滑公式[13]为

(15)

第t+m期的预测值为

(16)

式(16)中:m为预测步长,取正整数1,2,3,…。其中预测参数为

(17)

一般情况下确定平滑初值有两种方式:

1) 当数据量较多时,应取

(18)

2) 当数据量较少时,一般选取最初三期的平均数作为初值,即

(19)

另外,选取合适的平滑系数对于建立平滑模型非常关键。若数据波动较大,为提高预测精度,应将α值取大一些,以增加近期数据的权重;若数据波动平稳,则α值应取小一些。

当数据量较多时,可编制通用化程序,计算动态平滑系数;当数据量较少时,一般采用试算法确定α值,即先根据自身数据变化趋势来大致确定取值范围,再根据取值范围选取不同的α值进行试算,将预测误差平方和最小的α选为最终参数。误差平方和最小公式为

(20)

2.2 ES-Markov模型的建立

ES-Markov模型结合三次指数平滑法与马尔科夫模型,首先利用三次指数平滑法得出初始预测值,再用马尔科夫原理得到状态转移矩阵,修正初始预测值,以此提高预测精度。以下为具体步骤。

2.2.1计算精确度[14]

精确度为实际值与三次指数平滑预测初值之比,即

(21)

2.2.2状态区间划分

通过简单层次聚类将精确度划分为n个状态,其状态区间表示为Ei=[Ei1,Ei2],其中:Ei1、Ei2分别为状态Ei的上下限,总的精确度集合为E= (E1,E2,…,En)。

2.2.3构建状态转移概率矩阵

状态转移概率Pij(k)计算为

(22)

式(22)中:Pij(k)为客观事物经一种状态转移至另一种状态发生的概率,其中Mi为Ei状态的原始数据数量;Mij(k)为Ei经过k步转移至状态Ej的原始数据数量,处于样本序列末尾的Mi不计入算式。

状态转移矩阵由状态转移概率组成,其代表着客观事物在t时刻所处状态转变为(t+1)时刻所处状态时的条件概率矩阵,其表达式为

(23)

2.2.4确定预测时刻转移状态

马尔科夫链具有无后效性,即转移的发生只与当前状态有关,假设预测对象处于Ei状态,则仅考察当前状态转移概率矩阵第i行状态向量P(t),若第j列概率值最大,则预测对象下一时刻最有可能转向Ej状态。

2.2.5修正预测初值

超声波模块固定在小车的正前方,用来检测正前方的障碍物。在这里笔者选用的型号是US-100,其测距范围为2cm-450cm,自带温度传感器可以自动对测试结果进行校正,具有电平输出和UART输出两种输出方式,小车使用的是电平输出。该模块具有五个端子,1号端子接VCC电源;4号和5号端子接外部电路的地;2号端子为 Trig端;3号端子为 Echo端。需要测距时,单片机会从Trig管脚输入一个10微秒以上的高电平,系统会发出8个40KHz的超声波脉冲,然后检测回波信号,经过温度校正后,将结果通过Echo管脚输出[3]。

首先确定预测对象下一步转移到状态Ei,然后结合三次指数平滑法所得初值和所处状态确定组合预测优化值yt。

(24)

2.3 模型精度检验指标

设置以下3个检验精度的指标:

1) 将t时刻实际值与预测值的相对误差记为δ(t),其表达式为

(25)

2) 将所有时刻的平均绝对百分误差记为(Mean Absolute Percentage Error, MAPE),其表达式为

(26)

3) 将所有时刻的均方根误差记(Root Mean Square Error, RMSE),其表达式为

(27)

3 港口集装箱吞吐量预测

以2012—2016年深圳港集装箱季度吞吐量作为原始数据,如表1所示。首先使用三次指数平滑法、组合预测优化模型分别对数据进行拟合,再预测2017年4个季度的集装箱吞吐量,并将预测值与实际值进行对比。

3.1 三次指数平滑法初步预测

首先确定平滑初值,由于本文数据量只有20个,而初始值对预测值影响较大,因此,采用前3个数据的平均数作为初始值,即

(28)

本文利用MATLAB,首先选取几个大致区间临界值代入进行试算,找出误差平方和最小的区间,再从该区间内找到使误差平方和最小的α值,经过计算,确定α=0.1时预测误差最小。

通过三次指数平滑模型得出预测结果,由于篇幅所限,各季度对应的平滑值与参数无法全部展示。主要预测2016年之后的集装箱吞吐量,因此,取t=20,根据式(16)可得a20=598.140 1,b20=3.81,c20=0.042 7,根据式(16)得到三次平滑预测式为

(29)

由式(29)得出2017年4个季度的3次平滑预测初值分别为601.99万TEU、605.93万TEU、609.95万TEU、614.06万TEU。

3.2 Markov模型修正

3.2.1划分状态区间

根据三次指数平滑法的初步预测结果,可得到预测初值的精确度序列,通过简单层次聚类,将精确度序列划分为(0.854 2,0.939)、(0.939,1.032 8)、(1.032 8,1.126 6)、(1.126 6,1.220 4)等4个状态,各季度集装箱吞吐量所处状态见表2。

表2 各预测模型拟合精度对比与状态划分

3.2.2预测状态向量及预测值计算

通过式(24)得到由Markov优化后的2012—2016年吞吐量组合预测值如表2所示。根据马尔科夫预测原理,得到1步转移矩阵P1为

(30)

由于2016年第四季度处于状态E3,由P1可知2017年第一季度预测状态向量P(1)=(1/5,2/5,1/5,1/5),则2017年第一季度集装箱吞吐量最有可能处于状态E2,求出组合预测值为593.50万TEU;此时再求出二步转移矩阵P2=(P1)2,得到2017年第二季度预测状态向量P(2)=(21/160,169/320,9/40,37/320),则2017年第二季度集装箱吞吐量最有可能处于状态E2,求出组合预测值为597.39万TEU;同理,2017年第三季度预测状态向P(3)=(390/2 203,950/2 753,587/1 600,646/5 819),则2017年第三季度集装箱吞吐量最有可能处于状态E3,求出组合预测值为658.57万TEU;同理,2017年第四季度预测状态向量P(4)=(860/4 879,167/464,583/1 678,287/2 466),则该港口2017年第四季度集装箱吞吐量最有可能处于状态E2,求出组合预测值为605.40万TEU。

3.3 精度检验

由表2可知:相比传统的三次指数平滑模型、灰色预测模型,组合优化模型使相对误差都降至5%以下,再计算出各模型的平均相对百分误差及均方根误差,见表3。

表3 各模型精度检验结果

由表3可知:组合模型所得平均相对百分误差(MAPE)相比灰色模型降低4.21%,比三次指数平滑模型降低4.97%;组合模型所得均方根误差(RMSE)相比灰色模型降低29.56,比三次指数平滑模型降低36.55,预测精度大幅提高。2012—2017年的实际值与3种模型的预测值对比见图1,可看出相对于传统的三次指数平滑模型和灰色预测模型,组合模型的预测曲线与实际值曲线更加吻合,模型效果更优。

图1 3种模型预测结果对比图

4 结束语

本文使用加权灰色关联分析和ES-Markov组合模型,对深圳港2012—2017年集装箱季度吞吐量数据进行定量研究,结果表明:港口集装箱吞吐量存在季节性波动,组合预测模型能很好地适应其发展变化规律,且预测精度和拟合度较高,同时建模相对简单、易于实现,可为港口未来的决策规划提供新思路。

猜你喜欢
初值预测值吞吐量
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
AI讲座:ML的分类方法
自体荧光内镜对消化道肿瘤诊断临床应用分析
2017年3月长三角地区主要港口吞吐量
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
美国三季度GDP初值创两年最高
《吉普林》欧元区经济持续低迷
2014年1月长三角地区主要港口吞吐量