黄跃华, 陈小龙
(1.天津海运职业学院 航海系, 天津 300350;2.大唐电力燃料有限公司, 北京)
港口吞吐量预测在确定港口物流发展规划、资源合理配置和经营管理策略中占有重要地位。政府可依据港口货物吞吐量预测数据制定行业发展政策,引导市场资源的合理利用与优化配置以避免资源浪费。[1]目前,港口吞吐量预测方法较多,有线性回归法[2-3]、组合模型法[4-6]、神经网络模型法[7-8]、遗传规划法[9]和灰色模型法[10-12]等,然而在预测过程中这些模型的应用范围与预测精度有所不同,特别是对振荡数据序列的预测精度不高,部分模型需要大量的统计数据,而在实际工作中统计数据的数量往往难以满足建模要求,导致不能取得较好的预测效果。
邓聚龙提出的GM(1,1)灰色模型适用于小样本、贫信息的时间序列数据模拟和预测,运用部分已知信息挖掘信息的发展,可不必研究影响港口吞吐量的相关因素和相互关系,将影响吞吐量的因素作为灰色变量,通过挖掘数据自身中有用信息来建立预测模型,揭示发展规律,进而做出预测。国内外许多学者对GM(1,1)模型进行改进并将模型应用于不同的领域,扩大传统GM(1,1)模型的应用范围,提高了拟合预测精度。但是,改进模型的预测响应式主要是指数函数,对于非指数函数或具有振荡性质的数据拟合预测精度并不高。
祝建[13]研究发现,世界经济的发展状况对我国沿海港口货物吞吐量的影响最大,世界各国经济内部性质各异、长短不一的周期性波动,通过国际贸易、国际投资和国际金融市场在国家间传递、扩散,并相互叠加、共振而形成的周期导致我国港口吞吐量具有振荡性。为有效预测具有振荡性质的港口吞吐量,本文拟应用正弦和修正具有自适应背景值的GM(1,1)模型的预测残差,用以识别港口吞吐量时间序列中的周期性振荡特征,并利用该模型对广州港港口吞吐量数据进行模拟与预测,从而验证优化GM(1,1)模型的有效性。
1) 设港口历史吞吐量数据为
X(0)=(x(0)(1),x(0)(2),…,x(0)(n))
(1)
2) 对吞吐量数据进行一阶累加得
X(1)=(x(1)(1),x(1)(2),…,x(1)(n))
(2)
式(2)中:
(3)
3) 根据X(1)序列生成紧邻均值序列为
Z(1)=(z(1)(1),z(1)(2),…,z(1)(n))
(4)
式(4)中:
z(1)(k)=(1-λ)x(1)(k)+λx(1)(k-1),
λ=0.5,k=2,3,…,n
(5)
4) 设x(0)(k),x(1)(k),z(1)(k)如上所述,灰色微分方程为
x(0)(k)+az(1)(k)=b
(6)
称为GM(1,1)模型。
5) 方程
(7)
式(6)和式(7)中:GM(1,1)模型白化微分方程,a、b为待定系数;t为时间。
根据式(6)对参数列(a,b)T作最小二乘估计
(a,b)T=(BTB)-1BTY
(8)
式(8)中:
(9)
求解式(7),便可得时间响应式为
(10)
(11)
在传统GM(1,1)模型中,背景值系数固定赋值为0.5,影响模型的预测精度。将背景值系数设置为可调整的参数,则可增强模型的自适应能力,背景值序列按照式(12)生成。采用此方法生成的模型未改变灰色模型的结构,对应的白化微分方程与传统的传统GM(1,1)模型一致。
z(1)(k)=(1-λ)x(1)(k)+λx(1)(k-1),
λ∈[0,1];k=2,3,…,n
(12)
以吞吐量平均相对误差最小化为目标,利用背景值系数λ与参数a和b之间的关系为约束条件建立下列优化背景值的模型,求得最优的背景值系数λ、a、b的值,使得吞吐量预测模型的平均相对误差绝对值在达到理论上最小。
(13)
(14)
通过MATLAB等相关运筹学软件很方便地求解模型参数λ、a、b的优化值。根据式(13)和式(14)可求得背景值系数λ与参数a和b的值,将通过以上方式获得的参数值代入式(10)便可获得优化背景值的GM(1,1)模型。
由于吞吐量残差中包含周期振荡信息,本文引入正弦和作为残差周期补偿。方法如下:
设GM(1,1)模型的残差序列为
ε(0)=(ε(0)(2),ε(0)(3),…,ε(0)(n))
(15)
式(15)中:
k=2,3,…,n
(16)
k=2,3,…,n;z∈[3,
n/3
]
(17)
利用MATLAB拟合工具箱或者其他相应数学工具,可选出最优拟合结果参数a1,a2,…,az;b1,b2,…,bz;c1,c2,…,cz的值。代入式(17)可得正弦和修正的残差为
(18)
根据式(13)对GM(1,1)模型的预测结果进行修正,得
(19)
将第k年的吞吐量残差相对误差(Throughput Relative Percentage Error,TRPE)记为TRPE(k),计算为
(20)
将所有时刻的吞吐量残差平均相对误差(Throughput Average Relative Percentage Error,TARPE)记为TRPE,计算为
(21)
1) 当k≤n时,称TRPE(k)为k时刻吞吐量模拟相对误差;当k>n时,称TRPE(k)为k时刻吞吐量预测相对误差,称TARPE为吞吐量平均模拟相对误差;当TRPE、TARPE在要求的相对误差范围内时,称吞吐量模型为残差合格模型。
2) 吞吐量平均模拟相对精度为1-TRPE(k),1-TRPE为k时刻吞吐量模拟相对精度。
通常将误差5%设定为界定标准,即当残差的相对误差<5%时为残差合格模型,当残差的相对误差>5%时认为残差不合格。
为评价优化GM(1,1)模型的模拟与预测效果,本文选用广州港1998—2016年吞吐量数据对模型进行模拟与预测效果验证(见表1)。选取广州港1998—2016年共19年吞吐量数值作为建模数据,2017年数据作为验证数据。
表1 1998—2017年广州港货物吞吐量数据 万t
运用传统GM(1,1)模型计算可得:a=-0.078 533,b=14 393.0,取吞吐量预测初值为
(22)
计算时间响应式得
(23)
根据上述优化GM(1,1)模型计算方法可得:λ=0.678 96,a=-0.077 538,b=14 173.0,取吞吐量预测初值为
(24)
计算时间响应式得
5 125.9sin(0.364 44t+0.758 89)+
797.23sin(1.911 2t-0.336 71)+
830.24sin(0.845 15t-1.956)
(25)
根据式(10)、式(11)和式(19)对吞吐量进行拟合预测,1999—2017年广州港货物吞吐量数据两种模型的数据比较见表2。两种模型的残差比较见图1。
图1 传统模型GM(1,1)与优化GM(1,1)模型的残差比较
4.3.1相对误差与残差比较
由表2和图1可知:优化GM(1,1)模型的残差值比传统GM(1,1)模型残差值小,优化GM(1,1)模型的预测值与实际值基本一致。同时,优化GM(1,1)模型的残差平均相对误差为1.09%远小于传统GM(1,1)模型的16.36%。由此可见,传统GM(1,1)模型的误差较大、优化GM(1,1)模型的误差较小。1999—2016年吞吐量优化模型的拟合值完全满足TARPE<5%且TRPE<5%,同时,2017年吞吐量优化模型的预测值残差相对误差TRPE=1.09%<5%,所以优化模型为合格模型。
4.3.2拟合度比较
两种模型模拟值和真实值的拟合曲线见图2。
图2 传统GM(1,1)模型模拟值、优化GM(1,1)模型 模拟值和真实值的拟合曲线
由表2和图2可知:原始吞吐量呈波动性变化,传统GM(1,1)模型拟合度较低;优化GM(1,1)模型与原始数据基本一致,拟合度较高。由此可见,优化GM(1,1)模型很好地克服了传统GM(1,1)模型数据的随机性、离散性变化的问题,拟合度更高。
传统GM(1,1)模型不适用于具有振荡性质的港口吞吐量,本文提出基于正弦和具有自适应背景值的GM(1,1)模型,该方法利用正弦和描述残差中包含的周期性振荡规律。利用该模型对广州港港口的吞吐量数据进行模拟与预测,通过比较传统GM(1,1)模型与优化GM(1,1)模型的残差、相对误差和曲线拟合度指标,发现相比较于传统GM(1,1)模型,优化的GM(1,1)模型对振荡性质的港口吞吐量预测精度有很大程度的提高,并且拟合度好,克服了传统GM(1,1)模型的局限性。本文的模型适用于具有周期性振荡性质的吞吐量预测,影响世界经济突发性事件爆发将对模型产生较大冲击,预测结果可能会产生较大偏差。