吕燕梅,王苏林
(西南交通大学希望学院,四川 成都 610400)
铁路货运量作为运输体系中的关键统计指标,能够为货运市场份额估计提供重要理论依据。对其进行预测是制定运输战略基础,在经济发展规划中起到重要作用,影响铁路货运组织实施。精准的预测结果可提高铁路运输效率与经济利益。由于铁路货运属于复杂的社会经济系统,容易受到社会、自然环境、经济等因素影响,且这些影响因素一般不能用具体数学方程式来准确表示,所以加大了建立预测模型的困难程度。
为克服上述不足,相关学者提出如下方法。文献[1]提出基于粗糙集和多元回归的铁路货运量预测方法。将铁路货运周转量当作指标,预测某地物流需求。首先通过粗糙集方法对影响铁路货运的运输做属性约简,确定关键因素;其次利用多元回归分析法研究货运量与关键因素存在的关系;最后通过仿真结果表明,消费品总额、产业值等因素对铁路货运量预测影响较大,在制定物流规划时应重点考虑。文献[2]在铁路运输需求方面描述交通运输和国民经济之间的关联,通过这些关联构建铁路运输需求预测神经网络模型,并通过误差反向传播方法完成这些联系到运输需求的映射。此种方法计算量较小,所需样本数量少。
上述两种方法参数选择较为困难,容易陷入局部最优,从而影响预测结果精准度。因此,本文在离散灰色模型[3]基础上对铁路货运量进行预测。确定预测精度指标,基于小波变换方法对提取的铁路运输数据进行去噪处理,提升预测准确性,通过铁路运输数据的离散序列构建近似微分方程模型,通过迭代值修正完成对离散模型的优化。仿真结果证明,所提方法在预测过程中消除噪声数据影响,改善预测精准度,提升预测效率,为铁路部门制定运输营销策略提供有价值的参考,同时提高经济效益[4]。
在铁路货运量预测过程中,首先要确定铁路运货量的预测精度指标,以残差检验,关联度检验及均方差检验为指标,保证预测准确性,指标检验方法如下。
1)残差检验
假设初始序列为
X(0)=(x(0)(1),x(0)(2),…,x(0)(n))
(1)
与其相对的预测模型模拟序列表示为
(2)
若残差序列表示为
ε(0)=(ε(1),ε(2),…,ε(n))=
(3)
对应的误差序列描述为
(4)
2)关联度检验
假设X(0)表示初始序列,(0)代表对应的模拟序列,ε属于X(0)和(0)的绝对关联程度,如果针对已知条件ε0>0,且有ε>ε0,因此称模型是关联度检测合格模型。
3)均方差检验
假设X(0)与(0)分别为初始序列和对应模拟序列,ε(0)表示残差序列,则X(0)的平均值与方差分别表示为
(5)
(6)
残差平均值和方差的表达式分别如下所示
(7)
(8)
小波变换是常用的数据去噪方法之一。实际获取的铁路货运量数据一般情况下由真实数据与噪声数据构成,二者反映的值不同。真实数据值较为集中,而噪声值比较分散。通过小波变换处理后,真实数据系数高于噪声数据系数。主要由于能够确定一个小波阈值当做临界值,并将分解后的系数和此界面临界值做对比,如果已知阈值高于分解后的小波系数,则表示噪声引发此系数,需要对其进行剔除或置零操作;反之则表示此系数是真实数据引起的,保留该数据;最后对获得的小波系数做逆变换操作,获取有效重构数据[6]。
基于小波阈值降噪的方法主要分为:硬阈值降噪与软阈值降噪两种方法。其中,硬阈值降噪公式描述为
(9)
软阈值降噪表达式为
(10)
(11)
式中,W代表原始数据经过小波分解处理后的系数,为降噪后小波系数,λ属于任意阈值,gn(*)为符号函数。结合定义可知,阈值降噪实际上是对比数据绝对值与阈值。如果绝对值高于阈值则不发生改变,反之设置为0。软阈值降噪与其不同,是将数据的绝对值与设定阈值进行比较,如果绝对值高于阈值,需要将数据绝对值和阈值的差值当作典型值,反之设置为0。结合本文需求,选用软阈值去噪方法更为合适。
基本降噪过程如下所示,可以分为三个步骤:
1)选取合适小波函数且设置理想的分解层数,之后对存在噪声的初始信号做小波变换,即可获得不同尺度相对的分解系数Wi,k。
2)确定阈值和相应的阈值函数,对分解系数做对应处理,即可获得预测小波系数i,k。
3)对通过小波分解获得的系数做对应处理,并采用小波逆变换形式重新获取降噪后的数据。
一些相关学者认为微分方程可以非常深刻地反映事物本质特征,但是对于离散数据序列,通常束手无策,这主要因为只有连续可导函数才能使用微分方程。灰色理论经过对普通微分方程的深入研究定义了灰导数,因此可通过离散序列构建近似微分方程模型[7]。
一般情况下,一阶微分方程的组成部分包括导数、背景值与参数三部分。假设x(t)表示在时间集合T上的函数,假设Δt→0,则有x(t+Δt)-x(t)≠0,因此x(t)在T上的数据浓度为无限大。
假设初始序列表示为:X(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)),其中X(1)表示X(0)的1-AGO序列,因此X(1)的灰导数形式为d(k)=x(0)(k)。则称d(i)(ki)+ax(1)(k1)=b为灰色微分方程。
如果灰色微分方程符合以下条件:信息浓度无穷大[8];序列存在灰微分内涵;背景值与灰导数之间存在平射关系。因此称为该方程属于标准灰微分方程。
在分析完微分方程符合的条件后,需要对有效因素进行明确。假设Xi表示系统因素,则它在序号k上的观测信息表示为xi(k),k=1,2,…,n,因此得出Xi=(xi(1),xi(2),…,xi(n))属于因素Xi行为序列。
如果k代表时间序号,xi(k)是因素Xi在k时间点上获取的观测数据,则Xi=(xi(1),xi(2),…,xi(n))是因素Xi的行为时间序列。
如果k描述指标序号,xi(k)表示因素Xi有关k指标的观测信息,则Xi=(xi(1),xi(2),…,xi(n))可以作为Xi的行为指标序列。
无论上述哪一种序列均可以当作关联分析的基础。
不论哪种预测,都会不可避免误差的产生。为提高误差预测精准度,合理安排铁路货运决策,预测过程需要遵从目的性、连贯性、客观性等原则。在进行预测时,需要确定预测数据的用途与要求;必须全面了解历史性的准确资料,结合资料分析结果,发现势态变化规律,预测未来情况;铁路货运量预测会涉及较多方面的影响因素,应多方位收集有关资料,并做纵向与横向对比分析;及时掌控全部重要影响因素的突然改变,可以对预测好的结果进行补充,避免误差太大,提升结果可用性。
现阶段最常见的灰色预测模型为GM(1,1)[9]模型。此模型是在随机初始时间序列基础上,按照时间累积后生成新时间序列所表现出的规律可以利用一阶微分方程解进行逼近。通过一阶微分方程解逼近获取的初始时间序列呈现出指数变化趋势。所以,在初始时间序列隐藏指数变化规律时,模型GM(1,1)的预测结果是非常精准的。该模型的结构如下所示:
假设X(0)属于非负序列,在X(0)=(x(0)(1),x(0)(2),…,x(0)(n))中,x(0)(k)≥0,k=1,2,…,n。
若X(1)是X(0)的一次累计生成1-AGO序列,X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中
(12)
综上所述,灰色微分方程x(0)(k)+az(1)(k)=b属于GM(1,1)模型。其中符号代表的含义如下:G代表灰色(Grey),M为模型(Model),第一个“1”描述一阶方程,第二个“1”代表变量。
(13)
因此,GM(1,1)预测模型x(0)(k)+az(1)(k)=b的最小二乘预测参数需要符合如下标准
(14)
若一组数据序列符合指数增长变化规律,则可以利用GM(1,1)模型,它可以较好地表示单调变化过程。但是在实际预测过程中,直接利用GM(1,1)模型对铁路货运量进行预测,会出现预测偏差过大的情况,因此必须进一步改进。
因为离散形式与连续形式组成结构不同,是不可以精确等同的,在两者之间的跳跃是导致模型存在误差的重要因素。从模型自身角度出发,离散灰色预测模型也不属于最优模型,在预测过程中对序列原始值存在较大依赖性。因此,即使序列原始值发生较小变动也会导致模拟序列发生很大改变,不利于预测经过准确度。
为解决上述问题,本文利用优化方法改善这种敏感的原始值问题。构建优化后的离散灰色预测模型。
结合不同迭代基值,将离散灰色模型表示为下述形式
(15)
为避免迭代基值对模型拟合结果的影响,需要对迭代值添加一个修正项[10],因此将式(15)变换为以下形式
(16)
通过上述优化后的模型即可实现对铁路货运量预测。
仿真中将分别使用本文所提的离散灰色模型与文献[1]、文献[2]方法对西昌南铁路货运站的发送货运总量进行模拟和预测,对比其预测精准度。此货运站2014-2018年货运量信息如表1所示。
表1 西昌南铁路货运站2014-2018货运量数据表
铁路货运量很容易受到外界环境因素影响,所以仅仅凭借历史数据不能完全体现货运量变化趋势,为降低历史数据对预测结果的影响,需要充分利用新生数据,提高预测精准度,仿真过程中通过滑动窗对预测过程做动态调整。即在每次预测之后,将预测序列中最后一个数据当作初始数据序列的最后数据,与此同时剔除初始数据中第一个数据,将形成的新序列用作下次预测的初始序列。全部过程利用下述公式进行描述:
(17)
式(17)中,X(N)代表第(N+1)次预测过程的初始数据序列,X(N+1)为第(N+2)次预测过程初始数据序列,N必须满足非负整数。
图1为三种不同方法预测值与实际值对比结果:
图1 不同方法预测准确率对比图
由图1可以看出,三种不同预测模型中,所提预测结果与实际值最为接近,预测误差较小。本文方法引入灰色关联度理论,通过离散序列构建近似微分方程模型,在随机初始时间序列基础上,通过一阶微分方程解逼近获取的初始时间序列呈现出指数变化趋势。因此能够得到模型精准的预测结果。
在此基础上测试不同方法预测铁路货运量的耗时情况,以一个月的货运量作为实验对象,进行6次测试,得到对比结果如图2所示。
图2 不同方法预测耗时对比图
分析图2可知,在6次铁路货运量预测实验过程中,文献[1]算法的平均用时为45s,文献[2]算法的平均用时为109s,而所提算法的平均用时为14s。所提算法实现了铁路货运量预测的快速预测,有效提升了铁路货运量预测效率。
为提高铁路货运量预测精准度,本文利用离散灰色模型对其进行预测仿真。确定预测精准度的评价指标,通过小波阈值降噪方法对获取的数据做降噪处理,提高预测精度;最后,在导数、背景值和参数基础上建立微分方程,通过对该方程解的逼近处理,获取离散灰色模型,对此模型做优化处理,实现对铁路货运量的预测。仿真结果证明所提方法能够有效减少预测误差,提升预测效率,为铁路货运政策的制定提供理论依据。