张蕾 孙德山 张文政 王玥
摘 要 采用基于灰色关联分析的支持向量机对铁路货运量进行预测.首先利用灰色关联分析法对影响铁路货运量的因素进行分析处理,然后利用基于高斯核函数的支持向量回归机建立了铁路货运量预测模型.通过分析预测结果可以发现,经过灰色关联分析后的支持向量机模型对复杂的铁路货运量数据有较好地处理能力,且预测相对误差较小.特别地,由于支持向量机的适应性,该模型具有较高的泛化能力,对影响因素较为复杂,样本数量小的预测问题可以提供一定参考.
关键词 铁路货运量预测;灰色关联分析;支持向量机
中图分类号 O213 文献标识码 A
Abstract Using the method of support vector machine which is based on grey correlation analysis to predict railway freight volume. Firstly, using the gray correlation analysis method to analyze the influencing factors of railway freight volume, Secondly using the support vector regression which is based on the Gauss kernel function to establish the prediction model of the volume of railway freight. By analyzing the prediction results, we can find that the support vector machine model which is analyzed by the gray correlation analysis method can process the complex date of the volume of railway freight well, and the relative error of the prediction is relatively smal. Especially, due to the adaptability of support vector machine, the model has a high ability of generalization, and it can provide a reference for the prediction problems with complex factors and small sample size.
Key words applied mathematics; forecast of railway freight volume; grey relational analysis; support vector machine
1 引 言
隨着我国国力日渐强盛,交通运输能力也有了巨大的提升,运输方式逐渐增多,传统运输方式受到猛烈冲击,这种情况在铁路货运市场尤为明显.自2010年起,铁路货运量开始逐渐下滑.2011年,我国铁路货运量为393263亿吨,占全国总货运量的10.63%,而到了2015年,铁路货运量为335801亿吨,同比降低10.53%,几乎跌至6年前的水平.面对越来越严峻的货物运输市场,铁路货运在面临着巨大的挑战的同时也充满了新的机遇.铁路货运管理部门如果想要抓住机遇,焕发生机,就需要更加准确掌握铁路货运未来的发展趋势.
影响铁路货运量的因素万缕千丝,这些因素对货运量的作用机制又很难用精确的数学语言来表示,这就使数学预测模型难以建立.传统的预测方法有:线性回归法、时间序列法、状态空间法和指数平滑法等;后来也发展出许多其他预测方法,如:灰色系统法、神经网络法等.国内很多学者对此进行过研究,刘梦婷和喻建龙(2015)[1]借助时间序列分析软件 Eviews,建立了基于SARIMA的我国铁路货运量预测模型,并对我国的铁路货运量进行了短期外推预测;杨新(2015)[2]在建立货运量预测的模糊时间序列分析模型的基础上,以湛江港铁路分公司为实例求解模型并得出预测结果,并就此提出提高货运量的措施;黄勇和徐景昊(2009)[3]运用多变量灰色 MGM( 1,4) 模型,找出影响铁路货运量的主要因素,对其后四年的铁路货运量进行了预测分析;温爱华和李松(2010)[4]使用GRNN模型与混沌BP神经网络模型分别对铁路货运量进行预测,通过比较发现,GRNN模型具有良好的收敛性和较高的精度;宋苏民和旷文珍等(2017)[5]建立了RBF神经网络模型对全国铁路货运量进行详细分析和预测并对灰色预测、BP神经网络预测和RBF神经网络预测模型进行仿真实验,表明RBF神经网络预测方法的预测精度比另外两种预测方法高;王宁和徐志禹(2013)[6]将指数平滑、乘幂、一元回归以及灰色模型进行组合,得到比单项模型更精确的组合模型对我国 2011~2015 年的铁路货运量进行预测;李彦(2008)[7]用数据挖掘的方法建立了铁路货运量预测的三种算法: 线性回归、BP 神经网络、支持向量回归机,并通过实例验证比较了算法的有效性;迟骋和袁志明等(2015)[8]提出了基于聚类—随机期望值的铁路货运量预测研究方法,使得铁路货运量研究预测方法更加完善.这些传统方法在事先知道许多不同参数的情况下可以对短时间内的铁路货运量的大致情况进行预测,但需要根据不同的情况对不同的参数进行调整.灰色系统预测其本质是一种指数增长预测,可以预测中长期数据.该方法要求原始时间序列是单调非负的,但是这个条件一般不能完全满足.神经网络方法结构较为复杂,同时相对于小样本数据需要估计的参数较多,容易陷入局部极小值,影响预测结果.
支持向量机(Support Vector Machine,简称SVM)是建立在统计学习理论的VC维理论和结构风险最小原理基础上的一种新型理论,它在解决小样本、非线性及高维模式识别等问题中表现出许多特有的优势,在很多情况下可以克服维数灾难问题.该方法目前已经在模式识别、函数逼近和金融时间序列等方面都取得了成功.王治(2010)[9]利用遗传算法确定支持向量机中的训练参数,以得到优化的支持向量机预测模型,并利用支持向量机在小样本、非线性中优越的预测性能对铁路货运量进行预测。耿立艳和梁毅刚(2012)[10]通过灰色预测模型中的灰色序列算子,弱化原始数列随机性,挖掘数列中蕴含的规律,再利用最小二乘支持向量机进行预测,得到了适用于铁路货运量的短期预测.由于支持向量机中训练样本的选择对其预测效果有着比较大的影响,因此选用灰色关联分析法来分析全国铁路货运量的影响因素.灰关联分析方法是灰色理论的重要组成部分.它是根据因素之间发展趋势的相似或相异程度作为衡量因素间关联程度的一种方法,相对于传统的因素分析,灰色关联分析具有对样本要求低 、计算量小等优点,已经成功地用于经济 、生态、农业等不确定系统 .综上,论文采用将关联程度比较高的指标带入支持向量机,以期达到更好效果.
将灰色关联度结果排序,选择关联度高的前10个因素作为相关因素序列,分别为铁路货运量、水运货运量、年末总人口、国内生产总值、第二产业增加值、第三产业增加值、社会消费品零售总额、粮食产量、国家财政收入、粗钢产量.
3 基于灰色关联分析的支持
向量机对铁路货运量的预测
3.1 数据的预处理
根据铁路货运量影响因素的灰色关联分析,选取主要因素,建立支持向量机模型对铁路货运量进行预测,把1975~2014年的铁路货运量,水运货运量,年末总人口,国内生产总值,第二产业增加值,第三产业增加值,社会消费品零售总额,粮食产量,国家财政收入,粗钢产量共10个因素作为支持向量机的输入,把1976~2015年的鐵路货运量作为的输出.由于模型样本数据偏大,所以继续采用归一化处理.消除各个因子间由于单位和量纲的差别产生的影响.
3.3 模型建立与验证
由于数据可构造样本共40组,将前37组数据作为训练样本,将后3组数据作为测试样本后,利用建立的最优模型对1976~2013年的铁路货运量数据进行拟合,然后带入2013~2015年的铁路货运量进行验证,检验模型的泛化能力.结果见图1.
图中横轴为具体年份,纵轴为铁路货运量归一后的数值.为检验模型的有效性,将选取的20个影响因素直接作为输入变量重新构建支持向量机模型,与优化后模型进行对比.由于数据是经过归一处理的,因此将2013~2015年的铁路货运量的真实值与预测值进行还原,并计算相对误差,结果见表2.
由表2可以看出,使用灰色关联分析优化后的模型效果明显好于支持向量机模型,且由于经过灰色关联分析的支持向量机模型输入变量较少,计算时间明显小于输入全部变量的支持向量机模型.通过以上的实际分析,此模型在我国铁路货运量的预测方面具有一定优势.
4 结 论
结果显示基于灰色关联分析的支持向量机预测的铁路货运量的精度较高,对于铁路货运量的预测可以采用该模型来完成.且通过此方法,我国政府和相关经济工作者可以获得铁路货运量较精准的预测值.甚至可以通过调整铁路货运量的影响因素,进行更深一步的研究,以振兴我国铁路货运发展.同时,该方法不仅可以用于铁路货运量的预测,还可以用于其他有类似数据特征的问题预测,即时效性较强,影响因素多,样本小.该模型的另一个突出的优点是具有较强的泛化能力.在对具有很多影响因素的复杂问题预测时,该方法更具全面性,因为该方法可以突破时间序列的约束,把横向的多因素引入模型,把纵向的时间序列拓宽,这既是非线性时间序列模型的改进也是时间序列模型的拓展.
参考文献
[1] 刘梦婷,喻建龙.基于SARIMA模型的我国铁路货运量预测分析[J],贵州师范学院学报:2015,32(12):44-47.
[2] 杨新.基于模糊时间序列的港口铁路货运量预测[J],科技创新与应用,2015(30):5-6.
[3] 黄勇,徐景昊.关于铁路货运量预测研究[J],铁道运输与经济,2010,32(4):86-89.
[4] 温爱华,李松.基于广义回归神经网络的铁路货运量预测[J],铁道运输与经济,2010,33(2):88-91.
[5] 宋苏民,旷文珍,许丽等.RBF神经网络在铁路货运量预测中的应用[J],计算机应用,2017,26(1):47-51.
[6] 王宁,徐志禹.组合预测模型在铁路货运量预测中的应用[J].交通科技与经济,2013,15(5):78-81.
[7] 李彦.基于数据挖掘的铁路货运量预测方法[J].铁道货运,2008(5):20-22.
[8] 迟骋,袁志明,周茵.基于聚类—随机期望值的铁路货运量预测研究[J].公路交通科技,2015 (4):250-252.
[9] 王治.基于遗传算法—支持向量机的铁路货运量预测[J].计算机仿真,2010,27(12):320-322.
[10]耿立艳,梁毅刚.基于灰色自适应粒子群LSSVM的铁路货运量预测[J]西南交通大学学报,2012,47(1):144-149.
[11]李瑞,代明睿,李凤姿.基于灰色关联度的铁路货运量关键影响因子选取方法研究[J].铁道货运,2015(11):11-14.
[12]中华人民共和国国家统计局,http://www.stats.gov.cn/.