□文/杨伟静
基于BP神经网络的铁路客流量预测研究
□文/杨伟静
铁路客流量的影响因素既来自于顾客的需求,也来自于铁路系统的供给。根据这些影响因素选取样本,利用BP神经网络的非线性映射特性进行网络训练及预测,结果客观可靠,从而为铁路系统的管理工作提供了有力的支持。
铁路客流量;BP神经网络;预测
铁路运输在社会生活中占有极为重要的地位,它是国民经济活动中必不可少的重要组成部分。随着社会的发展,铁路客流量呈现出不断增长的趋势,铁路运输管理部门应做好铁路客流量的预测工作,提前做好准备,从而保证旅客顺利出行。
一些学者对铁路客流量预测进行了相关研究,如常国珍、张前登(2008)采用时间序列分析方法对我国铁路客流量进行预测;沈家军、王炜、陈峻(2007)为了科学准确地预测近期公交客流量,提出了应用灰色马尔可夫模型进行预测的方法;田艳君、毛月华、李克(2007)通过对某市公路客运量数据特征的分析,建立了基于支持向量机的客流量预测方法。这些方法主要是从客流量随时间的变化规律进行研究的,属于时间模型预测法,这类方法要求环境相对稳定,因此在应用中存在一定的局限性。
陈翠利、黄志彤(2008)按照客运专线客流的形成原因将其分为趋势客流、诱发客流和转移客流,根据各部分客流的自身变化特点,分别采用不同的模型或方法进行预测,最后给出了总体客流量预测的计算方法;这种方法虽然界定了三部分客流量的范围,但是从实际来讲,三者之间的界限不可能完全划分清晰。转移客流和诱发客流在实际中会有极少部分和趋势客流相重合,同时还会有其他因素形成的微小客流而不被归入这三部分,因此这种方法也存在一定的问题。
铁路客流量受多种因素的影响,不仅仅是时间的函数。因此,本文利用BP神经网络具有高度非线性关系的映射能力,可以实现M维欧氏空间到N维欧氏空间的任意映射这一特点,把影响铁路客流量的各种因素作为输入,建立起与客流量之间的映射,从而对客流量进行预测。
从经济学角度来讲,铁路客流量就如同交易的商品数量,这个交易数量既受顾客需求的影响,也受来自铁路供给方面的影响,现把这些影响因素总结如下:
1、经济发展水平。影响铁路客流量首当其冲的一个因素就是经济发展水平,而经济发展水平往往用一个国家的GDP来反映,这是一个重要的宏观经济指标。经济发展水平高,意味着旅客的出行增加,同时也意味着铁路旅客运输能力的提升,这是一个综合性的影响因素,也是一个非常基础的影响因素。
2、铁路基础设施状况。我国铁路旅客运输属于垄断市场,铁路投资的主体主要是政府。一个国家的铁路营业里程、铁路客车拥有量等决定着铁路旅客运输的供给,决定运输服务的数量、质量。
3、居民消费水平。随着人们生活水平的提高,在满足了人们起码的生存和安全需求后,探亲、休养、旅游、访友等的需求也必然增长,与此相联系的消费性需求也将相应地在数量上和质量上发生变化。居民消费水平可通过居民消费支出来反映。
4、人口数量。旅客运输的对象是人,人口数量的变化必然引起旅行需求的变化。城市化进程的加快,人口集中加速,人口流动相对频繁,客运需求量也将变大。
5、旅行费用,即运输服务价格。在一定的旅行条件下,旅客具有选择运价较低的运输工具的倾向,尤其是消费性旅行需求更是如此。在我国富裕程度还远没有达到发达国家水平的时候,票价仍将是旅客选择运输方式时所考虑的主要因素之一。
6、其他替代运输方式的发展。对于某一运输方式而言,其他运输方式的运价水平、服务质量及其发展情况会直接影响其需求。比如,航空与公路交通的性价比显著提高,会直接影响旅客对铁路的需求。
7、政策因素。国家为了保证国民经济快速、持续、稳定的增长,对国家的资源配置、能源交通等对国民经济发展有重大影响的方面施行宏观管理和调控。因此,国家针对交通运输制定的有关政策必然会对各种交通运输方式产生很大的影响。
由于经济事物的复杂性,铁路客流量的影响因素除了上述几个主要方面外,还存在其他一些影响因素。在不影响问题分析的前提下,抓住主要方面,忽略次要的影响因素。
3.技术平台。通过精干高效、优势互补、互惠双赢的联合运营管理体系,统筹兼顾本院学员、教职员工及部分石油企业员工随时随地培训学习的需求,快速建立起“管院在线”网络技术学习平台。其主要特点:一是平台具备在线学习、在线考试、互动交流、考核评估、培训管理等功能,支持多终端的用户访问,同时PC 端、移动端、微信端数据可以同步,支持断点续播;二是创新使用分布式微服务架构,技术先进,对数据、应用、访问层都作保障系统性和稳定性的优化处理。
反向传播算法是一种计算单个权值变化引起网络性能变化值的较为简单的方法。由于BP算法过程包含从输出节点开始,反向地向第一隐含层(即最接近输入层的隐含层)传播由总误差引起的权值修正,所以称为“反向传播”。
BP网络不仅含有输入节点和输出节点,而且含有一层或多层隐(层)节点。输入信息先向前传递到隐节点,经过作用后,再把隐节点的输出信息传递到输出节点,最后给出输出结果。
BP算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐单元层逐层处理后,传至输出层。每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望输出,那么就转为反向传播,把误差信号沿原连接路径返回,并通过修改各层神经元的权值,使误差信号最小。
BP神经网络原理已经应用于国民经济的多个领域,显示出了自身的优势。本文结合铁路客流量自身的特点,运用BP神经网络原理进行铁路客流量预测的探讨。
运用BP神经网络进行预测,首先要提供一组训练样本,每个训练样本由输入和理想输出对组成。通过对一组训练样本的训练,网络就可以形成自身的记忆规律。在此基础上,输入验证样本利用模型进行仿真预测,从而判断预测结果的精确度是否符合实际需要,若不符合,需要修改相应的参数后重新训练网络,直至符合实际需要为止。
1、根据前文所介绍的影响铁路客流量的因素,可以把各个影响因素作为输入量。在七类影响因素中,假定政策是相对稳定的,并且其他替代运输方式的影响也是相对稳定的,因此这两类影响因素可不必考虑;另外,旅行费用与经济的发展水平存在高度相关关系,旅行费用也可忽略。这样,作为输入层的指标主要有:GDP、铁路营业里程、铁路客车拥有量、居民消费支出、人口数量这五个指标,从而决定了输入层有五个节点。
3、隐含层节点数的选取关系到整个BP网络的精确度和学习效率,最佳节点数可参考公式n1=log2n(其中n1为隐含层节点数,n为输入层节点数),这样可把隐含层节点数设定为3。
4、网络中间层的神经元传递函数S型正切函数tansig,输出层神经元传递函数采用S型对数函数logsig,trainlm为网络的训练函数。
5、初始状态的各节点之间的连接权值和阈值为(-1,1)之间随机小数,系统可自行产生。样本的学习参数取0.2,训练次数为1,000次,误差精度为0.001。
6、根据统计年鉴的数据,选取1996~2007年的数据作为样本,共12个样本,前11个为训练样本,最后1个作为验证样本(数据表略)。
在网络训练前,应该对样本数据进行归一化处理。归一化的方法很多,考虑到铁路客运量及其影响因素均为正向向量,因此可采用一列数据分别除以这一列数据中最大值的方法,结果体现在下面的输入输出向量中。
7、网络训练的MATLAB代码如下:
8、神经网络输出的结果。对BP神经网络训练8次后,达到了误差精度小于0.001。把归一化后的验证样本进行仿真,输出的结果为0.9553,与理想值1相差0.0447,误差小于5%,说明预测模型是可靠的。
在本文的实例应用中,由于数据获取的渠道有限,在符合实际情况的前提下选取的指标数量相对较少,在以后的研究中将在这方面继续探索。另外,一些能够带来重要影响的偶发因素也可以通过随机变量的方式体现在预测模型中,从而使预测结果更为科学、可靠。
本文所选取的样本数据是按年份进行的,从而进行的是铁路年客流量的预测。根据实际需要,可以选取月份的样本数据,进行月客流量的预测。比如,为了预测春运期间铁路客流量,可以找出其影响因素,选取历年春运期间的样本数据进行预测。
BP神经网络预测方法是一种非线性映射方法,它只要将处理过的数据输入到网络中,通过MATLAB的神经网络工具箱处理即可得到预测结果,避免了人为因素的影响,提高了预测的可靠性,使预测结果更有效、更客观。但是,它也存在着一些缺点,比如所选取的学习样本的数量和质量很大程度上影响着神经网络模型的学习性能,网络层数以及隐含层神经元数的选取也影响整个网络的学习能力和学习效率等等。尽管如此,我们不能否认BP神经网络对非线性系统的预测所取得的成果,人工神经网络应用于铁路客流量的预测具有很好的发展前景。
[1]常国珍,张前登.基于时间序列的我国铁路客流量预测[J].统计与咨询,2008.4.
[2]刘强,贾利民.基于复杂系统的铁路客流影响因素分析研究 [J].铁道运输与经济,2008.11.
F53
A
河北金融学院)