当前的中国社会正在处于高速的发展阶段,尤其是城市道路建设以及交通的发展正处于迅猛高速的成长阶段。随着人民生活质量的提高以及人均GDP的不断增长,城市中尤其是大城市,如:北京,上海,广州等,的机动车数量在大幅度增加、膨胀,以至于给城市交通造成了很大的压力,为市民的出行造成了不便。比如,生活在首都北京,如果在上下班高峰时期出行,本可以以小客车平均时速60km/h的速度1小时到达的地方,需要近3个小时才能到达。据北京市公安局公安交通管理局统计数据显示,截止到2010年底,本市机动车保有量为480.9万辆,比2009年增加79.0万辆,上升19.7%。与2000年底比较,10年来机动车保有量增加了323.1万辆。
截止到2010年底,本市机动车驾驶员为625.3万人,比20 09年增加56万人,上升9.8%。与2000年底比较,10年来驾驶员保有量增加了359.2万人。
针对目前种种交通拥塞问题,提前预测交通流量走势可有效预知某地区某路段的来某一时间段内的交通流走势,通过对未来交通流量的预测可以提前提供预测数据于有计划出行的市民中,让这些市民可根据得到的预测数据对自己的出行计划重新进行评估和准备,优化自己的出行路线和时间,最后可选择最优路径和时间去达自己的目的地。
神经网络方法正是可以得到预测数据的较理想的方法,通过大量交通流量的统计数据作为神经网络的训练集,较长时间和较大规模地对交通流量神经网络进行训练,可以得到相对可靠和准确的预测方法,在实际应用中可以对不同时间阶段的道路交通情况进行预测,提供有效的预测数据给需要的人们,让大家的生活更加便利和高效。
图1 机动车保有量增长趋势图
早期的交通流量预测主要为交通控制系统服务。第一代城市交通控制系统(Urban Traffic Control Systems,UTCS)采用历史数据对交通流量进行离线预测;第二代UTCS应用实测数据对历史平均数据进行修正,进而对交通流量进行预测;第三代UTCS只利用实测数据预测交通流量。第二代和第三代UTCS预测算法都存在时滞问题。与此同时,不少研究者也在积极地探讨着交通流量预测的其他方法。Nicholson和Swann(1974)利用谱分析法预测交通流量,取得了令人比较满意的结果,但这种方法无法预测突发交通事件对交通流状态产生的影响。AhmaedS.A.和CookA.R.(1979)利用Box—Jerkins技术对高速公路的交通流量进行预测,结果表明这种方法的精度有限。NancyL.Nihan和Kjell0 Holmesland(1980)应用BoxJerkins技术和一路段4年的交通流量数据对该路段的交通流量进行预测,精度较高,但这种方法要求的历史数据较多,对建模者的知识水平和建模技巧要求较高。1waoOkutani(1984)利用卡尔曼滤波理论建立了交通流量预测模型,预测的精度优于第二代UTCS预测方法。GaryA.Davis和NancyL.Nihan(1991)应用非参数回归模型预测交通流量,此模型在某些情况下比时间序列预测模型的预测精度要高。P.C.Vythotkas(1993)提出了基于卡尔曼滤波理论的交通流量预测模型,计算结果比较令人满意。BrianL.Smith和MichaelJ.Demetsky(1993)利用神经网络方法预测交通流量,预测结果具有较高的精度,并且没有时滞现象。MaschavanderVoort(1996)将神经网络与ARIMA时间序列模型相结合预测交通流量,使ARIMA模型具有更广泛的适应性和可移植性。CorinneLedOUX(1997)建立了基于神经网络的交通流量预测模型,首先利用神经网络建立每个路段的交通流量预测模型,再建立整个路网的交通流量预测模型,并应用模拟的数据对模型进行了验证。
利用机器模仿人类的智能是长期以来人们认识自然、改造自然和认识自身的理想。人们希望能够探索和模拟人的感觉、思维和行为的规律,设计具有人类智能的计算机系统。探讨人脑的智能活动,用物化了的智能来考察和研究人脑智能的物质过程及其规律。基于此,人工神经网络(Artificial Neural Networks,简称ANN)的方法应运而生。T.Koholen对于人工神经网络的定义:“人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所的交互反应。”
图3 神经网络基本模型
BP(Back propagation)神经网络也称为误差反向传播神经网络——由非线性变换单元组成的前馈网络,一般多层前馈网络也指BP神经网络。其实质就是:求解误差函数的最小值问题多层前馈神经网络权值的调节。
图4 传统三层BP神经网络结构图
首先应当确定数据收集地点。地点的选取必须要有代表性,否则预测是毫无意义。该地点首先应当在高峰时期具有较大车流量,以便数据的记录与统计,由于BP网络的成功建立需要大量数据的训练,因此较大的车流量可以保证数据量方面的支持。其次该地点应当具有普遍性,使得该地点可以代表一定数量的其他道路,这样也保证了训练好的BP网络可以有效的进行预测。
因为考虑到数据的可靠性与普通性,因此应当根据一定的时间间隔,对数据进行采样,以保证其随机性。对于数据量的要求,最重要的就是这些数据应当能准确的训练出适当的BP网络,并且能够用这个网络去较为准确的进行预测。因此在训练时应当首先保证训练数据在100组以上。而对于测试数据的要求比较宽松。因此至少应当采集120组数据样本。为了保证数据的完整性,数据的采集可以持续一周连续五个工作日,并且对每日早晚高峰三个小时内每隔十五分钟的车流量进行统计。
首先应当选择适当的训练函数。在matlab软件中包含的传递函数主要有tansig,logsig,purelin,训练函数包括∶learnbp(),trainbp(),trainbpx().这两类函数有多种不同的组合方式,在实际操作中,应当根据数据的不同进行调配,以选择出误差最小,即训练效果最好的一组搭配作为实验采用的BP网络模型。
模型组建完成之后,将采集好的前100组的数据输入到模型中。本文采取的预测方法是,使用前三个数据预测第四个数据,因此对于BP网络应当选择三输入一输出的架构。将100组数据分别输入完成之后,针对该地段车流量预测的BP网络就训练完成了。
现在可以利用训练好的BP网络对采集到的剩余数据进行预测。预测时应当继续采用三输入一输出的结构,以保证训练与预测的一致性。需要注意的是,数据记录的是车流量,因此都以整数形式出现。为了训练与预测的方便,数据的大小可以自行调整。
从网络结构可以看出,网络运行时单方向传播,没有反馈。因此,BP网络本质上是静态网络,只能实现非线性静态映射,不具有动态信息处理能力,并不是一个非线性的动力学系统。标准BP算法采用的是非线性无约束极值问题求解方法是最速下降法。由非线性优化知识可知,最速下降法只是对局部而言,整体来说却不一定是最速下降方向。另外,由于算法本身的原因,学习过程可能收敛于局部极小点。
BP网络学习过程应当包括BP网络连接权值的学习和网络结构的学习,新的改进算法应当是同时包括权值学习和结构学习的混合算法。学习算法的改进也可以考虑采用混合算法的形式。从联结主义的观点来看,神经网络的结构学习应当受到重视,通过结构调整中不使用梯度法而是基于别的理论进行改进。自适应的网络结构调整方法和适用于BP网络这一特殊非线性无约束优化问题的改进算法都将使BP网络研究取得突破性进展。
为了克服算法的缺陷,实践中已经提出了多种对其改进的新算法,从不同角度对网络进行改进,并取得了一定的成果,在一定程度上改进了BP学习算法的性能。
使用BP网络对车流量进行预测,不仅是一种有效而准确的尝试,更重要的是预测具有较大的实际意义,可以被相关部门用来进行交通的管理与疏导,真正做到科研与实际相结合。
[1]E.Gelenbe.Neural Networks:Advances and Applications[M].Amsterdam:North-Hollande.1991.
[2]罗军辉,冯平等.MATLAB 7.0在图像处理中的应用[M].北京:机械工业出版社,2005.
[3]闻新,周露等.MATLAB神经网络仿真与应用[M].北京:科学出版社,2003.
[4]李士勇.模糊控制.神经控制和智能控制[M].哈尔滨:哈尔滨工业大学出版社,1998.
[5]索胜军,孙光伟.几种改进BP算法的性能比较[J].哈尔滨建筑大学学报,2000.