熊文真,沈雪梅,李红娟
(1.信阳职业技术学院,河南 信阳 464000;2.昆明理工大学,云南 昆明 650000)
基于相关向量机的交通流量预测
熊文真1,沈雪梅1,李红娟2
(1.信阳职业技术学院,河南 信阳 464000;2.昆明理工大学,云南 昆明 650000)
目的在短时间内实时性预测交通流量值是构建交通管理系统的重要内容。交通流量数据存在着不确定性、复杂性和非线性等显著特点,使流量值的实时预测难度增大,交通流量的精准预测一直是行业内亟待解决的问题。基于已有学者研究基础之上,构建基于相关向量机方法的交通流量预测模型。方法相关向量机的预测精度优于逻辑回归和支持向量机方法,且相关向量机方法具有产生预测误差范围的功能,对于实际交通流量序列数据,采用基于相关RVM的交通流量预测模型。结果预测结果十分理想,预测速度比其他2种模型明显加快,达到了交通流量预测的实时性要求,适合于实时在线预测,且所用方法的预测精度相对较高。三方面的对比分析表明,利用相关向量机方法对交通流量进行预测可以较为精确地描述出交通流量变化的非线性特点,模型性能和实时性都较好。结论实例分析表明,基于相关向量机的交通流量预测模型可以提高预测的速度和精度,非常适用于有实时性要求的交通流量预测估计,为实时性测量交通流量值提供了一种科学的方法。
相关向量机;交通流量;预测
随着经济的不断发展,城市化进程也随之加快,造成城市交通流量的持续增加与堵塞,故可以有效解决交通问题的智能交通系统应运而生,并逐渐获得重视。该系统的核心在于如何精准预测时刻变化的交通流量值,且预测结果的优劣将直接影响交通规划和控制问题[1]。交通流量预测最为明显的特征为其短时性,相比于长期性的预测,其更易受到随机性因素的干扰,故具有更为明显的不确定性,并呈现非规律性。
针对上述问题,多位学者开始研究交通流量的预测问题。目前主要应用的方法有:时间序列模型、线性回归模型、卡尔曼滤波模型、神经网络模型以及学习算法支持向量机模型等[2-4]。时间序列模型主要利用数据的线性特征对未来的数据进行预测,核心在于利用线性特征,但难以精确描述出有着非线性特征的交通流量数据,预测的准确度有所偏颇;线性回归模型主要利用多元线性回归模型对交通流量值进行分析,在数据充足情况下,可以对较多的流量数据值进行较快的预测,但也存在一些缺点。例如若某一时刻的数据缺失,则预测精度会迅速降低;卡尔曼滤波模型也属于线性回归方法,其基于对多元线性回归方法的进一步改进,可依据实际情况选择预测因素,预测精度相比于多元线性回归也有所提高,但由于该方法的运算过程中存在繁杂的向量与矩阵的运算,导致其计算时间的延长,故对于实时预测的实现存在一定的难度;神经网络算法主要基于风险的处理,即最小化预测中的经验风险,但并未对期望风险做最小化处理,故存在着一定的不足,且该方法需要一些网络结构、局部极小值点、过学习等的确定,同时神经网络需要基于大量的训练样本进行数据的预测[5]。支持向量机属于机器学习方法,并获得广泛应用,支持向量机解决了神经网络算法中易出现的过拟合、易陷入局部极值、收敛速度较慢等问题,主要针对性解决一些小样本、非线性数据的处理问题,是交通流量预测中的新预测方法[6]。相关向量机(relevance vector machine,RVM)是基于支持向量机基础所发展的新方法,同时具有一些特点,例如与支持向量相比,相关向量数目较少,且具有高稀疏性的特点;只利用核参数,样本的训练时间得以压缩;同时核函数非单一,具有多种选择空间等。因此,为达到提高交通流量预测方法的准确性和体现实时性的目的,本文提出一种基于相关向量机方法的交通流量预测,并利用该方法进行实例分析,验证该方法的预测性能。
2.1交通流量的特性分析
交通流量是指在确定的单位时间内,某一路段所通过的车流量的总和。交通流量的数据变化有着不确定性、实时变化性和高度非线性等特点。考虑到上述特点,以及某一路段、某一时段上的交通流量与前几个时段的交通流量存在着某种关系,可以利用前几个时段流量数据序列对未来某一个短时间时段的交通流量进行预测研究[7],即依据历史的交通流量数据与现有数据,应用一些数学与统计知识构建预测模型,对未来某一时段的交通流量进行数值的预测。设前t时间段的流量为:X1,X2,…,Xt,则下一时间单位的交通流量Xt+1可以描述为:Xt+1=f(X1,X2,…,Xt)。
2.2样本数据的预处理
交通流量值具有较大的差异性,在相关向量机模型的数据训练中,如果训练过程中所用数据具有较大的差异性,将导致模型学习速度变缓,从而影响数据预测的实时性。为了加快样本的训练速度和收敛速度,需要对最初采集的交通流量样本进行进一步的处理,以提高相关向量机模型的预测速度与精度。本文利用归一化方法对交通流量的数据做进一步处理:
相关向量机是以支持向量机为根基进行构建的,是基于贝叶斯学习理论提出的新的机器学习方法[8,9]。将同一时间段内同等间隔的交通流量观测值表示为一个时间序列S,S=[s1,s2,…,si,…,sM],假设观测值si与观测值si-1,si-2,…,si-r(si之前的r个观测值)之间存在的高度非线性关系,该关系可以表示如下:
si=ξ(si-1,si-2,…,si-r),i=r+1,r+2,…,M
其中,K(X,Xi)是核函数(radial basis function,RBF),Wi是回归系数。其中,核函数的构造主要选择高斯函数与二项式函数进行组合得到的多项式函数。输出结果集相互独立时,整个样本集的似然函数可以表示为:
其中,α=[α0,α1,…αN]T表示为超参数,αi具有对应的权值Wi。在获得先验分布和训练样本的情况下,定义先验概率分布及似然分布之后,由贝叶斯原理,权值向量Wi后验分布的数学表达式表示如下:
m=σ-2∑ΦTt∑=(σ-2ΦTΦ+A)-1
其中,A=diag(α1,α2,…,αN)。利用集成权重的方式获得最大似然函数如下:
其中协方差可表示C=σ2I+ΦA-1ΦT。分别对α和σ2求偏导,并且令偏导等于0,可以得到:
其中mi是第i个元素,同时γi=1-αi∑ii,∑ii是矩阵∑的第i个对角元。
相关向量机在循环计算过程中不断改变m和∑的值,直至达到收敛要求或最大迭代次数。即在模型内部的循环计算中,大部分权重趋近于0,故很大程度上核函数矩阵的项不会参与到实际的交通流量预测计算中。
为了验证RVM模型的实时性与预测精度,本文采用某市某路段一检测器的交通流量数据来进行对比验证。流量数据的检测周期是5 min。采用5个不同时间段的数据样本,共360个检测数据。对交通流量数据进行提前1个间隔点(5 min)的预测。建立模型前对数据进行预处理,用MATLAB软件编制仿真实验程序,选取合理的参数。图1为对交通流量的采集数据归一化处理之后的结果;图2主要将基于相关向量机的交通流量预测模型的实际交通流量值与预测流量的结果进行比较分析。表1为与其它方法相比的评价结果。
图1 交通流量原始数据的归一化结果 图2 支持向量机的预测结果
因为相关向量机为非线性预测能力模型,可以基本刻画交通流量的变化规律,由图2可知,RVM预测结果可以较好地描述交通流量的非线性变化规律,预测误差得以降低,预测实时性提高,精度得以提高。为验证应用RVM方法预测交通流量的精度与可靠性,将逻辑回归、支持向量机与相关向量机3种方法的预测结果进行对比分析,如表1所示。
表1 不同模型计算量的对比
从表1中3类方法的比较参数可知,逻辑回归和支持向量机的交通流量预测实时性明显高于相关向量机所用的预测时间,相关向量机的预测精度优于其它2种方法,且相关向量机方法具有产生预测误差范围的功能。对于该组实际的交通流量序列,本文提出的基于RVM的交通流量预测模型的综合预测性能优于逻辑回归模型和支持向量机模型。预测结果十分理想,预测速度相比其他两种模型明显加快,达到了交通流量预测的实时性要求,适合实时在线预测。同时从表1的预测精度结果可以得出,本文所用方法的预测精度相对较高。3种方法的对比分析表明,利用相关向量机方法对交通流量进行预测可以较为精确地描述出交通流量变化的非线性特点,模型性能和实时性都较好,是一种较为可靠的交通流量预测方法。综上可知,相关向量机提供了一种精度高、实时性较好的交通流量预测工具。
文中基于交通流量数据的特殊性,提出了基于RVM的交通流量预测模型。RVM方法解决了神经网络预测时间较长、泛化能力较差等问题,体现了其强大的小样本处理能力。实际数据验证结果表明,通过运用相关向量机方法预测交通流量,提高了预测效率、准确性和实时性。与其它模型进行对比分析表明,基于RVM的交通流量预测模型在预测精度和时间方面都具有一定的优势,是一种有效的交通流量预测方法。RVM可以同时输出预测值和预测值方差,非常适用于有实时性要求的交通流量预测估计,为交通流量预测这一关键技术领域的研究开拓了新的研究视角。下一步的工作内容,可以考虑将相关向量机方法与其他方法进一步结合,即构建基于相关向量机的组合预测模型,使预测精度更高、预测效度更详细,在不断的研究对比中扩展交通流量预测研究领域。
[1]傅贵,韩国强,逯峰,等.基于支持向量机回归的短时交通流预测模型[J].华南理工大学学报:自然科学版,2013,41(09):71-76.
[2]刘子昱.基于流量的交通信号智能控制算法与仿真[J].计算机仿真,2007,24(12):226-229.
[3]丛新宇,虞慧群,范贵生.基于组合模型的交通流量预测方法[J].华东理工大学学报:自然科学版,2011,37(03):340-345.
[4]周桐,杨智勇,孙棣华,等.分车型的高速公路短时交通流量预测方法研究[J].计算机应用研究,2015,37(07):1996-1999.
[5]杨显立,许伦辉,周勇.基于小波神经网络的道路交通流量实时预测模型研究[J].公路交通技术,2013,(05):111-114.
[6]郑勋烨,黄晶晶.基于支持向量回归机的交通状态短时预测和北京某区域实例分析[J].数学的实践与认识,2010,40(10):76-85.
[7]Wu C H,Ho J M,Lee D T.Travel-time prediction with support vector regression[J].Intell Transport Syst,IEEE Transact,2004,5(04):276-281.
[8]Tipping M E.Sparse Bayesian learning and the relevance vector machine[J].J Machine Learning Res,2001,1:211-244.
[9]杨国鹏,周欣,余旭初.稀疏贝叶斯模型与相关向量机学习研究[J].计算机科学,2010,37(07):225-228.
[责任编辑:关金玉英文编辑:刘彦哲]
Traffic Flow Prediction Based on Relevance Vector Machine
XONG Wen-zhen1,SHEN Xue-mei1,LI Hong-juan2
(1.Xinyang Vocational & Technical College,Xinyang,Henan 464000,China;2.Engineering Research Center of Metallurgical Energy Conservation & Emission Reduction,Ministry of Education,Kunming University of Science and Technology,Kunming,Yunnan 650093,China)
ObjectiveThe traffic flow value prediction in short time is an important part of traffic management system.And the traffic flow data is uncertain,complex and nonlinear,and so on.So the difficulty of the real-time prediction of the flow rate is improved and becomes an urgent problem.The traffic flow forecasting model based on correlation vector machine is built upon the existing research.MethodsThe relevant vector machine prediction accuracy was better than logistic regression and support vector machine method and RVM method had the function of prediction error range.For the actual traffic flow data,relevance vector machine model model was used in this paper.ResultsThe prediction results were ideal and the prediction speeded significantly faster when compared with the other two models,which met the requirements of real-time traffic flow forecasting.The results were suitable for real-time online prediction,and the prediction accuracy was relatively high.Comparative analysis of three aspects showed that by using relevance vector machine,the prediction could accurately describe the nonlinear characteristics of the traffic flow changes of traffic flow model and real-time performance was good. ConclusionAnalysis of the example shows that the prediction model based on traffic in the relevance vector machine can improve the speed and accuracy of forecast.It is applicable to the requirements of the real-time traffic flow forecasting,and provides a scientific method for real-time measurement of traffic flow data.
relevance vector machine;traffic flow;prediction
10.3969/j.issn.1673-1492.2016.05.006
国家自然科学基金资助项目(51066002/E060701);云南联合基金资助项目(U0937604)
熊文真(1983-),女,河南泌阳人,讲师,硕士研究生,主要研究方向:数学建摸、数字图象处理。
李红娟(1984-),女,辽宁彰武人,博士研究生,副教授,主要研究方向:能源预测与调度。
F 721.7
A
来稿日期:2016-03-03