基于核函数切换和支持向量回归的交通量短时预测模型

2017-10-12 07:45李林超
关键词:交通量交通流向量

李林超 张 健 杨 帆 冉 斌

(东南大学交通学院, 南京 210096)(东南大学物联网交通应用研究中心, 南京 210096)

基于核函数切换和支持向量回归的交通量短时预测模型

李林超 张 健 杨 帆 冉 斌

(东南大学交通学院, 南京 210096)(东南大学物联网交通应用研究中心, 南京 210096)

基于高速公路交通量短时变化的非线性、不确定性和复杂性,利用支持向量回归模型,提出一种核函数切换的预测方法.首先,通过历史数据构建不同核函数的支持向量回归模型并对历史数据进行拟合,根据拟合的误差确定不同时刻对应的最优核函数类别; 然后根据历史数据及确定的不同时刻的核函数类别训练支持向量分类机; 最后利用支持向量分类机确定预测时刻最优的核函数类别,选取相应的支持向量回归模型进行预测.实例分析表明,与传统的支持向量回归模型相比,含核函数切换的预测方法预测精度较高,且具有较好的鲁棒性.

交通运输系统工程;交通量;短时预测;支持向量回归;核函数

Abstract: To simulate the nonlinear, probabilistic and complicated patterns in the short-term change of the highway traffic volume, a prediction model was proposed based on support vector regression and switch kernel functions. First, support vector regression models were built with different kernel functions by the historical data and the best kernel function was obtained using the fitting error. Then, a support vector machine model was trained. Finally, the best kernel function for the prediction interval was selected and the corresponding support vector regression model was implemented. A case study was used to evaluate the performance of the proposed model. The result shows that the model is superior to the traditional support vector regression model on the predicted accuracy, and thus it is more robust.

Keywords: system engineering of communication and transportation; traffic volume; short-term prediction; support vector regression; kernel function

进入21世纪后,我国城镇一体化进程加快,出行需求日益增加,交通拥堵问题不断恶化,随之产生的安全事故和环境污染问题成为阻碍城市经济发展的主要因素.因此如何解决交通拥堵问题引起了各个领域研究人员的广泛关注.在IT技术、通信技术和数据采集技术的推动下,智能交通技术也实现了突飞猛进的发展,并成为解决交通拥堵、提高交通安全、缓解交通污染的最有效手段.交通预测技术作为智能交通系统的组成部分,不仅能够为出行者提供路况信息,而且能够为交通管理与运营部门提供决策依据,因此,引起了研究人员的广泛关注.

交通预测是指利用历史数据对未来交通流状态进行推断.随着数据采集技术的发展,检测设备短时间内即可获取一次交通流状态数据,为实时交通预测提供了数据基础.目前短时交通预测研究中多采用5 min作为预测的周期,能够满足实时性要求.国内外主要的短时交通流研究可以分为时间序列类模型和机器学习类模型两大类[1].

时间序列类模型主要基于历史的交通流数据拟合其不确定性、周期性和非线性的变化规律,通过最小二乘、最大似然估计等参数估计的方法计算预先设定模型中的参数,然后使用模型对未来交通流进行预测.自回归移动平均模型(ARIMA)是一种著名的时间序列模型,在初期的交通预测建模研究中应用广泛.Smith等[2]最早应用ARIMA模型预测交通量;随后,Ghosh等[3]将季节性因素引入时间序列模型,构建季节性ARIMA模型,应用于拟合交通流数据的季节性变化特征.为了提高预测的准确性,Szeto等[4]将元胞传输模型与时间序列模型相结合,构建更加先进的预测模型,提高了其稳定性.除ARIMA模型外,Liu等[5]构建了可变参数的指数平滑与卡尔曼滤波组合算法,获得了较好的效果.然而此类模型建立基于大量的假设条件,包括模型形式、数据分布如正态分布等,限制了模型的发展.

随着机器学习的兴起,交通预测领域出现了大量机器学习类模型,该类模型形式灵活,对数据没有严格的分布要求,而且方便添加实时获取的新数据.季彦婕等[6]提出应用多层感知神经网络(artificial neural networks,ANN),并结合小波分解,提高预测精度.王建等[7]改进传统的贝叶斯模型,解决了迭代步长问题,提高了模型的运算效率.杨敏等[8]提出了支持向量回归(support vector regression,SVR)模型.Abdulha等[9]提出贝叶斯神经网络模型,提高了ANN模型的适用性能.另外k近邻回归模型也被应用于短时交通流预测研究中[10].在机器学习类模型中,ANN和SVR模型预测效果较好,应用也最为广泛.Smith等[11]使用ANN和时间序列模型对交通量进行预测,结果表明神经网络具有明显的优势.为提升预测精度,产生了大量由神经网络衍生的预测模型,包括贝叶斯神经网络预测模型[9]、小波神经网络预测模型[12]、动态小波神经网络预测模型[13]等.然而在交通量预测建模过程中,ANN易陷入局部最优解的困境,从而造成过拟合现象,虽然模型训练过程中精度很高,然而进行预测时,结果不理想.与ANN不同,SVR可以求出模型的全局最优解,因此,可以克服过拟合的不足.Chen等[14]对比了2种模型的预测精度,证明了SVR的预测精度高于ANN.

交通流状态的时间序列数据具有动态、非线性的变化特征,在不同的时段变化规律不同,这一复杂过程对建立交通预测模型带来困难.本文基于传统的SVR模型,提出了一种核函数切换的短时交通量预测模型,模型通过不同时段的变化规律对核函数进行调整,提高了预测的精度,从而可以为出行者和交通管理部门提供更加准确的交通信息.

1 支持向量回归

支持向量回归是一种典型的非线性核机器学习算法,有效地利用了核函数的特性,具有将低维空间的非线性问题转化为高维空间的线性问题这一特征,将模型的结构化风险降到最低.另一方面,SVR通过引入松弛变量在模型的精度与复杂度之间寻求折中,求取模型的稀疏解,从而有效避免过拟合现象的发生.

给定数据集(xn,yn),其中,xn为由历史交通量数据组成的第n个输入向量,yn为第n个测定的交通量.回归函数可以表示为

f(xn)=ωTφ(xn)+b

(1)

式中,φ(xn)为高维特征空间映射函数,对输入向量进行变换;ω,b为参数,可以通过最小化正则风险函数求解,可得

(2)

式中,C为惩罚系数;L(yn,pn)为损失函数;ε为回归函数不敏感区域的宽度.由式(1)计算的预测值pn和实际值yn之间的差值小于ε,则损失函数为0.否则会产生一个与误差相关联的线性代价.

(3)

上述约束优化问题可通过拉格朗日乘子法转化为

(4)

根据Karush-Kuhn-Tucker(KKT)最优化条件,进行对偶变换,可得

(5)

k(x,y)=xTy

(6)

k(x,y)=exp(-γ‖x-y‖2)

(7)

k(x,y)=tanh(γxTy+c)

(8)

k(x,y)=(γxTy+c)d

(9)

式中,γ为惩罚函数宽度系数;d为指数.核函数选定后,令拉格朗日函数关于ω的导数为0,最优化拉格朗日函数可得

(10)

因此,式(1)可表示为

(11)

2 含核函数切换的预测模型

根据所建立的支持向量回归模型,采用4种不同的核函数,利用历史数据进行训练即可获取传统的支持向量回归预测模型.采用4种不同模型对历史数据进行拟合,计算部分数据预测误差,结果如图1所示.由图中可以看出,不同核函数模型在不同的时段内具有不同的预测能力.为了提高预测精度,可以在不同的时段为支持向量回归选择最合适的核函数.

为确定不同时刻核函数的类别,将4类核函数对应于4个类别,将xi作为输入量,误差最小的核函数对应的类别yi作为输出,最终得到训练集为

T={(x1,y1),(x2,y2),…,(xn,yn)}

(12)

图1 不同时间核函数预测误差

① 利用历史数据训练不同核函数支持向量回归模型SVR1(KL),SVR2(KR),SVR3(KS)和SVR4(KP).

② 根据所建模型对历史数据进行拟合,确定不同时刻的最优核函数(误差最小的核函数),并将该时刻标定为类别i(i=1,2,3,4)对应的4种核函数.

③ 利用步骤② 中生成的数据构建支持向量分类机,采用分级分类的方法,实现多分类.

④ 将预测时刻的数据输入支持向量分类机,确定其类别i,进而确定最优核函数.

⑤ 利用最优核函数从步骤①中选择对应的支持向量回归模型,完成预测.

3 实例分析

3.1 数据来源及评价指标

本研究中采用高速公路检测器数据对模型进行验证,选取安装于I-43高速公路的5个检测器作为研究对象,其位置如图2所示.采集该路段2015年

图2 I-43 检测器位置

12月6日~12日的交通量数据,采集间隔为5 min.在验证过程中,将采集的数据分为训练集和测试集:前4天作为训练数据,第5天作为预测数据.数据中包含约1.2%的缺失数据,缺失数据通过取其他天相同时刻的数据的平均值进行修复.

本文选择的评价模型预测能力指标为平均绝对百分误差(Emape)和绝对百分方差(Evape)2种指标[15],其表达式如下:

(13)

(14)

3.2 试验环境

试验中支持向量模型通过R软件中的e1071包实现,电脑的配置为Window 10,64位操作系统,Intel(R) Core(TM) i7-2600 CPU @ 3.40 GHz,安装内存(RAM)为12 GB.

3.3 预测结果

不同模型的Emape和Evape值如图3所示.由图可见,在不同的地点,模型的预测能力相同,当使用单独核函数进行预测时,高斯核函数的预测性能较好;而引入核函数切换机制后,基于核函数切换的支持向量回归预测模型不仅可以提高模型的精度,而且可以提高模型的稳定性.

(a) 平均绝对百分误差

(b) 绝对百分方差

图4为5544号检测器在不同区间内模型的Emape值.由图可见,使用单独核函数进行预测时,在不同区间范围内,模型精度不同,具有不同的预测能力;而使用切换核函数预测模型,在所有的区间内预测精度都优于单一核函数.与高斯核函数、线性核函数、Sigmoid核函数和多项式核函数的支持向量回归模型相比,切换核函数平均精度分别提高了51.43%,60.37%,66.50%和90.27%.相比于传统的时间序列模型,切换核函数平均精度提高了68.73%.这表明切换核函数可以提高模型预测的鲁棒性.

图4 预测模型在不同区间内Emape的值

4 结论

1) 为改善交通量短时预测的性能,提出了一种基于核函数切换的支持向量回归机模型.首先通过分析不同的核函数预测误差,验证了在不同时刻、不同核函数具有不同的预测能力.其次,建立了支持向量分类模型,确定需要预测时刻的最佳核函数的选取.

2) 基于实际交通流数据,分析验证了本文提出的基于核函数切换和支持向量回归的交通量短时预测模型.结果表明,该模型具有较好的预测能力,相比于单一核函数(高斯核函数、线性核函数、Sigmoid核函数、多项式核函数)的支持向量回归模型,平均精度分别提高了51.43%,60.37%,66.50%,90.27%.相比于传统的时间序列模型,该模型平均精度提高了68.73%.另一方面,本文提出的预测模型预测结果稳定性也有所提高.

3) 综上所述,本文提出的基于核函数切换的支持向量回归机模型能够提高短时交通量预测的精度,并具有较好的鲁棒性能.

References)

[1] 李林超,何赏璐,张健. 时空因素影响下在线短时交通量预测 [J]. 交通运输系统工程与信息, 2016, 16(5): 165-171. DOI:10.3969/j.issn.1009-6744.2016.05.025. Li Linchao, He Shanglu, Zhang Jian. Online short-term traffic flow prediction considering the impact of temporal-spatial features [J].JournalofTransportationSystemsEngineeringandInformationTechnology, 2016,16(5): 165-171. DOI:10.3969/j.issn.1009-6744.2016.05.025. (in Chinese)

[2] Smith B L, Williams B M, Oswald R K. Comparison of parametric and nonparametric models for traffic flow forecasting [J].TransportationResearchPartC:EmergingTechnologies, 2002,10(4): 303-321. DOI:10.1016/S0968-090X(02)00009-8.

[3] Ghosh B, Basu B, O'Mahony M. Multivariate short-term traffic flow forecasting using time-series analysis [J].IEEETransactionsonIntelligentTransportationSystems, 2009,10(2): 246-254. DOI: 10.1109/TITS.2009.2021448.

[4] Szeto W Y, Ghosh B, Basu B, et al. Multivariate traffic forecasting technique using cell transmission model and SARIMA model [J].JournalofTransportationEngineering, 2009,135(9): 658-667. DOI: 10.1061/(asce)0733-947X(2009)135:9(658).

[5] Liu X, Chien S I, Chen M. An adaptive model for highway travel time prediction [J].JournalofAdvancedTransportation, 2014,48(6): 642-654. DOI: 10.1002/atr.1216.

[6] 季彦婕, 陈晓实, 王炜, 等. 基于小波变换和粒子群小波神经网络组合模型的有效停车泊位短时预测[J]. 吉林大学学报(工学版), 2016, 46(2): 399-405. DOI:10.13229/j.cnki.jdxbgxb201602010. Ji Yanjie, Chen Xiaoshi, Wang Wei, et al. Short-term forecasting of parking space using particle swarm optimization-wavelet neural network model [J].JournalofJilinUniversity(EngineeringandTechnologyEdition), 2016,46(2): 399-405. DOI:10.13229/j.cnki.jdxbgxb201602010. (in Chinese)

[7] 王建,邓卫,赵金宝.基于改进型贝叶斯组合模型的短时交通流量预测[J].东南大学学报(自然科学版),2012,42(1):162-167. DOI: 10.3969/j.issn.1001-0505.2012.0 1.030. Wang Jian, Deng Wei, Zhao Jinbao. Short-term freeway traffic flow prediction based on improved Bayesian combined model [J].JournalofSoutheastUniversity(NaturalScienceEdition), 2012,42(1):162-167. DOI:10.3969/j.issn.1001-0505.2012.01.030. (in Chinese)

[8] 杨敏,丁剑,王炜.基于ARIMA-SVM模型的快速公交停站时间组合预测方法[J].东南大学学报(自然科学版),2016,46(3):651-656. DOI: 10.3969/j.issn.1001-0505.2016.0 3.033. Yang Min, Ding Jian, Wang Wei. Hybrid dwell time prediction method for bus rapid transit based on ARIMA-SVM model [J].JournalofSoutheastUniversity(NaturalScienceEdition), 2016,46(3):651-656. DOI:10.3969/j.issn.1001-0505.2016.03.033. (in Chinese)

[9] Abdulhai B, Ritchie S G. Enhancing the universality and transferability of freeway incident detection using a Bayesian-based neural network [J].TransportationResearchPartC:EmergingTechnologies, 1999,7(5): 261-280. DOI: 10.1016/S0968-090X(99)00022-4.

[10] Zheng Z, Su D. Short-term traffic volume forecasting: A k-nearest neighbor approach enhanced by constrained linearly sewing principle component algorithm [J].TransportationResearchPartC:EmergingTechnologies, 2014,43: 143-157. DOI: 10.1016/j.trc.2014.02.009.

[11] Smith B L, Demetsky M J. Traffic flow forecasting: Comparison of modeling approaches [J].JournalofTransportationEngineering, 1997,123(4): 261-266. DOI: 10.10 61/(ASCE)0733-947X(1997)123:4(261).

[12] Ji Y, Tang D, Blythe P, et al. Short-term forecasting of available parking space using wavelet neural network model [J].IETIntelligentTransportSystems, 2015,9(2): 202-209. DOI: 10.1049/iet-its.2013.0184.

[13] Jiang X, Adeli H. Dynamic wavelet neural network model for traffic flow forecasting [J].JournalofTransportationEngineering, 2005,131(10): 771-779. DOI: 10.1061/(ASCE) 0733-947X(2005)131:10(771).

[14] Chen C, Wang Y, Li L, et al. The retrieval of intra-day trend and its influence on traffic prediction [J].TransportationResearchPartC:EmergingTechnologies, 2012,22: 103-118. DOI: 10.1016/j.trc.2011.12.006.

[15] Li L, He S, Zhang J, et al. Short-term highway traffic flow prediction based on a hybrid strategy considering temporal-spatial information[J].JournalofAdvancedTransportation, 2016,50(8): 2029-2040. DOI:10.1002/atr.1443.

Trafficvolumepredictionbasedonsupportvectorregressionwithswitchkernelfunctions

Li Linchao Zhang Jian Yang Fan Ran Bin

(School of Transportation, Southeast University, Nanjing 210096, China) (Research Center for Internet of Mobility, Southeast University, Nanjing 210096, China)

U491

A

1001-0505(2017)05-1032-05

10.3969/j.issn.1001-0505.2017.05.030

2016-11-26.

李林超(1991—),男,博士生;冉斌(联系人),男,博士,教授,博士生导师,bran@seu.edu.cn.

交通运输部科技示范工程资助项目 (2015364X16030, 2014364223150)、国家自然科学基金资助项目(6161001115)、东南大学优秀博士学位论文基金资助项目(YBJJ1736).

李林超,张健,杨帆,等.基于核函数切换和支持向量回归的交通量短时预测模型[J].东南大学学报(自然科学版),2017,47(5):1032-1036.

10.3969/j.issn.1001-0505.2017.05.030.

猜你喜欢
交通量交通流向量
基于LSTM的沪渝高速公路短时交通流预测研究
京德高速交通流时空特性数字孪生系统
基于ETC门架数据的高速公路交通量转换探究
向量的分解
聚焦“向量与三角”创新题
基于动态差法的交通量监测技术应用
高速公路补偿交通量模型研究
基于四阶段法的公路交通量预测研究
交通流随机行为的研究进展
向量垂直在解析几何中的应用