钱坤 张建 娄欢 任勇 夏婷婷
摘要:目前,城市道路交通拥堵问题是亟待解决的城市管理难题之一,而交通流拥堵的预测对城市的交通管理至关重要。交通流密度是交通流状态的重要指标,交通流密度的预测对交通流状态的预测具有重要的意义。本文采用模糊信息粒化和支持向量机的组合模型对交通流的拥堵情况进行预测,通过数据降噪、数据标准化、数据信息粒化等处理,然后利用支持向量机(SVM)分类回归预测模型对处理后的数据进行回归预测,预测结果较为精确,可以很好地预测交通流饱和度的发展趋势和区间范围,对交通管理具有很高的参考价值。
关键字:模糊信息粒化;支持向量机;小波变换;数据标准化;交通流拥堵预测
Abstract:At present, traffic congestion is one of the challenges in urban management, while, prediction of traffic congestion is essential to traffic management. Traffic density is an important indicator of the traffic flow, density prediction of traffic flow is of important significance. This article uses a combined model of fuzzy information granulation and support vector machine to predict the traffic congestion, we carry out denoising, data normalization, data information granulation before using support vector machine to accomplish classification and regression prediction, prediction results is accurate. The model does better in prediction of trend and range of traffic density and has high reference value for traffic management.
Keywords: Fuzzy Information Granulation; Support Vector Machine; Wavelet Transform; Data Normalization; Congestion Prediction.
1 引 言
城市道路拥堵问题是大城市管理中主要的社会难题之一,严重影响城市居民的出行效率,特别是近些年来,尽管完成了一大批城市道路基础设施的建设,但是交通基础设施的建设很难满足交通需求的发展速度,城市交通的供需矛盾依然严峻。然而,交通基础设施的建设不仅严重浪费社会资源,同时由于建设周期长,很难及时有效地缓解交通供需矛盾,因此,交通管理和决策势必成为较为经济合理有效的路径,进而,有效的交通状态预测为交通管理提供科学有效的支撑显得尤为重要。
城市道路交通流状态的预测是智能交通一项重要的研究内容,根据交通流的平均速度、流量、密度和道路饱和率等评价指标将交通流划分为不同的状态,例如Stutz C等利用多元型聚类(FCMP)方法以速度为指标将交通流基本图分为自由流、密集流、拥挤流、阻塞流4个区域;廖瑞辉等利用云—支持向量机模型在交通流量、车辆速度、交通密度指标预测基础上评定交通流的状态并建立了交通拥堵预警机制; poriklif等直接在压缩域提取拥挤特征,利用高斯混合隐马尔可夫模型来检测交通状况。
城市道路交通流密度是交通流状态评价的重要指标,为简单起见,本文仅对交通流密度进行预测分析,而交通流量、车辆速度等指标预测分析和交通流密度预测分析原理相同,在此不做过多分析。
2 交通流拥堵预测建模
本文把交通流拥堵预测模型分为数据降噪、数据标准化、模糊信息粒化和回归分析预测四个组成部分,以下针对每一部分进行详细阐述。
2.1 数据降噪处理
城市道路交通系统主要受交通出行、道路条件和交通管理等因素的影响,因此在一定的道路条件和交通管理情况下,城市道路交通随着出行早晚高峰而呈现相对稳定的变化规律;然而,交通系统是人车路环境综合作用的复杂系统,因此城市道路交通因人车路环境随机因素的影响呈现随机性波动。对道路交通流的状态基本规律预测需要减弱随机性波动的影响,因此需要对数据进行降噪处理。
数据降噪方法主要包括基于时域或空间域的方法和基于频率域的方法,基于时域或空间域的方法常用的有: N点平均滤波、中值滤波、标准高斯滤波及自适应滤波;基于频率域的方法常用的有:傅立叶变换和小波变换。
傅立叶变换是在整体上将信号分解为不同频率分量 ,只能在频率域范围内表述,而缺乏局域性信息,小波变换对信号进行多层次分解,在各个层次选择阈值,对噪声成分进行抑制,更加灵活。本文采用数据小波变换处理来降低随机性造成的数据噪声。
小波变换分析能够针对某时间段内的信号的频率信息,即对时间序列信号采取多层分解策略,每一步分解得到分解信号的低频部分和高频部分,逐步分解N层就会得到最终的低频信息和每层产生的N层高频信息。
该方法能够很好地解决Z-Score标准化方法存在的变异程度上的差异相同的不足。标准化的数据通过分析运算后,将分析运算得到的结果进行逆向标准化处理即可把结果恢复到标准化之前的量纲。
综上所述,本文不存在数据变量间变异程度上差异的比较,选择Z-Score标准化方法对数据进行标准化处理。
2.3 模糊信息粒化
信息粒是一些相似度、功能性、接近性、一致性以及可识别性元素的集合,信息粒化是将研究数据整体分解为离散的信息粒的过程,信息粒化主要模型有基于粗糙集理论的模型、基于模糊集理论的模型和基于商空间理论模型,这三种模型具备不同的特点又在功能上相互补充。
交通流拥堵状态的界定存在一定的模糊性,同时由于城市交通系统受出行、道路条件以及交通管理等因素影响,交通流是人车路和环境的综合影响,呈现不确定性,然而,相邻较短时间段内交通流的状态又呈现相对的稳定性,因此我们对数据进行模糊信息粒化处理,每个信息粒代表某个时间段的模糊性和不确定性。
模糊信息粒化分为时间窗口划分和时间窗口模糊化两个步骤,对交通流密度数据进行时间窗口划分时,假定交通流的在5min时间段内保持相对稳定,其时间窗口 ;针对粒化后的时间窗口模糊化常用的基本形式包括高斯型、抛物线型、三角形和梯形,在此采用较为简单的三角形模糊粒子,其隶属函数形式如式(7):
(7)
数据经过模糊信息粒化后可以由一系列的信息粒 代表,其中,a表示相应时间窗口原始数据的最小值,m代表相应时间窗口原始数据的平均水平,b表示相应时间窗口原始数据的最大值。
2.4 数据回归预测
数据回归分析模型除了传统的线性和非线性回归分析等方法之外,应用较为广泛的还有人工神经网络模型、决策树模型、贝叶斯分类器和支持向量机模型。
支持向量机(SVM)用于模式分类和非线性回归分析,对原始数据通过特定的核函数映射的高维空间,使得在高维空间达到线性可分的目的,其主要思想是建立一个分类超平面作为决策曲面,使得正例和反例之间的隔离边缘最大化,是结构风险最小化的近似体现,在分类和回归预测问题上支持向量机能够提供好的泛化性能,然后,将分类问题转化为二次规划问题,因此能够得出全局最优解,进而避免了存在局部极值的弊端。
基于上述支持向量机的优势,本文采用支持向量机进行回归分析建模,该回归分析模型分为两步,第一步利用历史数据对模型进行学习训练,第二步利用第一步训练好的模型对未来数据进行回归预测分析。
3 仿真分析
我们基于上述模型在Matlab8.0和LibSVM-3.11工具包环境中进行编程实现,并针对交通流一天内每分钟密度数据进行仿真分析,我们把一天1 440个交通流密度数据粒化为288个信息粒数据,利用前287个数据对回归预测模型进行训练学习,利用训练好的模型对最后一个信息粒进行预测分析。
图1表示的是对交通流密度原始数据进行小波变换降噪处理前后的对比图,灰色线图表示未经降噪处理的交通流密度的曲线图,蓝色线图表示交通流密度经过小波变换降噪后的曲线图,对比发现,小波变换能够对交通流密度数据很好地降噪处理。
对降噪处理的数据进行数据标准化处理以消除量纲的影响,接下来对标准化的数据进行模糊信息粒化,模糊信息粒化得到的信息粒包含每个时间窗口的最大最小值和均值,由此对信息粒的最大最小值以及均值分别做回归预测分析,核函数采取径向基核函数,支持向量机的惩罚函数参数和核函数参数的寻优采取网格搜索的算法。
图2表示回归预测模型的训练效果图和最大最小值和均值预测值的点线图,横纵标表示一天24小时的时间序列,纵坐标是交通流密度的取值。(a)展示的是支持向量机回归预测模型的训练效果图,从图中可以看出,回归预测模型训练后的预测结果能够跟训练数据贴合得很紧密,由此可以看出支持向量机回归预测模型能够对交通流密度做很好的回归预测;(b)表示交通流密度预测的最大最小值以及均值,发现预测的均值全部包含在最大最小值组成的取值区间内,最大最小值和均值的预测值能够很好地展示原始数据的发展趋势。
图3表示交通流密度预测的最大最小值之差,横坐标表示一天时间序列,纵坐标range是最大最小值之差构成的交通流密度取值区间的范围,即 , 分别表示交通流密度预测的最大最小值,其中,误差 的占80.6%,由此可见模型能够准确地预测交通流密度的取值区间。
表1是基于模糊信息粒化和支持向量机组合模型对未来1个时间段内交通流密度的预测值和实际值以及预测相对误差的信息表,对比最大值最小值以及均值的实际值和预测值可以得出,相对误差在10%左右,模型的预测结果较为精确,能够很好地预测交通流密度的发展趋势和取值区间。
4 结 语
本文对城市道路交通流密度的历史数据进行建模分析,从数据去噪声处理到数据标准化处理,然后模糊信息粒化得到信息粒,最后利用支持向量机对信息粒进行回归预测,由仿真分析可知,基于模糊信息粒化的支持向量机模型在交通流密度预测中的效果较佳,实际值和预测值的误差基本可以控制在10%左右,从而能够获得城市道路交通流密度的发展趋势,此外,该模型能够获得城市道路交通流密度的变化区间,对交通管理的决策具有很大的参考意义。
主要参考文献
[1]Stutz C, Runkler T A. Classification and Prediction of Road Traffic Using Application-Specific Fuzzy Clustering[J]. IEEE Transactions on Fuzzy Systems,2002, 10(3):297 - 308.
[2] Porikli, Li F X. Traffic Congestion Estimation Using Hmm Models Without Vehicle Tracking[J].Intelligent Vehicles Symposium,2004IEEE:188 - 193.
[3]廖瑞辉,周晶.基于云-支持向量机的道路交通拥挤预警模型[J].系统工程,2015, 33(4):149-153.
[4]潘洋宇,李东波,童一飞.基于小波技术的数据降噪[J].机械设计, 2006,23(1):31-33.
[5]何韬,梁栋,李瑶.小波变换在电力谐波分析中的应用[J].计算机技术与发展,2007, 17(1):229-232.
[6]张钹,张铃.问题求解理论及应用[M].北京:清华大学出版社,1990.
[7]Zadeh L A.Towards a Theory of Fuzzy Information Granulation and its Centrality in Human Reasoning and Fuzzy Logic[J].Fuzzy Sets and Systems,1997,19(1):111-117.
[8]史峰,王小川,郁磊,李洋.Matlab神经网络30个案例分析[M].北京:北京航空航天大学出版社,2009.