齐绪存 沈琴琴 单小轩 茅一波
摘 要:文章提出了一种新型的融合时空信息的分数阶滚动DGM(1,N)模型,新的预测模型充分考虑了城市路网中待测路段的交通流受多条相邻道路的历史信息的影响,采用分数阶累加生成算子对数据进行预处理极大程度上弱化原始序列的随机性和波动性,并采用粒子群算法(PSO)选取最优的累加阶数?酌。此外,在有限数据的情况下对模型进行一个实时滚动预测保证模型能够充分利用新信息。来自OpenITS平台的中国长沙城市路网算例的计算结果表明,文章所提出的模型具有较高的预测精度,明显优于已有的一些预测模型。
关键词:城市路网;时空关联性;分数阶滚动DGM(1,N)模型;粒子群算法
中图分类号:N941 文献标志码:A 文章编号:2095-2945(2020)27-0023-05
Abstract: In this paper, a new fractional order rolling DGM(1,N) model is proposed. The new prediction model fully considers the influence of the historical information of several adjacent roads on the experimental section. The fractional-order summation generating operator is used to preprocess the data to minimize the randomness and volatility of the original sequence to a great extent, and the particle swarm optimization(PSO) is used to select the optimal summation order ?酌. In addition, a real-time rolling prediction of the model with limited data ensures that the model can make full use of the new information. The calculation results of the urban road network in China's Changsha City from the OpenITS platform show that the model proposed in this paper has a high prediction accuracy and is obviously better than some existing prediction models.
Keywords: urban network; relevance of spatial and temporal; fractional rolling DGM(1,N) model; particle swarm optimization
1 概述
在過去的几十年里,为了解决由于急速上升的私家车数量引起的交通拥堵问题,许多国家采用智能交通控制系统(ITS)实时监管、调控城市交通路网的路况,从而达到缓解交通拥堵、预防交通事故的目的。实时准确的短时交通流预测是智能交通控制系统(ITS)的关键,是现阶段交通工作者研究的热点问题。
短时交通流预测,指分析局部交通系统在较短时间周期内交通流量数的变化规律,通过历史数据模拟预测未来时段的交通流。自1974年,Nicholson等[1]将时间序列模型应用到短时交通流预测上,大量的预测模型被提出并应用到短时交通流预测中,这些模型大致分为三类[2]:基础模型、参数模型[3,4]与非参数-数据驱动模型[5-7]。这些方法通常采用单一道路上的历史数据模拟预测,忽略路网系统内各路段的时空关联性。考虑到这一问题,国内外研究者逐渐将目光投向融合时空信息的交通流预测模型上: Stathopoulos等[8]提出了一种多元时间序列状态空间模型利用上游路段的历史数据改善下游路段的预测精度;而Ryu等[9]则是利用多条道路上的历史交通流信息,在原有的长短时记忆(LSTM)神经网络模型的基础上构建了时空状态向量进行预测。
但是,上述方法需要通过大量数据模拟训练,耗时长,不能满足交通流预测的实时性。多元灰色GM(1,N)模型可以在小样本、贫信息的情况下将与待测路段邻近的(N-1)条道路的历史信息用于预测,保证在利用各道路间的空间关联性的同时避免大量的数据模拟。传统的GM(1,N)模型采用一阶累加生成算子对原始数据进行预处理,这种处理方式并不能较好的弱化极端数据对预测精度的影响。为使灰色模型在数据处理时更好地弱化数据的波动性,吴利丰等[10]首次提出分数阶累加生成算子,大幅度提高了灰色预测模型的预测精度。
本文针对城市路网短时交通流的时空关联性、波动性等特性提出了一种新的融合时空信息的分数阶滚动DGM(1,N)预测模型(FRDGM(1,N)),新的预测模型首先将城市路网中待测路段与其具有空间关联性的(N-1)条邻近道路上的历史信息用于预测,相较单一断面的预测模型在工程应用中更具有实际意义;其次,在DGM(1,N)的基础上采用分数阶累加生成算子弱化原始序列的波动性,提高了模型的普适性和稳定性;最后,模型进行了实时滚动,在少数据的情况下也能充分利用新信息,保证了模型的精度。
2 融合时空信息的分数阶滚动DGM(1,N)预测模型(FRDGM(1,N))
传统的DGM(1,N)模型[11]采用一阶累加生成算子对原始序列进行处理,然而一阶累加生成为等权累加形式,在处理波动较强的序列时会因累加程度不够或累加过剩造成预测精度不理想。为此,本文选用?酌阶分数累加生成算子对原始序列进行处理,最优累加阶数?酌通过粒子群算法(PSO)选取,在此基础上实时滚动,新的模型得以建立。
2.1 分数阶累加生成算子
2.2 FRDGM(1,N) 的建立
2.3 粒子群算法确定r
根据式(7)与式(8)易知,待估参数 与累加阶数r存在明显的非线性关系,最小二乘法不能同时确定最优累加阶数r与待估参数 的值,在實际求解中,需给定r的范围,采用特殊的寻优算法确定最优累加阶数r的值,从而代入式(7)与式(8)求解待估参数,进而确定时间响应式。因此,本文选取粒子群算法在[0,2]范围内多次迭代选取最优累加阶数r,并选取拟合误差平方和(S S E)作为该算法的适应度函数,即:
粒子群算法(PSO)是一种在初始状态时随机输入多个粒子,并通过不断迭代更新粒子的速度和位置信息,通过适应度函数不断判断选择产生全局最优解gBest和个体最优解pBest。适应于多维变量寻优和较为复杂变量的寻优算法,由于其迭代次数少,寻优精度高的特点现已应用于各类模型中[12];其最基本的两个公式为速度迭代公式和位置迭代公式,如下:
其中,?棕,c1,c2为自定义系数,?姿1与?姿2为取值在[0,2]范围的常数;pBestq表示在第q次迭代中的局部最优解;pBestq是指经过前q次迭代后得到的全局最优解;Vq(i)为第i个粒子在第q次迭代时的速度,rq(i)为第i个粒子在第q次迭代时的位置;可由式(12)迭代得,而初始值r1(i)则根据r的取值范围确定,即:
其中Pmax和Pmin分别是r取值范围的下限和上限。
本文一共设置了10组初始解,迭代次数设置为100次。根据上述公式对每组初始解进行迭代运算,每次迭代都会产生一个局部最优解,pBest即为该次迭代中的最优累加次数。将其代入式(10)计算适应度,当高于gBest的适应度时用pBest代替,否则不变。直到迭代完成后,最终的gBest即为所求分数阶的全局最优解。
3 数值案例
3.1 数据来源
本文所采用的交通流数据来自于开放的智能交通系统平台(OpenITS)[13]。以中国长沙市芙蓉区的一段路网为例,如图1所示。根据交通流的空间相关性原理,选择路段1为待测路段,其余6个路段作为输入变量,分别以15min、10min、5min为一时间间隔来比较分析本文提出的FRDGM(1,N) 模型与LSSVM模型[13]、滚动DGM(1,N)模型的精度。
3.2 评价指标
为了评价预测结果,本文采取平均绝对百分比误差(Mean Absolute Percent Error,MAPE):
由于离差被绝对化,不会出现正负相抵消的情况,所以平均绝对误差能更好的反映预测值误差的实际情况,其值越小表明模型的精度越高。
3.3 预测结果
三种模型均采用路段1的8:00-15:00历史交通流与其余路段7:50-14:50的历史交通流作为拟合交通流数据,不断滚动输入其余 6个路段14:50-19:50的交通流数据,用以预测路段1的15:00-20:00时刻的交通流,其中LSSVM模型需要给定参数,本文给定的参数?酌为10,?啄2为0.4。利用MATLAB计算出几种模型的预测值和MAPE值,对比分析模型的精度。
表1比较分析了FRDGM(1,N)模型、LSSVM、滚动DGM(1,N)模型以5min、10min、15min为一时间间隔的预测MAPE值,可以看出FRDGM(1,N)模型明显优于另外两个模型,这是因为FRDGM(1,N)模型在预测时采用粒子群算法确定最优分数阶?酌,最大程度上削弱了极端数据对预测精度的影响,进而提高了预测精度。
从图2、图3与图4可以看出各时间间隔下的三种模型的预测数值波动规律与原始交通流波动基本一致,但以10min、5min为一个时间间隔的实际交通流因为间隔较小,随机波动性较强,图上的高峰点与低峰点较多,三种模型虽然没有完全与其保持一致,但数值偏差较小。但融合局部交通路网时空信息且能削弱原始序列波动性的FRDGM(1,N)模型相较其他两种模型在数据节点与实际值的偏差上更小。
4 结论
本文建立了一种新的融合时空信息的分数阶滚动DGM(1,N)预测模型(FRDGM(1,N)),该模型能够适用于路网较复杂、各道路之间空间关联系较大的路段预测,且能在最大程度上削弱极端数据对整个模型精度影响的同时保证数据的实时更替性。以下为本文结论:
(1)对于城市路网各道路之间的因果关联性,采取离散多元灰色预测模型作为本模型的基础模型,相较一般传统GM(1,1)模型能够将其他与待测道路因果关联性较强的道路实时交通流数据作为影响变量加入模型中,进而提高模型的精度。
(2)对于城市路网局部系统内交通流的随机波动性,
该模型通过粒子群算法选取最优累加算子极大程度上削弱极端数据的影响,使模型相较基于一阶累加算子的灰色预测模型的普适性更高。
(3)建立了滚动模型在有限数据的条件下保持新信息优先,模型精度更高,工程应用的难度更低。
对于章节3的数值案例,该模型分别与智能算法模型(LSSVM),传统多元灰色模型(DGM(1,N))进行了系统科学地比较,该模型稳定性与普适性相较传统DGM(1,N)模型得到了改善,同时在预测精度上明显优于其他两种模型。
参考文献:
[1]Nicholson H, Swann C D. The prediction of traffic flow volumes based on spectral analysis[J]. Transportation Research, 1974,8(6):533-538.
[2]Laa I, Ser J D, Vélez M, et al. Road traffic forecasting: recent advances and new challenges[C]. IEEE Intelligent Transportation Systems Magazine, 2018,10(2):93-109.
[3]孫波军,尹伟石.改进的灰色模型及在短时交通流中的应用[J].数学的实践与认识,2016,46(23):201-206.
[4]裴焰栏,肖新平.具有时滞和周期特征的短时交通流灰建模及其应用[J].数学的实践与认识,2016,46(19):110-116.
[5]马秋芳.改进PSO优化的BP神经网络短时交通流预测[J].计算机仿真,2019,36(04):94-98+323.
[6]王祥雪,许伦辉.基于深度学习的短时交通流预测研究[J].交通运输系统工程与信息,2018,18(01):81-88.
[7]温惠英,李俊辉.基于改进支持向量机的交通流量预测算法研究[J].交通与计算机,2008,26(02):4-7.
[8]Stathopoulos A, Karlaftis M G. A multivariate state space approach for urban traffic flow modeling and prediction[J]. Tran- sportation Research Part C: Emerging Technologies, 2003,11(2):121-135.
[9]Ryu U, Wang J, Kim T, et al. Construction of traffic state vector using mutual information for short-term traffic flow prediction[J]. Transportation Research Part C: Emerging Technologies, 2018,96:55-71.
[10]Wu L F, Liu S F, Yao L G, et al. Grey system model with the fractional order accumulation[J]. Communications in Nonlinear Science and Numerical Simulation, 2013,18(7):1775-1785.
[11]Ma X, Liu Z B. Research on the novel recursive discrete multivariate grey prediction model and its applications[J]. Applied Mat-hematical Modelling, 2016,40(7-8):4876-4890.
[12]温惠英,李俊辉.基于改进支持向量机的交通流量预测算法研究[J].交通与计算机,2008,26(02):4-7.
[13][EB/OL]http://www.openits.cn/openpaper/567.jhtml.