基于MLP的相关路段流量预测模型

2021-09-13 13:51:04付相君周先颖
关键词:隐层检测器路网

张 弛,付相君,周先颖,陈 坚

(1.重庆交通大学 交通运输学院, 重庆 400074; 2.重庆市交通规划和技术发展中心, 重庆 400060)

作为交通现代化建设的关键组成部分,智能交通系统(intelligent transport system,ITS)在提升交通管理水平、道路通行效率方面发挥了重要作用。从智能交通系统基于数据驱动的内核来看,完善的交通数据采集系统不可或缺。但受制于财政预算与建设计划,目前流量检测器主要布设于城市快速路、主次干路等重点区域,无法达到路网全覆盖[1]。这导致部分道路无法受到有效监控,成为了交通数据采集系统的“盲区”。因此,通过有限数量的流量检测器实现全路网交通状态的实时准确感知,是现阶段快速推广智能交通系统、实施城市交通精细化管理的必要保障。

交通流量预测研究按不同预测时间跨度可分为:实时预测、短期预测(5~30 min)、中长期预测(30 min以上)。其中,实时流量预测以具有相关性的路段流量为研究对象,通过已知路段(有流量检测器)流量来预测其他具有相关性的未知路段(无流量检测器)流量,实际应用于指导路网流量检测器的布设优化。Bianco等[2]使用OD矩阵分析路段流量相关性,得到路网所需流量检测器的最少数量。姜桂艳等[3]根据聚类谱系图按流量相关性强弱对路段进行划分,将相关性强的路段定义为“相关路段”,然后根据逐步回归法构建了相关路段流量间的线形回归方程。张航等[4]通过模糊聚类对路段流量相关性进行分析,并同样使用逐步回归法构建了流量预测模型。Castillo等[5]考虑OD对的变异性,提出了基于贝叶斯网络的相关路段流量预测模型。王殿海等[6]基于路段流量相关性筛选路网中的关键路段,通过线性组合的方法由关键路段流量推算出了其他路段流量。郑长江等[7]采用模糊聚类划分相关路段,再根据分组结果对流量检测器布局进行优化。已有研究主要通过聚类分析来探索路段流量间的相关性,然后在相关性较强的路段流量间分别建立两两对应的数学关系,其建模过程较为繁复,难以实际应用。在使用多维标度法划分相关路段的基础上,针对每组相关路段基于多层感知机建立了实时流量预测模型,实现了由关键路段已知流量至同组其他所有未知路段流量的整合建模,建模过程更为简捷。在区域路网流量检测器的实际布设中,仅需在少数关键路段布设流量检测器,即可由模型预测得到全部路段的流量数据。

1 相关路段

1.1 路段流量相关性

在空间层面,城市路网中的路段通过节点(交叉口)相互连接,节点处交通流量总流入等于总流出,并呈现一定程度的连续流状态,故区域路网内的某些路段流量数据呈现空间相关性(即路段流量相关性),这是构建和训练相关路段流量预测模型的基本依据[8]。

1.2 相关路段界定

城市路网由基本路段(交通量保持不变的一段单向道路)组成。根据路段流量相关性,区域路网中所有基本路段可被划分为多组具有流量相关性的路段(即相关路段),每组相关路段的流量在同一时刻存在多元线性相关或多元非线性相关的关系。流量检测器的布设原理是在每组相关路段中选取一条关键路段布设流量检测器,实时获取该关键路段某一时刻的流量数据,再根据流量相关性使用适当的方法来实时预测同组其他基本路段在同一时刻的流量。因此,区域路网中相关路段的分组数量即是所需布设流量检测器的最少数量。

2 基于MDS的相关路段划分

相关分析是一种研究不同变量之间关系的统计分析手段,常用的方法包含相关系数法、聚类分析及多维标度法等。其中,相关系数法仅能分析样本两两之间的相关关系,无法直接确定所有样本间的相对相关程度,对于相关路段划分这类大样本问题的适用性不高。聚类分析由于直接把高维样本纳入一维谱系分类中,可能导致样本间关系简化甚至失真。而多维标度法(multi dimensional scaling,MDS)依据样本之间的原始距离,将样本从高维空间转化到低维空间,实现了低维空间中样本坐标点间欧几里得距离与其实际相关性的匹配,相较于聚类分析更能完善地保存样本间的原始关系[9]。因此,本文采用Kruskal的非度量古典MDS分析路网中所有路段流量间的关系,根据流量相对相关程度来划分相关路段,步骤如下[10]:

步骤3假设X(n×r)是r维拟合构造图,相应的距离矩阵为D=(dij);假设r维空间中的n个点表示为X1,X2,…,Xn,则Xi的坐标记为Xi=(Xi1,Xi2,…,Xir)T,i=1,2,…,n。则对象i与j在r维空间中的欧几里得距离为:

(1)

(2)

式中:Stress取值范围为[0,1],数值越小表示拟合度越好。拟合构图压力系数的值所对应的拟合程度如表1所示。

表1 压力系数值拟合程度

步骤4在确定维数r时,从r=1开始迭代,当Stress的值首次小于5%时的维数r即为最小维数。对于每一个r,都可以找到使Stress值最小的拟合构图。

步骤5根据各路段流量样本在r维拟合图中的分布,得到相关路段分组。

3 基于MLP的流量预测模型

3.1 MLP适用性

多层感知机(multi-layer perceptron,MLP)由单层感知机拓展而来,网络结构包含输入层、隐层、输出层,是一种常用的深度学习模型。由于结构中存在一层或多层隐层,MLP具有很强的自适应、自学习及容错能力,能解决单层感知机不适用的非线性可分问题,目前已被广泛应用于区域物流需求预测、区域公路网规模预测等领域。根据城市道路交通流理论,路段流量与其影响因素之间存在复杂的非线性关系,简单模型难以对其进行建模和计算。因此,本文使用MLP模型来建立相关路段流量间的映射关系。

3.2 模型变量及结构

相关路段流量是城市形态、路网布局特征、区域交通流时空特征等多维因素相互耦合的结果,并在空间上呈现出路段流量相关的现象。因此,在每组相关路段中关键路段流量已知的前提下,预测同组其余路段流量的要点在于如何描述该关键路段与被预测路段流量间的相关性,并以此构建相关路段流量间的映射关系。路段流量相关性的本质是依附于路网的车流存在连续流状态,故路网拓扑结构是影响路段流量相关性的最主要因素。在微观路段层面,被预测路段的车道数[11]反映了其物理特性,最短路径长度反映了其与关键路段间的距离关系;在宏观路网层面,被预测路段的度[12]、介数[13]、紧密中心度[14]分别从相连路段的数量、出现在路网中各个最短路径的概率、至其他路段的可达性3个方面反映了其在路网中的重要程度。这5个拓扑结构指标均通过直接影响路网流量分配结果间接影响关键路段与被预测路段流量间的相关性,如图1所示。

图1 路网拓扑结构对路段流量相关性的影响过程框图

因此,针对每组相关路段,选取关键路段已知流量及被预测路段的车道数、最短路径长度、度、介数、紧密中心度5个拓扑结构指标作为流量预测模型的输入层变量,如表2所示。

表2 输入层变量定义

双隐层MLP模型相较于单隐层MLP模型更适宜学习不连续函数(如锯齿波),如图2、3所示。同时,如在第1个隐层设置较多的隐节点,而第2个隐层设置较少的隐节点,更有利于改善多层前馈网的性能。因此,构建结构为(6,p,q,1)的双隐层MLP模型及(6,p,1)单隐层MLP对比模型,分析隐层数量对流量预测效果的影响。各模型均采用相同的样本数据进行训练,通过试凑法(对比网络的迭代次数和误差精度等指标)确定隐层神经元数量。

图2 单隐层模型结构示意图

图3 双隐层模型结构示意图

3.3 模型训练

对样本数据进行归一化处理后,采用BP算法进行MLP模型训练。BP神经网络的学习过程包括信息正向传播和误差反向传播两部分,核心思想是通过反向传播将所得误差分摊给各层所有单元。

1) 信息正向传播过程

(3)

2) 误差反向传播过程

(4)

式中:yi为样本数据输出层i节点流量真实值;ai为样本数据输出层i节点流量输出值。

优化目标为确定W(权值)和b(偏置)使得损失函数C(W,b)最小,模型输出的流量预测值将越来越趋近于真实值。W和b的迭代公式如下:

(5)

式中:α为学习速率,取值范围(0,1]。

3) 效果评价

为验证预测模型精度,使用平均相对误差(MRE)、均等系数(EC)对模型预测效果进行综合评价。其中,MRE反映了模型预测值偏离实际值的程度;EC反映了模型预测值与实际值的拟合度,数值大于0.85表明拟合度较好[15]。

(6)

式中:yi为第i个测试样本实测值;为第i个测试样本预测值;n为测试样本数量。

4 实例分析

以重庆市渝中区两路口环道及周边道路路网为实例分析对象。该区域路网主要承担南北向出入境车流及区内东西向转换车流,交通地位突出。路网共包含12条道路,按单向路段流量不变(无流入流出)的原则可被划分为33条基本路段,如图4所示。通过区域路网已布设并投入使用的微波检测器获取全部基本路段2019年7月15日至8月15日(共32 d)每天6∶00—24∶00(间隔5 min,一天217条数据)的流量数据。

图4 区域路网

以33个基本路段为变量(变量名分别为L1~L33),使用IBM SPSS Statistics 22软件基于MDS进行相关路段划分。将各路段32 d中每天间隔5 min 的流量数据取32 d的平均值,整合得到各路段一天的平均流量数据,以此计算各路段的流量数据相关系数矩阵,然后将其转化为广义距离矩阵。分别计算1、2、3维空间下的压力系数值,结果显示二维空间下匹配程度最高,如表3所示。根据二维空间拟合构图,33个基本路段可分为4组相关路段。第1组:L13、L26、L30,第2组:L3、L4、L5、L6、L7、L8、L9、L17、L18、L27、L28、L29,第3组:L1、L2、L10、L11、L12、L14、L15、L20、L21、L22、L23、L24、L25、L31,第4组:L16、L19、L32、L33,如图5所示。MDS线性拟合散点分布基本呈线性,如图6所示,表明采用欧几里得距离对原始距离矩阵的拟合程度较好。

表3 各维数压力系数值

图5 二维拟合分组示意图

图6 线性拟合散点分布示意图

以第3组相关路段为例,建立基于MLP的流量预测模型。使用Pajek软件处理路网拓扑结构,结合实地调查,得到第3组各相关路段的车道数、最短距离、度、介数、紧密中心度数据。经相关分析,5个拓扑结构指标之间呈弱相关性(相关系数均小于0.3)。根据介数最大原则,确定路段L20为第3组的关键路段。按照神经网络训练数据量大,测试数据量小的原则,选取各基本路段前31 d(7月15日—8月14日)的流量及5个拓扑结构指标数据作为训练样本数据,最后1 d(8月15日)的流量及5个拓扑结构指标数据作为测试样本数据。对数据进行缺失值和异常值处理后再归一化。采用Matlab编程进行训练,将模型训练误差指标设置为MRE,训练目标设置为0.1,传递函数采用sigmoid,学习率为0.001,最大迭代次数为1 000次。经过训练并形成稳定的预测模型后,单、双隐层模型各层神经元节点数分别为(6,13,1)、(6,10,3,1),误差评价指标如表4所示,模型输出结果反归一化得到的各路段流量预测值与实际值拟合如图7、8所示。结果显示:单、双隐层模型的平均相对误差(MRE)均在0.1以内且均等系数(EC)均大于0.85,表明流量预测值与实际值拟合度较高,MPL模型在实时流量预测中具有较高适用性。其次,双隐层模型的误差指标均优于单隐层模型,表明双隐层MLP模型较单隐层MLP模型在相关路段流量实时预测领域具有更高的预测精度,即隐层数量在一定程度上会影响模型预测精度。

表4 模型误差评价指标

图7 单隐层模型流量拟合曲线

图8 双隐层模型流量拟合曲线

5 结论

1) MDS、MLP在城市区域路网相关路段流量预测领域具有较高适用性,可实现由关键路段已知流量至同组其他所有未知相关路段流量的整合建模,建模过程较传统实时流量预测更为简单。

2) 双隐层MLP模型较单隐层MLP模型在相关路段流量预测领域具有更高的预测精度,达到87.4%。

3) 区域路网流量检测器的布设可根据相关路段MDS划分结果,仅需在每组相关路段中的关键路段布设流量检测器,再由双隐层MLP模型预测得到同组其余未布设流量检测器路段的流量,通过有限数量的流量检测器实现对区域路网流量的全面检测。

猜你喜欢
隐层检测器路网
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
人民珠江(2019年4期)2019-04-20 02:32:00
打着“飞的”去上班 城市空中交通路网还有多远
环球飞行(2018年7期)2018-06-27 07:25:54
省际路网联动机制的锦囊妙计
中国公路(2017年11期)2017-07-31 17:56:30
首都路网 不堪其重——2016年重大节假日高速公路免通期的北京路网运行状况
中国公路(2017年7期)2017-07-24 13:56:29
路网标志该如何指路?
中国公路(2017年10期)2017-07-21 14:02:37
车道微波车辆检测器的应用
一种雾霾检测器的研究与设计
工业设计(2016年11期)2016-04-16 02:49:43
基于近似结构风险的ELM隐层节点数优化
计算机工程(2014年9期)2014-06-06 10:46:47
最优隐层BP神经网络的滚动轴承故障诊断
一体化火焰检测器常见故障分析
河南科技(2014年22期)2014-02-27 14:18:12