(长安大学 电子与控制工程学院,陕西 西安 710054)
随着公路交通和信息技术的飞速发展,高速公路管理者和使用者对公路交通提出了更高的要求,包括行驶速度、交通流量和道路安全等。在这些特征中,速度和速度变化是安全分析的重要指标。一些研究指出,速度变化和速度本身均为事故统计中的重要因素[1]。但速度通常受许多内部和外部因素的影响,前者包括交通流量和交通密度,后者包括天气(尤其是降雨和能见度)、道路状况和照明等[2]。在这些不利因素中,降雨是普遍因素,由于道路摩擦力差和能见度低,会对速度产生很大影响[3]。因此,为了提高道路安全性和舒适性,有必要研究降雨对速度的影响,并提供考虑降雨的速度预测方法。
本文首先系统评估了高峰时段和正常时段降雨强度和交通流量对行驶速度与速度方差的影响,明确了降雨强度和交通流量对行驶速度预测的必要性。然后,提出了一款基于深度置信网络(DBN)的决策级融合模型,该模型融合了3个数据源:交通流量数据、降雨强度数据和行驶速度数据。最后,融合3个数据的模型可预测出最准确的速度值。
从地理区域看,降雨分布的形状与城市环形道路的形状相似。因此,本文选择绕城高速作为研究对象。西安绕城高速全长88 km,路基宽35 m,是一条全封闭的双向两车道和六车道高速公路,设计速度[4]为120 km/h。将西安绕城高速上的12个收费站和11个立交点作为路段划分依据,但由于部分收费站与立交点距离很短,难以划分,因此选择12个收费站和5个立交桥将环城路划分为34个路段。
在收费数据中,每一行数据都记录了一辆车进入和离开收费站时的时间和牌照号。在收费站出口数据中,还记录了车辆进入时间和进入的收费站点。因此,收集了12个收费站的出口数据作为交通数据,由此可获得车辆的最短路径平均与平均行驶速度。
气象数据从中国天气网站收集,包括常见的气象参数,例如降雨、温度、风速、风向和相对湿度。网站天气数据每小时更新一次。本文收集了2018年5月至2018年7月每小时的天气数据。在三个月的时间里,收集了22 132条天气数据,其中包含26天中的713条降雨数据。
为研究降雨强度对不同时间段行驶速度和速度方差的影响,我们比较了高新收费站和雁塔收费站之间降雨日和正常日的行驶速度和速度方差。行驶速度值为该时段经过该路段所有车辆的平均速度。速度方差值为该时段经过该路段所有车辆的速度方差。选择3个典型的降雨日和正常日,并按小时计算行驶速度、速度方差与降雨量的平均值。图1展示了降雨日与正常日间的每小时行驶速度和速度方差对比。
从统计结果来看,降雨日的行驶速度与正常日的同一时间相比,中雨、大雨和暴雨条件下分别减少0.5 km/h,1.9 km/h和5.05 km/h。但是从图1可以看出,这些样本存在波动,降雨强度相似的不同时段变化幅度不同。分析降雨强度的影响应考虑时间段或交通流量。根据交通状况的不同,一天可分为3个时段:夜间时段、正常时段和高峰时段[5]。时间范围分别定义为23:00—07:00,9:00—17:00、19:00—23:00,7:00—8:00、17:00—19:00。在图1(a)中,降雨会降低车辆行驶速度,尤其在高峰时段。降雨日与正常日的速度差在早高峰时为2.99 km/h,在晚高峰时为5.52 km/h,明显大于一天的平均速度差2.15 km/h。同样,在图1(b)中,降雨时早晚高峰车辆的速度方差也明显大于正常日,早高峰两曲线的差值为0.02,晚高峰两曲线的差值为0.04,明显大于一天的平均值0.01。
图1 一天中行驶速度、速度方差与降雨强度之间的关系
统计结果一方面展示了降雨强度与行驶速度有较强的相关性,融合降雨数据为提高行驶速度预测精度提供数据依据;另一方面,降雨时高峰时段的速度方差变化说明了降雨对交通状态稳定性的干扰,进一步展示了使用预测的行驶速度来提前管控的必要性。
上文介绍了降雨和交通流量对速度的复合影响。本章利用获取的降雨和交通流量数据作为补充,基于DBN和决策级数据融合的预测模型对行驶速度进行更准确的预测。
深度置信网络(DBN)是由多层限制玻尔兹曼机(RBM)组成的深度学习模型。这些网络被限制为一个可视层与一个隐层,层间存在连接,层内单元间无连接。DBN首先使用非监督贪婪逐层方法训练RBM获得生成模型的权值,然后通过带标签数据用BP算法对判别性能做调整[6]。这种独特的训练方法使DBN可以解决梯度消失问题。图2展示了包含3个RBM和1个神经网络(NN)层的DBN结构。
行驶速度预测模型是一种时间序列预测模型,这种模型的超参数除了隐藏层数、神经元数量、Epoch外,还包括窗口长度。为确定合理的DBN体系结构,本文遍历2~24(时间)来选择合适的窗口长度,遍历1~5来设置合适的隐藏层数,从[100,500]中以50步长为单位测试最优神经元数量,从[100,1 000]中以100为步长测试最优Epoch。利用网格搜索找到最佳的超参数,结果见表1所列。
表1 不同输入数据的每个DBN网络的最佳结构参数
多源数据融合是一种能够综合多个来源信息的技术,与使用单个源数据相比,它可以实现更高的准确性。多源数据融合通常位于3个抽象层次:输入层(传感器数据)、特征层和决策层[7-8]。著名的分类结果如下[9]:
(1)低级融合:也称为原始数据融合,原始数据直接作为融合过程的源;
(2)中级融合:也称为特征级融合,融合特征以获得可以用于其他更高任务的其他特征;
(3)高级融合:也称为符号或决策级融合,它以决策形式为输入并将其组合以获得更准确或全局的决策;
(4)多重融合:处理来自不同级别的数据,例如输入与决策融合在一起以提供决策。
本文涵盖两种类型的数据:交通数据和降雨量数据。行驶速度预测模型的体系结构采用决策融合,将DBN模型使用交通和降雨时间序列数据获得的行驶速度进行融合,以提供更准确的预测。
本文构建的预测模型结构如图2所示。使用不同的输入数据构造了3个DBN,其输出均为未来时段的行驶速度。将DBN的数据作为数据融合层的输入,分别输入过去12 h的交通流量数据的时间序列,过去12 h的行驶速度数据的时间序列和过去2 h的降雨强度数据的时间序列。因此,输入为26。DBN的输出是预测的行驶速度。3种不同的决策作为数据融合的输入。
图2 使用DBN在决策级融合的行驶速度预测模型结构
由于径向基函数网络(RBFN)具有很好的拟合能力,因此它被用来融合数据融合模型中的3个决策。RBFN包含2部分,一个是具有RBF激活功能的隐藏层,另一个是使用NN层作为输出层。在此结构中,数据融合层的表达式如下所示:
式中:h(x)是RBFN的输出;output(x)表示NN层的函数;wm和b分别表示权重和偏差。
本文使用局方误差MSE与决定系数R2作为模型评价依据,其定义如下:
选择7个正常日与3个典型降雨日(6月26日,7月3日,7月4日)作为测试用例来验证预测模型。其中,6月26日早高峰有阵雨,7月3日和7月4日几乎全天降雨。我们使用3个月的多源数据(测试数据除外)来训练融合预测模型。作为对比,选择不包含降雨强度的多源数据和不包含降雨强度和交通流量的多源数据以及只包含行驶速度的数据来训练预测模型。另外,为了避免较大误差,每个预测方法测试3次。
图3展示了典型降雨日6月26日与7月3日不同输入数据下行驶速度预测曲线。表2详细展示了不同输入数据下模型在不同时段的精度。
图3 不同输入数据下模型的行驶速度预测曲线
表2 不同输入数据下模型在不同时段的评价指标
(1)不同输入数据的预测结果可以跟踪行驶速度的变化,并且它们具有相似的趋势,说明预测模型体系结构良好。
(2)通过对比MSE和R2评价指标,模型在融合行驶速度、流量和降雨强度时MSE为16.20,R2为0.61时表现最佳。模型融合行驶速度和流量次之(MSE为18.21,R2为0.57)。模型只使用行驶速度预测时最差(MSE为19.02,R2为0.52)。结果证实降雨强度数据和流量数据对提高行驶速度预测精度是有效的,而且本文的数据融合架构是可行的。
(3)降雨时段的MSE与正常时段的MSE进行比较,降雨时段的MSE明显更大。结合文中提到的降雨将引起行驶速度波动,可以看出降雨将显著增加预测难度。但融合降雨强度数据的模型可以减少降雨影响,将MSE值从22.15或21.67降低到19.11。
(4)比较高峰期和非高峰期的MSE,高峰期的MSE明显更大。主要原因是大交通流量引起的行驶速度波动。融合交通流量的模型性能在高峰期显著提高,MSE值从37.16降低到30.74或26.87。
本文首先分析了降雨对高速公路的影响,发现降雨会显著降低行驶速度。更重要的是,不同时段的降雨对速度带来不同的影响。在高速公路上,不同的时间通常意味着不同的交通量。所以,本文设计了一个融合降雨强度、流量与行驶速度的DBN预测模型,将综合预测误差由19.02降到16.20,以提高行驶速度的预测精度。根据该模型预测的行驶速度,道路管理者可以动态设置降雨条件下的道路管控方案,以提高高速公路的安全性与通行效率。