李长亮
(中远海运科技股份有限公司,上海 200135)
近年来,国家有关部门发布了多项用于指导公路信息化发展和智慧公路建设的文件,其中提出的云控平台将给高速公路的运行管理模式带来巨大变革。根据2018年3月交通运输部发布的《关于加快推进新一代国家交通控制网和智慧公路试点的通知》,基于大数据的路网综合管理已在多个省市试点,为智慧高速云控平台的发展奠定了基础。近几年,很多省市都在大力推进智慧高速公路建设,其中北京、浙江和江苏的影响力较大。
智慧公路云控平台主要为一定区域内的高速公路管理提供信息化、智能化手段,为高速公路上的应急事件处置提供信息支撑。借助云控平台,可全面掌控路网的状态,提高相关部门的路网管理能力和服务公众的水平,最终实现高速公路管理“可知、可测、可控、可服务”,使路网运行更安全高效,公众出行更便捷舒适,交通管理更科学智能,智慧道路更绿色经济。
随着经济的快速发展,车辆的不断增多,人们对高速公路服务质量的要求越来越高。目前的手机导航软件支持实时路况探知和未来短时路况预测功能,但在行车过程中频繁使用手机是比较危险的行为。同时,手机导航软件是从道路使用者的角度对路况进行预测的,未从道路管理者的角度对路况进行综合管控。本文尝试从道路管理者的角度出发,综合应用各类数据搭建能进行短时路况预测的预警系统。该基于短时路况预测算法的预警系统是智慧公路云控平台内有关路网管控的一个重要系统。
该预警系统的原理是:通过搭建数据中台,将门架数据、收费数据和天气数据等各种数据汇集到一起;对这些数据进行清洗、转换、分析和统计等处理之后,将其转换成数据服务,供系统本身和外部系统调用。因此,该预警系统主要由数据收集层、数据中台层和展示层等3部分构成,见图1。
图1 预警系统架构图
1) 数据收集层。数据收集主要是读取各种数据,并将其汇集到系统中。收集的数据主要包括收费车道数据、门架数据、黑名单数据、治超数据、绿色通道车(以下简称“绿通”)数据和发行数据等。
2) 数据中台层。数据中台包含平台管理、数据计算和应用程序接口(Application Programming Interface,API)开放平台等3部分。
(1) 平台管理主要是对平台的用户、API的权限和其他平台运行的基础数据进行管理,不包含业务数据;
(2) 数据计算主要是对收集到的业务数据进行清洗、转换和去重等操作,在此基础上整理分析统计结果,并将其存储到各数据库中;
(3) API开放平台主要对计算得到的数据进行封装和查询,提供对外服务功能,供前端应用或供第三方系统使用。
预警系统采用微服务开发架构,底层包含Cassandra集群服务、关系型数据库服务、ElasticSearch集群服务、Kafka集群服务、Redis服务、Hadoop服务和Spark服务等,底层服务上面是由很多微服务构成的数据应用,例如对发行数据进行分析的发行服务,对绿通数据进行分析的绿通服务,以及治超服务和平台数据监控等微服务。另外,还有提供给外部开发人员的API开放平台和提供给后台管理人员的后台数据管理服务等。最终这些微服务通过注册、网关服务,经由Nginx代理对外开放。系统本身也有一些主题展示,也通过Nginx代理对外开放。当然,短时路况预测算法采用的数据主要来自于运营服务。图2为预警系统服务构成图。
图2 预警系统服务构成图
预警系统包含交通数据获取模块、深度学习模块、算法校正模块和信息发布模块等4个模块,其工作流程见图3。
图3 预警系统工作流程
1) 交通数据获取模块主要用来获取实时和历时的交通数据,这些数据经过预处理之后流入深度学习模块。交通数据需作脱敏处理。
2) 深度学习模块采用短时路况预测算法对未来1 h或15 min的路况进行预测。下面以预测某40 km长的区域内未来15 min(即以15 min为1个时间片)的路况为例进行说明。取过去6个时间片(即6个15 min,合计90 min)中每15 min内各组出入口对(以下简称OD)的平均车速和流量作为算法的输入;取未来15 min内各组OD的预测车速作为算法的输出。
3) 算法校正模块在对算法进行训练和学习过程中,通过配置项不断地对其进行校正,以获取更好的预测效果和更高的准确度。
4) 信息发布模块根据预测的车速,按高速公路运行状态等级划分标准描绘对应路段的颜色,高速公路上的情报板实时显示该信息。
交通数据获取模块主要用于获取实时和历时的交通数据,并对这些数据进行预处理。预处理的内容包括删除异常数据和重复数据、填补缺失数据、去除噪声和使数据标准化。这部分工作主要由数据中台完成。
交通历史数据作为一种时间序列数据,具有时间相关性,即某时段的交通数据与之前多个时段的交通数据有关,且距离当前时段越近,数据的相关性越强。为分析交通数据的时间相关性,采用深度学习算法探究当前时刻交通数据与滞后时刻交通数据的相关性[1]。考虑到单个路段并不能很好地体现车辆行驶情况的变化趋势和整个高速路网中路段之间的关联性,就交通流速度或流量而言,某路段的交通状况易受周边路段的影响,如当路段上游堵车时,势必会导致下游车辆的速度减慢。通过对路网中的交通空间依赖性进行分析,可发现路段间交通数据的空间关联程度。
2.2.1 空间相关性
图卷积网络(Graph Convolutional Network,GCN)模型可获得中心道路与其周边道路之间的拓扑关系、编码道路网络的拓扑结构和道路上的属性,进而获得空间相关性。本文采用GCN模型,从交通数据中学习空间特征。一个双层GCN模型可表示为
(1)
2.2.2 时间相关性
获取时间相关性是交通预测的另一个关键环节。长短期记忆(Long Short-Term Memory,LSTM)网格采用门控机制控制信息的传递及状态和记忆单元的更新。本文采用LSTM网络模型,从流量数据中获得时间相关性[2]。LSTM内部的门控单元分别为输入门、遗忘门和输出门,这3个门相互独立,分别处理时间序列特征信息的输入、遗忘和输出过程。图4为LSTM单元模型的结构。
图4 LSTM单元模型的结构
2.2.3 时空图卷积网络模型
为同时捕获交通数据的空间相关性和时间相关性,提出一种基于GCN和LSTM网络单元的时空图卷积网络(Spatio-Temporal Graph Convolutional Network,ST-GCN)模型。具体而言,ST-GCN模型由GCN、LSTM网络单元和注意力机制(Attention)等3部分组成。hi-1为在时间i-1的输出;GC为图形卷积过程;ut和rt分别为在时间t的更新门和复位门;hi为在时间i的输出。具体计算过程如下。
ut=σ(Wu[f(A,Xt),ht-1]+bu)
(2)
rt=σ(Wr[f(A,Xt),ht-1]+br)
(3)
ct=tanh(Wc[f(A,Xt),(rt·ht-1)]+bc)
(4)
ht=ut·ht-1+(1-ut)·ct
(5)
式(2)~式(5)中:f(A,Xt)为图形卷积过程,定义为式(1);W和b分别为训练过程中的权重和偏差;tanh函数为双切正切曲线函数。图5为ST-GCN算法流程图。
ST-GCN模型可处理复杂的空间相关性和时间相关性问题。一方面,利用GCN对高速公路网络的拓扑结构进行捕捉,得到高速公路网络的空间相关性;另一方面,利用LSTM网络单元捕捉道路交通信息的动态变化,获得时间相关性,最终实现交通预测。
算法校正模块在对算法进行训练和学习过程中,通过配置项不断地对其进行校正,以获取更好的预测效果和更高的准确度。ST-GCN模型的配置项主要包括学习率、批量大小、训练循环和隐藏单元数。通过系统配置学习率为0.000 5,批量大小为32个,训练循环(次数)为50次。隐藏单元(数量)是ST-GCN模型的一个非常重要的参数,可能会极大地影响预测精度,系统配置隐藏单元为128个,此时预测精度最高。图6为配置项配置界面。
图5 ST-GCN算法流程图
图6 配置项配置界面
(6)
具体来说,EMA用于衡量预测值与观察值之间的平均绝对误差大小,其值越小,说明预测模型的精确度越高。本文采用2022年8月4日—9月15日宁夏银川市的高速公路数据进行算法训练和测试,图7为短时路况预测结果,得到15 min短时预测的EMA为13.36,60 min短时预测的EMA为11.51。即实际车速值和预测车速值的误差绝对值的平均值仅为13.36和11.51。
a) 15 min短时路况预测
b) 60 min短时路况预测
结合ST-GCN模型输出的预测车速,根据高速公路运行状态等级划分标准(见表1)换算得到路段的颜色信息,根据颜色信息生成可在情报板上显示的图片,经接口将图片推送给情报板展示。高速公路多彩智能情报板上显示的路况信息见图8。
表1 高速公路运行状态等级划分标准
图8 高速公路多彩智能情报板上显示的路况信息
预警系统除了集成实时和历时的交通数据以外,还集成道路服务者对道路的相关服务内容。本文将智慧服务区系统接入数据中台,利用外场多彩智能情报板显示服务区信息,见图9。
图9 高速公路多彩智能情报板上显示的服务区信息
当遇到事故时,将事故详细数据接入数据中台,通过车道级别的管控引导车辆提前避让,同时在交警的授权下开放应急车道,以缓解拥堵现象,见图10。
图10 高速公路多彩智能情报上板显示的车道管控信息
本文根据车辆速度的时间和空间特性提出一种以ST-GCN为核心算法,将GCN、LSTM网络模型和Attention相结合的基于短时路况预测算法的预警系统。目前该系统已在宁夏银川绕城高速公路和机场高速公路中得到应用,可对未来15 min和未来1 h的路况进行预测,算法支持2 min级别的更新。外场多彩智能情报板上显示的预测路况随着算法结果的更新而实时变化,同时支持道路施工和车道级别的管控等。该系统准确的路况和时间预测、多彩的信息展示得到了司乘用户的一致认可。然而,目前只能利用门架流水和收费站流水预测路况,数据还存在一定的滞后性和局限性,若能搭配高速公路上浮动车的数据,则系统的预测结果会更准确,这是未来研究的方向。