吴启用, 廖嘉欣, 兰小机
(江西理工大学土木与测绘工程学院,江西 赣州341000)
社会经济的快速发展和城市规模的不断扩大促使城市机动车保有量迅速增长,城市道路通行承载压力不断加大,交通拥堵现象已呈常态化蔓延趋势。智能交通系统(Intelligent Traffic System,ITS)作为智慧城市的重要组成部分可以有效缓解交通拥堵,准确的短时交通预测则是其实现的关键。一般而言,对下一阶段交通状态预测的时间间隔不超过15 min称为短时交通预测[1-2]。然而,交通状态具有随机性和复杂性,特别是随着时间间隔的缩短,其呈现的非线性越强,预测难度也越大[3]。
目前,广泛部署于城市内的各类传感器为交通状态的预测提供了可靠的数据支撑,按传感器的运动状态可将其划分为固定位置的传感器(微波传感器、环路感应器、视频检测器、红外检测器及雷达检测器等[4-5])和移动式传感器(如GPS传感器[6-7])。近年来,无线技术的快速发展使得配备有蓝牙、WiFi等功能的智能移动设备大量普及,为交通信息的采集提供了新的思路。例如:Ahmed等初步验证了无线探测技术在交通领域应用的可行性[8];文献[9-10]研究了蓝牙传感技术在ITS中的应用,进一步揭示了无线技术服务于交通的潜力。
国内外针对短时交通状态预测已开展了大量研究,相关方法可分为参数方法和非参数方法。常用的参数方法有自回归综合移动平均(Autoregressive Integrated Moving Average,ARIMA)和Kalman滤波模型,二者在处理平稳时序数据时表现良好,但由于交通状态并非一直是平稳的,因此该方法不能很好地捕捉交通特征。非参数方法由于弥补了参数方法的这一不足而受到研究学者的关注,如傅贵等采用支持向量机回归 (Support Vector Regression,SVR)构建预测模型,并以此预测交通流量[11];王雪菲等提出一种面向高速公路大数据的K近邻(KNearest Neighbor,KNN)交通流预测方法,并验证其相比ARIMA模型有更高的预测精度[12];薛红军等基于决策树理论构建分类回归树模型,并对短时交通流参数进行了预测[13];Chen等将改进的小波神经网络引入短时交通流预测模型中,获得了更加稳定、准确的预测结果[14]。
从现有研究来看,交通预测建模大多采用的是传统交通检测数据,而鲜有涉及无线探测数据。为此本文利用WiFi探针获取交通数据,结合长短期记忆(Long Short-Term Memory,LSTM)网络进行交通预测建模,以交通状态指数(Traffic State Index,TSI)作为道路交通拥堵预测目标,并通过试验证明该方法的有效性和可行性,以期为未来交通预测方案提供新思路。
东莞市是珠三角区域中心城市之一,同时也是广东省重要的交通枢纽和外贸口岸。近年来,东莞市汽车保有量不断攀升,目前已突破300万辆,交通拥堵现象时有发生。东莞大道是市内的主要交通干线,贯穿整个东莞的中心区,每天交通流量巨大。本文在东莞大道选取5个路段作为研究对象,每条路段两端各安置一个WiFi探针,以东城中路路口至旗峰公园路口为待预测目标路段RP,其上游路段分别用RU1、RU2表示,下游路段分别用RD1、RD2表示,探针设备的分布地点如图1所示。
图1 探针设备的分布地点
信息技术的快速发展使得以WiFi为代表的无线通信技术逐渐普及,WiFi探针可根据WiFi技术的特点来捕获周围环境中可用的无线接入点(Access Point,AP)及开启WiFi的终端所发出的请求帧信号,其中包含了部分不涉及用户安全性的设备基础信息,如媒体访问控制 (Media Access Control,MAC)地址、信号强度、时间戳等[15-16]。WiFi探针的安装和维护成本较低,其采样频率为毫秒至秒级,在实际中设备的漏检率较低,因此,在特定的路口或路边安装WiFi探针可作为交通信息的采集工具。本文使用的WiFi探针数据为捕获的车载AP发出的信号,其部分数据形式如表1所列。表1中gwid为探针的MAC地址;stamac为探针在某一时刻探测到的车载AP的MAC地址,可用作对车辆的唯一标识;ssid为车载AP的网络名称;ctime为时间戳;power为探测的信号强度。
表1 原始探针数据
由于收集到的WiFi探针数据集中存在部分低质量数据,需对其进行如下预处理:①剔除只出现一次的数据。该类数据无法构成有效的车流数据,故选择删除。②删除异常记录的数据。由于探针设备布设在路口,信号在传输过程中可能会受周围环境的影响而产生异常,如同一个探测点在同一时间记录两条甚至多条相同的MAC数据,或在记录过程中时间戳出现乱码,这些数据对本研究无意义,故将此类数据也剔除。研究期间共获得321 851 848条WiFi探针数据,经预处理后获得有效数据175 970 793条。
当车载AP的MAC地址在某时刻被检测点Oi探测到,在另一时刻又被其相邻的下游检测点Oi+1探测到,则可将此MAC地址记为一条数据流,在时间间隔T内该路段交通流数据可表示为fT={x1,x2,x3,…,xk}。为获得更加接近实际车流量的样本数,采用人工计数法辅以验证,并通过式(1)获得扩样比例系数r。
式(1)中:fT表示15 min内通过MAC地址提取出的车流量;fK表示在同一时间段内通过人工统计的车流量,后经试验得到比例系数r为0.25。
虽然交通流量是造成交通拥堵的一个重要因素,但车流量的大小与交通状态并没有直接关系,当车流量很小时,可能是路段拥堵严重无法通行或者路段空旷车辆较少[17]。目前不少城市采取交通状态指数(TSI)衡量道路交通运行状况,本文采用式(2)量化描述拥堵情况,并以此作为拥堵预测的目标。TSI的取值范围为0~10,数值越大表示拥堵越严重。
式(2)中:vi表示路段i的平均车速,可通过探测到的MAC时差和连续探测点之间的距离进行计算;vi表示路段i的自由流车速,即指在交通量很小的条件下,车辆通过没有信号交叉口的城市干道的最大速度。结合东莞大道实际情况,本文以该路段设计最大限速80 km/h作为自由流车速。
基于获取的WiFi探针数据,以15 min为时间间隔构建完整的TSI时间序列。图2展示了2019年11月第4周RP路段周四至周日的TSI变化趋势。可以看出,周四与周五的TSI时间序列具有相似性,一天中TSI分别在8:00和18:00左右出现两次高峰,即工作日具有明显的早晚高峰,早晚高峰时TSI值较大,路况较为拥堵,而在周末则没有表现出明显的早晚高峰变化趋势,图2所描绘情况与实际情况较为吻合,可在一定程度上反映道路交通运行状态。
图2 工作日与非工作日TSI时间序列
长短期记忆(LSTM)网络是一种基于循环神经网络的变体网络,其具备学习序列数据中长期依赖关系的能力,因此可以有效弥补传统循环神经网络的不足[18-19]。LSTM使用记忆模块取代传统的隐层神经元,并在其中添加细胞单元状态用于存储和访问长期信息。单个LSTM记忆块的结构如图3所示。
图3 LSTM模块的结构
LSTM记忆块结构的关键在于通过输入门it、遗忘门ft和输出门ot控制长期状态c以达到长期记忆的目的。输入门负责将即时状态更新到长期状态c,遗忘门负责控制前一时刻单元状态中部分信息的取舍,输出门负责控制是否将长期状态c作为当前LSTM的输出。当前一时刻的单元状态ct-1沿图3中最上方的记忆线传播时,首先受到遗忘门ft的作用舍弃部分信息,保留下来的部分信息通过输入门it和当前输入的单元状态c~进行信息的更新,最后经过一系列计算得到当前时刻的单元状态ct;在记忆块中的另一条主线上,前一时刻的输出结果ht-1和当前时刻的输入值xt在经过输出门ot的运算后,与当前时刻的单元状态ct共同确定了当前时刻LSTM的最终输出结果ht。LSTM记忆块结构中具体的前向计算过程如式(3)~式(8)。
其中,W和b分别为对应的权重矩阵和偏置向量;[ht-1,xt]表示将两个向量连接成一个更长的向量;σ和tanh分别为sigmoid和tanh激活函数;◦表示按元素相乘。
为更好地评估本文模型在WiFi探针数据上的表现及预测能力,选用均方根误差(RMSE)、平均绝对误差(MAE)和决定系数R2作为模型预测精度评定指标,计算公式为:
其中,yi和分别为实测值和预测值;N为测试数据集中的样本数量。
神经网络中不同超参数的设置会对模型的性能造成不同影响,本文将TSI数据集按照4∶1的比例划分成训练集和测试集,并选取以下几个对LSTM网络有较大影响的超参数进行调整,包括时间步长、最大训练轮数、批次大小、学习率、优化算法和LSTM层神经元节点数量。其中,时间步长决定了需要通过前几个时刻的值来预测下一刻的值,未来交通拥堵状况不仅与当前时刻的状态有关,还与前几个时刻的状态有关,若时间步长过长则会增加模型训练时长,因此需通过不断调整时间步长使模型性能达到平衡。经多次调整后,RMSE在时间步长为3时最小,故确定时间步长参数为3,如图4所示。
图4 时间步长参数的选取
在确定时间步长后,其余5个超参数采用网格搜索法进行优化选取。网格搜索法是目前相对直观的一种参数优化方法,它可以通过枚举搜索得到模型在限定网格内的全局最优解。本文中各超参数网设置如下:最大训练轮数的取值范围为[100,800],步长为100;批次大小的取值范围为[10,60],步长为10;学习率的取值为[0.1,0.01,0.001,0.000 1];优化算法的取值为[SGD,RMSprop,Adam];LSTM层神经元节点数量的取值[16,32,64,128]。
表2列出了5种根据网格搜索法组合且具有较低RMSE的结果。当最大训练轮数为800,批次大小为60,学习率为0.000 1,优化算法为Adam,神经元节点个数为64时超参数组合的RMSE最低,此超参数组合下模型的损失函数图像如图5所示,结合RMSE与损失函数二者变化情况来看即确定了整个网络的各超参数。
表2 网格搜索调整结果
图5 损失函数变化
通常LSTM神经网络中拥有的层数越多,其相应的学习能力也就越强,但过多的网络层数设置也越易造成过拟合,所需训练数据也越多,训练难度加大。因此,本文采用2个LSTM层捕获时间序列特征,并在其后加入1个Dropout层防止过拟合,Dropout的比例依经验设置为0.5其泛化能力最好,最后以1个Dense层对结果进行降维并输出。整个网络结构的可视化结果如图6所示。
图6 多层LSTM神经网络结构
选取2019年11月1日—12月1日WiFi探针收集到的数据作为试验数据集,并对该数据集以15 min为时间间隔进行处理,共得2 976条数据,其中前24 d的数据用于模型训练,余下7 d数据用于模型测试,每条数据均包含该路段的交通流量、平均速度和TSI。
1)考虑流量/速度组合的TSI预测。对于短时TSI预测而言,其未来时刻的值不仅与当前以及前几个时刻的TSI有关,还可能与流量、速度等交通信息相关,因此通过构建不同的组合方式作为模型的输入可探究流量、速度对预测性能的影响。流量、速度及TSI这3个变量的不同组合形式如表3所列。
表3 流量、速度与TSI的不同组合
根据表3中的4种不同组合方式,分别对RU2、RU1、RP、RD1、RD25条路段用LSTM预测模型进行测试,其预测表现见图7所示。从预测结果可以发现,A3和A4这两种组合的表现要略好于A1和A2,而A3和A4均考虑了交通流量信息,因此可以推测流量对于模型提升TSI的预测精度有一定的影响。
图7 不同组合的指标比较
2)考虑上下游信息组合的TSI预测。城市交通路网中每条路段都不是孤立的,在进行交通预测时,通常都会考虑时间和空间相关性。对TSI的预测不仅可以使用目标路段自身的历史TSI数据,还可以使用其上下游路段的历史TSI数据。在同时考虑历史交通流量和TSI数据的基础上,将目标路段RP与其上下游相邻路段进行不同组合,并针对每一种组合使用LSTM模型进行预测,得到各个不同输入变量组合的预测结果(表4)。由表4可知,组合4和组合9相较于其他几种组合的预测精度要高,其中组合9使用全部5个路段的历史交通流量数据和TSI数据作为预测模型的输入,其预测精度最高。
表4 加入上下游信息的LSTM模型预测性能
表5列出了进行参数组合和不进行参数组合预测的对比结果,S1表示仅考虑目标路段的历史TSI数据,S2表示考虑目标路段历史交通流量和TSI数据,S3表示考虑目标路段及其上下游的历史交通流量和TSI数据。可以看出,相比于不进行参数组合,即仅考虑历史TSI数据的S1,进行了参数组合的S2与S3的各项评价指标均优于S1,但S3综合了时空因素的影响,因此其预测精度要进一步优于S2,且相较于S1其RMSE降低了11.89%,MAE降低了12.22%,R2提升了3.6%。
表5 不同参数组合的预测结果对比
本文选取支持向量机回归(SVR)和梯度提升决策树(Gradient Boosting Decision Tree,GBDT)两种常用的机器学习方法与LSTM进行对比,以评估不同模型对TSI的预测表现。其中,SVR核函数采用径向基函数,惩罚系数取值为200;GBDT的最大树深度为5,弱学习器的最大数量为750。同时为方便比较分析,LSTM、SVR和GBDT均采用相同的变量输入,即均以流量、TSI结合上下游信息作为组合变量输入。3种模型的预测值、实际值和残差在2019年11月29日的96个测试样本上的表现如图8所示,可以看出,3种模型均能较好地预测TSI的变化趋势。
图8 3种模型在2019年11月29日上的预测结果
表6列出了3种模型对1 d及7 d后数据进行预测获得的各项评价指标,从整体上看LSTM的RMSE、MAE和R2均优于SVR和GBDT,即考虑时间传播规律的深度学习模型对于原始数据的贴合性更好,证明了LSTM模型对短时交通拥堵预测的有效性。
表6 3种模型不同时长的预测结果
在数据驱动模式下的交通状态建模中,存在数据采集设备成本较高、特定目标路段采样量较少等问题,且以往关于WiFi等无线通信技术的研究多局限于室内客流检测,对开放环境下城市道路交通状况的检测关注较少。为此,本文以WiFi探针作为一种新式交通传感器获取数据,并通过LSTM网络建立城市道路短时交通状态预测模型,基于东莞市东莞大道的TSI数据进行实证研究,得到以下结论:
1)用WiFi探针数据构建的交通状态指数在一定程度上刻画了道路交通运行状态,其变化趋势基本符合道路实际运行情况,表明WiFi探针数据在交通领域具有一定的应用潜力。
2)根据LSTM网络结构及各种交通参数的特点,探究不同参数的最佳组合方式,发现在考虑空间相关性的情况下,交通流量与交通状态指数组合作为网络的输入获得的预测效果最好,说明该网络不仅利用了历史数据的时间相关关系,还利用了上下游路段的空间相关关系。
本文虽研究了WiFi数据在短时交通拥堵预测方面的应用,但由于无线通信检测技术应用于交通领域的相关研究较少,而开展大量实证性检验的成本又过高,因此WiFi探针数据的效用情况还需通过其他手段(如融合GPS、微波雷达等多源数据)进一步验证。同时限于当时所用探针数量,仅针对主干道路进行了研究,若日后进行大规模部署则可从更大尺度研究道路运行状态。