徐先峰, 宋亚囡, 黄刘洋, 夏振, 潘卓毅
(长安大学 电子与控制工程学院,陕西 西安 710064)
经济社会发展,交通运输先行。随着我国居民汽车保有量的不断增加,给道路交通系统带来的压力也越来越大,交通事故和能源短缺等问题日益严重,对居民的出行造成了许多不便[1]。
早期的交通流预测研究主要都是基于参数化模型展开的。在具有噪声和干扰的环境中,参数化模型的预测结果往往不尽人意。因此人们逐渐将重心从参数化模型转移到非参数化模型的研究上[2-4]。但单一的预测模型预测精度很难达到要求,组合预测模型的思路是将多种预测模型进行融合,提高预测精度。Chen等人构建多个非线性LSSVR基本模型进行预测[5]。Cai等人提出了一种使用GSA搜索最佳SVR参数的混合交通流量预测模型[6]。Zhang等人研究应用门控递归神经网络来预测考虑天气条件下的城市交通流量[7]。
本文在充分利用交通流时空信息的基础上,利用KNN算法完成待测观测点的上下游观测点空间相关性的遴选,在完成二维输入数据矩阵的构造后,研究了基于卷积神经网络的交通流空间特征的提取;结合Bi-LSTM对时间特征的提取,完成了KNN-CNN-BiLSTM预测模型的搭建;分析了用于交通流空间特征优化的最佳K值以及预测模型的超参数设置。与其他的主流预测模型进行性能对比可以得出,本文提出的KNN-CNN-BiLSTM模型预测精度高,是一种精准有效的交通流预测模型。
组合预测模型的输入是从观测点实测并经过预处理和KNN算法遴选后的交通流量数据,输入为二维矩阵的数据形式。预测模型的前半部分是卷积神经网络层,用于交通流数据的空间特征提取,预测模型的后半部分是双向LSTM网络,用于提取交通流数据的时间特征,模型使用全连接层来输出最后的预测交通流量值。KNN-CNN-BiLSTM组合预测模型的体系结构如图1所示。
图1 KNN-CNN-BiLSTM组合预测模型示意图
通常在KNN算法中使用较多距离,包括曼哈顿距离、欧式距离和最大距离等。在这三种距离计算方法中,欧氏距离通过计算两组序列的差值平方和来衡量数据之间的距离,考虑了各个时间段之间序列的相似程度。本文选用欧氏距离用于计算序列之间的距离,运用KNN 算法对相关监测站点的交通流进行筛选,达到优化数据集的作用。
在交通流预测问题中,CNN常常用于预测模型的底端部分,对历史数据的空间特征进行捕捉并以特征向量的形式传送给时间序列预测部分。双向LSTM模型可以同时考虑两个方向的历史数据,可以更好地利用时间序列数据中包含的所有信息。双向LSTM的结构如图2所示。
图2 双向LSTM结构示意图
本文的交通流试验样本数据来自美国交通研究数据实验室(TRDL),其编号包括了I35E、 I394和TH62等高速公路,由美国交管部门在各个高速公路上布置的检测器来获取全年的交通流量。本文以2016年2月1日至2016年5月31日共四个月的交通流量数据作为试验样本,采用间隔为15 min的交通流量作为样本数据。
本文采用KNN算法对预测节点与上下游的观测点进行重要程度的排序,实现有效观测点信息的提炼析取和对无效信息的过滤清洗。通过模型提取时空特征来预测出下一个时间点的交通流,从而实现短时交通流预测。
由表1可知,当K值取6时,模型可以获得最佳的预测性能。此时,选取的空间相关性最大的监测节点编号分别为S896、S898、S894、S895、S893和S899,均位于待测节点的上下游路段。
表1 不同组合情况下遴选的观测点编号
图3、图4分别展示了不同预测模型的周内、周末预测效果,其中SVR模型的预测效果最差,而本文利用时空信息的KNN-CNN-BiLSTM模型预测效果最佳。
图3 不同模型周内预测
图4 不同模型周末预测
将本文提出的KNN-CNN-BiLSTM模型与目前主流的预测模型对比分析可以得出,本文提出的KNN-CNN-BiLSTM模型相比于目前主流的交通流预测模型,其预测精度提升明显,对比结果如表2所示。
表2 各种算法预测性能对比表
最后,本文将经过KNN筛选后的数据集和未经过筛选的数据集分别送入预测模型的输入。由表3可知,经过KNN算法筛选后的数据集可以更好地利用待测节点上下游节点的时空相关性,经过优化后的输入数据集可以改善模型的预测精度,大幅缩短预测模型的运行时间。预测的具体结果如表3所示。
表3 KNN筛选对试验结果的影响
本文提出了利用交通流时空信息的KNN-CNN-BiLSTM交通流量预测模型,并结合美国交通实验室的实测交通流数据完成了模型搭建和精细调参。结果表明:KNN算法可以有效地对上下游观测点进行遴选,经过遴选优化后的数据集可以改善模型的预测精度;在考虑交通流时空信息的情况下,将交通流的时空二维数据一起作为预测模型的输入,根据交通流的空间相关性改变输入数据的形式,提高了预测结果的准确性。因此,本文提出的基于KNN-CNN-BiLSTM的交通流预测模型是一种精准有效的模型,具有实际推广应用价值。