城市交通网格集群的Bi-LSTM的流量预测

2023-10-12 16:38贾现广冯超琴苏治文钱正富宋腾飞刘欢吕英英

重庆大学学报 2023年9期

关键词：交通流量集群聚类

贾现广冯超琴苏治文钱正富宋腾飞刘欢吕英英

doi：10.11835/j.issn.1000.582X.2023.09.013

收稿日期：2022-11-09

網络出版日期：2023-07-06

基金项目：国家自然科学基金资助项目（71961012）。

Foundation：Supported by National Natural Science Foundation of China（71961012）.

作者简介：贾现广（1997—），男，副教授，主要从事智能交通与大数据方向研究，（E-mail）jxg@kust.edu.cn。

通信作者：吕英英，女，主要从事智能交通与大数据方向研究，（E-mail）20070102@kust.edu.cn。

摘要：为提升交通流预测精度，深层次地挖掘交通流数据的时空特征，提出一种基于双向长短时记忆网络（Bi-LSTM）的城市交通网格集群流量预测模型。将所获得的网约车轨迹数据集网格化；考虑人为确定集群个数对结果的影响，用贝叶斯信息准则进行参数估计确定集群数，利用高斯混合模型对交通状况相似的网格进行聚类得到不同交通网格集群；利用集群内部交通网格的输入时间序列的相互影响设计多对多模型，构建Bi-LSTM模型预测不相交集群上的流量；以经典多元线性回归模型（MLRA）作为对照组进行实验验证，采用平均绝对误差（MAE）、均方根误差（RMSE）、平均绝对百分比误差（MAPE）和动态时间规整（DTW）这四类评价指标对预测结果进行综合评价，验证基于Bi-LSTM模型的城市交通网格集群流量预测的可行性。实验结果表明：MLRA模型和Bi-LSTM模型对城市交通网格集群流量的预测值小于真实值，早高峰时段尤为明显；各交通网格集群的交通状态态势相似，集群的簇内相关性较强，两类模型均可实现较好的流量预测效果，Bi-LSTM表现更优； MLRA和Bi-LSTM预测模型的精度MAE、RMSE、MAPE分别为3.2011、4.4009、0.3187，3.0687、4.2943、0.3045，Bi-LSTM与MLRA相比，模型精度分别提高了4.14%、2.40%、4.46%，说明所构建的Bi-LSTM交通流网格集群流量预测精度高、误差低，要优于MLRA模型，表现出较好的泛化性能； MLRA和Bi-LSTM的DTW结果分别为52938.6356、54815.1055，构建的Bi-LSTM模型较MLRA模型各自工作日和节假日时间序列相似性DTW结果提高3.42%，表现出更好的鲁棒性。利用城市交通流量的特点和交通轨迹数据网格化的优点，基于Bi-LSTM模型的城市交通网格集群流量预测与MLRA交通流量预测模型相比，具有精度高、误差低的特点。同时，DTW指标方面，基于Bi-LSTM对城市交通网格集群流量模型与真实流量变化趋势一致，表现出较好的鲁棒性。

关键词：城市交通；交通流量预测；Bi-LSTM；交通网格集群；时空单元划分

中图分类号：U491.2 文献标志码：A 文章编号：1000-582X（2023）09-130-12

Forecasting for urban traffic grid clusters based on Bi-LSTM

JIA Xianguang^a， FENG Chaoqin^a， SU Zhiwen^a， QIAN Zhengfu^a， SONG Tengfei^a， LIU Huan^a， LYU Yingying^b

（a. Faculty of Transportation Engineering； b. Faculty of Information Engineering and Automation， Kunming University of Science and Technology， Kunming 650500， P. R. China）

Abstract： This study aims to improve the accuracy of traffic prediction and to explore the spatio-temporal characteristics of traffic data in urban areas by proposing a traffic flow prediction model based on Bi-LSTM （Bidirectional Long Short Term Memory） for urban traffic grid clusters. The trajectory dataset of ride-hailing vehicles was gridified， and the Bayesian information criterion was used for parameter estimation to determine the cluster number， with considering the influence of manually determining the number of clusters on the results. The Gaussian mixture model was then employed to cluster grids with similar traffic conditions， resulting in distinct traffic grid clusters. A Multi-to-Multi model was designed by considering the mutual influence of input time series of traffic grids within each cluster. The Bi-LSTM model was established to predict traffic flow in non-overlapping clusters. Experimental validation was conducted using the classical MLRA （multiple linear regression analysis） as a control group， and four performance metrics： MAE（mean absolute error）， RMSE（mean squared root error）， MAPE（mean absolute percentage error） and DTW （dynamic time warping） were used to comprehensively evaluate the prediction results， confirming the feasibility and superiority of the Bi-LSTM model for city traffic grid cluster flow prediction. The results showed that both MLRA and Bi-LSTM models predicted urban traffic grid cluster traffic values were generally smaller than the real value， with more pronounced discrepancies observed during morning peak hours. Increasing data volume improved the prediction performance of the models. Traffic state dynamics within each traffic grid cluster were similar， displaying strong intra-cluster correlation. Both models achieved better traffic prediction results， with Bi-LSTM outperforming MLRA. In terms of model accuracy， the Bi-LSTM model showed improved MAE， RMSE and MAPE（3.068 7， 4.294 3， 0.304 5， respectively） compared to MLRA（3.201 1， 4.400 9， 0.318 7， respectively）， representing a 4.14%， 2.40% and 4.46% enhancement， respectively. The constructed Bi-LSTM model exhibited higher accuracy， lower error and better generalization performance. In terms of similarity result evaluation， the DTW results of MLRA and Bi-LSTM were 52 938.635 6 and 54 815.105 5 respectively. The Bi-LSTM model showed better robustness by 3.42% compared to the respective weekday and holiday time series similarity DTW results of the MLRA model. By considering the characteristics of urban traffic flow and leveraging the advantages of gridding traffic trajectory data， the Bi-LSTM-based model for urban traffic grid cluster traffic prediction exhibited high accuracy， low error and superior robustness compared to the MLRA traffic flow prediction model. Meanwhile， in terms of DTW metrics， the Bi-LSTM-based urban traffic grid cluster traffic model captured the real traffic variation trend and demonstrated excellent performance in traffic flow prediction for urban areas.

Keywords： urban transportation; traffic flow forecasting; Bi-LSTM; traffic grid clusters; spatiotemporal unit division

智能交通系统（intelligent transport system， ITS）是智慧城市的重要组成部分，可有效解决交通拥堵问题，城市交通流量预测是ITS的基石，精准高效的交通流量预测对缓解交通拥堵具有重要意义^[1]。城市交通流量预测是城市交通管理不可或缺的重要手段，准确的交通流量预测可为智能城市规划和交通管理提供可靠管理，为拥挤区域提供预警确保公共安全，为乘客提供建议方便日常通勤^[2]。

早期交通流量预测是基于统计学模型的方法。Vythoulkas^[3]采用卡尔曼滤波模型利用线性系统状态方程对交通流量进行预测，Ahmed等^[4]将流量预测转换成时序预测提出ARIMA方法（Auto-Regressive integrated moving average）对高速路交通流量进行预测。但基于统计模型的预测方法大多为线性模型，随着交通数据的非线性和不确定性增强，模型预测精度逐渐变差，学者开始利用机器学习对交通流量预测。Feng等^[5]提出具有时空相关性的自适应多核SVM模型（support vector machine）用于短期交通流量预测，Lee等^[6]提出基于天气状况的多元线性回归分析模型（multiple linear regression analysis，MLRA）用于交通预测。随着交通数据的数据量剧增，交通流量数据也呈现出多维度的趋势，机器学习对于复杂庞大的连续数据深层次特征的提取日益困难，研究者开始运用深度学习进行交通流量预测。

Zhang等^[7]对交通数据进行时空分析，引入CNN（convolutional neural network）进行交通流量预测，单一模型预测难免会使数据特征信息丢失，将神经网络拓展延伸形成组合预测方法，逐渐成为发展趋势。Fu等^[8]使用LSTM（long short term memory）-GRU（gate recurrent unit）组合模型对交通流量进行预测，Zheng等^[9]将注意力机制引入图神经网络用于交通流量预测。基于神经网络创新取得较好预测效果，但模型复杂度增加且效率变低。为挖掘深层次特征，Wang等^[10]构建动态感知系统收集数据，对交通道路数据进行AP（affinity propagation）聚类，利用LSTM进行交通流量预测^[11]，Chiabaut等^[12]对高速道路数据进行高斯混合模型（gaussian mixture model，GMM）聚类得到拥堵图，运用共识学习技术进行交通预测。研究均是基于道路聚类，聚类前并未对道路数据进行其它处理以得到其隐含的时空特征。

针对交通流量数据的非线性和不确定性增加、复杂庞大的连续数据特征难以提取、交通轨迹数据的隐含特征提取不充分问题，笔者提出基于深度学习的交通流量预测方法，引入双向长短时记忆网络模型（bidirectional long short-term memory network， Bi-LSTM），贡献如下：

1）网格化处理和交通网格集群建模：通过将交通轨迹数据进行网格化处理，将复杂庞大的连续数据转化为网格化的交通网格集群。利用贝叶斯信息准则（bayesian information criterion， BIC）和GMM模型，将网格化的交通流量数据序列分解为若干个加速度、速度比率、平均停车次数等相似交通状况的网格集群，有效提取交通网格集群的时空特征，深入挖掘路网的时空关联性。

2）设计多对多模型进行序列预测：全面考虑交通网格之间的相互影響和时序关系，设计了多对多模型，将分解得到的交通网格集群作为Bi-LSTM的输入，实现对网格集群交通流量的序列预测。

3）通过使用滴滴盖亚数据开放计划的数据集进行实验，实验结果表明，基于Bi-LSTM的城市交通网格集群流量预测具有良好的预测能力，且优于基准模型。

1城市交通网格集群的Bi-LSTM流量预测模型

基于多对多模型设计思想，构建Bi-LSTM预测模型对城市交通流网格集群流量进行预测。考虑输入的交通网格集群序列遵循正态分布，为便于计算，对各个集群进行标准化处理；交通网格集群可用的时序数据可确定2个网格之间的时间和空间相关性，使所输入数据具有较强的时空关联，利用多对多模型设计将分解的若干个交通网格集群作为Bi-LSTM的输入；根据预测精度调整Bi-LSTM模型相关参数权重，以此预测n时刻该交通网格集群每个网格未来的交通流量。基于Bi-LSTM对城市交通网格集群流量模型预测框架如图1所示。

1.1多对多模型设计

1.1.1 交通传播

交通传播模式是在一个道路网络中特定路段的流量水平所拥有的时空关系^[13]，在空间上的周期性和时间上的相似性可从历史数据中获得有价值信息，进而挖掘深层次时空特征。交通流量在不同交通网格中的传播随时间和空间动态变化，图2是某集群某日早高峰时段各空间网格的交通流量图，横纵坐标表示轨迹数据网格化后的空间索引值，从图2可以看出交通网格（6，34）的交通流量大，周围其他交通网格的流量越靠近这个网格流量影响越大，说明这个交通网格影响着周围其它交通网格的流量大小。

1.1.2 多对对模型设计

交通网格可用的时序数据可确定2个网格之间的时空相关性，得到t时刻当前网格的交通流量对其它网格影响。考虑到多对多模型对整个交通网络的交通流量预测效率更高^[11]，为挖掘集群内各网格的时空特征，进行多对多模型设计。多对多模型设计思路图如图3所示，左图表示将网格化的交通数据进行聚类后所得到的某集群，为充分利用每个网格的时序数据将某集群t = 1，2…n-1个时间序列数据作为Bi-LSTM模型的输入，预测该集群的每个网格在t=n时刻的流量。多对多模型设计是在被网格化的交通网络中，读取网格的所有集群，将相似交通网格的聚类数据输入Bi-LSTM，预测n时刻每个网格未来的交通流量。

1.2Bi-LSTM模型框架

交通流量当前状态不仅与之前的状态有关，还与未来的状态有关。Bi-LSTM具有较强的序列建模能力，可以对交通数据的时间序列特征进行建模和预测，包括小时、天、周等不同时间尺度。Bi-LSTM其结构由上下堆叠的2个单向LSTM组成，输入在2个方向流动^[14]，输入包含预测时间前后的时间序列，可以同时考虑历史时刻和未来时刻的信息，通过结合前后时刻的信息可更好地捕获交通数据的动态变化，较好地预测流量。在交通流量预测中，其模型的结构如图4所示。该网络克服了RNN（recurrent neural network， RNN）衰退问题，利用了LSTM可长时间储存记忆的优点。

2数据说明

研究的数据集来源于滴滴出行设立的盖亚数据开放计划平台，地理区域是四川省成都市二环内局部范围，原始数据大小约180 GB，轨迹点采集间隔为2-4 s，时间区间是某年11月1日-30日，轨迹数据与实际路段相对应。司机及乘客订单的隐私信息进行了加密脱敏匿名化处理可保证用户安全。为了使轨迹数据更加集中，便于提取时空特征，对大规模杂乱轨迹数据进行清洗、错误筛查、压缩等处理，处理前后区域范围如图5所示，（a）表示处理前区域范围，（b）表示处理后区域范围。从图看出处理后的区域范围更加清晰，数据更加集中，便于进行时空网格划分。

大规模轨迹数据时空相关性较强，其时间数据只有一维属性且具有严格的序列性，空间数据具有多维属性且空间相关性更复杂。网格划分可高效地挖掘数据中隐含的时空特征，对不同类别的时空数据进行融合^[15]。笔者利用网格划分方法将研究区域划分为棋盘状的网格以便于提取深层次的交通特征，时空网格划分如图6所示，左图中若干个黑色圆圈表示网约车轨迹数据点的分布情况，红色箭头表示将其归类到各个空间网格的过程，右图表示划分时间网格。取空间网格大小为50，时间窗为600 s，将空间数据点映射到各个网格中，在对定位点进行映射的同时也将矢量的轨迹网格化为网格序列，实现将轨迹数据打散成点坐标转化为张量，从而可直接或间接得到每个网格的索引值以及网格平均加速度、网格浮动车流量、网格平均停车次数等。

3交通网格集群模型构建

3.1确定最佳组分

基于Bi-LSTM的城市交通网格集群流量进行预测，确定交通网格的最佳集群数是进行GMM模型聚类的基础。为避免人为确定最佳集群数对实验结果产生影响，利用BIC进行参数估计确定交通网格最优集群数k。

很多参数估计问题采用似然函数作为目标函数，当训练数据集足够大时，该方法可不断提高模型的精度，但也会随着模型复杂度增加而出现过拟合问题^[16]。在模型选择上，在模型复杂度与模型对数据集描述能力之间寻求最佳平衡，Schwarz提出BIC^[17]信息准则，避免样本数量过多导致模型精度过高造成模型复杂度过高的问题。该准则如式（5）所示，通过在模型中加入与模型参数个数相关的惩罚项来避免模型的过拟合。

BIC倾向于选擇较小的值，而模型参数的个数k过大会导致模型出现过拟合^[17]。依据样本数据， GMM模型参数个数与BIC值关系如图7所示。由图7可知BIC的值在4出现了大转折，7以后虽然BIC的值一直在下降，但下降变缓。同时，k值过大会使BIC值变化不明显且极易导致模型出现过拟合现象，为使BIC值和k值都相对小，取k值为6。

3.2构建GMM模型

某种程度上GMM模型是改进型的K-means模型。K-means模型的作用是将数据收集到方差相等的组中，使组内总和最小^[18]，与其他聚类相比收敛速度快，算法可解释度较强，但K-means存在集群形状缺乏灵活性和概率集群分配概念的问题，无法将2个聚类中心相同的类聚类。GMM模型是多个高斯概率密度函数的线性组合，其曲线由若干个单高斯函数叠加而成，任何一个复杂曲线都可用若干个高斯曲线无限逼近。GMM聚类方法重视数据点分布而不仅是数据点之间的距离，它是通过选择成分最大化后验概率来完成聚类，提供的聚类有不同的大小^[19]。基于构成不同聚类的交通网格集群遵循正态分布，故此选择GMM算法。GMM聚类模型如式（6）所示。

利用K-means迭代获取最优值后将聚类中心点作为GMM的初始值进行训练，以避免GMM收敛到局部最优解；在GMM聚类时，利用EM算法估算参数使每个分量都有自己的通用协方差矩阵。图8为交通网格聚类的示意图，网格id和时间id表示将交通数据网格化后所得到网格时空索引值，网格id和时间id构成时空网格，clusters表示集群的类别，其中（48，3），3，C₂和（19，15），92，C₂属于同一集群，构成了交通网格集群。

4模型验证

4.1模型训练

使用1～24日的数据作为练数据，25～30日的数据作为测试数据，取训练集的15%作为验证集，利用过去1 h的交通流量数据（6个时间步长）来预测未来10 min（1个时间步长）的交通流量。采用Python语言进行编程，该程序使用Keras库，在AMD Ryzen 7 5800H with Radeon Graphics处理器、16gb内存、Window10操作系统和Tensorflow2.0深度学习框架上实现。经过GMM聚类后所生成的交通网格集群利用多对多模型输入Bi-LSTM模型进行训练。Bi-LSTM设计有6个隐藏层，前两层是bi-lstm层，各有64个神经元；第三层有32个神经元；第四层16个神经元；第五层为dropout层，为防止模型过拟合，丢弃率设为0.2；最后一层为全连接层。LSTM模型学习率为0.001，损失函数使用MSE，反向传播算法使用Adam优化器，激活函数采用ReLU。由于不同集群的交通状况不一致，故每批次所训练的样本数（batch sizes）、总迭代次数（epoches）和训练时间（times）如表1所示。为对模型预测效果进行评价，使用经典的多元线性回归分析（MLRA）模型作为对照组，在同一实验环境中进行对比实验验证。

4.2模型误差分析

利用过去1 h的交通数据预测未来10 min的交通流量，图9为某交通网格集群MLRA模型和Bi-LSTM各自相同工作日早高峰时段网格流量的预测结果图，其中a为真实值，b为预测值，右下角为同一区域网格的放大图。

从图9可以看出：1）总体来看MLRA模型和Bi-LSTM模型预测结果均小于真实值，可能与早高峰时段的交通流量大、交通状况复杂等因素有关，使2个模型的预测值都偏小;2）从局部放大网格图直观上发现每个网格流量趋势大体相同，但MLRA模型的流量预测值较真实值波动大，不稳定，Bi-LSTM模型的预测精度高于MLRA模型。

模型时间序列相似性结果：图10、图11表示的是某交通网格集群MLRA模型和Bi-LSTM模型在工作日和节假日早高峰和平峰时段时间序列相似性的结果，其中a为早高峰（7：00-9：00）、b为平峰（9：00-11：00），纵坐标表示流量，横坐标表示时间步长，一个时间步长代表10 min，时间窗取600 s，42代表早上7：00，48为8：00，以此类推。

从图10、图11可以看出：1）整体来看，MLRA模型和Bi-LSTM模型对于工作日和节假日的时间序列相似性结果，预测值与实际交通流量值的流动形态非常接近，说明2个模型能够进行较好预测。2个模型的预测值大多时间小于真实值，早高峰时段更为明显，且2个模型对早高峰的预测没有平峰的预测好，可能与早高峰时段流量大、交通状况复杂等因素有关。2）在工作日早高峰时段，MLRA模型和Bi-LSTM模型流量預测值大多小于真实值。在7：00-7：30时间段和8：00-8：10时间段MLRA模型和Bi-LSTM模型预测值严重偏离真实值，但Bi-LSTM更加接近真实值，其它时间段2个模型的预测值直观上与MLRA模型更为接近，预测效果好；3）在节假日7：10-7：30时间段，MLRA模型时间序列相似性结果的预测值和实际值流动状态相差较大，随着数据增加预测值和真实值逐渐接近，表现出较好预测效果。在多数时段Bi-LSTM模型优于MLRA模型；4）对于平峰时段的预测，MLRA模型和Bi-LSTM模型流量预测值较为接近真实值，可能与平峰时段交通状况稳定有关。Bi-LSTM模型在工作日和节假日上午时段流量的预测值和真实值更加接近也更加稳定，表现出更好的鲁棒性。

为量化模型预测结果，采用经典的误差评价指标^[20]平均绝对误差（mean absolute error，MAE）、均方根误差（mean squared root error，RMSE）、平均绝对百分比误差（mean absolute percentage error，MAPE）和动态时间规整（dynamic time warping，DTW）对模型结果进行评价。

1） MAE：用于评估交通流量预测值和真实值的接近程度，其值越小拟合效果越好，

2） RMSE：该指标计算的是交通流量预测结果和真实值对应样本点误差的平方根，其值越小说明预测速度值精度越高，

3）MAPE：用于测量测试集上平均流量测试值与实际测试值之间的相对误差，范围[0，+∞），MAPE为0%表示完美模型，MAPE大于100 %则表示劣质模型，

4） DTW：用于测量交通流量预测值和真实值2个时间序列之间的相似性，所得到的距离越小，说明2个时间序列越相似。

不同模型和集群的评价结果如表2所示，整体来看，在每个交通网格集群中，MLRA模型、Bi-LSTM模型对交通流量的预测都取得了不错效果，这与将网格化的交通流量数据通过GMM聚类所得到的一系列交通网格集群有关。因为每个交通网格集群内部相关性较强，交通状况极为相似，从而使2个模型的预测效果较好，但各自在模型精度以及时间序列相似性方面存在些许差异。为使MLRA模型、Bi-LSTM模型评价更直观，利用不同交通网格集群所占整个交通网格的权重方法，使每个交通网格集群乘以各自的权重再进行叠加，得到如表3所示总的模型评价结果。

模型精度：模型的平均评价结果如表3所示，通过表3发现，MLRA、Bi-LSTM的MAE、MSE、MAPE分别为3.201 1、4.400 9、0.318 7，3.068 7、4.294 3、0.304 5。

1）Bi-LSTM与MLRA相比，MAE降低0.1324，提高4.14%，Bi-LSTM的流量预测值较为接近真实值，拟合效果较好；

2）Bi-LSTM與MLRA相比，RMSE降低0.1066，提高2.42%，Bi-LSTM模型的交通流量预测结果和真实值对应样本点的误差平方根较小，预测精度比经典MLRA模型流量预测高，预测效果较好；

3）Bi-LSTM与MLRA相比，MAPE降低0.0142，提高4.46%，Bi-LSTM模型的测试集上平均流量测试值与实际测试值之间的相对误差小，说明Bi-LSTM模型优于MLRA模型。

DTW结果：表3中MLRA模型、Bi-LSTM模型时间序列相似性结果DTW分别为52938.6356、54815.1055，Bi-LSTM模型较MLRA模型提高3.42%，说明Bi-LSTM的流量预测值更加接近真实值，Bi-LSTM优于MLRA模型，表现出较好的鲁棒性。

Bi-LSTM模型较经典MLRA模型在对交通网格集群进行流量预测时表现出较好的泛化性和鲁棒性，Bi-LSTM在交通流量集群预测方面比MLRA模型更有优势。

5结语

在Tensorflow2.0深度学习的理论框架下，基于Python语言，利用贝叶斯信息准则和高斯混合模型，将网格化的交通流量数据序列分解为若干个相似交通状况的网格集群，设计了多对多模型，根据交通网格可用的时间序列数据，构建了基于Bi-LSTM交通流量时间序列预测框架，借助Keras完成逐层网络构建和精细化调参，实现基于Bi-LSTM对城市交通网格集群的短时交通流预测。Bi-LSTM模型较MLRA模型在MAE、MSE、MAPE方面分别提高了4.14%、2.40%、4.46%，Bi-LSTM模型表现出更好的泛化性能。2个时间序列之间相似性表现出的DTW结果为Bi-LSTM组合预测模型较MLRA模型提高了3.42%，Bi-LSTM要优于MLRA，表现出较好的鲁棒性。说明基于Bi-LSTM对城市交通网格集群流量预测是可行的，具有应用于城市交通网格流量预测的潜力。

参考文献

［1］刘宜成，李志鹏，吕淳朴，等. 基于动态时间调整的时空图卷积路网交通流量预测[J]. 交通运输系统工程与信息， 2022， 22（3）： 147-157， 178.

Liu Y C， Li Z P， Lv C P， et al. Network-wide traffic flow prediction research based on DTW algorithm spatial-temporal graph convolution[J]. Journal of Transportation Systems Engineering and Information Technology， 2022， 22（3）： 147-157， 178.（in Chinese）

［2］ Chen C L， Liu Y B， Chen L， et al. Bidirectional spatial-temporal adaptive transformer for urban traffic flow forecasting[J]. IEEE Transactions on Neural Networks and Learning Systems， 2022， PP（99）： 1-13.

［3］ Vythoulkas P. Alternative approaches to short term traffic forecasting for use in driver information systems[J]. Transportation and Traffic Theory， 1993， 12： 485-506.

［4］ Ahmed M S. Analysis of freeway traffic time series data and their application to incident detection[M]. OKlahoma;The University of Oklahoma， 1979.

［5］ Feng X X， Ling X Y， Zheng H F， et al. Adaptive multi-kernel SVM with spatial–temporal correlation for short-term traffic flow prediction[J]. IEEE Transactions on Intelligent Transportation Systems， 2019， 20（6）： 2001-2013.

［6］ Lee J W， Hong B， Lee K， et al. A prediction model of traffic congestion using weather data[C]//2015 IEEE International Conference on Data Science and Data Intensive Systems. December 11-13， 2015. Sydney， NSW， Australia：IEEE， 2016： 81-88.

［7］ Zhang W B， Yu Y H， Qi Y， et al. Short-term traffic flow prediction based on spatio-temporal analysis and CNN deep learning[J]. Transportmetrica a Transport Science， 2019， 15（2）： 1688-1711.

［8］ Fu R， Zhang Z， Li L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation （YAC）. November 11-13， 2016.Wuhan， China：IEEE， 2017： 324-328.

［9］ Zheng C P， Fan X L， Wang C， et al. GMAN： a graph multi-attention network for traffic prediction[J]. Proceedings of the AAAI Conference on Artificial Intelligence， 2020， 34（1）： 1234-1241.

［10］ Wang Z Y， Thulasiraman P， Thulasiram R. A dynamic traffic awareness system for urban driving[C]//2019 International Conference on Internet of Things （iThings）， IEEE Green Computing and Communications （GreenCom）， IEEE Cyber， Physical， Social Computing （CPSCom） and IEEE Smart Data （SmartData）， July 14-17， 2019.Atlanta， GA， USA： IEEE， 2019： 945-952.

［11］ Wang Z Y， Thulasiraman P. Foreseeing congestion using LSTM on urban traffic flow clusters[C]//2019 6th International Conference on Systems and Informatics （ICSAI）. November 2-4， 2019， Shanghai， China. IEEE， 2020： 768-774.

［12］ Chiabaut N， Faitout R. Traffic congestion and travel time prediction based on historical congestion maps and identification of consensual days[J]. Transportation Research Part C： Emerging Technologies， 2021， 124： 102920.

［13］ Long J C， Gao Z Y， Ren H L， et al. Urban traffic congestion propagation and bottleneck identification[J]. Science in China Series F： Information Sciences， 2008， 51（7）： 948-964.

［14］ Chen K H， Jia J P. Network evasion detection with Bi-LSTM model[J]. Journal of Physics： Conference Series， 2019， 1168： 052009.

［15］劉志远，张文波. 交通大数据：理论与方法[M]. 杭州：浙江大学出版社， 2020.

Liu Z Y， Zhang W B. Traffic big data： theory and method[M]. Hangzhou： Zhejiang University Press， 2020.（in Chinese）

［16］赵杨璐，段丹丹，胡饶敏，等. 基于EM算法的混合模型中子总体个数的研究[J]. 数理统计与管理， 2020， 39（1）： 35-50.

Zhao Y L， Duan D D， Hu R M， et al. On the number of components in mixture model based on EM algorithm[J]. Journal of Applied Statistics and Management， 2020， 39（1）： 35-50.（in Chinese）

［17］ Schwarz G. Estimating the dimension of a model[J]. The Annals of Statistics， 1978，6（2）： 461-464.

［18］ Likas A， Vlassis N， Verbeek J J. The global K-means clustering algorithm[J]. Pattern Recognition， 2003， 36（2）： 451-461.

［19］ Reynolds D. Gaussian mixture models[M]. Boston， MA： Springer， 2009： 659-663.

［20］王博文，王景升，王统一，等. 基于长短时记忆网络的Encoder-Decoder多步交通流预测模型[J]. 重庆大学学报， 2021， 44（11）： 71-80.

Wang B W， Wang J S， Wang T Y， et al. An encoder-decoder multi-step traffic flow prediction model based on long short-time memory network[J]. Journal of Chongqing University， 2021， 44（11）： 71-80.（in Chinese）

（编辑侯湘）