基于流量大数据的交叉口信号控制时段划分方法研究

2021-11-23 00:03:20任柏寒丁雪梅

海峡科技与产业 2021年8期

任柏寒丁雪梅

吉林建筑科技学院，吉林长春 130000

智能交通是解决现代社会各种交通问题的新途径。在数据采集过程中，环境变化和使用寿命往往会损坏数据采集器，使采集到的数据异常或完全丢失。因此，在数据分析之前，应清理收集的数据，修复数据中的异常值，并对缺失点和缺失段进行插值，以提高样本的准确性。利用该算法对数据进行有效的修复，可以促进智能交通更好更快的发展。

1 通过流量大数据预测交叉口流量

首先，通过交通部门获得交通流数据并进行处理，为了方便观察，以矩阵形式进行排列表示，矩阵内容包括每天通过该监测点的交通流和外部因素，其中外部因素以独立编号的形式记录以方便控制变量，交通流数据以垂直编号记录。数据简单处理后就可以进行交通流参数预测，以提高城市道路资源的利用率。在预测时，交通流数据的垂直编号用于预测未来交叉口的交通流量。因此，时间间隔设置为24小时（N），每日交通流矩阵为X∈RN。其中矩阵中的元素为Xi，y，i是交叉点的5分钟存储单元号，j是交叉点的特征。该方法不仅可以预测交叉口的日流量，还可以每5分钟实现流量预测，从而可以得到更细粒度的结果，有利于交通管理和调度。时间存储单元的Gru-RNN模型[1]包括三个不同的存储单元，第一个存储单元对应短期记忆，用于临时存储，第二个存储单元对应周期记忆，用于预测数据流，第三个存储单元对应长期记忆，用于存储验证后的预测数据。捕获数据中的交通流特征并分别拟合，根据不同的比重对子存储单元的数据进行加权融合，通过训练得到最终结果。

Gru-RNN模型参数在实际使用过程中可以自动化调整，即在使用过程中，根据输入数据确定后续数据并通过预设的比重进行调整。在确定模型的单位运行长度时，模型将根据数据计算实际误差，并通过误差来反复调整预设比重。在计算实际误差过程中，实时对误差进行监控，当误差最小时，此时模型对应的数据参数将作为模型的最优数据参数进行记录。同时模型的部分参数还可以人为预置，可以认为预设的参数包括节点参数、模型层级参数、对象优化函数、目标损失函数、加权激活函数等，这些参数的设置一般都是通过反复试验来获得最佳参数。通常，试验过程中使用测试方法来确定这些参数。在预测时可以使用tanh函数作为加权激活函数。tanh函数是深度神经网络模型中一种常用的激活函数，这种函数图像中心对称，具有极为快速的计算速度。同时使用RMSE作为目标损失函数来对模型预测结果进行验算。采用Adam函数作为对象优化函数，对象优化过程中对计算机性能具有较高要求，因为在计算时数据量较大，需要同时批处理次数至少为30次。确定上述手动预设参数后，需要确定模型的模型层级参数，模型层级参数的节点参数数必须小于n-1（n为样本数）。如果超过样本数，则模型的系统误差与训练样本无关。构建的模型就无法基于这些参数产生合理的预测，且模型层级参数不能由固定的公式确定，因此只能通过实验或者查阅文献来确定最佳值。将最初的模型层级参数设置为2，节点参数设置为1。在训练期间添加dropout算法以避免过度拟合，为了提升提高网络性能需要防止特征检测器的联合。

2 动态交通数据处理

对于缺失数据的处理，方法如下：

①对于较小的数据源[2]，如仅一周的交通流信息，可以丢弃，丢弃的数据，不再使用相同的方法获得，而是通过数据多层筛分，并对筛分后的数据进行描点绘图，再通过图像观察发现缺失数据，将丢弃的数据进行补足或者彻底丢弃，彻底丢弃后仅使用其他的交通流量平均值来填充缺失数据。

②对于数据量较大的数据源，先根据数据建立活动模型再根据活动模型来预测部分缺失数据，从而获得更完整的交通流信息。

③交通流数据在分时段处理后具有时段性，同时在交通岔路口采集信息具有空间性，此时可以采用均方法、期望值法或者增量法对缺失数据进行数值补足。

对于冗余数据的处理，方法如下：

①对应完全重复的数据，先保留一条数据然后删除其余数据。

②对应多条相似的数据，取平均值或者中值，最后留下简短记录。

3 数据仿真处理

编程环境采用Matlab7.1，利用改进的NSGA[3]对编号序列过程进行了仿真。计算步骤如下：

第一步：输入收集数据和对变量进行初始化。输入交叉口具体结构、流量变化数据、相位移动数据和相序排列数据；考虑4个约束条件，在可行区域内生成多个个体并成种群，形成初始种群，同时设置遗传代数；对初始参数进行设置，其中种群数据范围为50，汽车运动交叉概率为0.95。直行数据平行交叉，变异概率为0.08，变异来源为不遵守交通规则的车辆和行人。终止计数迭代最大值为80，连续计算至少80次以获得最佳参数。

第二步：推算单个车辆行驶过程中直行、左转和右转的概率。

第三步：选择多个车辆的数据进行拟合。

第四步：将多个车辆的数据交叉处理，以适应复杂的交通环境。

第五步：将变异概率计入计算，以适应变化。

第六步：如果迭代数值达到80，停止迭代操作，对迭代过程中的数据进行统计，寻找误差最小的迭代轮次产生的数据作为最佳数据参数；否则，进入第一步。

仿真时的管控时段划分步骤如下：

第一步：计算交叉口流量比。四阶段交叉以交叉口的东西入口为例，计算交叉口的流量比：对于大多数交叉口，右转没有专用信号灯，只需计算交叉口左转和直行车道的交通流，每个入口通道的左侧应考虑转弯和直行车道的数量。

第二步：比较各相位大小下缓解车道的交通流量比，以流量比最大的车道为关键车道，流量比作为交叉口信号周期的计算参数。由于第一步采用东西入口为例，车辆方向固定沿东西方向，即只需比较向东或者向西的直接流量比。

仿真得到的数据目标不会朝着同一个方向完全改变，随着仿真次数的增加，通过降低平均车速，而提高整个交通容量，同时不可避免地增加平均延误。

在对数据仿真处理后，得到了多个理想模型下的交叉口车流模型，即通过大数据对未来的交叉口的路况进行预测，仿真采用基于parcto解的多目标遗传算法，它将传统的多目标处理方法转化为单目标问题，在多次仿真演算的过程中更贴合交叉口的实际数据，得到的最终模型也更能代表交叉口的实际路况。

4 时段划分方法

在交通流不饱和的情况下，以不同时段的信号周利润韦伯斯特最优周期作为计算时间段的精确划分控制依据。当车队即将延伸到上游路口时，知道堵车情况后赶来的司机，结合一定的交通诱导和交通组织等手段进行交通分流，使交叉口处于非饱和交通流状态，周期计算仍采用韦伯斯特法。仅使用交通量作为时间划分的基础，不能使用交通量，它反映了每个进口通道不同流向的特性。由于交叉口的现状，大多数交叉口都存在流向不一致的问题，且流量仅来自交叉口，大小被划分为时间段，没有考虑流向之间的差异，导致划分依据不足。基于上述考虑，本文根据韦伯斯特最优周期计算各流向的流量比，周期的计算值取阈值范围内各周期信号周期之间的绝对差值，作为同一控制周期外信号周期的绝对差值该范围用作另一个管控制周期。

时段划分步骤如下：

第一步：计算交叉口流量比。对于四阶段交叉以交叉口的东西入口为例，计算交叉口的流量比，其中对于大多数交叉口，右转没有专用相位，只需计算交叉口左转和直行车道的交通流量。交通量较大，每个入口通道的左侧应考虑转弯和直行车道的数量。

第二步：比较各相位大小下缓解车道的车流比，以车流比最大的车道为关键车道，以车流比作为交叉口信号周期的计算参数，由于以东西入口为例，车辆均从东向西直行，即只需比较东向流向直接流量比、西入口直接流量减去流量比的大小和较大的流量比用作第一阶段的临界流量比。同样，其他阶段的临界流量比也可通过该方法获得。

第三步：求每个阶段的关键流量比之和，即交叉口流量比。

时段划分之后进行配时选择，解决不同时段交叉口信号灯的配时问题，采用改进的SGA.II算法，具体方法步骤如下：

第一步：编号。编号是使用染色单位来表示算法问题的解决方案的过程。在单交叉口信号配时设计中，每个交叉口车道只有等待通行和超车两种状态，对不同状态下的路口设置不同的颜色。因此，车道状态可以用红-绿双色进行编号：当颜色为绿色时，表示对应入口车道上的车辆可以通行；相反为红色时，则表示入口车道上的相位车辆应进行等待。

第二步：计算。首先对染色单位进行译码，然后根据分段时区产生的流量模型来计算每个个体对应的目标函数，再根据目标函数的值计算每个个体的虚拟适应度。

第三步：选择运算。选择运算的具体方法为：随机抽取2名个体。如果个体级别不同且不小于2，则取高级别（即小级别）的个体；如果两个个体处于同一水平，则选择相对密度较小区域中的个体，根据熵增定律多个个体在无干扰环境下会无序运动，而最优解在无干扰环境下运动范围小，此时密度较小的区域具有较大概率活动最优解。

第四步：保留策略。SGA.II算法采用了一种新的后代选择方法对后代进行保留，保留父代中的优秀个体，保证了后代种群的良好优化。

在实际划分中，需要考虑交通效率：一般考虑交叉口相位，采用对称法，理想模型下，直行车道饱和流量为1600 veh/h；左转车道饱和流量一般为1500辆/h；转换为车头时距，直线行驶2.25 s，左转2.4 s。如果循环增加5 s，这种情况下所有时间都增加到同一阶段，即一个阶段的时间增加5 s，这意味着该阶段在每个循环中通过2辆以上的车辆。因此，校准标准定义为每循环至少通过2辆车；同时，应考虑排空时间。车辆直线行驶比左转快，行驶距离短，最基本的安全保证至少是直线行驶。车辆的排空时间应根据车辆在城市道路上的平均行驶速度计算为36 km/h。对于距离道路50 m处交叉口的东西入口或南北入口，在绿灯结束时进入交叉口，直行车辆通过交叉口至少需要5 s。因此，在城市主交叉口或主、次交叉口的交叉口反方向行驶时，出入口距离基本大于50 m，保证在此期间至少增加5 s。

5 结语