高速铁路列车调度策略关联规则分析

2022-03-24 01:53葛学锴陈锐锐黄平文超蒋朝哲
中国铁路 2022年1期
关键词:停站晚点调度员

葛学锴 , 陈锐锐, 黄平 , 文超 , 蒋朝哲

(1. 西南交通大学 综合交通运输国家地方联合工程实验室,四川 成都 610031;2. 西南交通大学 交通运输与物流学院,四川 成都 610031)

0 引言

我国高速铁路已进入大规模的网络化运营时代。高速铁路的快速发展显著提高了我国铁路运输能力,推动了铁路设备设施的持续更新和建设水平的不断提高,对国民经济的持续快速发展及国家“交通强国,铁路先行”和中国高铁“走出去”战略的实施起到了积极推动作用。

高速列车在运行过程中可能受到人为操作失误、恶劣环境以及设备故障等干扰的影响而偏离计划运行图[1-2]。当列车受干扰晚点后,调度员需要对列车进行调整以避免列车运行冲突或减小列车晚点时间。目前,列车晚点情况下调度员主要依靠经验来进行列车运行调整,调度员经验化的调度决策原则严重制约了我国高速铁路调度指挥效率的进一步提升,因此,探明调度指挥策略与列车运行指标之间存在的规律是提高高速铁路调度指挥工作效率的关键所在。

高速铁路调度指挥研究一直是专家学者关注的重点。孟令云等[3]针对单线铁路区间能力失效条件下列车运行调整问题,考虑能力失效持续时间的不确定性,提出了列车运行调整优化模型。Veelenturf 等[4]提出了改进的混合整数线性规划模型以实现列车到发时刻和运行顺序的调整。占曙光等[5]针对列车实时调整问题算法效率不高这一问题,设计了一种基于约束规划方法的调整模型,将列车运行计划调整问题转化为有向图构建下的约束满足问题。聂磊等[6]利用列车运行试验系统对多种运营条件下的列车运行调整策略进行仿真模拟分析,为优化高速铁路列车运行调整提供了方法和决策依据。文超等[7]基于工作流网络研究了实时调度指挥过程中列车运行冲突预测方法。黄平等[8]基于贝叶斯网络研究了高速铁路故障对列车运行的影响,为故障条件下列车的控制与调整提供支撑。

目前,相关研究多采用数学优化或系统仿真方法,在一定程度上优化调度调整策略,但此类方法具有较多的假设,往往难以充分挖掘调度策略的潜在信息。运用数据挖掘方法可以研究列车更为复杂的作用过程,更深入地解析调度策略与列车运行指标之间的规律。但相关的研究工作较少,因此从列车实际运行数据出发,利用数据挖掘方法,能够更好地探明调度策略的实际规律。

1 问题陈述与数据描述

1.1 问题陈述

高速铁路列车调度策略是指当列车实际运行时间与计划运行图所规定的时间发生偏离时,在满足发车、到达时间间隔约束、最小追踪间隔约束等各种约束条件下,通过合理优化和调整时刻表实现及时、有效的列车运行调整措施。列车调度策略具有不同的调整原则和调整措施,文献[6]对调整原则和措施做了详细阐述,其中最常用的是压缩列车停站时间策略和压缩区间运行时间策略,因此针对这2 类策略展开深入研究。首先将压缩列车车站停站时间策略定义为车站调度策略;将压缩列车区间运行时间策略定义为区间调度策略。然后对2 类策略的发生过程进行分析(见图1):列车1在受到干扰后,到达车站1发生晚点,调度员采取压缩列车停站时间策略,减少了列车在车站1的停站时间,使得列车到达车站2时晚点有所恢复。列车2 在车站1 受到干扰,导致列车出发晚点,此时调度员采取压缩区间运行时间策略,缩短列车区间运行时间,使列车到达车站2时恢复到正点状态。

图1 列车调度策略示意图

对调度策略发生过程进一步分析可知:针对不同晚点程度的列车,调度员可能会考虑采取不同的策略,如列车晚点程度较大,则放弃该列车的晚点恢复,主要对晚点程度较小的列车进行调整,以提高正点率。另外,调度员会根据列车的停站时间、运行时间和冗余时间量的大小,采取不同程度的调度策略,如晚点列车的区间冗余时间量较大,调度员会压缩较多的区间运行时间量来恢复晚点。可见调度策略的采取与列车运行状态(是否发生晚点)、停站时间、区间运行时间、冗余时间等因素具有密不可分的联系。

因此该研究旨在挖掘列车调度策略与晚点时间、冗余时间、区间运行时间、停站时间指标之间的规律,得出列车在不同晚点时间、冗余时间、区间运行时间、停站时间条件下,调度员倾向于采取哪种调度策略,并分析采取该策略的原因,研究结果对我国高速铁路列车调度指挥工作质量的提高具有重要意义。

1.2 数据描述

列车运行数据来源于杭深高铁的厦深段下行列车,时间跨度为2016 年1—11 月,下行方向包含诏安、饶平、潮汕、潮阳、普宁、葵潭、陆丰、汕尾、鲘门、惠东、惠州南、深圳坪山、深圳北共13 个车站。原始数据(见表1)包括行车日期、列车车次、车站、每次列车在每个车站的图定到达时间、实际到达时间、图定出发时间和实际出发时间,时间精度为1 min。对数据进行去重、降噪之后,数据总共包含198 882条。

表1 列车运行原始数据示例

将列车晚点时间、停站时间、区间运行时间、冗余时间统称为列车运行指标,列车到达车站时的到达晚点作为车站晚点,列车离开车站时的出发晚点作为区间晚点。统计各车站的晚点时间、停站时间、冗余时间,作为列车的车站指标(见表2),统计各区间的晚点时间、运行时间、冗余时间,作为列车的区间指标(见表3)。同时,只考虑列车晚点时间大于0 的情况,即只针对处于非正常情况下(晚点)的列车进行研究,得到数据总量为91 081条。

表2 车站指标统计 min

表3 区间指标统计 min

由表2可知,各车站的平均晚点时间均在10 min以内,随着列车的运行,平均晚点时间逐渐增加,说明随着列车的运行车站晚点时间分布越分散,列车运行随机性变大。列车停站时间在空间上具有差异性,潮汕站的平均停站时间最长,鲘门站的平均停站时间最小。此外,潮汕站和惠州南站具有较大的平均车站冗余时间,其余车站的平均冗余时间均小于1 min。表3表明,列车运行至潮阳—普宁区间时,列车晚点有所恢复,平均区间晚点达到最低值,之后随着列车运行平均区间晚点逐渐增加。各区间的平均运行时间与冗余时间差异较大,其中深圳坪山—深圳北区间的平均运行时间与平均冗余时间最大,此区间为列车下行最后一个区间,列车的晚点恢复主要集中于该区间。

2 调度策略统计分析

2.1 车站调度策略

为了更好地了解全线各车站的调度策略情况,提取各车站调度策略,并进行频数分布统计(见图2)。由图2可知,潮汕站采取压缩车站停站时间策略次数最多,接近3 500 次,占总数的18.6%。普宁站和陆丰站采取压缩车站停站时间策略较多,分别占总数的12.6%、9.9%。深圳北站采取的压缩车站停站时间策略次数最少,仅占总数的0.3%。

图2 车站调度策略频数分布

另外对不同时段下的车站调度策略频数进行统计,绘制各时段的车站调度策略频数分布图(见图3)。由图3 可知,全线在13∶00—14∶00 以及17∶00—18∶00 采取压缩车站停站时间策略的频数最大,其中潮汕站在10∶00—19∶00发生较多次数的压缩车站停站时间策略,可见该时段的调度员工作负荷较大,应在该时段对调度员工作状态重点关注。

图3 车站调度策略时空分布

2.2 区间调度策略

对全线各区间采取的区间调度策略进行提取,并进行频数分布统计(见图4)。由图4可知,深圳坪山—深圳北区间(SZPS—SZB)发生压缩区间运行时间次数最多占比18.9%,该区间为下行方向最后一个区间,可推断调度员倾向于在列车运行的最后一个区间采取调度策略,使晚点状态的列车正点运行至终到站。其次在潮阳—普宁区间(CY—PN)、普宁—葵潭区间(PN—KT)、汕尾—鲘门区间(SW—HM)采取了较多次数的压缩区间运行时间策略。

图4 区间调度策略频数分布

对不同时段下的区间调度策略频数进行统计,绘制各时段区间调度策略频数的时空分布图(见图5)。由图 5 可知,11∶00—21∶00 是采取压缩区间运行时间策略频数较高的时段,其中深圳坪山—深圳北(SZPS—SZB)在该时段内发生的压缩区间运行时间策略最多,其次潮阳—普宁区间(CY—PN)、普宁—葵潭区间(PN—KT)、汕尾—鲘门区间(SW—HM)在该时段也采取了较多次数的区间调度策略。

图5 区间调度策略时空分布

由以上分析可知:调度策略在不同时间、不同位置的频数均不同。因此,基于关联分析进一步探明调度策略与其影响因素的关系。

3 调度策略关联分析

采用Apriori算法对车站、区间调度策略与列车运行指标进行关联规则挖掘,揭示调度员在车站和区间采用调度策略类型的偏好;剖析冗余时间量与调度策略的关系,揭示冗余时间量对调度策略的影响;解析不同晚点程度下调度策略差异,揭示晚点程度对调度策略的影响;分析列车停站时间、区间运行时间与调度策略关系,揭示不同列车停站时间和区间运行时间下的调度策略差异。

3.1 Apriori算法介绍

Apriori 算法是最为经典的用于挖掘数据关联规则的算法[9],其核心思想包括:(1)通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定阈值的项集;(2)利用频繁项集构造出满足用户最小置信度的关联规则。该算法包含以下重要概念:

(1)频繁项集(Frequent Item Sets)是经常出现在一起的事务的集合。

(2)关联规则(Association Rules)暗示2种事务之间可能存在很强的关系。

(3)支持度(Support)指的是事物A和B同时出现在数据集中所占的比例[10],也就是概率P(AB),可以表示为:

式中:N为数据集中总的事务数;(A∩B)为事务A和B同时出现在数据集中的频次。

(4)置信度(Confidence)指的是事务A和B同时出现在数据集中占事务A的比例[10],即条件概率P(B|A),可表示为:

如果满足设定的最小支持度和置信度阈值,则认为关联规则是感兴趣的[11]。

3.2 车站调度策略与车站指标关联分析

选取车站调度策略、车站晚点时间、车站冗余时间、列车停站时间4 个指标进行关联规则挖掘,分析车站调度策略与其余3个指标之间的关系。为了更好地研究车站调度策略与车站指标之间的规律,根据4个指标的统计分布,对指标进行离散化处理(见表4)。

表4 车站指标离散化 min

由表4 可知,将压缩车站停站时间分为3 类:CZYS0 代表压缩车站停站时间量为0 min,CZYS1 代表压缩车站停站时间1~5 min,CZYS2代表压缩车站停站时间大于5 min;车站冗余时间分为3 类:CZRY0 代表该车站冗余时间为0 min,CZRY1 代表该车站冗余时间1~5 min,CZRY2 代表该车站冗余时间大于5 min;列车停站时间分为3 类:TZSJ0 代表列车停站时间为0 min,TZSJ1 代表列车停站时间1~5 min,TZSJ2 代表列车停站时间大于5 min;将车站晚点时间分为4 类:CZWD1 代表车站晚点时间1~10 min,CZWD2 代表车站晚点时间11~30 min,CZWD3 代表车站晚点时间31~60 min,CZWD4代表车站晚点时间大于60 min。

由于高速铁路行业具有事故发生频率低、而一旦发生则影响巨大的特殊性[12],算法中支持度可设定较低阈值,避免潜在因素关联性被遗漏。经多次试验,将最小支持度设为0.2%,最小置信度设为35%,筛选得出5条关联规则(见表5)。

表5 车站调度策略与车站指标关联规则 %

从表5 可知,第2 条关联规则的支持度最高,该事务在数据集中发生的次数最多,且置信度为72.8%,属于强关联规则。同时该关联规则表明,针对晚点列车调度员倾向于不采取车站调度策略,保持列车当前状态。进一步可以推断当列车的车站晚点时间在10 min 以内时,虽然列车在本站有1~5 min 冗余时间,但调度员倾向于保持该列车的晚点状态,不采取车站调度策略,这在一定程度上造成了本站冗余时间的浪费。分析发现,产生该现象的原因包括2 点:(1)车站晚点列车受到同向列车连发间隔时间的制约,导致该列车不能够压缩停站时间;(2)晚点列车可能需要等待另一到达列车的乘客进行换乘,导致不能采取车站调度策略。如果此类列车发车后在区间不能得到较好晚点恢复,到达前方站时晚点程度可能会加重,或者会对后方列车的运行造成影响。因此,调度员应该提高对该类列车的关注,在避免发生列车运行冲突和保证车站作业正常完成的情况下,适当采取调度策略以恢复列车晚点,避免列车晚点的传播。此外,若列车晚点时间在1~10 min 时,且在本站有5 min 以上的冗余时间,调度员大概率会采取压缩停站时间1~5 min策略。表5 关联规则中压缩停站时间的最大范围为1~5 min,而车站晚点的取值范围为1~60 min,即无论列车在车站的晚点时间是多少,在有冗余时间的条件下,调度员更加倾向于采取压缩停站时间1~5 min 策略,而压缩停站时间5 min 以上的策略极少采用,车站冗余时间的利用较低,因此晚点较为严重的列车难以恢复正点。

3.3 区间调度策略与区间指标关联分析

选取区间调度策略、区间晚点时间、区间运行时间、区间冗余时间4个指标进行关联规则挖掘,分析区间调度与其余3 个指标之间的规律,首先对4 个指标进行离散化处理(见表6)。

表6 区间指标离散化 min

由表6 可知,区间压缩时间分为4 类:QJYS0 代表压缩区间运行时间0 min,QJYS1 代表压缩区间运行时间1~5 min,QJYS2 代表压缩区间运行时间6~10 min,QJYS3代表压缩区间运行时间11~30 min;区间冗余时间分为4 类:QJRY0 代表区间冗余时间为0 min,QJRY1 代表区间冗余时间为1~5 min,QJRY2 代表区间冗余时间为6~10 min,QJRY3 代表区间冗余时间为11~30 min;将区间晚点时间分类4类,QJWD1代表区间晚点时间1~10 min,QJWD2代表区间晚点时间11~30 min, QJWD3 代 表 区 间 晚 点 时 间 31~60 min,QJWD4 代表区间晚点时间大于60 min;将区间运行时间分为3 类:QJYX1 代表区间运行时间为1~10 min,QJYX2代表区间运行时间11~30 min,QJYX3代表区间运行时间大于30 min。

与上文同理,为了避免区间指标与区间调度策略的潜在关联性被遗漏,经过多次试验后,设置最小支持度为0.10%,最小置信度为25%,筛选出6条关联规则(见表7)。

由表7可知,采取压缩区间运行时间策略的情况大多数发生在区间晚点1~10 min 的列车,且不采取区间调度策略的情况居多。另外,当晚点列车的区间冗余时间等级高于区间晚点时间等级时,调度员大概率会采取较高等级的压缩区间运行时间策略来缩短列车晚点时间。对比上述第2、3 条规则,在同样的列车区间晚点时间、冗余时间和运行时间下,调度员对区间晚点列车倾向于不采取区间调度策略,产生该现象的原因如下:(1)晚点列车受到追踪列车间隔时间的制约,使列车不能加速运行,晚点时间得不到恢复;(2)前方车站正在进行车站作业,不能正点接入列车,即使采取了区间调度策略,列车也只能缓速运行等待,直到前方车站能够接车为止。与车站的调度策略类似,此现象会导致晚点列车的区间冗余时间利用率较低,不能很好地恢复晚点。此外,第6条规则为晚点程度较大的列车调度策略规律,但其支持度仅为0.16%,且置信度为25.6%,这表明区间晚点在11~30 min的列车仅有少量能够得到恢复,同时可以推断区间晚点时间大于30 min的列车能够得到晚点恢复的概率更小。

表7 区间调度策略与区间指标关联规则 %

综上分析,揭示我国高速铁路列车调度指挥工作中的规律和问题主要如下:

(1)在车站调度策略和区间调度策略关联分析中,冗余时间是关联性最强的因素,而列车晚点时间是关联性最小的因素,但冗余时间的利用率整体不高,且车站冗余时间利用率明显低于区间冗余时间。因此合理分配列车运行图冗余时间,是恢复列车晚点的关键。

(2)晚点程度严重的列车得不到较好恢复是最为突出的问题,可对该类列车的调度策略规律作深入研究,对严重晚点列车以及列车发生大面积晚点时的调度指挥工作具有一定指导意义。

(3)通过得出的关联规则可以推断出部分晚点列车在车站或区间具有冗余时间但未采取调度策略进行晚点恢复,其中不乏存在部分列车应采取调度策略来恢复晚点却没有采取的情况,即存在调度指挥的不合理性,因此针对晚点列车,对调度策略的采取与否作进一步研究分析,有利于提高列车调度指挥工作的质量。

4 结束语

基于高速铁路列车运行数据,利用关联分析的方法,挖掘调度策略与列车运行指标之间的关联规则,并对每项规则进行深入分析,分析结果能够很好地解释调度策略与列车运行指标之间潜在的规律。研究结果为进一步开展高速铁路列车调度策略规律研究提供了一些思路,可为我国高速铁路调度指挥工作提供辅助支持。挖掘出的关联规则有助于列车调度策略优化及生成,同时调度策略与运行图冗余时间的关联规则分析能为编制列车运行图冗余时间的布局和优化给予一定参考。研究结论为将来实现高速铁路列车调度策略智能优化和生成方法、构建智能调度指挥理论体系提供了一定基础。

猜你喜欢
停站晚点调度员
基于马尔科夫链的高铁列车连带晚点横向传播
晚点的火车(外三首)
考虑高铁与其它运输方式竞争的停站方案优化
基于扣除系数的快慢车模式下线路通过能力计算
买长乘短
地铁列车制动控制研究
“晚点围巾”揭德铁伤疤
轨道交通调度员培训管理与能力提升探讨
德调度员玩手机造成火车相撞