韩 浪,王壮锋,张春德
(1.中国铁道科学研究院研究生部,北京 100081; 2.中国铁道科学研究院集团有限公司通信信号研究所,北京 100081; 3.中国铁路北京局集团有限公司,北京 100860)
在调车作业频繁的调度集中车站,影响接发车作业和切割正线的调车作业会与列车作业在时间和空间上产生冲突,影响彼此的作业效率和行车安全[1]。分散自律调度集中控制系统将调车作业权和列车作业权分置,协调解决了列车作业和调车作业的时空冲突问题[2]。在分散自律控制模式下,调度中心控制列车作业,助调员(采用中心控制操作方式的车站)或车站值班员(采用车站控制操作方式的车站)控制调车作业。在不影响列车作业的情况下,车站自律机根据列车运行调整计划,调车作业估算时间,联锁关系,《车站行车工作细则》(以下简称“《站细》”)等条件寻找列车与列车之间合适的运行空当,及时完成调车作业[3-4]。
科学准确地预测调车作业时间对于调车作业安全卡控,提升调车作业效率,保证列车作业不受影响及行车安全十分重要。预测值过大,会导致调车作业长时间处于等待状态,调车作业效率不高,车站线路利用率低;预测值过小,会导致调车作业时间紧张甚至无法完成,影响列车作业,导致后续列车的停车和运缓,甚至导致列车站外停车,发生冲突等危险情况。由于调车作业过程复杂,参与人员众多,对调车作业时间合理有效地进行预测具有较大难度。
目前,针对调度集中系统中调车作业时间估算方法的研究较少。由于影响调车作业时间的因素复杂,部分因素不可量化,无法参与计算,所以纯粹的计算法便显得过于理想化,无法付诸实践。纯计算法考虑调车程类型、调车程数量和调动车辆数3种因素建立简单线性函数对调车作业时间进行粗略估算;王秀娟[5]等通过采用写实法建立调车作业时间库,并对库中数据进行不断修正与补充,从中获取调车作业时间的评估值。纯计算法无法综合考虑各影响因素,其计算值与实际相差较大,误差率较高;写实法需要大量的时间成本和人力成本,且由于靠人工经验和少量计算评估,所获取调车作业时间评估值波动性大,指导性参考性较弱,个人主观性强,缺乏统一的解读标准,容易产生不同的解读。
在对调度集中车站调车作业过程和时间影响因素分析的基础上,提取调车作业时间的影响因素作为数据集特征,构建有标识的数据集训练和验证回归分析预测模型,得出误差率可接受的调车作业时间预测值;通过采用回归分析算法[6]对智能预测模型进行示例实现,并对智能预测逻辑流程和应用效果进行简单分析。
在铁路运输生产活动中,除列车运行以外,机车、车辆或机车车辆在站线或其他线路上一切有目的、有计划的移动都属于调车。调车作业是在一定气候、光照等外部物理环境下,助调员或车站值班员编制调车计划,机车乘务组按调车进路操纵机车或机车车辆运行,调车组按计划对车辆进行摘、挂等作业的一系列过程。调车作业按照调车设备不同可分为牵出线调车和驼峰调车[7]。调度集中站一般利用到发线、正线进行调车作业,特殊情况下会用到部分区间线路进行调车作业,属于牵出线调车作业。
任何调车作业都能以调车钩作为基本单位进行分解,调车钩按照作业性质不同可分为牵出钩、摘车钩、挂车钩、转线钩,调车钩,按照一定顺序排列即可组成调车作业计划[8-10]。调车钩可进一步细分为不同种类、数量和长度的调车程,调车程按照其各阶段运行速度不同分为加速—制动、加速—惰行—制动、加速—定速—制动、加速—定速—惰行—制动等类型。为阐述调车钩、调车程和调车作业计划的概念,以某一调车作业计划为例进行分析:A车起始位置如图1所示,位于VG道,调至8G摘钩甩2节车辆,进行一次摘车钩作业;然后调至7G挂钩1节待编组车辆,进行一次挂车钩作业;重新调回VG。其对应的调车作业计划如表1所示,其中,“-”表示摘车作业,“+”表示挂车作业。
图1 车站调车作业示例
表1 调车作业计划
A车从VG牵出至2-4DG为一个加速—定速—制动调车程;调至8G摘钩甩2节车辆,为一个加速—定速—惰行—制动调车程;回至2-4DG为一个加速—定速—制动调车程;调至7G挂钩1节待编组车辆,为一个加速—定速—惰行—制动调车程;回至2-4DG为一个加速—定速—制动调车程;回至VG为一个加速—定速—制动调车程。
调度集中车站的调车作业在相邻两次列车作业间的时间空当内完成,该空当时间记作T间。根据《站细》,调度集中站在接发列车前,应在规定的时间内停止影响列车进路的调车作业,这一按规定预留的时间间隔称为安全预留时间,记作T安。在相邻两次列车作业时间间隔T间内,做完一次调车作业T总并保证安全预留时间T安后,可能会空出一段时间间隔,无调车作业计划或不能满足下次调车作业时间的要求,该时间间隔称作空闲时间,记作T空。
调车作业的总时间T总与T间、T安、T空之间有如下关系
(1)
其包含关系如图2所示。
图2 调车作业各时间量关系
一次实际调车作业时间可由上述各时间量相加得出,但每个时间量并不能通过简单的数值计算得到。实际调车作业过程会受到各种因素的影响,如天气、夜间照明等物理环境,机车乘务组机车操纵水平,调车组摘挂作业熟练程度,调车机车的类型、牵引性能、制动性能等,均会对加速运行时间T加、定速运行时间T定、惰行时间T惰、制动运行时间T制和摘挂钩作业时间t产生不同程度的影响。将这些影响因素进行抽象,视作变量。可知这些影响因素变量部分是分类变量,部分是含义和量纲均不同的数值变量,均无法通过传统数学计算进行分析。针对这一问题,利用大数据技术,将影响因素变量作为特征构建数据集,通过构建回归分析模型并对其进行训练验证,构建一种综合考虑各种影响因素的智能预测模型,获取到更为科学准确的调车作业时间预测值。
利用大数据技术和机器学习算法对调车作业时间进行预测需分3个步骤进行。
(1)抽象时间影响因素作为特征,构建数据集。
(2)构建算法模型并利用训练数据集对模型进行训练,利用测试数据集对模型进行验证。
(3)结合调车作业流程,设计调车作业时间智能预测逻辑流程。
构建数据集首先需进行特征提取,即对所有影响调车作业时间的影响因素进行变量定义和命名,如图3所示,调车作业时间数据集的特征组如下。
图3 调车作业时间数据集特征组成
(1)调车程类型x1、调车程长度x2、调车程数量x3:不同调车钩计划可以分解为不同类型、长度和数量的调车程,调车程决定调车作业的走行距离。
(2)调动车辆的数量x4、调动车辆的质量x5:在牵引和制动性能一定条件下,调动车辆的数量和质量会限制调车车列的运行速度。
(3)调车机车类型x6、调车机车牵引性能x7、调车机车制动性能x8:不同动力的调车机车具有不同的牵引和制动性能,决定调车程加速、定速、惰行和制动过程的速度曲线。
(4)调车允许速度x9:不同的调车进路,途径的道岔号不同,所允许的最高调车速度会不同[11]。
(5)站场的正线数量x10、站场的到发线数量x11:站场的正线和到发线数量等站场布置信息决定构成调车进路的调车程的类型、长度和数量。
(6)机车乘务组机车操纵水平x12、调车组摘挂作业熟练程度x13:参与调车作业的机车乘务组和调车组的业务水平影响机车性能发挥程度和摘挂钩作业时间t。
(7)湿度x14、温度x15、光照条件x16:不同湿度、温度,对轮轨的黏着系数[12],各种调车设备性能和作业人员的生理、心理都会产生不同程度且难以量化的影响。
(8)调车作业时间T总:记录实际调车作业时间,包含该特征值的数据集是有标识的数据集[13],方可用于训练或测试算法模型。
数值特征是特征取值为数字的一类特征,如调车程长度x2、调车程数量x3、调动车辆的数量x4、调动车辆的质量x5、调车允许速度x9、站场的正线数量x10、站场的到发线数量x11、湿度x14、温度x15、光照强度x16、调车机车牵引性能x7、调车机车制动性能x8、调车作业时间T总等。不同数值特征的取值范围和衡量单位差异较大,需进行特征标准化处理,即将特征值缩放成均值为0,方差为1的状态,可减少取值过大的特征对训练模型精度的影响程度[14]。
分类特征是特征取值为不同类别的一类特征,如调车程类型x1、调车机车类型x6、机车乘务组机车操纵水平x12(例如取值“优”“良”“一般”)、调车组摘挂作业熟练程度x13(例如取值“优”“良”“一般”)等。不同的分类特征,其取值通常为具有不同含义的字符,为使训练模型可以识别其含义并进行处理运算,需进行one-hot[15]特征编码。
数据集按照4:1分为训练数据集和测试数据集,训练数据集用来训练预测算法模型,测试数据集用来验证预测算法模型的好坏程度。
数据集具有可调性,其中的特征可以进行增、删调整,对调车作业时间影响微乎其微的特征可进行剔除,对调车作业时间具有一定影响但未被考虑的因素进行增加操作,使得数据集特征结构更具科学合理性。
数据集同样具有一定的时效性,调车设备大规模升级改造、调车作业规范发生较大变化等时间节点前后的数据对于调车作业时间预测模型会产生不同程度的影响,应尽量使用最新时间节点的数据作为数据集进行预测。
在建立数据集结构的基础上,便可利用机器学习算法对时间预测问题进行建模。调车作业时间预测问题可抽象为:由已知的16种影响因素,即调车程类型、调车程长度、调车程数量,调车机车类型等,对调车作业时间T总进行预测。输入是一系列数值特征数据或分类特征数据,输出是一个数值型数据,回归分析算法或深度学习算法均适用于此类预测问题。以回归分析算法[16]为例进行介绍,建立回归分析算法模型分3步进行,如图4所示。
图4 回归分析算法模型训练过程
STEP1:确定方程域
T总=f1、2、3、…(x1,x2,x3,…,x15,x16)
(2)
方程域是由一系列函数方程f1、f2、f3…组成的方程集合。调车作业时间与16种影响因素的映射关系就被包含于方程域中,回归分析算法就是试图从方程域中寻找出最拟合调车作业时间预测的函数模型。根据调车作业时间影响因素及调车作业过程特性,采用线性回归方程域,即
T总=b+∑wixi,i=1,2,3,…,15,16
(3)
其中,wi为特征权重;xi为特征;b为偏差。
STEP2:建立损失函数
(4)
STEP3:寻找目标线性回归模型,即寻找目标函数f*使满足
(5)
或寻找目标参数w*和b*使满足
(6)
即,寻找使损失函数L(f)=L(wi,b)最小的f*,即为所求的最佳线性回归函数模型。确定方程域,建立损失函数后,需利用数据集进行训练,逐步逼近最拟合调车作业时间的回归分析模型。文中采用随机梯度下降的方法,即初始时随机给定一组wi和b值,计算损失函数L(f),设定各参数的下降梯度,使得wi和b值向着使损失函数递减的方向梯度变化,可设定
wi的下降梯度为
(7)
b的下降梯度为
(8)
学习率(Learning Rate)η值可由专家确定,决定wi和b值的梯度变化速度。利用随机梯度下降的方法可以逐步逼近得出最拟合调车作业时间的预测模型f*。
构建出调车作业时间智能预测模型f*后,设计智能预测逻辑流程,可将预测得到的调车作业时间提供给车站自律机进行必要的自律运算和安全卡控。调车作业时间智能预测逻辑流程如图5所示。
图5 调车钩时间智能预测逻辑流程
(1)对调车作业时间进行智能预测,首先需要对调车作业计划进行分解,一次调车作业可分解为若干不同类型的调车钩[17],调车钩可进一步分解为若干个不同类型、长度和数量的调车程。
(2)通过铁路大数据平台[18-19]或调度集中大数据平台[20-21]可获取除调车作业时间以外的16种特征值,输入智能预测模型f*中获取预测值。
(3)自律机根据调车作业时间的预测值,综合列车运行调整计划、《站细》、联锁关系等条件进行自律运算,判断调车进路是否符合排列条件并进行安全卡控。
(4)当调车进路排列完成,进行调车作业,并在调车作业完成后,记录实际调车作业时间,与预测值进行比对,计算误差率(可接受误差率范围由专家设定),判断误差能否接受。误差率可接受,则进行下一钩调车作业;如果不满足误差率要求,则将数据更新至数据集对预测模型f*进行重新训练,得到优化后新的预测模型f′*,返回至第3步骤重新进行自律运算及后续操作,直至调车作业完成。
选取某铁路局下辖3个区段站内一昼夜间的调车作业为研究对象,利用调度集中系统总显示软件的历史回放功能,统计得到实际调车作业时间。根据实际调车作业信息,结合路内及路外数据,构建仿真数据集,对线性回归分析预测模型进行仿真训练。
所选取的3个区段站有如下特点:调车作业频繁,昼夜均有大量调车作业进行;车站所处地区昼夜气候变化大,温度、湿度、光照均有较大起伏;机车型号不一,数量较多;机车乘务组和调车组人员众多,各班组间作业水平存在一定差距;站场调车设备状况不同;站场布局及相关信号设备有较大差异。
仿真分析时,对调车作业场景作如下假设。
(1)调车作业均由一台本务机车完成。
(2)调车作业时间,系指在站线作业(不包括货场内的货物线)的时间。
(3)对各项非生产时间(如待摘挂、待发车等信号的各种等待时间),不计入作业时间内。
文中写实法评估值由专家(经验丰富的助调员和车站值班员)给出参考值;纯计算法预测值由以下公式计算得出
t=a+bm
(9)
式中,t为调车钩作业时间;a为单机完成该调车钩作业所需要的平均时间,参照写实法评估值;b为每增加调动一辆车所增加的调车钩作业时间;m为本调车钩调动的车数。
利用写实法和纯计算法对某车站10个调车钩作业时间进行预测,与线性回归智能预测值的对比如表2所示。
表2 调车钩作业时间对比分析
由表2可知:由写实法得出的10个调车钩作业时间的评估值与实际值相比,累计偏差为2 278 s,平均相对误差为13.171%;由纯计算法得出的10个调车钩作业计划的评估值与实际值相比,累计偏差为2 109 s,平均相对误差为11.861%;由线性回归分析预测模型得出的10个调车钩作业计划的预测值与实际值相比,累计偏差减小到835 s,对相对误差取绝对值之后求得平均值为4.712%,满足设定的可接受误差率(本文设定可接受误差率为5%),验证了本文模型和方法的可行性。
未来需加强对现场调车作业数据的规范收集和统计工作,以便扩充数据集,进一步优化模型和相关参数。
利用大数据技术和机器学习算法,构建数据集和智能预测模型,设计调车作业时间智能预测逻辑流程。根据调车作业各个影响因素,获取误差率可接受的调车作业时间预测值,为调车作业在列车运行空当及时合理地完成提供可靠判断依据。
通过对调度集中车站调车作业的物理过程进行细致分析,并对调车作业时间的各部分组成进行分解和详细阐述,在此基础上找出影响调车作业时间的多种影响因素,并将其作为数据集特征,提出一种调车作业时间的线性回归分析智能预测方法。相比于纯计算法和写实法,预测得到的调车作业时间所考虑的影响因素更全面,获取的数值误差相对较小,可为车站自律机对调车作业的自律运算和安全卡控提供更为有效可靠的数值依据。未来通过与调度集中系统大数据平台或铁路大数据平台(目前可通过与现车系统接口)信息共享,实现调车作业计划单自动获取,调车进路指令序列自动生成和调车进路自动排列等功能,提高调度集中系统中调车作业的自动化水平,减轻人员劳动强度,提高运输效率和安全水平。