余 淮,王振宏,邢科家
(1.中国铁道科学研究院, 北京 100081;2.中国铁道科学研究院 通信信号研究所,北京 100081)
编组站运输能力自动计算系统的研究
余 淮1,王振宏1,邢科家2
(1.中国铁道科学研究院, 北京 100081;2.中国铁道科学研究院 通信信号研究所,北京 100081)
本文介绍编组站运输能力自动计算系统,该系统采用数据挖掘技术—决策树C4.5算法,从编组站综合自动化(SAM)系统数据库丰富的数据信息中自动筛选、汇总能力计算所需数据,自动建立符合当前编组站实际情况的能力自动计算体系,按照预先设置的能力计算单位时间,自动计算编组站全站能力或单项设备能力。最终通过人机界面以图表方式显示能力计算及查询结果,为编组站技术装备的管理和运营组织方式的调整提供更加丰富、客观的数据依据。
运输能力;编组站综合自动化(SAM);决策树;C4.5算法
编组站运营工作是根据车流情况,利用车站运输设备最大限度地发挥其运输能力。因此,掌握编组站的实际运输能力对于优化调整编组站运营组织方式,提高编组站运输能力具有重要意义。
目前编组站运输能力计算工作主要由人工完成,每隔数年查定一次,每次需数十人同时进行连续三昼夜的数据采集,并由专人汇总、分析数据,计算结果,整个过程历时数周甚至更久,而且由于数据采集、录入及处理均由人工完成,能力计算结果存在主观性和不准确性,并不能很好的满足需求。近年来,随着电气集中设备和微机联锁设备的普及,国内学者对于能力计算的自动计算方法进行了研究,研究结果虽可自动采集部分数据,但数据并不全面,且分析及计算仍需人工完成,并未真正实现编组站运输能力的自动计算。
本文介绍了一种编组站运输能力自动计算系统,该系统使用决策树C4.5算法对编组站综合自动化(SAM)系统数据库中的大量数据进行智能分类,整合生成能力计算的参数,通过能力计算公式实时、准确地自动计算编组站运输能力值。
1.1 系统总体设计
系统的体系结构采用C/S模式,其不依赖于系统外网环境,安全性较高,如图1所示。
图1 系统体系结构
系统的层次结构设计为3层:表示层:应用程序的客户端,提供人机接口;业务逻辑层:实现业务逻辑功能,负责数据处理及计算;数据层:物理数据库,包括数据访问的组件以及数据对象,提供了数据访问的公共链接等,如图2所示。
图2 系统层次结构
系统的主要模块设计如下:独立的数据整合模块进行能力计算基础数据的处理,数据读写模块作为业务逻辑层进行数据库的读写以及数据转换,能力计算模块主要完成人机交互,按照界面输入参数计算站场的能力并将计算结果以数据图表的形式展示给用户。系统模块构成如图3所示。
图3 系统模块构成
1.2 系统功能设计
(1)数据自动分类汇总功能。系统可从编组站综合自动化系统(SAM)数据库中自动汇总能力计算所需数据,存储于数据表中。
(2)能力自动计算及查询功能:a.编组站通过解编等能力的自动计算及查询功能。b.单项作业能力的自动计算及查询功能。包括:各区域(按场别、咽喉等划分)能力的自动计算及查询功能;各作业系统(如不同作业方式下的驼峰解体系统,编组系统等)能力的自动计算及查询功能;各设备(道岔、单条牵出线等)能力的自动计算及查询功能。c.按设定时间进行全站或单项能力自动计算及查询功能。包括:24 h能力自动计算及查询对比功能;按班次进行能力自动计算及查询对比功能;按阶段计划周期进行能力自动计算及查询对比功能。
(3)能力计算日志及文档管理功能。系统可自动管理运行日志以及能力计算相关文档。
(4)界面显示功能。通过人机界面以图表形式显示能力计算结果功能。
(5)参数设定功能。系统可对编组站相关特性进行设置。
(6)用户管理功能。系统可对用户进行权限管理,按照用户权限进行不同程度的功能开放。
系统功能结构图如图4所示。
图4 系统功能结构图
1.3 数据结构设计编组站能力计算所需的基础数据主要包含作业计划数据,作业指令数据,作业进路数据和作业计划执行结果数据等。编组站综合自动化(SAM)系统的计划信息子系统以作业计划为依据不间断地进行着列车的到、解、编、发,运输设备根据作业计划分解后形成的作业指令动作实现生产指挥人员的运输意图;SAM系统的控制子系统采集设备运行状态信息并进行逻辑处理形成作业执行结果信息。上述数据按照数据类型以离散状态存在,编组站运输能力自动计算所需的数据是以耦合状态存在的数据,因此需按照现场作业的先后顺序关系、作业的交叉关系对上述数据进行整合处理。例如,处理到达场接车作业数据时,将作业计划、作业指令、作业进路、作业计划执行结果以及股道占用情况整合,供数据挖掘使用,整合后的能力计算基础数据表如表1所示。
表1 能力计算基础数据表
表1中各符号意义如下:E—设备名称;M—机车类型,包含调机、本务机、列车等;T—占用时间;P—计划类型;WD—Δt内是否有需占用当前设备的调车计划处于等待状态;Type—时间类型,包含妨碍时间、空程时间、推峰时间、整备时间等。
(1)适时自动能力计算。目前的能力计算以一昼夜为单位,且一般间隔数年才进行一次,目的是服务于路网层面的规划建设、运营组织调整,但对编组站站内运营组织的改善并没有太多参考意义。而本系统可根据预先设定的能力计算时间单位进行自动能力计算,若设置为3 h可为以阶段计划的编制调整提供重要的数据支持。本系统在保留能力计算原有作用的基础上,同时也为编组站站内运营组织模式的改善提供重要依据。
(2)参数全部使用真实值,计算结果更加准确。现有能力计算方法由于原始数据匮乏和不准确,一些人工难以统计的参数多采用经验值代替真实数据,而本系统可从SAM系统数据库中轻松获得编组站能力计算所需的所有原始数据,进而得到所有参数的真实值,计算结果更符合编组站实际情况,因而更加准确。
综合铁路编组站能力计算国家标准以及国内外研究成果,结合数据挖掘C4.5算法,形成新的计算体系。以编组站尾部编组能力计算为例,目前的直接计算法公式为:
式中M为尾部配备的编组调车机台数;α为空费系数;∑t固为固定作业总时间;t编组为平均编组一列车的时间(min);N摘为一昼夜编组的摘挂列车数。
目前算法模型的缺点:各种参数的计算均依据数昼夜人工采集的数据,既不灵活又缺乏普遍性和准确性;α等人工难以测量的参数目前仍主要使用经验值或概率值,即2台调车机时采用0.06~0.08;3台调机时采用0.08~0.12,并不能保证完全符合当前编组站情况。
现改进如下:
(1)进行能力计算使用的原始数据不再局限于数天内的采集,现可使用数周、数月或者更长时间的历史数据,甚至可使用不同班组各自的历史数据生成计算模型。如此生成的数据模型更加准确且具有针对性,计算结果更具参考价值。
(2)能力计算的单位时间不再局限于24 h,现可设置为一个阶段计划周期、一个班周期或者任意时间长度。以便服务于编组站阶段计划的编制调整以及班组作业方式的考量改善等。
(3)不再采用目前普遍使用的经验值,采用数据挖掘中的分类算法C4.5算法统计数据计算妨碍时间等人工方式难以统计的参数。根据当前编组站大量历史数据生成的决策树模型,更加符合当前编组站的技术装备条件和作业组织风格,更能准确地挖掘出可用数据,获得准确的编组站运输能力。系统使用以下步骤构造决策树:
定义:从数据库中选取原始数据集组成训练集D,定义候选属性集为A,选取表1中属性“Type”为类标号属性C,集合C具有m个不同值,即有m个不同的类Ci(i=1,…,m),设Ci,D是D中Ci类元组的集合,|D|和|Ci,D|分别是D和Ci,D中元组的个数。按照以下步骤生成决策树。
步骤1:创建一个结点N。此结点第一次被创建,则为根结点。
步骤2:判断D中数据是否都属于类C,若是,则返回N作为叶结点并标记为类C;若否,继续下一步。经过判断,D中数据不均属于类C,因此,继续下一步。
步骤3:若A为空集或者没有剩余属性进一步划分样本,则将N作为叶结点返回,标记N为D中的多数类。
步骤4:计算A中每个属性的信息增益率。
步骤5:将信息增益率最高的属性H作为N的测试属性。
步骤6:若结点N的测试属性取值是离散值,那么这个属性有几个取值就在结点N处产生几个分支。
步骤7:由结点N产生若干个分枝结点分别产生子树。返回步骤1。若决策树已经生长完毕,对决策树进行剪枝。例如,若对妨碍时间中的本务机妨碍时间进行挖掘,则决策树构造如图5所示,剪枝后如图6所示。再根据剪枝后的决策树生成分类规则从大量时间数据中分类得出本务机妨碍时间数据。
本系统软件的开发基于Microsoft.NET Framework 3.5,使用面向对象语言C#处理数据以及逻辑,使用Oracle10g进行数据的存储、查询及备份。
图5 未剪枝的决策树(本务机妨碍时间)
图6 剪枝的决策树(本务机妨碍时间)
在对某编组站进行的3次能力查定工作中,将编组站运输能力自动计算系统计算结果与人工计算结果进行对比。以该站上行编组能力的计算为例,人工方式采用传统的直接计算法,利用一昼夜内采集得到的基础数据计算24 h编组能力值。与此同时,编组站运输能力自动计算系统设定基础数据取值时间范围为30 天(以查定日期为截止日期),并将能力计算的单位时间设定为24 h,进行自动能力计算。对比结果如表2所示。
表2 某编组站能力计算结果对比
人工能力计算方式由于原始数据的波动性和人为因素的影响,呈现不稳定态势,而编组站运输能力自动计算系统的计算结果非常稳定,能够正确反映当前装备技术条件和作业方式下编组站的真实作业能力,便于通过与实际作业量比照,为编组站作业组织方式的改善提供可靠的依据。
[1] 国家技术监督局.铁路编组站到发线通过能力计算方法(三级三场)[S]. 北京:中国标准出版社,1992,7.
[2] 国家标准局.铁路编组站改编能力计算方法(三级三场)[S].北京:中国标准出版社,1989.
[3] 孔庆铃,刘其斌.铁路运输能力计算与加强[M].北京:中国铁道出版社,2008:327-333.
[4] 杨介平.铁路运输能力的计算与利用[M].北京:中国铁道出版社,2001:23-29.
[5] Jiawei Han,Micheline Kamber,Jian Pei.数据挖掘:概念与技术[M]. 3版. 范 明,孟小峰,译.北京:机械工业出版社,2012:213-222.
责任编辑 陈 蓉
Research on Automatic Calculation System for transport capacity of marshalling yard
YU Huai1, WANG Zhenhong1, XING Kejia2
( 1.China Academy of Railway Sciences, Beijing 100081, China;2. Signal & Communication Research Institute, China Academy of Railway Sciences, Beijing 100081, China )
This thesis introduced the Automatic Calculation System for transport capacity of the marshalling yard. The DM technology that was the decision tree C4.5 Algorithm was used to screen and collect the data used in capacity calculation from abundant data information in the database of the Synthetic Automation of Marshalling Yard(SAM) System. It was built the automatic calculation system which conformed to the current actual situation of the marshalling station automatically, automatically calculated the total capacity of the marshalling station or single equipment capacity according to the preset capacity calculating unit time. Finally the capacity calculation and the query results were displayed in charts through friendly man-machine interface.It was provided richer and more objective data for the management of technical equipment and the adjustment of the operational organization of marshalling station.
transport capacity; Synthetic Automation of Marshalling Yard (SAM); decision tree; C4.5 Algorithm
U291.4∶TP39
A
1005-8451(2014)05-0041-05
2013-11-22
余 淮,在读硕士研究生;王振宏,助理研究员。