宋晓丽,蔡 涛,王振一
(1.中国铁道科学研究院集团有限公司 北京市华铁信息技术开发总公司,北京 100081;2.中国铁道科学研究院集团有限公司 通信信号研究所,北京 100081)
近年来,我国高速铁路发展迅猛,随着信息化步伐的加快,铁路大数据可能带来的深刻影响和巨大价值日益被认识,无论政府还是企业,围绕铁路大数据的布局和措施都层出不穷。2017年11月,国家发展和改革委员会等四部门印发《铁路“十三五”发展规划》,确立了实施大数据战略、完善铁路行业云数据中心、加强数据分析及开发利用的铁路发展重点任务。关于铁路大数据的研究,目前主要集中在数据平台架构[1-2]、铁路客流分析[3-4]、设备安全管理及运行状态监控[5-6]等方面。王同军[7]将铁路大数据应用顶层设计划分为大数据基础设施、大数据汇集、大数据资产、大数据治理、大数据分析及大数据应用等 6 个体系,而铁路调度指挥主要体现在大数据应用体系的运输安全和运输效率 2 个方面。刘俊[8]提出铁路调度的信息化建设需要从信息系统建设、系统功能完善、系统大数据应用等 3 个方面着手,其中大数据应用主要体现在计划调度和列车调度 2 个方面。
高速铁路调度指挥系统是一个由人、机、环境、信息、决策等要素所构成的复杂系统,管理并控制高速铁路全线及整个路网系统,保障其调度决策正确、信息传输通畅、系统协同动作的功能。相比其他拥有高速铁路的日本、韩国,以及欧洲等国家或地区,我国幅员辽阔、气候多变、地形地质条件复杂,高速铁路运输环境更为复杂,列车运行及调度指挥决策存在的不确定性更大[9]。大数据处理复杂性数据的能力,包括传统科学计算面临的时空复杂性,以及大数据独有的数据量的复杂性[10],无疑为高速铁路调度指挥系统的信息化、科学化发展提供了全新的理念和手段。
目前,我国高速铁路调度指挥系统采用的是按区域设置的二级调度指挥系统架构,业务按时间进程从远至近分为基本计划层、实施计划层和调度指挥层,具体包括计划编制、列车调度、动车调度、供电调度、客服调度、综合设施调度等子系统。我国高速铁路调度指挥机构设置如图1 所示[11]。
高速铁路调度指挥系统具有范围广、功能多、构成复杂等特点,满足调度指挥系统需求的大数据具有以下特征。
(1)调度指挥中心所需的原始数据大多来自基层,包括车站、路段、动车所、变电所、维修基地等,各业务子系统功能的完善,需要以高性能、多业务的通信网为依托,实现所需数据的快速、自动、准确获取。
(2)基于 2 个调度层级功能的不同,需要构建中国铁路总公司、铁路局集团公司 2 个层面的云数据中心和信息处理平台,实现不同信息资源的集中配置与管理。
(3)针对高速铁路的大数据特性,需要全面梳理现有资源及数据交换,打破调度指挥系统中各业务子系统的数据壁垒,建立跨领域的、通用的数据模型,实现信息资源共享共用。
图1 我国高速铁路调度指挥的机构设置Fig.1 Institutions establishment for high-speed railway dispatching and command in China
(4)高速铁路调度指挥系统的智能化决策及风险管理,有赖于大数据的深度挖掘和分析服务,信息处理平台需要强化数据治理,提升数据可靠性;需要利用数据挖掘、分布式并行计算等技术,实现面向调度指挥业务的数据建模,全面提升决策管理水平。
根据工业和信息化部电信研究院提出的大数据技术框架[12],综合高速铁路调度指挥系统的大数据需求、业务功能及系统构成,提出高速铁路调度指挥大数据平台总体架构。其平台包括基础设施层、数据来源层、数据整合层、数据存储层、数据分析层、展示访问层和业务应用层,与大数据相关的标准、规范和安全机制则贯穿所有层次。
(1)基础设施层,是指支撑大数据平台运行的软硬件设备和环境。硬件设备包括服务器、存储设备、网络设备、安全设备等;软件设备包括应用服务器软件、接口通信软件、网络管理软件、数据模型/服务软件等;环境包括系统设备及调度人员所处的工作环境和自然环境。
(2)数据来源层,是指调度指挥所需的路内数据和路外数据。路内数据主要来自于铁路现场和基层单位,包括供电、信号、售检票、乘务管理、旅客向导、综合维修作业、车辆维修管理、车站视频监控、动车组运行检测、防灾安全监控等系统,分为结构化数据、半结构化数据和非结构化数据。外部数据主要来自于综合交通信息平台,与高速铁路相关的其他客运系统,以及自然灾害 (风、雨、雪、泥石流、地震等) 的监测、预警系统。
(3)数据整合层,是指对原始数据进行采集及预处理的有关工具和技术,目的是将原始数据转换为适合数据分析的格式。重点是针对来自数据来源层的不同类型的原始数据,通过采用统一的数据接口和处理流程,完成数据的抽取、映射、转换、加载等工作,以实现异构数据、定时/实时数据的快速接入和分布式数据的融合。
(4)数据存储层,是指采用一定的格式,记录调度指挥系统大数据的各种介质,侧重数据存储方式及其采用的技术。通常,大数据的存储方式与数据结构及实时性等密切相关,并且需要解决数据来源的统一管理和数据容量的自由扩展问题。基于数据的异构性及不同应用场景,高速铁路调度指挥系统大数据存储不仅有以 Oracle、MySQL 等为代表的关系数据库,还有以 Habse 为代表的非关系数据库和以 HDFS 为代表的分布式文件库。
(5)数据分析层,是指支撑大数据价值挖掘的算法模型和数据挖掘技术。主要是利用批处理、交互分析、流处理等技术来实现大数据的计算和快速处理,利用 A/B 测试、分类、统计、关联规则、模式识别、机器学习、MapReduce、R 语言等技术来实现大数据的离线、在线分析与模型构建,目的是为调度指挥决策应用提供数据分析服务。
(6)展示访问层,是指在大数据服务于调度指挥决策支撑场景下,以直观、简便、便于操作的方式将分析结果呈现给用户。主要包括与具体展示内容相关的可视化工具,面向中国铁路总公司、铁路局集团公司等众多用户的统计生产,为各类系统提供的数据推送、数据分发等服务。
(7)业务应用层,是指大数据的分析结果及其展示在高速铁路调度指挥中的具体应用,重点是指运营调度系统具体功能的完善,包括计划调度、运行调整、动车调度、供电调度等[13]。
(8)大数据标准体系和安全保障体系,保障高速铁路调度指挥系统大数据平台可靠运行的规范制度和管理措施。大数据标准体系由基础标准、技术标准、产品和平台标准、管理标准、安全标准、应用和服务标准等类别的标准组成,具体涉及到大数据的采集、整合、存储、分析、应用、安全等规范。大数据安全保障体系涉及战略保障、运行管理保障、技术保障等方面的措施,保障对象包括大数据基础设施、数据及网络信息、调度指挥组织及人才技术等方面。
高速铁路调度指挥系统大数据平台是一个集数据接入、数据处理、数据存储、数据分析、数据展现等为一体的复杂应用系统,大数据平台总体架构、大数据平台存储管理、大数据分析处理等关键技术的选择和实现,最终目标是能够有效支撑大数据的应用。
高速铁路调度指挥系统大数据应用的核心是通过对多源数据的融合、挖掘、分析和关联,准确辨识行车安全的风险因素、把握系统风险的演变规律,有效支撑调度指挥的风险管理决策,确保高速铁路运营安全;并从海量历史数据中发现列车运行的时空特性、把握不同业务调整之间的关联性,实现调度指挥在不同层级、不同部门、不同岗位之间的协同动作,确保高速铁路正点、高效。
基于总体架构,提出高速铁路调度指挥大数据平台应用架构如图2 所示。
首先将铁路现场、基层单位和路外的多源、异构、分布式原始数据接入大数据平台,然后通过大数据平台的治理、存储和挖掘,实现调度指挥业务的大数据应用,既有在线的实时监控及运行调整,也有离线的统计分析和计划编制。例如,在运输计划方面,通过对不同时期的客运需求、不同条件下的列车开行方案,以及线路参数、车站参数、信号参数、动车组参数、基本列车运行参数等数据的分析,编制和调整基本列车运行计划,并利用平台提供的数据环境进行列车运行模拟、线路通过能力计算和列车运行计划评价,确保运输计划方案的合理性和可行性;在设备状态监视方面,通过对设备的资产、台账、运行、修试、图像、环境等数据的分析,进行设备状态的评价、设备重要度的分析、设备缺陷及生命周期的预测,并且利用平台进行趋势告警、关联预警及即时可视化展现,辅助设备状态检修,提升风险的管控能力。
大数据是一种思维方式的信息革命,大数据的应用和实践正在日益改变着人们的生活和工作方式,同时推动着理念、模式、技术的创新。对于处在转型发展期的我国高速铁路,目前大数据的来源和数据采集已相当成熟,但仍然面临着数据存储和共享困难、数据分析和处理能力不足、数据利用率低等一系列挑战[7]。针对高速铁路调度指挥系统大数据的需求,通过对高速铁路调度指挥系统大数据平台的架构方案的研究,对于将来高速铁路调度指挥系统大数据平台的构建及应用实施等具有一定的参考价值。
图2 高速铁路调度指挥大数据平台应用架构Fig.2 Application architecture of big data platform for high-speed railway dispatching and command system