李 鑫,史天运,马小宁,刘 军
(1.中国铁道科学研究院 研究生部,北京 100081;2.中国铁道科学研究院集团有限公司 科技和信息化部,北京 100081;3.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
在铁路深入实施“三大举措”、不断推进“六个变革”的背景下[1],铁路客、货运输屡创历史新高[2-3]。作为铁路运输中的重要组成,铁路机务专业的运输生产组织效率、机车质量安全状态、机车整备检修能力、机车乘务员管理水平等,均会对铁路运输能力的稳健提升和经营工作的稳步发展产生重要影响。随着铁路行业关于智能铁路的研究不断深入,云计算、大数据、区块链等新技术对于促进铁路运输生产效率、保障列车运营安全的作用日益突显,铁路已经进入到了数字化发展时代[4]。如何盘活积累的铁路机务大数据,促进铁路行业的数字化发展,支撑铁路平稳有序地运输生产,是目前机务专业在提升运输质量、巩固经营效益中面临的挑战。
铁路机务专业是铁路运输生产的重要行车专业,主要负责铁路各型机车的运用组织、整备保养和综合检修,为客货、行包及专运列车等提供动力牵引,并担当机车乘务员和动车组司机的培养及管理任务。目前我国铁路机务专业诸多业务领域已投入了大量监测检测设备、行车监控装置[5],以及相关的信息管理系统[6],有效地提高了作业效率、管理精度,节约了生产成本[7]。同时,通过这些设备和信息系统,机务专业积累了大量的数据,数据类型十分丰富,数据量增长极快[8]。铁路机务大数据的特征主要体现在以下方面。
(1)数据总量大。随着新型现代化监测检测设备和信息管理系统的持续投入,机务专业各个运输生产环节已初步完成了信息化建设,逐渐形成了庞大的数据体量。
(2)数据类型多。机务专业的数据类型主要包含结构化数据、非结构化数据及半结构化数据。结构化数据主要包括基本台账信息、日常统计信息等。非结构化数据主要包括机车周转运行图、机车设备图纸、监控视频、作业录音等。半结构化数据主要包括事故故障报告、调度命令、作业报单等。
(3)数据增长快。随着铁路运输规模的不断扩大[9],机务运输生产中产生了大量不同类型的数据,特别是非结构化数据占比不断提高,出现了“多源头、井喷式”的数据增长现象。
(4)数据间关联性强。机务专业的数据涉及机车运用、检修养护、人员管理等多个业务领域,由于不同的领域之间存在极强的业务联系,使得机务专业的数据间有着很强的关联性,往往“互为因果”、彼此嵌套。
(5)利用潜力大。机务专业所积累的数据内容全面、内涵丰富,对于提高机车周转效率、强化整备检修质量、保证列车运行安全、加强作业人员管理、提升跨专业综合保障能力具有重要价值。
为了实现生产数据的可靠存储、机车周转的灵活安排、安全管理的高效开展,机务专业针对不同的业务环节,部署了一定数量的信息采集和管理系统,积累了十分可观的数据资源[10]。然而,由于缺乏统一的数据治理体系和高效的大数据分析应用,铁路机务专业仍面临数据采集手段落后、系统应用不充分、数据管理不规范等问题,严重影响了机务专业信息化建设的高质量发展。
(1)数据采集手段落后。由于部分信息管理系统缺乏有效的维护和升级,一线作业环节数据采集手段仍较落后,缺乏专业的数据采集和治理手段,数据的时效性、真实性、精确度不高。
(2)系统应用不充分。机务专业各类信息系统普遍存在重复建设、缺乏维护、使用率低的问题,导致数据标准化程度不高、数据管控力度薄弱、运维人员劳动作业强度大、数据质量不高。
(3)数据管理不规范。由于各个数据管理系统应用范围有限、管理碎片化、业务场景单一,缺乏统一有效的数据管理,导致数据采集的时间成本上升,数据分析的准确性有待提高,各层级间的数据共享难以保证,数据的安全管理有待完善。
(4)数据挖掘不深入。机务专业的数据应用目前仍然停留在录入、存储、查询、统计等基础阶段,关联分析、文本分析、图像识别等大数据分析技术运用尚浅,数据中所蕴含的深层价值尚未得到充分地挖掘和利用,尚未形成数据应用与业务管理间的良性闭环。
(5)数据融合共享难度大。机务专业的数据存储和分析多以本部门存储、本系统管理、本领域分析为主,“信息孤岛”现象突出,“数据壁垒”问题严重,数据资源协调共享、汇集融合、综合利用和跨专业分析难度较大,较难发挥出海量数据的潜在价值。
1.3.1 设计目标及定位
铁路机务大数据应用系统依据《铁路信息化总体规划》和《铁路大数据应用实施方案》,以铁路机务专业的数据集成共享为基础,以铁路数据服务平台[11]为依托,以大数据分析技术为核心,以提升铁路运输生产水平为目的,汇集机务专业各业务系统数据,开展铁路机务大数据应用,满足机务专业不同层级业务部门的日常生产和分析决策需求,促进铁路运输生产效率和安全生产水平进一步提升。
中国国家铁路集团有限公司现已在武清建成铁路数据服务平台,提供面向全数据类型的数据汇集、存储及计算服务。铁路机务大数据应用系统以“平台+应用”的方式,将机务专业各业务系统的数据汇集到铁路数据服务平台,集成整合数据资源,打破数据壁垒,在数据共享的基础上开展大数据分析及应用。铁路机务大数据应用系统的定位如图1 所示。
图1 铁路机务大数据应用系统的定位Fig.1 Functions of the big data application system for the railway locomotive system
1.3.2 总体架构设计
铁路机务大数据应用系统的总体架构如图2 所示,可概括为“N+1+3”。“N”表示多个不同的机务信息系统及相关的路外数据,提供基础的数据来源。“1”表示铁路数据服务平台,通过数据采集、数据传输、数据存储、数据治理等功能模块,提供数据计算和可视化服务。“3”指的是铁路机务大数据应用系统所包含的三大应用板块,即从设备质量综合分析、人员运用综合把控、运输生产综合管理3 个方面,为机务专业提供全面、可靠、高效的应用服务。
(1)数据源。针对不同的类型数据,通过数据录入、数据导入、实时接入、离线抽取等方式,实现机务专业众多业务系统及与机务运输生产密切相关的工务、电务、供电等专业的数据接入。同时汇集天气、地理信息等路外数据,打通数据传输及共享壁垒,支撑后续的数据处理及分析。
(2)铁路数据服务平台。铁路数据服务平台作为数据服务层,将机务专业相关的各类数据,通过采集、传输、存储、可视化等环节,完成数据的规范治理、交互共享和综合展示。各项数据经由统计、分类、聚类、关联分析、预测分析、智能推荐等深度学习方法,为不同的应用需求提供计算支持。
(3)铁路机务大数据应用系统。铁路机务大数据应用系统通过MapReduce,TensorFlow,Storm等多种类型的计算框架,开展关系型数据分析、事故故障文本分析、流数据分析等多种数据分析工作,为不同的业务场景提供包括统计分析、报表生成、数据挖掘、决策推荐等多样的大数据应用服务。同时,针对共性的分析需求,以丰富的大数据分析算法为基础,为各业务部门提供基础的数据挖掘分析模型,有效提高应用效率。数据挖掘分析模型的应用思路如图3 所示。
1.3.3 技术架构设计
铁路机务大数据应用系统采用基于J2EE 的企业技术架构,Web 应用程序使用HTTP 作为核心的通信协议,系统数据库采用Hadoop 平台和PostgreSQL,平台使用“B/S”模式(即Browser/Server 模式)构建。系统整体框架以Spring Boot为核心,运用面向对象的设计方法,客户端采用Layui 框架渲染页面,通过AJAX 异步请求实现与服务端交互数据,服务端通过Spring MVC 拦截用户请求、获取请求参数、实现页面导航,Spring贯穿了整个中间层,将Web 层、Service 层、DAO层无缝整合。Quartz定时任务实时获取和处理数据,并通过Hibernate 实现数据持久化操作。铁路机务大数据应用系统的技术架构如图4 所示。
数据汇集层汇集机务专业相关数据,经过数据清洗、治理后以标准数据格式统一存储到数据服务平台数据库。基础服务层提供不同类型数据的存储等服务,PostgreSQL 存储结构化数据并提供访问,Hadoop 技术体系对海量非结构化数据进行分布式计算。数据访问层采用Hibernate 完成对象关系型数据库映射,对外数据接口使用Restful 等方式进行访问。数据应用层采用Spring 技术对Spring MVC、Quartz 等实现无缝整合,对逻辑功能进行统一管理。数据展示层采用Layui 框架对页面进行响应式渲染,通过AJAX 异步请求实现与服务端的数据交互,提高用户体验。
图2 铁路机务大数据应用系统的总体架构Fig.2 Overall architecture of the big data application system for the railway locomotive system
图3 数据挖掘分析模型的应用思路Fig.3 Design ideas of data mining analysis model
铁路机务大数据应用系统主要涉及设备质量综合分析、人员运用综合把控和运输生产综合管理3 个方面,具体可分为机车安全分析、机车整备检修、车外设备盯控、人员安全分析、司乘组织管理、机车运用组织、辅助决策分析7 个典型应用场景。典型应用场景的所属关系如图5 所示。
2.1.1 机车安全分析
为满足机车安全管理需要,一是对涉及机车安全管理的重点设备控制、安全装备监控、LKJ 检测、非正常行车、机车故障、安全预警等数据开展聚类分析、关联分析及预测分析,查找影响机车运行安全的薄弱环节,提高机车安全管理的科学性和准确度;二是对现场盯控、事故故障责任报告、安全装备故障、LKJ 制动控制信息等数据开展分类及关联分析,深入研判影响机车安全的内在诱因,及时提出安全预警;三是借鉴用户画像思路[12],以机车为评价分析单元,通过构建机车标签体系形成机车设备画像分析模型,为机车健康管理及安全状态评估提供更加科学直观的依据。
机车设备画像分析模型如图6 所示,以机车为分析对象,通过机车运用、机车整备、机车检修、技防改造、专项整治等多维度的综合把控,构建描述机车健康状态的标签体系和画像模型,科学有效地分析机车的质量状态,实现事故故障的超前防范和机车安全状态的可靠把控。
2.1.2 机车整备检修
整备及检修作业是机车养护维修的重要作业环节,应深入挖掘与此有关的各类数据,促进机车养护水平的提升。在整备作业方面,一是运用遗传优化、神经网络预测等技术,对燃料信息、用砂信息等数据开展预测分析,在加强机务整备用料信息动态管理的同时提高节支降耗能力;二是通过对整备周转时间、整备平均停时、作业重点等诸多数据项点的分类及聚类分析,开展整备信息24 小时管理,为机车交路安排、用工排班等提供支持;三是将整备信息与机车运行信息相关联,对机车整备用料进行预测分析,便于统筹调配,确保整备作业进度。在检修作业方面,一是通过对机车各类修程、故障信息、质量监测信息、配件信息等数据的时序分析,构建机车检修作业的全生命周期数据链;二是运用分类、预测等分析手段,动态监控机车检修中的检备率、检修兑现率、平均停时、入修率、临修定责率等关键指标;三是提取影响机车质量和安全状态的关联因素,以问题防范为导向,引导机车检修工作由计划修逐步向状态修转变,有效提高机车周转效率、提升检修质量、降低检修成本。
图4 铁路机务大数据应用系统的技术架构Fig.4 Technical architecture of the big data application system of the railway locomotive system
图5 典型应用场景的所属关系Fig.5 Hierarchy of typical application scenarios
图6 机车设备画像分析模型Fig.6 Analytical model of locomotive equipment portrait
目前,机车养护作业环节的大量数据需要先由人工填记后再录入系统,制约了机车养护质量的分析效果。基于多源数据采集终端的机车养护数据汇集模型如图7 所示,通过开发机车整备作业全过程扫码器、机车检修作业手持记录仪等适用于不同养护场景的数据采集设备,提高数据采集的准确性和数据汇集的时效性,实现机车养护作业的全过程动态精准分析。
图7 基于多源数据采集终端的机车养护数据汇集模型Fig.7 Locomotive maintenance data fusion model based on multi-source data acquisition terminals
2.1.3 车外设备盯控
除机车外,机务专业还涉及诸多其他重要设备的管理及养护工作,如整备棚、检修库、油库、站场音视频设备、生产用具等。一是对车外设备的基础信息、更新改造信息、专项整修信息等开展时序分析、分类及预测分析,对设备实施全生命周期管理;二是加强对设备各类检修信息的分类及聚类分析,及时分析出影响设备质量的薄弱环节;三是运用分类、预测等多种数据挖掘手段,构建设备质量评估体系,实现实时的设备安全预警;四是运用可视化等多种展示方法,及时更新重点工程的建设进度和存在问题,确保重大设备建设项目稳步推进。
2.2.1 人员安全分析
人员是机务专业众多生产作业环节的直接参与者,机车乘务员、机车钳工、机车电工、制动钳工等一线作业工种的状态将直接影响机务专业的运输生产质量。需要综合运用分类、聚类、关联分析等多种数据挖掘方法,深入分析人员作业环境的监控视频、录音记录等非结构化数据,结合人员基础履历、技术业务考核、两纪管理、安全问题通知书、表扬通知书、培训考试等动、静态信息,建立针对不同作业工种的画像标签体系和综合考评办法,对人员的状态进行有效把控,为人员的科学合理安排提供及时有效的依据,从“人防”的角度保障运输生产安全。
构建人员画像分析体系的最终目的是确保铁路运输的整体安全和高效运营,因此,还应将人员画像分析同设备画像分析有机结合,以各个生产作业环节为切入点,整合人员作业与设备运行数据,保障机务运输生产质量。机务人员画像与机车设备画像联动分析模型如图8 所示。
图8 机务人员画像与机车设备画像联动分析模型Fig.8 Comprehensive analysis model of personnel portrait and locomotive equipment portrait
2.2.2 司乘组织管理
司机的业务能力和操纵情况对列车运行安全状态有着巨大影响,应充分挖掘与司机运用组织有关的各类数据。一是综合利用机车及动车组车型配属、司机日常排班、外驻点、列车运行图、异常天气、施工等各类信息,运用遗传优化、聚类、分类、神经网络预测等分析算法,有效开展司机派班优化调整、操纵技能预测分析、操纵质量评估、人员超劳诊断等综合分析;二是通过对列车运行调度信息、事故故障信息、异常报警信息等数据的综合运用,为司机提供个性化的智能辅助驾驶提示。
司机智能辅助安全驾驶系统模型如图9 所示,通过汇集机务、工务、电务、车辆、车务等专业提供的基础信息、动静检信息、维修信息、历史事故故障信息以及实时报警信息等数据,结合地理信息、天气信息等路外数据,以电子地图、语音、图表等多种友好的人机交互方式,为司机提供安全驾驶提示,保障列车运行安全。
图9 司机智能辅助安全驾驶系统模型Fig.9 Model of intelligent auxiliary safe driving system for locomotive drivers
2.3.1 机车运用组织
机车运用组织是机务专业运输生产工作的重中之重,主要涉及机车周转调度、列车牵引、运行监控等工作。为了确保机务运用工作的高效、平稳和安全,一是通过大数据关联分析,实现机车担当交路、机车配属、调度命令、LKJ 数据换装、机破、碎修、运用故障、乘务员使用、人员超劳等与机车运用相关的多类信息的关联规则挖掘,分析影响机车运用质量及安全状态的关联因素;二是通过故障预测、状态分类、人员聚类等大数据分析手段,实现机车周转、人员派班、机车运用状态等信息的24 小时盯控和优化调整;三是利用图像及语音识别技术,加强对机车视频、语音等流数据的实时分析,提高机车安全质量、司乘驾驶状态的监控能力;四是借助文本分析技术深度挖掘机车运行日志、机车临修登记票等文本信息,分析事故故障原因及发展趋势。
借助神经网络、支持向量机等机器学习算法,建立针对图像、音频等非结构化数据的研究模型,为人员违规自动甄别、设备问题精准查源、线路异常实时报警、操纵驾驶重点盯控等提供技术支持。异常状态信息经过专业人员确认后,形成安全问题通知书,存入安全隐患库。对于较为严重的问题,及时通报给机车乘务员,防止问题进一步恶化。机车视频传输及分析模型如图10 所示。
图10 机车视频传输及分析模型Fig.10 Transmission and analysis model for locomotive video
2.3.2 辅助决策分析
机务专业的综合管理及决策应在对“车”“人”“物”“修”等多个业务环节开展大数据分析的基础上,为各级业务部门提供辅助决策支持。一是综合利用各类数据挖掘算法及可视化展示手段,及时更新展示机车上线运行情况、整备及检修情况、事故故障处理情况、人员运用情况、安全考核情况等多种综合统计信息,便于实时掌握阶段性运输生产现状;二是加强设备改造、段区施工、救援列车部署、重点任务督办等信息的统计、分类及关联分析,动态掌握重点工作的推进完成情况;三是综合利用其他应用分析场景获得的数据挖掘结果,开展进一步的统计分析、关联分析及预测分析,获取机车事故故障及非正常行车的发生原因、机车养护的优化重点、人员使用的薄弱环节、设备质量趋势等信息,为防范事故故障、提升机车运用质量、优化人员配置、提高设备养护水平提供决策依据。
随着铁路信息化建设的不断推进,大数据技术对促进行业转型升级、优化安全管理、提升企业核心竞争力的作用日益凸显。铁路机务大数据应用系统立足铁路机务运输生产实际,以大数据应用为核心,通过“N+1+3”的总体架构设计,开展面向3 个应用板块、7 个典型场景的应用研究,充分挖掘铁路机务数据的深层价值,服务于提高机车运用周转效率、改善设备维护质量、保障机车运行安全、改进人员使用现状、完善生产管理手段、提升行业综合效益,为铁路机务专业的运输生产精细化、安全生产智能化、综合管理信息化发展提供了一定的技术支持,有利于大数据技术在机务运输生产中的扎实推广。