王华伟,史天运,蒋 荟,朱 槿
WANG Hua-wei, SHI Tian-yun, JIANG Hui, ZHU Jin
(中国铁道科学研究院 电子计算技术研究所,北京 100081)
(Institute of Computing Technology, China Academy of Railway Sciences, Beijing 100081, China)
近年来,大量现代化铁路运输设备的应用为保障我国铁路运输安全有序发挥了重要作用。目前,对运输设备状态的管理是分专业独立开展的,还没有实现对各类运输设备技术状态数据统一采集、处理、存储、分析和综合应用。因此,为实现铁路运输设备技术状态的全面掌控和精益化管理,更好地支撑我国铁路安全运营和智能检修,迫切需要基于大数据技术开展铁路运输设备技术状态相关技术研究,实现设备履历化管理[1],提供铁路运输设备的全寿命周期管理、故障预测、健康管理、状态评价等应用服务。
大数据目前已经成为继网格计算、云计算之后最流行的 IT 行业术语。伴随大数据技术的发展和国家政策的支持[2],围绕大数据的技术研究及应用研究层出不穷,涵盖了社会中的诸多领域,如互联网行业、电子商务、电力行业、物流行业、医疗行业、地质行业等[3-5]。此外,我国许多学者也积极开展大数据技术在铁路行业的应用探索[6-7],对于推动大数据技术在铁路领域的应用具有重要价值。铁路运输设备按应用特点可以分为移动设备、固定设备设施、安全监测设备等,具体分类如表1所示。
铁路运输设备技术状态数据集涵盖了运输设备全寿命周期内的所有动静态技术状态相关信息,涉及文本、图片、视频、日志等各种数据类型,并随着时间的推移,其数据量呈指数增长,这些数据具有显著的“海量数据+复杂类型数据”的特点,符合大数据大体量 (Volume)、多样性 (Variety)、时效性 (Velocity)、大价值 (Value) 的 4V 特征。
铁路运输设备技术状态大数据平台的设计思路概括为:基于铁路计算机网络集中搭建运输设备技术状态大数据平台,将全路各专业运输设备的动、静态技术状态信息 (包括履历、检修运用和监测报警信息等),经过采集、加工和规范化处理后接入平台,从而为各级相关用户提供运输设备技术状态管理大数据应用服务。
铁路运输设备技术状态大数据平台总体架构主要是由基础设施层、数据源层、数据采集层、数据存储层、数据分析层、数据管理层、应用展示层、大数据标准及安全保障体系等8个部分组成,实现运输设备技术状态大数据的产生、聚集、分析和应用各个阶段的串联。铁路运输设备技术状态大数据平台总体架构如图1所示。
(1)基础设施层。主要提供大数据平台所需的基础软硬件支撑,包括各类服务器设备、存储设备、网络设备、虚拟化设备及相关软件等。
(2)数据源层。铁路机务、供电、工务、电务、车辆等各专业运输设备相关系统共同构成运输设备数据源体系,包含运输设备技术状态全寿命周期内的动静态数据。
(3)数据采集层。该层利用网络技术将运输设备技术状态相关数据进行传输,并对数据进行集成、抽取、清洗及适配,实现对结构化、非结构化数据的全面采集及预处理。
(4)数据存储层。通过构建适应不同应用场景的大数据存储架构,支撑对数据采集层采集到的运输设备技术状态数据进行融合,并进行分块存储。
(5)数据分析层。建立运输设备技术状态大数据分析计算策略,利用工作流、分析算法和模型工具等数据分析引擎组件来实现大数据的处理和分析,完成对运输设计技术状态海量数据潜在价值的挖掘分析。
表1 铁路运输设备按应用特点分类表Tab.1 Classification of railway transport equipment by its application features
(6)数据管理层。主要完成对元数据、主数据、业务模型及数据质量的管理和监控,为平台的数据管理及运维提供支撑。
图1 铁路运输设备技术状态大数据平台总体架构Fig.1 Overall architecture of big data platform for monitoring the status of railway transportation equipment
(7)应用展示层。结合实际应用需求,利用分析层提供的服务,为用户提供基于大数据的各类应用展示服务。
(8)大数据标准及安全保障体系。大数据标准体系主要为相关系统的网络互联、信息集成、数据共享提供支撑,保证各异构系统之间按统一的标准进行信息整合;安全保障体系主要为大数据平台的数据安全提供可靠保障。
铁路运输设备技术状态大数据平台的主要应用功能分为全寿命周期电子履历、故障诊断与预测、健康评估、寿命预测、风险识别、综合考核评价、维修辅助决策7个功能模块,功能说明如下[8]。
(1)全寿命周期电子履历。按照“一单元一档案”的管理原则,对运输设备寿命周期内的所有信息按照单元编码进行有效串联,形成完整的运输设备技术状态电子履历档案。
(2)故障诊断及预测。构建运输设备故障诊断、故障预测模型,结合各类设备技术状态指标参数及实时状态数据,对运输设备故障进行及时诊断及预测。
(3)健康评估。利用大数据分析技术,剖析设备状态的关联影响因素,综合评价设备的健康状态。
(4)寿命预测。综合分析运输设备的整体性能,进行设备寿命趋势分析,完成对设备寿命的预测,为设备更新改造提供辅助决策支持。
(5)风险识别。根据积累的各项指标数据,挖掘分析运输设备的安全风险,识别安全风险源,为风险管理提供可靠支撑。
(6)状态维修辅助决策。分析铁路运输设施设备状态变化规律,优化检修维护计划,为“计划修”向“状态修”的模式转变提供决策支持。
(7)综合考核评价。建立运输设备综合考核评价体系,可以按设备分类、产权单位、维护单位、生产厂家等对设备运用质量、可靠性、稳定性等进行综合考核评价,运用多种可视化展示方式,为设备运用管理提供数据支撑。
1.4.1 运输设备全寿命周期电子履历管理流程
基于大数据的铁路运输设备全寿命周期电子履历管理,需要将各类运输设备从安装建设时的基本信息和静态信息,设备运用过程中的状态动态监测信息、检修信息、维修养护信息,设备使用终止时的废止信息等合理地采集、加工及集成,形成贯穿设备全寿命周期的电子履历档案信息,从而为各级部门提供运输设备单元化电子履历的查询、统计和分析等功能。铁路运输设备全寿命周期电子履历管理流程如图2所示。
1.4.2 运输设备状态检测监控管理流程
铁路运输设备状态检测监控管理流程的总体思路:实时检测监控设备关键技术参数,综合利用各项指标参数及相关专业检测数据对设备故障进行分析评判,达到告警级别的设备故障给予提示,基层设备维护人员将根据提示进行故障处理及反馈,同时,设备故障处理信息将作为运输设备技术状态大数据中的重要内容,为后期的故障预测及风险分析提供信息支撑,从而形成设备状态检测监控管理的闭环处置。铁路运输设备状态检测监控管理流程如图3所示。
图2 铁路运输设备全寿命周期电子履历管理流程图Fig.2 Electronic management of railway transportation equipment in its whole life cycle
图3 铁路运输设备状态检测监控管理流程图Fig.3 Monitoring and managing the status of railway transportation equipment
铁路设备技术状态大数据平台建设的基础工作之一是要确定合理的设备技术状态管理单元,研究适应运用、管理、维修需要的设备单元划分方法,以保证技术状态数据按单元化划分进行有效集成。对于运输设备单元划分,采用 K 均值 (K-Means) 聚类法,现以电务通信设备为例进行简要说明。假设所有要纳入大数据平台管理的通信设备的集合为 S,S1,S2,…,Sn分别表示其中各类通信设备及组件,若用 Pi1,Pi2,…,Pim表示某一通信设备技术状态属性,则有 S = {S1,S2,…,Si,…,Sn},其中 Si= {Pi1,Pi2,…,Pim}。
记初始化需要聚类的个数为 K,从 S 随机选取 K 个设备作为初始的 K 个聚类的中心,设算法迭代次数为 I。S 中每个对象分配给距离它最近的聚类中心,聚类中心及分配给它们的对象就代表一个聚类。当全部设备都完成了一次聚类,该次形成的聚类中心会根据聚类中现有的对象被重新计算,直到达到设定的迭代次数 I。
利用该算法,可将第一次得到的聚类中心作为单元一级分类,若需要再细化分类,则利用该算法再次进行聚类,形成二级单元分类,最终完成通信设备284类通信设备的单元划分。铁路通信设备部分单元划分结果如表2所示。
铁路运输设备大数据平台的数据集成主要利用 ETL、文件适配器等技术,融合分布式高速高可靠数据爬取技术,完成运输设备技术状态海量的多样化的数据采集、转换与加载[9]。通过实时数据采集、文件数据采集、关系数据库数据抽取、数据库实时复制、分布式 ETL 等多个功能的封装,实现平台的数据集成,具备对实时、非实时数据的采集处理能力,为实现后期的数据存储和分析奠定基础。大数据采集技术示意图如图4所示。
表2 铁路通信设备部分单元划分结果Tab.2 Classification of railway communication equipment units
图4 大数据集成技术示意图Fig.4 Sketch map of big data integration
平台的数据存储面向各类型数据 (结构化、半结构化、非结构化),以海量规模存储、快速查询读取为目的,在低成本硬件 (X86)、磁盘的基础上,采用分布式文件系统、分布式关系型数据库、NoSQL 数据库、关系型数据库、内存数据库等目前主流技术,支撑运输设备大数据的存储[10]。原则上,结构化数据利用行式存储数据库存储,半结构化数据采用列式数据库或键值数据库存储,非结构化数据利用分布式文件系统存储。数据存储技术示意图如图5所示。
图5 数据存储技术示意图Fig.5 Sketch map of data storage
大数据时代的到来让海量数据变成了巨大的潜在财富,结合大数据技术开展铁路运输设备精细化管理与分析具有重要的现实意义。研究提出的平台总体架构、应用功能、业务流程及关键技术为铁路运输设备技术状态大数据平台的搭建提供了理论指导,铁路运输设计技术状态大数据平台的建设与应用,将提升铁路运输设备管理的信息化水平,推动铁路生产作业方式变革,促进铁路运输装备的创新发展。
[1] 王华伟. 铁路运输设备技术状态大数据平台架构研究[J]. 铁道运输与经济,2017,39(8):59-65.WANG Hua-wei. Study on Big Data Platform Framework for Technical Status of Railway Transport Equipment[J]. Railway Transport and Economy,2017,39(8):59-65.
[2] 中华人民共和国国务院. 促进大数据发展行动纲要:国发(2015)50号[A]. 北京:中华人民共和国国务院,2015.
[3] 彭小圣,邓迪元,程时杰,等. 面向智能电网应用的电力大数据关键技术[J]. 中国电机工程学报,2015(3):503-511.PENG Xiao-sheng,DENG Di-yuan,CHENG Shi-jie,et a1. Key Technologies of Electric Power Big Data and Its Application Prospects in Smart Grid[J]. Proceedings of the CSEE,2015(3):503-511.
[4] 武方方. 基于大数据的物流配送中心选址优化研究[D]. 合肥:合肥工业大学,2015.
[5] 汤 炀. 基于大数据的医院财务管理与决策系统的设计与开发[D]. 西安:第四军医大学,2013.
[6] 史天运,刘 军,李 平,等. 铁路大数据平台总体方案及关键技术研究[J]. 铁路计算机应用,2016,25(9):1-6.SHI Tian-yun,LIU Jun,LI Ping,et al. Overall Scheme and Key Technologies of Big Data Platform for China Railway[J].Railway Computer Application,2016,25(9):1-6.
[7] 马小宁,李 平,史天运. 铁路大数据应用体系架构研究[J]. 铁路计算机应用,2016,25(9):7-13.MA Xiao-ning,LI Ping,SHI Tian-yun et a1. System Framework of Railway Big Data Application Platform for China Railway[J]. Railway Computer Application,2016,25(9):7-13.
[8] 王华伟. 铁路批量零散快运计量安全检测应用技术方案研究[J]. 铁道货运,2016,36(7):42-47.WANG Hua-wei. Study on Technical Program of Measurement and Load Monitoring Application for Railway Batch Bulk Cargo Express[J]. Railway Freight Transport,2016,36(7):42-47.
[9] 张少敏,毛 冬,王保义. 大数据处理技术在风电机组齿轮箱故障诊断与预警中的应用[J]. 电力系统自动化,2016,40(14):129-134.ZHANG Shao-min,MAO Dong,WANG Bao-yi. Application of Big Data Processing Technology in Fault Diagnosis and Early Warning of Wind Turbine Gearbox[J]. Automation of Electric Power Systems,2016,40(14):129-134.
[10] 李 婧,陈建平,王 翔. 地质大数据存储技术[J]. 地质通报,2015(8):1589-1594.LI Jing,CHEN Jian-ping,WANG Xiang. A Study of The Storage Technology of Geological Big Data[J]. Geological Bulletin of China,2015(8):1589-1594.