李 君,徐春婕
(1.北京经纬信息技术有限公司,北京 100081;2.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
随着高速铁路的快速发展和信息化水平的显著提升,全国高速铁路网已基本形成。铁路客运车站(简称:客站)作为铁路客流运输及承载的场所,其目标已从提供基本的旅客服务转变为提升客运服务质量和信息化水平。随着人工智能时代的到来,作为客运服务的核心业务,设备运维管理从最初的事后维修[1]、预防维修、生产维修、可靠性维修及管理,发展到结合了设备综合工程学和全员生产维修(TPM,Total Productive Maintenance)机制的全面规范化生产维护(TnPM,Total Normalized Productive Maintenance)机制。TnPM 机制在智能客站的设备管理中起着举足轻重的作用。相比于TPM 机制,TnPM 机制以全系统的预防维修体系为载体,以员工的行为规范为过程,以设备的综合效率和完全有效生产为追求目标,是一种鼓励全员参与生产及设备维护、保养和维修的机制。
我国高速铁路发展至今,智能化、信息化、现代化的设备对购票、安检、进站、候车、乘降、问询、查验等客运服务起着举足轻重的作用。随着客运服务功能的智能化发展,以及服务品质需求的提高,配套客站设备种类和数量在逐年上升的同时,其运维管理和运行质量的作用也日趋显著,以事后维修、故障维修为主的设备运维管理模式早已无法满足智能客站的设备运维管理需求[2]。
目前,我国客站设备运维管理存在以下问题。
对于日常的设备运维管理模式,客站基本依靠现场盯控、定期巡检、计划内维护保养等方式。大多数客站尚未建立预测性设备维修机制,仅根据实时数据来维护设备,基本为“救火式”维修,并未结合设备运维的历史数据来对当前的运行状态进行实时分析和判断。同时,设备运维管理模式还缺乏设备预维修和保养措施等相关专业技术,导致设备老化速度加快,使用寿命缩短。
设备的日常维保及维修管理是确保客运设备运行质量和安全的重要环节,然而大多数车站由于建站较早,其设备设施和管理方式都较为陈旧,很多客站仍然存在“重故障轻保养”的情况,仅对日常巡检中发现的危害等级高的故障问题进行记录,并派发工单,进行维修。对于危害等级低的故障问题,客站没有给予足够的重视,仅记录设备台账和选择性地下发工单;又或者响应速度慢,进行选择性维修,从而导致隐患增多,甚至由量变突发为质变,影响设备的稳定运行。设备故障上报大多采取人工上报的形式,因而存在设备故障发现不及时、处置效率低、恢复周期较长等问题,同时客站也缺乏预防性维修和远程控制手段。
客站在设备信息的采集、管理、使用等方面存在监管系统重复和信息孤立的情况。例如,设备机房和通信机械室分别采集各自机房的环境数据,并使用各自的监管系统。这些监管系统独立运行,并未进行数据共享,因而导致客站设备监管系统之间缺乏数据互联互通。
车站智能化水平的提升将使设备更加智能化、信息化、数字化,但其运维和保养难度也明显增大,需要配套的智能运维管理技术。而很多客站并未对运维管理人员进行相关的技术培训,致使其在客站的日常巡检和设备的维护保养过程中,无法准确判断设备的故障,做到“对症下药”,导致出现返工、误判、错判、漏检等情况。另外,客站应对设备运维知识进行完善或更新,以符合智能客站设备运维管理需求。
根据智能客站设备的运维管理现状,结合用户职责及现场设备的使用情况,在保证全面提高客运设备安全性、稳定性、可靠性的基础上,本文搭建了智能客站设备大数据运维服务平台(简称:智能客站运维平台)。该平台能够对设备运行状态进行实时监控,对设备运行数据进行定量化和差异化分析,实现设备智能化运维和全生命周期管理。智能客站运维平台能够全面提升设备的安全性、稳定性、可靠性,以及客运服务质量[3-4],实现设备的数字化、智能化、可视化管理。
在设备的全生命周期管理中,维护管理是重要的一环。预防性分析和预警在提前采取重要预防维修措施的同时,也可为设备的升级和更新进行充分准备。智能客站运维平台依托物联网等环境,定期采集设备运行的相关数据(如温度、亮度、湿度、CO2浓度、PM2.5 浓度等环境数据),对设备及相关部件的运行状态进行检测,统计设备运行状态和生命周期使用寿命。同时,智能客站运维平台还结合视频监控、列车调度命令、生产作业计划等,通过大数据技术来进行智能客站设备运行动态分析和态势推演(如人群密度、车站能耗、站内舒适度、设备工作环境等),并根据同比/环比等分析报告为工作人员提供智能客站设备的运维策略和辅助决策依据[5],以远程控制或适当人为干预设备运维管理的全过程。
在智能客站中,大量的设备传感器产生的实时数据为构建设备管理全程可追溯机制提供了可能性。通过分析智能客站设备资产状况、维保信息、动静态履历等数据,智能客站运维平台结合客运生产组织业务、现场作业情况、设备维护保养周期、设备巡检保养和维修计划等,采用卷积神经网络等人工智能理论和算法,对设备运行数据进行分析。在此基础上,智能客站运维平台根据设备运行特点制订个性化的巡检保养计划,并实现智能化下发。从数据的采集到故障闭环反馈,到客站的健康状况评估、合理的设备运维策略,甚至设备健康状况的影响因素、过程参数和环境参数等状态类信息,智能客站运维平台实现了设备管理的全程可追溯。
设备运维服务平台的可视化主要针对设备建模、设备台账、设备巡检管理等内容,通过数据仓库技术(ETL,Extract Transform Load)、Hadoop 等大数据分析、处理技术对设备运行数据进行分析,采用图、表、线等多种表现形式对设备运维情况进行多维度、多角度、多粒度的统计展示。可视化为后期的设备采购、设备保养、库存管理、能源调控、供应商管理、设备健康评价等提供重要参考依据和决策支持。
根据对客站设备运维管理现状和运维需求的分析,借鉴信息技术基础架构库(ITIL,Information Technology Infrastructure Library)标准,智能客站运维平台融合了云计算、物联网等技术,采用多层架构和模块化的设计模式。该平台由数据采集层、数据传输层、数据处理层、数据存储层、平台支撑层、系统应用层、服务展现层等组成,实现了设备从运行状态数据采集、传输、分析存储到应用、展现的全过程运维管理,为设备全生命周期管理和智能化运维提供了一体化的处置方案。智能客站运维平台的架构如图1 所示。
图1 智能客站运维平台架构
数据采集层负责采集智能客站的客票、机电、旅服相关设备的状态数据和实时运行数据。状态数据指智能客站设备设施空间布局、地理位置等静态信息(如设备设施所在具体物理位置、所属楼层等)。实时运行数据指智能客站设备设施在运行及维保过程中所产生的信息。这些数据将作为后续分析的基础数据,以用于各类算法和相关应用。
数据传输层采用射频识别(RFID,Radio Frequency Identification)、超 宽 带(UWB,Ultra Wide Band)、ZigBee、Wi-Fi、蓝牙等物联网技术,经过无线传感器网络将数据采集层得到的设备状态数据和实时运行数据数据传输至智能客站运维平台。
数据处理层对数据传输层传输的数据进行清洗、集成、规约、转换、加工等预处理[6-7],将这些数据转变成格式统一且具有统一接口的规范化数据,并按照元数据、模型库和业务库对处理后的数据进行分类。智能客站运维平台的大数据分析服务对数据进行数据挖掘和分析,并采用机器学习相关算法,形成初步的统计分析结果。
智能客站运维平台将处理后的数据存储至配置管理数据库(CMDB,Configuration Management Database)。CMDB 又分为设备缓存数据库、用户管理数据库和运维管理数据库。这三大数据库分别存储设备缓存信息、基础用户信息和设备运维信息,为后续纳入平台及支撑系统的应用提供统一的存放和调用机制。
智能客站运维平台根据人工智能的相关算法,结合具体业务需要和应用场景,从节能控制、故障预测、智能运维、资产管理、健康评价等方面对CMDB的相关数据进行分析,并将分析结果统一接入智能客站旅客服务与生产管控平台,为后续系统应用提供数据支撑。
智能客站运维平台结合平台支撑层的设备运维大数据分析结果,按照知识库管理、故障管理、供应商管理、人员管理、履历管理、状态管理、运维管理、备品备件管理等应用和智能客站实际客运作业需要,进行智能报表和工单的智能化下发、故障预测、趋势推演等,并通过三维地理信息系统(3D GIS, 3D Geographic Information System)展示、数字孪生车站、智能驾驶舱等方式进行直观展示和可视化配置,为智能客站设备主动运维提供多维度、多角度的应用和展现方式。
智能客站运维平台的功能架构如图2 所示,具有设备管理、运维管理、履历管理、配置管理、系统管理、智能监测、能效管理、健康评价八大功能。综合考虑智能客站设备运维业务等级、重要程度和对智能客站健康状况的影响程度,这八大功能可划分为基本功能和扩展功能。基本功能主要包括设备管理、人员管理、履历管理、系统管理等4 个功能模块,实现基础数据的前期录入和管理。扩展功能在基本功能的基础上,按照业务场景进行了针对性的拓展和衍生,主要包括故障管理、能效管理、健康评价、状态监测等4 个功能模块,实现设备的全生命周期管理、设备运维工单的智能化派发、设备故障预测预警、车站能耗统一管理、状态及环境的主动感知测控、设备智能运维的图形化界面操作等功能。
图2 智能客站设备大数据运维服务平台功能架构
智能客站运维平台的基本功能提供设备台账、设备导入、排班管理、考勤管理、履历管理、故障登记、操作日志、数据字典、仓库字典等功能,主要实现设备台账录入、基本信息导入、排班计划制订和自动生成、日常考勤管理、基本履历管理、设备故障登记、故障字典维护、数据字典及数据仓库维护、日志管理等功能,满足智能客站设备运维的一般业务需求。
智能客站运维平台的扩展功能以基本功能为支撑,结合业务和具体应用需要,提供设备全生命周期管理、工单智能派发、运行状态监测、运行环境监测、故障预警告警、设备能耗管控、设备运行状况评价、设备库存能力评估、供应综合评价等延伸服务,以满足智能客站设备健康状况整体评估和智能化辅助运维需求。在保证设备安全、稳定运行的前提下,扩展功能为客运工作人员提供多元化、智能化的辅助决策手段。
为实现智能客站运维平台的各项功能,本文采用了多种新技术。智能客站运维平台的关键技术有特征主动识别和状态智能监测技术、规范化数据集成技术、故障趋势推演技术、全方位多属性健康评价技术。
依托物联网技术,智能客站在主要区域的设备上加装探测点,为车站巡检人员配备可穿戴的智能探测设备,为巡更机器人配置高清摄像头、激光雷达等智能感知设备,以实现客站的智能巡检。当客站设备发生故障时,智能巡检设备通过高速互联的网络环境,将相关信息传输至智能客站运维平台,使客站工作人员可通过远程客户端及时获得故障设备的图像和音频信息。智能客站运维平台可以对现场运维进行远程指导和安全防护,能够有效预防和及时处置突发事件,保障设备稳定运行。同时,设备维修数据可用传输至大数据运维服务平台,以完成数据的预处理和进一步分析总结,完善管理故障知识库。
智能客站设备实时运行数据的获取需要建立规范化的数据接口、统一的通信协议和接入方式,数据采集模块借助蓝牙、RFID、Wi-Fi、ZigBee 等通信技术实时采集平均运行时长、故障次数等设备运行状态数据和温度、湿度、亮度等设备运行环境数据,以及设备基础配置信息、履历信息和物理信息。对无法接入或协议不匹配的设备,智能客站运维平台通过现场盯控、人工记录的方式解决。此外,智能客站运维平台还统一建立适应各类设备的故障编码规范和入库机制,为后续设备接入提供一体化的接入方式,方便设备信息集中管理。
依托智能客站各类设备参数、设备实时运行数据、设备履历、运行维保信息及实验数据[8],结合设备历史数据、故障数据、巡检保养记录等,采用设备状态聚类算法和检修方案等辅助决策算法根据事先设定的状态评判规则统计、分析、判断设备运行状态,统计和预测设备零部件使用情况、故障发生情况、故障点运维状况等,推演出设备剩余使用寿命、未来健康状况、预计故障点及预计发生原因,对运维成本和客运服务影响程度进行预估,并给出对应维修案的辅助决策建议等。以上预测或预估结果先经模型、算法初筛、人工确认后,再向运维人员派发运维工单,最终经现场复验确认后处理。对于预测的故障趋势和故障点、故障起因等,客运工作人员可提前制订针对性的运维计划,提前安排巡检时间节点,做到全员参与、全程把控、事前预防。具体故障推演逻辑,如图3 所示。
图3 设备故障推演逻辑
根据设备属性、运行时长等因素建立递阶层级结构的指标体系,智能客站设备健康状况评价体系分为目标层、准则层、指标层和方案层。目标层对所有类别的智能客站设备进行健康状态评价。准则层是各类智能客站设备健康状况的评判准则(包括安全性、维修性、测试性、监测性、技术性、经济性、预测性),是针对设备自身属性、运行特点、功能和效用,提炼出的健康状况评价的主要评价要素。指标层则用于判定客运车站设备运行健康准则的详细指标,分别对应各评判准则,通过指标层可获得影响设备运行健康状态评价的评价指标集。方案层则给出用于解决具体指标的措施或方案,即实现对应指标拟提出的具体解决方案。智能客站设备健康状况评价体系具体架构如图4 所示。
图4 智能客站设备健康状况评价体系
全方位多属性健康状况评价技术运用主观和客观相结合的思想确定指标权重,结合德尔菲法、层次分析法、模糊评价法等方法,将高斯模型、马尔可夫模型、BP 遗传算法等人工智能算法和模型作为主观和客观权重的确定方法,并对权重进行修正。最后,全方位多属性健康状况评价技术运用线性加权法得到各属性及底层评价指标元素的综合权重值,实现智能客站设备的综合评估。
本文围绕智能客站设备运维管理,分析了客站设备运维现状和需求,搭建了智能客站运维平台。该平台提升数据资源的共享水平,满足了智能客站设备运维的基本业务和智能化辅助运维需求,提升了设备管理综合效率。本文将采用更先进的人工智能算法,对智能客站设备进行多维度、多角度综合运维管控,并通过多种开发工具的组合运用来实现应用软件的开发,为设备运维提供新的管理方式和技术思路,以对智能客站设备运维做出更客观、可信的评估。