赵文天
(北京城建设计发展集团股份有限公司,北京 100045)
随着地铁运营里程的快速增加,在运的信号系统和设备数量不断增多,给信号运维部门带来巨大维保压力,加之既有设备随着使用年限增加,故障率增高,更加大了运维负担;传统维护监测系统在线监测数据种类和数量有限,覆盖面小,标准化和集成度较低,且故障多以报警为主,不能实现设备故障诊断和故障预测等智能分析;目前的运维管理水平多停留在纸面和口头,缺乏信息化、流程化和标准化,难以适应远期运维压力的增加。由此,对信号系统维护技术提升和管理水平提高的需求日益迫切。
2020年,中国城市轨道交通协会发布《中国城市轨道交通智慧城轨发展纲要》,纲要提出的智慧城轨建设蓝图将“智能运维安全”作为八大体系之一。由此可见,智能运维是今后城轨运维技术发展的重要方向。[1-2]
目前,已有较多文章讨论线网级多专业智能运维平台的技术方案[3-4],但是方案多停留在系统架构层面,对各个专业的智能运维具体需求分析较少,难以达到信号系统初步设计和用户需求书的编制需求;同时,一些规划地铁数量不多的城市短时间内对线网级智能运维平台需求不大,又需要在信号等保障运营安全的关键系统上增加智能化功能以加强维护维修,提高运维和管理水平。
综上,本文重点研究单线路信号系统配置智能运维管理子系统的工程设计方案。
信号智能运维管理子系统并非成熟系统,正处于快速发展阶段,目前并无针对性的国家及行业标准进行规范。因此本文结合北京、上海[5]、成都、长春等地智能运维系统的工程实践经验,依据规划纲要的远景目标,结合行业最新技术发展,将系统功能设计为4大模块如图1所示,即维护监测、智能分析、运维管理和移动端智能运维。系统构成如图2所示。
《铁路信号集中监测系统技术条件》(QCR 442-2020)对传统维护监测的内容和功能做出规定,该规范仅包含常规监测功能[6-8],本文不再赘述。
智能运维对传统维护监测的补充增强主要体现在:
1)传统维护监测仅监测转辙机动作功率、电流、表示电压等,但是由于转辙机控制电路的复杂性,依据以上监测信息,难以发现道岔动作过程中各个继电器的故障。智能运维通过增加对道岔继电器动作时序采集,实现电路动作回放和时序逻辑分析,从而对道岔故障精确定位,提高故障排查效率。
2)传统维护监测仅对信号设备室环境温湿度进行监测,难以反映每个机柜内部实际温湿度情况,且不满足信息安全技术网络安全等级保护三级对设备室物理环境的要求[9]。智能运维增加对每个机柜内部温湿度的监测,具体定位到温湿度异常的机柜,并通过设置水浸传感器、漏水检测线等对设备室关键漏水点进行监测,满足三级等保的规范要求。
3)传统维护监测不关注信号各子系统的服务器/工控机物理硬件的性能是否出现问题,也不关注操作系统底层软件的故障报警,因此难以预警服务器硬件和底层软件的故障。智能运维通过增加对工控机关键硬件,如CPU、内存、I/O等性能监测,增加对底层软件,如文件系统、网络系统、数据库系统、Java虚拟机(JVM)及C#公共语言运行时(CLR)的异常监测,对于满负荷、超负荷运行以及性能下降等故障提前预警。
4)此外,通过增加对各个信号子系统设备的监测项目,将原来分散的数据通过系统组织结构图、关系图等图形化方式整合,从而为维护人员提供更加全面、详细、种类丰富的监测信息,实现集成可视化监测,也为大数据、人工智能、云计算等数据科学技术在信号智能运维领域的应用提供更加强大的数据支撑。
传统维护监测仅实现故障报警,不能实现设备状态的智能分析和预测,对维护人员的辅助作用差,导致维修效率低。智能运维通过数据科学手段分析采集数据,提示设备状态处于健康、故障或亚健康状态,如图3所示,并给出维修建议。
智能分析主要包括两个方面:故障智能分析和综合智能分析。
2.2.1 故障智能分析
1)故障诊断
系统诊断设备由健康状态转变为故障状态,自动定位故障处所和原因,以故障原理图、位置图方式显示故障,诊断结果包含故障位置、故障状态、故障维护建议等,辅助维护人员实现故障修。
2)故障预测
采用大数据等分析方法,实现对设备历史运行趋势的跟踪及分析。当运行趋势呈现劣化或异常过程,特性指标偏离标准值或经验值,设备由健康状态转变为亚健康状态,系统进行异常报警,及时提示维护人员干预,系统给出维修策略和维修建议,以辅助维护人员实现状态修。对于无需短时间内尽快处置的亚健康状态设备,系统给出维修计划,辅助维护人员实现计划修,避免欠维修和过维修。
2.2.2 综合智能分析
1)指标统计分析
通过对运维数据的多维度统计性挖掘分析,识别各设备的同比环比、关联对比等差异情况,为后续的决策支持提供数据支撑。如按时间序列的故障次数统计分析图表、按照设备树形结构展开的故障次数统计分析图表、重复故障现象/设备/原因的统计分析图表、各类输出数据结果的同比及环比分析等。
2)人员行为分析
通过对运营、维护人员的行为进行数据量化的采集、跟踪及分析,挖掘人员行为的规律特点以及在运营、维修场景下该行为规律可能的潜在影响及制约,从而优化行为规范,实现运营、维修的效率提升。如维护人员检修质量及效率分析、故障处置及闭环监督行为分析、日常系统操作习惯分析等。
地铁信号系统的安全运行离不开对设备的维护维修,运维管理是保证维护维修工作高效可靠进行的关键。当前信号系统运维管理模式,包括计划修和故障修。计划修一般是针对信号系统各设备原理和特点,制定相应的养护、小修、中修、大修、更换计划,维护人员按照计划对信号设备的电气特性、机械特性、配线、功能、外观、安装等实施维护作业;故障修是针对突发故障,一例一案应急维修处置。信号设备维护方式分为自主维护和委外维护。信号维修管理机构一般设置在车辆段或控制中心,信号工班根据线路特点设置于正线、控制中心、车辆段、停车场等地点,并在车辆段设置综合检修、ATC检修等专门工班。
信号维护人员可依托信息化系统进行维修作业管理,但设备、监测和维修信息人工录入,仅在信息化系统内部流转,不与信号系统接口,难以实现设备状态更新、故障报警记录和维修作业成果信息同步,信息传递脱节,难以形成有效闭环管理;甚至部分维护环节依靠文字记录和口头传达,过程复杂繁琐,需要投入较大人力成本,管理效率低,容易出现错漏,难以追溯责任。
智能运维通过对设备和管理的信息化、流程化和标准化,避免信息孤岛的形成,打通设备信息、监测信息与维修信息,在信息融合的基础上,建立标准流程,创新管理手段,构建高效的信号运维管理系统,提高信号运维管理的信息化、自动化和智能化水平。运维管理主要功能设计如下。
2.3.1 全生命周期设备管理(设备信息)
1)设备台账管理
设备台帐包括工程竣工后交接的所有设备、备品备件、专用测试设备、仪器仪表、工具等,按照运营单位资产管理码进行编号并粘贴或安装带二维码信息的标签或铭牌,并在管理系统中记录所属系统、设备名称等全生命周期设备履历信息,实现信号设备的信息化管理。
2)设备更新管理
系统跟踪管理设备生命周期,累计设备的运行时间或动作次数,作为预告设备生命周期和更换设备的依据,以便提示设备更新。
3)备品备件管理
根据设备台账中备品备件子账目,分析库存及消耗,针对备件或抢险物资处于库存预警或有大中修计划时,动态分析采购数量。系统累计备品备件的存储时间,当存储时间接近存储测试周期时产生预告,避免备品备件失效。系统应将备品备件与在线设备台帐相关联,当备件在现场替换后更新设备履历。
4)技术资料管理
技术资料包括交付运营管理的全部竣工资料及在运营过程中发生的变更技术文件,提供查询、调阅和更新功能,实现技术资料的全生命周期管理。
2.3.2 故障/异常报警管理(监测信息)
系统能查看报警的总体情况,具备归类统计、下载及打印功能,支持按选择时间段、设备类型、报警类型等多维度查询功能,便于维护人员查询故障报警记录;具备设置设备停用、设备不合格及设备长期盯控的功能。
2.3.3 维修管理(维修信息)
1)维修计划管理
根据维护管理需要,系统自动形成各年的年修计划并可自动分解生成每月和每周的维护计划。综合每周的维护计划和维修工区班制以及规定的维护人员的班次等因素,自动生成日检计划。系统根据维修计划生成维修作业工单。
2)维修作业管理
维修作业工单包括巡检、日检、周检、月检、故障应急处理、配合作业、临时作业等工单,系统自动生成或人工发起工单,通过移动端或智能运维工作站推送给相应工区维护人员。工单内提供维修参考步骤及说明,可输入文字、拍照、录像反馈维修结果。
3)维修成本管理
系统根据维修作业所包括的任务工时计算累计人力工时,并结合投入的材料、机械、设备等,核算维修作业成本。
在传统维护监测系统中,维护人员去现场前只能通过维修工区工作站手动下载或用纸笔记录设备故障信息,携带专用笔记本和维修工具在设备现场维修和在地测试,无法实现通过移动端(手机端或专用平板电脑)设备实时获取设备状态、监测维修效果、获取技术支持等,维修作业效率低,存在返工的可能。
智能运维系统通过接入公网移动信号,维护人员利用配置的移动端设备智能运维APP,如图4所示,实现移动端在线智能运维。移动端智能运维主要功能设计如下。
1)设备状态查询:可通过点选设备示意图或扫描现场实际设备二维码,查询全线设备维护监测的实时数据、故障/异常报警及智能分析的结果。
2)设备台账管理:现场设备拆除、更换、软件升级等设备台账更新维护。
3)维修作业管理:工单的查询、填报[10]、交接等。
4)远程维护支持:厂家技术支持人员与维护人员音视频双向实时沟通联系,在视频画面中标注指导、推送多媒体信息;经维修管理人员授权,厂家技术支持人员可远程获得系统数据,协助现场故障处理。
5)技术资料查询:设备安装检修视频、技术图纸、运维手册、变更文件等的调阅。
以某市地铁为例,采用智能运维管理子系统后,统计道岔转辙机平均故障间隔(MCBF)、车载设备运营可靠度、主要故障频率减少情况,如图5~7所示。
转辙机MCBF及车载设备运营可靠度显著增加,主要设备故障频率有较明显降低。经统计,信号系统故障平均修复延时由20 min降低至5~10 min。
参考某市地铁统计数据[11],智能运维在降低运维人员投入方面也有较大作用,如图8所示。
由于各地信号智能运维项目落地时间较短,应用项目较少,能获得的统计数据有限。但从以上有限的数据中可以得出,利用智能运维管理子系统,维护人员可以提前预知故障隐患,对已发生故障进行定位和诊断,机器智能分析故障数据辅助甚至代替人工故障分析,从而降低故障发生频率,减少信号维护人员投入,使信号系统运维的信息化、自动化和智能化水平大幅提高。
智能运维技术在信号系统的研究和应用是近几年新的技术发展方向。本文提出对单线路信号系统配置智能运维管理子系统的工程设计,结合北京、上海、成都、长春等地工程实践经验,较为全面地设计系统功能和构成,应用效果良好,信号系统运维的信息化、自动化和智能化水平大幅提高。本文为今后轨道交通信号系统初步设计、用户需求书编制以及线网级智能运维平台信号方案细化提供参考,也为轨道交通智能运维系统相关标准的形成尽绵薄之力。