王佳毅,张宏强,查 靓
(1.江苏航天大为科技股份有限公司,无锡 214000;2.无锡地铁集团有限公司,无锡 214000)
轨道交通通信系统一般设有集中告警系统,但集中告警系统所收集到的告警数据相对独立,这些告警数据仅停留在提示设备故障发生,未能进一步数据挖掘,对设备安全和运维质量提升缺乏指导。此外,设备告警和故障处置在流程上又是脱节的,无法形成以事件为驱动的运维作业闭环处理。对于运维管理系统,目前也有国内厂家推出了运维管理平台方案,但这些方案往往是对老的维护规程进行信息化处理,只是简单从线下的人工记录迁移到线上的移动办公,没有真正能够将运维工作赋予“温度”,实现自动化和智慧化。
因此,整体运维体系的变革迫在眉睫。新型的运维技术体系理应在全生命周期内通过不断地收集运营数据和故障信息,对此进行存储、研究、整理,减小数据冗余的同时达到对故障原因的预测分析,最终将其融入到检修技术体系基础管理平台中,提高管理效率和事故处理准确性,达到在保障轨道交通系统安全可靠运营的基础上最大限度降低维护成本,满足环境可持续发展战略要求的同时提升城市轨道交通设备智能化管理水平的目标,从而构建一个智能的城市轨道交通运维技术系统。
目前,在城市轨道交通通信系统的运维普遍存在以下问题:
(1)人工维护安全风险高:无论是故障修还是预防修,工作围绕制度,多采用人工填报再录入系统的方式,实时性差存,且存在维修作业记录被篡改可能;
(2)运维过程不可跟踪:无法及时了解工作处理进度,业务支撑乏力,不利于资源合理调配;
(3)信息孤立无法共享:每个维护作业均为孤立事件,过程有价值的信息很难被后面工作分享和借鉴,并且统计报表工作重复且繁重;
(4)制约和影响人员能力提升:通信运维的能力集中在少数人身上,对核心人员依赖强,无法将能力传递出去,人员变动对业务影响大。
(5)利用经验沉淀效用低:轨道行业系统运维数据无法达到应用并反馈至运维工作的效果,对经验沉淀利用率较差。
因此将原分散于各条线路的通信子系统网管信息进行收集和协议规整,实现城市通信设备集中监控;利用数据分析技术对系统设备参数进行统计并根据其劣化趋势预判故障发生;利用运维管理平台将设备故障派发到维护人员的手持终端,打通设备运行和人员维护之间数据交互,提高轨道交通通信设备的集中监控和运维管理水平,将契合轨道通信运维工作中的痛点,也对运维管理能提提高大有裨益。
为实现本目标,无锡地铁运营公司就通信系统的智能运维进行了探索性研究:统一集中告警系统线网标准、并在基础上初步形成了通信运维大数据;打通集中告警与运维管理平台的接口,深度挖掘告警数据的潜在应用;利用AI、自我学习等技术手段形成运维专家经验库。具体进展如下:
(1)集中告警系统线网标准制定和线网级集中告警示范平台开发。
梳理已运营线路集中告警系统的差异,组织既有线厂商完成无锡线网地铁通信集中告警技术标准制定,为既有线通信集中告警的日常使用、后续技术改造以及新线通信集中告警系统建设提供依据。
完成线网集中告警示范平台的开发,并预留相应的南向接口与功能模块,实现对跨线通信设备故障信息的集中管理。
(2)打造基于数据挖掘的智能运维管理平台,探索告警信息的深度应用。
基于数据挖掘技术对历史告警数据进行分析,并在此基础上建立知识图谱,根据告警之间前后关系的记录、已有告警信息的历史处理方法以及告警之间的关联规则,提取出有价值的信息用于通信故障的定位检测和严重故障的预测等任务中。根据当前的告警信息和性能参数,得到历史故障信息和其后可能发生的各种情况,对故障起到了诊断和预防的作用。
(3)打通集中告警与运维管理平台接口,实现运维的闭环。
基于完全意义上的全自动通信系统运维管理,无锡地铁打通了通信系统设备端到维护作业人员端之间的通信,实现故障发生-故障推送-故障处理辅助-处理经验入库的闭环。
轨道交通的通信系统直接服务于行车调度和客运组织,因此一个高可靠的通信运维管理平台,可有效地减少故障历时,甚至将故障处理于萌芽状态,实现预防性维护。通过基于集中告警的数据挖掘,告警和性能参数深度分析,并进而打通后端运维管理平台,实现自动化运维,这对于提高设备运维质量,保障公共交通通畅具有较大的现实意义。