刘 运
(中国铁道科学研究院集团有限公司,北京 100081)
为了满足日益增加的客货运量需求,中国铁路也逐步向高速、高安全、智能化转型。高铁的诞生给铁路运维系统带来挑战。一方面,列车高速运行状态下,关键部件的磨损、消耗、损坏等问题带来较大的运维压力。另一方面,2006 年中国“十一五”推行的节能减排号召也限制了铁路运营维护成本效益。如何进一步提高运维效率、经济性一直是铁路运维行业研究重点。
当前,绝大多数铁路基础设施均暴露在室外环境中,恶劣天气以及风雨雪侵蚀进一步加大运营维护工作量。此外全球的绝大多数铁路已经运营数十年,例如,据统计韩国 42% 的铁路桥与 47% 的铁路隧道已经服役超过30 年[1],维护频率维护难度逐年增加。既有运维系统往往依赖于人工巡检,并手动将设备状态信息上传至运维中心,对于世界各国而言,铁路运维保养依旧是铁路公司的一项巨大支出。图 1 为铁路系统示意图,图中铁路系统包含车辆、轨道、桥隧、接触网、轨旁通信信号装置等多个子系统。铁路运营公司应当保障各个子系统持续安全、可靠运行,一旦任一子系统出现不安全因素,将危害整条铁路运营。国际方面,瑞士国家铁路采用了SAP 公司的资产智能网络。该网络进一步提高供应商数据交换的效率,确保机车构型数据和其他设备数据的及时准确完整,将使维护更加容易和高效。国内方面,中国中车股份有限公司提出的基于IoTDB 时序数据库的智能维修体系架构。该架构可实现毫秒级实时数据接收,TB 级数据存储,以及设备状态实时监控。
图1 铁路系统示意图
鉴于铁路行业运维压力较大,中国铁路开始研究如何高效完成运营维护以及延长铁路基础设施寿命,提出了基于状态维修(CBM)的运维概念[2-5]。CBM 强调维修计划应当根据当前设备状态制订。从传统运维角度出发,无论设备使用频次、设备当前状态,均需按时执行运维保养。虽然传统运维方式可以保障设备正常运行,但可能会替换、修理原本正常的设备,增加不必要的运维成本。如果采用CBM 理念,运维人员可根据当前设备状态仅维修损坏、磨损的设备,进一步延长铁路基础设施寿命。
铁路运维保养的目的是保证各个关键设备时刻保持正常运行状态。正如前文所述的CBM 概念,运维人员应逐个检查设备状态并根据设备状态进行必要的养护、保养或替换。图2 为CBM 步骤。首先运维人员根据设备使用说明书,逐个检查设备状态。此时,需要运维人员到设备安装现场并衡量设备的可靠性指标。根据指标情况,确定设备状态以及设备是否需要维护、维修。随后根据设备重要性、损坏磨损严重程度、运维预算对运维项目划分优先级。最后根据优先级执行维修、维护以及保养。
图2 基于状态维修的运维流程
基于状态维修的局限性主要体现在以下两点:
(1)检查效率。由于传统CBM 需要检测人员前往现场测量现场情况后方可决定维护执行顺序,如果设备距离车站、工点较远,人工往返检测比较耽误时间。
(2)人力成本。当需要检查的设备数量过多时,可能需要雇佣更多的检测人员以在短时间内完成设备检修,此时人员投入成本便会增加,当运维预算一定的情况下,更多的人力成本意味着分配在设备维修上的预算会进一步减少。
以上两个局限性可通过将基于状态维修和物联网技术结合起来解决,解决方案将在下文分析。
正如前文所述,传统CBM 方案大多通过人工检查判定设备状态,运维成本较高。物联网技术发展带来的万物互联、万物智联等概念重新定义人物交互手段,物联网终端可实时监测设备自身运行数据、状态信息,并上传至物联网网络。运维人员可远程实时查看设备当前情况并制订运维保养计划[6-7]。
物联网终端的设备状态感知主要分为三个部分:感知、接入和处理。在感知部分,传感器负责收集铁路基础设施、车辆、轨道的信息。接入部分无须人工操作,传感器自动收集设备状态数据并通过无线通信链路上传至物联网。处理阶段,物联网通过结合各专业的传感器数据进行跨学科计算分析,通过计算结果决定设备是否需要维护保养。
为了能实时掌握系统内各部件的可靠程度,需要在铁路干线、股道、站场等多种场景下布设物联网终端以收集信息,同时也要保障物联网终端设备本身的可靠性。通常铁路设备的生命周期一般为部署后的5~10 年。设备正常运行主要依赖于设备本身的可靠性以及功耗[8]。
可靠性侧面反映了设备在损坏前运行了多长时间,由平均无故障时间(MTBF)表示。通常来说,根据设备重要程度,要求铁路设备MTBF 介于50 000~100 000 h 之间。对于功耗而言,要求设备在没有供电条件下依旧可以持续工作较长时间。尽管靠近站场的设备可以通过线缆供电,但是对于地形较为艰险供电线缆故障的情况需要设备靠自身电池继续运行,因此,物联网终端应尽量降低功耗。
为了承载数据传输,基于物联网的状态维修系统需要包含多个子系统(例如LTE/5G 无线通信系统)。但系统复杂度、物联网终端的功耗将会进一步提升,虽然可采用蓝牙设备降低终端功耗,但是通常蓝牙设备监测距离较短,为了覆盖同一区域可能会需要部署更多设备,使用蓝牙设备可能并不经济。此外,系统应能从众多传感器传输的组合数据中分析出设备状态,在设计系统架构时,应考虑接入平台、设备、服务的多样化问题。
图3 为基于物联网与状态维修的运维系统解决方案的示意图,系统中,传感器负责实时监测设备的状态信息并汇聚到设备平台,随后设备平台向上传输至物联网。状态信息通过物联网汇聚到平台服务器。最后由平台服务器对设备情况进行排序、处理以及分析,并及时反映给现场的运维管理人员。
设备平台应能支持传感器的基本功能并在终端侧采用较为灵活的架构设计以应对多种传感器数据的组合接入。如图3 所示,设备平台包含功能模块(硬件聚合层),功能模块仅负责硬件层面操作。此模块仅为多种传感器提供设备接口,不更改传感器数据内容,随后上传至设备平台,设备平台对数据进行分析处理后通过其无线通信模块上传至物联网。
为了保障整个系统的可靠性,要求设备平台在服役期间保持良好的可靠性。同时也要求设备平台根据接入通信制式(例如 LTE 或5G-R)采取适当的功耗优化策略。例如在通信方面,物联网终端的电池续航时间取决于设备唤醒状态下的工作强度。以LTE 制式为例,设备最初处于空闲(IDLE)状态,并在每个不连续接收周期(320~2 560 ms)后唤醒开始监听基站信号。正是因为基于设备状态维修所产生的数据量较小,数据收发频次较低,所以LTE 终端设备的电池续航与不连续接收周期成反比。
网关设备应有较强的计算能力以解析各种物联网协议,但网关设备往往功耗低,不具备远程传输能力。如图3 所示,铁路物联网场景下,有长距离数据传输和短距离数据传输两种情况,网关通过短距离无线通信链路从设备平台收集数据并通过长距离通信系统上传至物联网。
图3 基于物联网与状态维修的运维系统解决方案示意图
平台服务器负责监管数据收集、数据上传过程,并处理底层设备生成的设备状态数据,分发给运维管理人员。平台服务器可远程配置、管理设备平台,并根据实际情况需要控制设备平台采集更多数据。同时应重点关注与行车安全相关的数据完整性,平台内部应设置相应的服务质量保障机制以保障行车安全相关数据完成无差错传输。为了便于物联网识别潜在故障设备,第4 章分析了一种基于模型的设备状态预测方法。
(1)基于设备状态维修的监测时间点为离散分布,物联网终端在监测时间点监测设备状态并传输至设备平台。
(2)在设备发生故障前一般经历两个阶段,第一阶段定义为从设备部署到设备可能发生潜在故障的时间;第二阶段为从潜在故障时间到故障发生时间。
(3)只有在第二阶段,才能基于设备状态-设备维修、替换需求进行建模。
(4)两个阶段相互独立,可靠度分布可通过常用分布模型模拟。
(5)在第二阶段的设备状态为一随机向量,可使用一个以设备使用寿命为参数的分布函数描述,具体见公式(1):
式中,i——正整数;ti——第二阶段中第i个状态监测时间点;Si——第i时刻时设备寿命。
该节重点关注在物联网终端获取状态信息条件下对设备寿命信息进行建模,求出设备寿命密度函数。根据公式(1)可知设备寿命只有在设备寿命大于两次监测时间差的时候才有意义。公式(2)为设备寿命密度函数。
式中,yi——时刻i物联网终端捕获到的设备状态信息;Yi——从时刻i以前的历史设备状态信息的集合;f(Si/Yi)——时刻i时设备状态信息。通过贝叶斯定律可知式(2)可进一步展开为:
将上述公式反复迭代后可得出:
通常来说当设备初次部署时设备情况为未知数,即当i=0 时Y0为未知数,可用正态分布、韦布尔分布以及对数正态分布等描述。通常情况下大部分设备服从双参数韦布尔分布,具体如下:
其概率密度函数为:
式中,β——形状参数;η——为物体集合参数,并定义θ=ηβ,则设备可靠度为:
因此每个设备可根据公式(8)计算出设备可靠度指数,每个设备可使用软件仿真计算出β和η的数值,并根据设备具体情况制定设备可靠指数下限值,当设备可靠性指数低于下限值时,须对设备进行维修、替换,否则暂时不用进行维修。
该文研究了一种基于状态维修的物联网智能运维系统方案以及设备可靠性的计算方式。物联网终端实时感知设备状态并上传至平台服务器,服务器通过计算当前设备可靠性指数决定是否需要维修以及维修工作的优先级,最后平台服务器按优先级将运维工作推送给现场管理人员。该系统可有效减少铁路运维行业的人员成本投入,使得运维管理人员可实时、远程查看设备状态,并在设备出现故障时可根据设备维修业务优先级安排养护维修任务。该文仅采用韦尔布分布方式计算设备可靠度,其他分布形式的可靠度计算研究不在该文研究范围内,相关问题有待进一步研究。