潘 潼 俞军燕 魏秀琨,3** 魏 倩 刘广泽
(1.北京交通大学交通运输学院,100044,北京;2.广州地铁集团有限公司,510330,广州;3.北京交通大学轨道交通控制与安全国家重点实验室,100044,北京∥第一作者,硕士研究生)
安全是城市轨道交通运输永恒的主题。城市轨道交通信号系统主要依靠高新技术装备保障安全,提高其服役能力。随着信号系统车载设备的逐年老化,许多电子设备和机械部件性能下降,会导致信号系统车载设备故障增多。针对目前地铁实际运营过程中由于信号系统车载设备故障导致的列车晚点、抽线和清客等严重影响列车运营的情况,在维保方面,一般是列车回库后进行故障设备或板件的更换,有的故障件更换后还要做静态或动态测试,不仅增加了维修成本,还有停机的时间成本,因而会造成很多浪费;在维修周期方面,一般按照信号系统车载设备维修规程进行周期性检修,但在实际运营中,有的信号系统车载设备故障频发,有的故障频率较低,不同的信号系统车载设备寿命长短具有较大差异性。因此,本文通过基于故障树的贝叶斯网络分析,识别出信号系统车载设备的重要度高低,有针对性地建立基于状态的维修模型进行维保策略优化,以在降低风险、保证安全的同时减少维修成本。
为了绘制故障树,首先要了解信号系统车载设备组成。信号系统车载设备主要由车载ATP/ATO(列车自动保护/列车自动运行)子系统、DCS(数据通信系统)和HMI(人机界面)构成。
DCS由网络数据传输和交换设备、光缆、车地数据通信设备(包括AP(无线接入点)等)组成。主要设备包括MR(车载无线电台)和MR天线,MR安装于OBCU(车载控制器)机柜内,每个MR需安装两副MR天线,安装在列车两端的驾驶室上方,沿车体中轴线对称布置。
HMI是列车驾驶员与ATP/ATO设备交互的接口,一方面用于向司机提供来自ATP/ATO的信息,包括运行模式、故障等信息,以字符、数字及图形等方式显示列车运行速度、允许速度、目标速度和目标距离,实时给出列车超速、制动和允许缓解等表示设备故障状态的报警;另一方面具有标准的列车数据输入界面,用于接收司机的输入操作,可根据运营和安全控制要求对输入数据进行有效性检查。
车载ATP/ATO子系统的功能是接收轨旁设备传送的ATP/ATO信息,计算列车运行曲线,测量列车运行速度和走行距离,实行列车运行超速防护以及列车自动运行,保证行车安全和为列车提供最佳运行方式。主要由OBCU(车载控制器单元)、OPG(速度传感器)、雷达和应答器读取装置(信标天线)组成,示意图如图1所示。
图1 地铁信号系统车载设备组成
根据信号系统车载设备结构及其与故障设备的结构关系,选取最不希望发生的故障状态作为顶事件;从顶事件开始,向下逐级推溯事件的直接原因。在这个过程中,准确写出故障事件方框中的说明,分析清楚各事件的逻辑关系和条件,直到找出所有底事件。底事件就是故障分布已知的随机故障事件,或是不需要或者暂时不能进一步查找其发生原因的事件[1]。信号系统车载设备的故障树如图2所示(故障代码含义见表2)。
图2 地铁信号系统车载设备故障树
从故障状态的描述和推理机制来看,贝叶斯网络分析与故障树分析具有很大的相似性。但故障树分析可以双向推理,是在不完全信息条件下决策支持和因果发现的工具,因此将故障树向贝叶斯网络转化,并对转化后的贝叶斯网络进行条件概率求解及后验概率推理,进而进行重要度的识别和分析。
贝叶斯推理的实质是后验概率推理问题,通过将拓扑结构和上述求得的条件概率表相结合,在已知系统发生故障的情况下,对各元部件发生故障的概率进行诊断推理,进一步进行重要度评估并找出系统的薄弱环节。贝叶斯网络的网络拓扑结构是一个有向无环图。有向无环图的节点是从实际问题中抽象出来的随机变量[2],对应于故障树的事件名称,其对应关系如表1所示。
表1 故障树与贝叶斯网络的对应关系
2.2.1 确定贝叶斯网络节点的先验概率
贝叶斯网络中各节点表示的含义及其编码如表2所示。
表2 地铁信号系统车载设备贝叶斯网络节点名称及编码
贝叶斯网络的根节点是不具有父节点的节点,拥有先验概率,对应于故障树底事件的失效概率qj,其计算公式为:
(1)
式中:
hj(t)——第j个单元的失效率,单位为次/年,可根据实际故障数据记录算出;
Tj——第j个单元的故障修复时间,单位为h。
根据故障数据,由式(1)计算得到根节点的先验概率表如表3所示。
表3 根节点的先验概率
2.2.2 构造贝叶斯网络并确定条件概率表
中间节点是非根节点,拥有条件概率;叶节点是不具有子节点的节点,同样拥有条件概率。节点的有向边表示条件独立关系,代表节点间的关联关系。条件概率表中,用0表示正常状态,用1表示故障状态,用P表示与每个节点相关的条件概率分布,如图3所示。
图3 贝叶斯网络及条件概率表示
基于上述故障树向贝叶斯网络转化的规则,得到如图4所示的贝叶斯网络及如表4所示的条件概率表。
图4 地铁信号系统车载设备贝叶斯网络
表4 部分非根节点的条件概率表
2.2.3 联结树算法进行贝叶斯网络诊断推理
联结树算法的基本思想是:首先把贝叶斯网络转换成联合树,它是一种二次结构(Second Structure, SS);接着为其所有节点指定概率,即对联结树进行初始化,从而得到一个带有能力函数的联结树;再通过各团节点之间的消息传递,传遍每一个节点,使其满足全局一致性,即达到稳态,在这种状态下,可计算任意节点的概率分布。当加入新的证据时,重新进行证据收集和证据扩散(即消息传递)的过程,最终每个节点包含的所有变量的分布函数即团节点的能量函数[3]。
根据上述算法思想,用MATLAB软件中的BNT工具箱编程计算得到贝叶斯网络各单元的后验概率如表5所示。
表5 根节点的后验概率
很多地铁公司在实际运营中仍采用传统的基于年龄的维修策略(Time-based Maintenance, TBM),这种策略更容易实施,只要记录一个单元的正常工作时间即可。然而,当执行这种预防性更换的时候,如果该设备仍处于合乎情理的状态,那么其实质的剩余寿命将会被浪费[4]。因此,本文针对信号系统车载的关键设备和单元,建立基于状态的维修模型(Condition-based Maintenance,CBM),从而进行维保策略优化。
CBM模型有连续监测、定期检查和不定期检查三种主要的检查班期。在连续监测中,连续报警系统持续监测机器的状态并在监测到问题时触发警报;定期检查为目前常用的策略;不定期检查策略可以导向潜在的成本节约,因为在系统运行的早期会执行较低频率的检查,而随着系统使用时间的增长会执行更频繁的检查,也就意味着系统处于较差状态时会执行更多的检查[5]。
基于上述理论基础,为了对检查间隔进行优化,获得最佳维修策略,需要通过建立比例风险模型和成本函数模型实现风险和成本最低的双目标最优决策模型,如图5所示。
图5 风险与成本双目标最优决策模型示意图
3.1.1 比例风险模型
在CBM模型中,机器的状态是通过风险测量,该风险取决于机器的使用时间和监测的变量[6]。基于历史故障数据进行统计分析,通过威布尔回归模型建模,也叫做比例风险模型(Proportional Hazards Model,PHM),计算最优更换决策。系统的失效率服从PHM模型。在PHM模型中,系统的失效率是两个独立函数的产物,其中一个是设备年龄的函数,另一个则是诊断过程的函数[7]。
风险函数可以用来以数学函数的形式表示统计模型。对于每个时间点,某工作件已持续到该时间点,将在下一个瞬间失效的概率h(t)为:
(2)
式中:
t——工作使用寿命,计算这点的风险;
Z1(t),Z2(t),…——工作时间点的协变量值;
η——比例参数;
β——形状参数,与工作时间相关。
3.1.2 成本函数模型
成本函数计算为:单次更换的预期成本与更换之间的预期时间(工作时间)的比率。在所有情况下,模型做出更新假设,即所有工作件将作为新的,工作时长为0。
(3)
式中:
CE——成本率;
W——工作时间;
C——预防性维修成本;
K——由于单元失效所产生的额外的费用;
Q——失效概率;
C+K——故障更换成本,可能包括直接更换或大修成本、损坏成本、运行停机时间成本,以及其他超过计划或定期维护成本的成本。
在信号系统车载设备中识别出的具有较高重要度的故障模式中,软件故障可通过软件升级解决,因此重点研究硬件故障。选取车载控制器中的ITF通信板作为案例进行建模与维保策略优化。
利用故障源数据进行预处理,利用Access软件构建Events事件记录表和Inspections检查记录表,建立如下字段映射关系:
“故障列车”——“Ident”;“故障日期”——“Date”;“检查间隔”——“WorkingAge”;“Events”——“EF”(何时因故障维修或更换)/“B”(何时开始服役)。经过预处理后的数据表如图6所示。
图6 部分车载设备故障源数据预处理结果截屏图
基于图6所示的预处理后数据,由式(2)和式(3)建立统计模型和决策模型,决策策略由更换成本C和C+K以及固定的“风险警告级别”d决定。成本参数C(d)显示了由风险等级d定义的策略的单位时间的预期成本。决策策略情况如下:
1)立即更换(t时的风险函数高于警告级别)。
2)在下一次检查之前的某个计划时间更换(t时的风险函数接近警告级别)。
3)暂不更换(t时的风险函数远低于警告级别)。
根据实际调研情况,决策模型参数C设为65 000元,即预防性更换费用;而失效后更换费用C+K设为600 000元,时间单位为d。
根据ITF板卡的实际故障数据建模优化后得到如图7所示的决策报告。
图7 车载控制器ITF通信板卡案例分析报告截屏图
由图7可知,最佳失效风险等级约为34 d。当更换成本率(C+K)/C=9.230 77时,最优成本率达到100%。失效后再更换的费用为11 342.9元/d,优化后的更换费用为10 393.6元/d,经过模型优化后可节约950元/d的成本,即节约大约8.4%的费用。
本文主要针对地铁运营中故障频发的信号系统车载设备故障的问题进行维保策略优化。在简要介绍信号系统车载设备构造后绘制相应的故障树,并基于该故障树构造信号系统车载设备贝叶斯网络,从而进行贝叶斯网络推理。通过联结树算法进行贝叶斯网络后验概率推理对信号系统车载设备的重要度进行评估,识别该系统的薄弱环节。选取车载控制器的ITF板卡进行维保策略优化的案例分析。在CBM模型建模过程中,考虑对故障风险和维保成本进行双目标优化,通过PHM风险函数模型和成本函数模型,推测出案例板件的最佳维保时间间隔。本文研究成果为地铁维保部门提供更换备件的合理建议,提高地铁运营安全性的同时可实现降低运维成本的目的。