杨文栋 赵刚
一、引言
轨道交通装备的服役期往往达10年以上,由于系统复杂度高、应用环境恶劣、使用维护不当等原因会产生形式多样的故障。无论是责任或非责任故障,都会对运营造成不良影响,轨道交通装备满足良好的RAMS特性,即可靠性(Reliability)、可用性(Availability)、可维修性(Maintainability)和安全性(Safety)的同时,仍然需要考虑故障的预防和故障处理技术服务。
根据轨道交通装备的特点,故障预防和故障处理应纳入统一的失效模式管理,以形成知识沉淀,使装备制造企业能够根据故障发生概率、故障原因,有针对性的提高产品可靠性、优化修程,并且帮助用户快速的应急处置、正确的处理故障,更进一步的价值是根据数据统计和故障机理进行装备的状态监控、故障诊断和故障预测。本文从知识沉淀和分类管理角度探讨轨道交通装备的失效模式管理方法。
二、失效模式管理的知识沉淀过程
失效模式知识沉淀的过程主要包括面向故障预防的失效模式分析,面向故障机理的故障树分析和面向故障处理的闭环管理三个过程。
(一)失效模式分析
失效模式及后果分析(Failure Mode and Effects Analysis,简称FMEA),是在产品设计阶段和过程设计阶段,对构成产品的子系统、零件,对构成过程的各个工序逐一进行分析,找出所有潜在的失效模式,并分析其可能的后果,从而预先采取必要的措施,以提高产品的质量和可靠性的活动。
(二)故障树分析
故障树分析(Fault Tree Analysis,简称FTA)是系统分析的一种技术,它从单个的潜在失效模式来识别所有的可能原因,分析系统失误。FTA考虑的是相互关联的原因以及独立原因。除了故障树结构和所有的逻辑关联,通常FTA还包括了失效可能性的识别,从而可以从零部件的可靠性来计算系统可靠性。故障树的建立步骤如下:
1. 选择和确定顶事件(可以为故障模式、系统故障代码)
2. 分析顶事件,寻找引起顶事件发生的直接、必要和充分的原因,将顶事件作为输出事件,将所有直接原因作为输入事件,并根据这些事件实际的逻辑关系用适当的逻辑门相联系。
3. 逐级向下分解,直到所有的输入事件不能再分解或不必再分解为止。
(三)基于失效模式知识库的故障闭环管理
故障闭环管理为现场处理闭环和管理闭环两个过程,根据故障等级,轻微故障仅需要现场处理闭环,重点故障进行管理闭环,重点故障闭环过程需完善如下内容:
D1:小组成员,确定故障提交、诊断、处理及制定措施的相关部门及人员。
D2:问题描述,检索功能对象、失效模式,明确是否为新的失效模式,新故障模式则D2至D7内容全部需要制定并纳入知识库。
D3:即日纠正措施,检索失效模式相应的即日纠正措施并执行,必要时完善即日纠正措施。
D4:明确和核实根本原因,检索失效模式相应的故障树及可能的原因,进行诊断分析,若发现新的原因,纳入知识库。
D5:永久性纠正措施,检索失效模式相应的既有永久性纠正措施,必要时进行更新完善。
D6:纠正措施效果验证,跟踪监控,确保故障隐患消除。
D7:预防再现措施,检索失效模式相应的既有预防再现措施,必要时进行完善。
D8:客户确认及评价。
三、轨道交通装备的失效模式分类方法
对失效模式分类是进行装备可靠性分析的基础,传统的故障分类是根據严重度、责任方、系统及部件进行分类,较前沿的做法是运用机器学习技术进行数据认知(例如季节规律、地域规律)。
(一)失效模式的人工分类方法
1.严重度分级管理
基于失效模式严重度的分级,根据轨道交通行业的特点将FMEA的10级简化对应到5级(轻微、一般功能故障、影响旅客舒适、影响行车秩序、影响行车安全)便于现场操作,故障等级将影响故障的闭环管理流程,轻微故障仅需现场闭环管理,重点故障需进行管理闭环。
2.责任分类管理
结合“人、机、料、法、环”的原则,按责任方进行分类,如设计问题、工艺问题、施工质量问题、合作方施工问题、配件质量问题、软件升级问题、使用维护问题、外部环境问题。故障分类也将影响故障的闭环管理流程,如果是责任问题,由相应责任方进行进一步分析处理。
3.按系统及部件分类管理
根据装备构型信息,提供按照系统、子系统、部件进行分类,实现故障定位到系统、子系统和部件,便于故障进行查询和统计分析。
(二)失效模式的机器学习分类方法
机器学习通过大数据可以发现许多有价值的规律,例如失效模式的季节规律、地域分布规律、用户规律、产品在不同寿命阶段的故障规律等,进行有效的预测分析,并且提供相应决策支持。
四、结语
通过知识沉淀过程管理和分类管理有助于有效的进行失效模式管理,从而将质量问题数据转变为可用信息并驱动质量提升,更进一步的价值是根据数据统计和故障机理进行装备的状态监控、故障诊断和故障预测。