刘福新
(1.北京全路通信信号研究设计院集团有限公司,北京 100070;2.北京市高速铁路运行控制系统工程技术研究中心,北京 100070)
基于RCM理论的计算机联锁系统维护的探讨
刘福新1,2
(1.北京全路通信信号研究设计院集团有限公司,北京 100070;2.北京市高速铁路运行控制系统工程技术研究中心,北京 100070)
RCM理论对系统维护的主要思路是深入分析系统所具有的各项功能和故障模式,明确系统故障所产生的后果, 在充分利用其固有可靠性的前提下,制定出各故障的预防性措施。将这一理论运用到计算机联锁系统维护工作中,优化系统的维护策略,达到系统安全、可靠的运行。
RCM;计算机联锁系统;维护;系统故障;安全可靠性
随着我国高速铁路的飞速发展,计算机联锁系统作为信号设备的核心系统之一,其性能的优劣对铁路运输安全起着决定性作用,因此对联锁系统的安全性、可靠性提出更高的要求。计算机联锁系统在其使用周期内能否安全、稳定的工作,很大程度上取决于合理的维护和科学的管理。因此,建立一套合理有效的维修策略模式,是我们面临的一项新课题。RCM理论的提出,为我们提供了计算机联锁系统新的维护思路。
以可靠性为中心的维护(Reliability Centered Maintenance,RCM)是一种维修的理念、策略和模式;是围绕可靠性维护这一特征,用以确定设备预防性维护需求的一种系统工程方法,也是优化各种设备维护制度的首选方法。
对于计算机联锁系统,RCM也可以定义为:按照以经济的、最低的维护成本保持设备固有的安全性和可靠性。通过对故障数据进行汇总、分析、建立故障案例库、专家评审等手段,以提高系统可靠性为目标优化系统的维护策略。
计算机联锁系统的故障包含硬件故障和软件故障两个方面。硬件故障分为永久性故障、间歇性故障和瞬时故障。
永久性故障一般是由于系统内板卡故障,线缆断线等因素导致,故障处理前,故障现象会永久存在。间歇性故障指设备故障现象频繁发生且能够自动恢复,通常由于元器件的性能发生变化导致工作不稳定,或板卡、线缆接触不良等原因导致。瞬时故障一般是由于外界干扰导致系统突发性故障。
永久性故障和间歇性故障的处理,通常是先用备件替换故障设备,恢复系统的正常使用,然后对故障现象、故障设备进行分析,找出具体的故障点。对于瞬时故障,一般故障原因很隐蔽,应先恢复系统正常使用,然后再对故障发生前后的外界因素进行汇总、分析,找出引起故障的干扰源。
软件故障是由于软件中数据配置错误,或软件逻辑存在的缺陷导致。对于软件问题,生产厂家要通过电务维修机等方式获取故障时间段的数据,试验室进行故障回放、模拟试验等手段查找软件中错误的地方,然后再按照各个路局、电务段规定的软件修改流程进行软件修改。
根据计算机联锁系统的故障类型,以可靠性维护理论作为基础,提出校正性维护、预防性维护、预测性维护3种维护方式。而可靠性维护是将校正性维护、预防性维护和预测性维护几种维护方式有机相结合而成的。
4.1 校正性维护
校正性维护是一种被动维护方式,因为设备元件的失效性是未知的。设备发生故障的时机存在不确定性,只有造成停机之后才进行维护。校正性维护要求故障发生后,人力、备件等维护资源必须及时到位,维护人员在最短的时间内恢复系统,以达到系统的安全、可靠性。
优良的校正性维护方法能够对安全性和可用性达到改进。然而这种方式要求维护人员必须快速响应并赶到故障现场,打乱了人员正常的工作计划,带有很大的随机性。校正性维护是花费代价大,资源反应和人力动用困难,并且对于系统的恢复时间也是不可预见的。
从各方面考虑,校正性维护是被动的、落后的维护方式。基于这种情况,计算机联锁系统的各个生产厂家采取组建分公司或区域化维护的方式来弥补校正性维护的弊端。
校正性维护适用于下列情况:
1)设备发生故障,但不会影响系统的整体功能和安全、可靠性;
2)故障属于偶发性且无规律可寻的故障,使用校正性维护方式更为经济。
4.2 预防性维护
预防性维护是一种有计划的维护体制,主要是为了防止故障。维护需要在一个设定好的间隔内,如时间间隔、条件间隔等,按照维护标准所描述的尽可能减少设备故障和失效的可能,达到系统稳定运行的目的。联锁系统内各部件使用到一定时间,不论其运行状态如何,安排进行计划规定的维护工作,以达到系统的安全、稳定地运行为目的。显然这种维护方式带有强制性。
预防性维护的主要目的是为了在故障发生之前防止设备故障。维护工作一般安排在行车间隙进行,并且对维护资源、维护内容、人员提前做好充分的准备。在设备发生故障之前,通过以换代修的方式提高设备的可用性。系统维护的次数或间隔周期是生产厂家人员依据设备规格需求和安全分析来加以确定。
预防性维护计划必须包含必要的资源并且可以加以执行。维护工作的时间安排可以在两种情况下进行:一种是利用天窗点对设备在线维护,另一种是在充分利用系统关机的情况下进行维护。这样可以最小程度减少由于维护对行车秩序造成的干扰。
定期维护的关键是掌握系统的维护时机。它适用于:
1)故障特征随时间变化,即设备的稳定性与运行的时间长短相关,设备的故障模式具有一定的规律性;
2)在使用期限内,由于设备元器件老化导致的故障,为保证行车安全,分析出即将发生故障的时间点并进行维护;
3)系统内一些部件没有检测手段确定其技术状态时,采用定期维护是一种有效的方式。
成功的预防性维护相对于被动维护,成本大大减少。定期进行预防性维护,虽然可以降低故障发生的可能性,但也可能造成资源浪费、维护过剩的问题。
4.3 预测性维护
基于状态预测基础上的维护简称为预测性维护。这种维护方式是通过监测设备状态,通过分析、判断其将要出现的故障,估算故障修理时机,以减少设备损坏。监测包括联锁系统各个部件的运行状态、数据分析、趋向预测等项目。按预测得到的状态实施维护是一种有效的维护方式。
把前面提到的预防维护与预测技术结合起来,根据预测确定适当的维护周期,设备运行到预定的时间后再进行检查预测,则可避免资源浪费、维护过剩的问题。目前,监测和诊断工具的技术性进步使设备的维护越来越精确、有效。精确的预测维修进程降低了联锁系统发生各种故障的可能性。
预测性维护的优点:通过监测等手段可提前知道设备运行的状态,对可能发生的故障提前准备好备件,以便能尽快恢复系统使用。这种维护方式有利于产品质量的控制,节约维护资源,同时可避免严重性故障的发生,提高系统运行的安全可靠性。
预测性维护适用于:
1)属于耗损故障的部件,且故障随时间缓慢发展,能估算出发生功能性故障的时间;
2)维护人员凭借经验和日常巡视很难发现故障,设备使用中又不能对内部进行检查;
3)有监测手段记录设备技术状态的,通过其运行状态确定是否需要进行维护。
为了达到最经济、最满意的维护效果,可靠性维护的理念要求维护活动在校正性维护、预防性维护、预测性维护之间取得平衡,因地制宜、取长补短。
在计算机联锁系统整个生命周期内,设备故障率分为3个阶段,并呈现出浴盆曲线形态,如图1所示。根据可靠性维护的策略,对不同阶段采取相应合理的维护手段。
图1 设备故障率浴盆曲线
第一阶段是初始故障期:在计算机联锁系统开通使用后,由于工程图纸设计、现场施工质量、设备质量存在问题,导致故障率很高,但随着系统工作时间的延长,故障率迅速降低。为了缩短这一阶段的时间,系统在工厂集成后要进行试运转、拷机试验,对不合格产品进行筛查。设备到达现场后要严格验收标准和测试过程,以便及早发现设备隐患并排除故障。
第二阶段是偶发故障期:这一阶段是系统的最佳工作期,系统运行较稳定,故障率较低,我们说的系统可靠性指标所指的就是这个时期。偶然故障主要原因是设备质量不合格、外界干扰和误操作等因素引起。为延长产品生命周期,保证系统可靠、稳定地运行,这一阶段要加强日常精细检测和维护。
第三阶段是损耗故障期:该阶段内,设备随着运行时间的延长,故障率呈明显上升趋势,主要是由于元器件疲劳、老化等因素导致。这一阶段面临系统有效寿命的结束,要加强设备的巡视,发生故障要深入分析原因,提出有针对性的维护措施并建议现场安排适当的大修作业。
根据以可靠性为中心的维护理论,从分析计算机联锁系统故障模式出发,根据各种故障模式对系统安全性的影响来确定有针对性的维护措施,即根据设备的实际运行状态、技术指标制定出最佳的维护方式,保证系统运行状态达到最稳定且节约设备维护费用的目的。对系统内部设备实行哪种维护方式,首先要对设备进行分级分类,根据设备特点再选择维护方式,使设备得到合理的维护。设备在计算机联锁系统中的重要性、安全性、维修性、经济性、检测性等因素都影响维护方式的选择。
为保证计算机联锁系统在其使用周期内稳定、可靠的运行,对于故障随时间缓慢发展的、可监测的、维护费用高的重要设备采取预测性维护;影响系统安全可靠性的,故障属于寿命型且无法检测的设备采用预防性维护,此时对维护内容和维护周期要进行合理优化,使其经济;故障对系统正常运行影响较小、故障率稳定、故障无法监测的设备实施校正性维护。
在实际工作中,根据故障模式,在充分利用其固有可靠性的前提下,选择一种或多种维护方式与科学的管理体系相结合,来确定最佳的维护策略。
将RCM理论应用到计算机联锁系统维护中,能够有效地指导维修活动和工程实施,达到优化维护策略,提高维修效率,降低维修成本等重大的现实意义。
[1]秦兆奭.计算机联锁的维护和管理[J].铁路通信信号工程技术,1999(4):1-5.
[2]钟章队,谢健骊,李翠然.铁路物联网[M].北京:中国铁道出版社,2014.
The main idea of RCM theory is to analyze the various functions and failure modes of the system, make clear the consequences of the system failure, and to make the preventive measures for the failure. In the maintenance work of computer interlocking systems, the RCM theory can be used to optimize the maintenance strategy of the system, in order to achieve the safe and reliable operation of the system.
RCM; computer interlocking system; maintenance; system failure; safety and reliability
10.3969/j.issn.1673-4440.2016.05.025
(2015-10-20)