王炳舜
(国核示范电站有限责任公司 山东威海)
核电站的维修不同于常规电站或其他工业部门的维修,因为它的规模巨大、设备复杂,而停运带来的损失也很大,并且在核安全以及保护公众健康方面甚为重要。为此,核电站对维修工作提出很高的要求。可靠性维修 (Reliability Centered Maintenance,简称RCM)是一种针对关键设备设置维修活动的系统化方法。RCM通过分析关键设备的各种故障模式,找出最主要的故障原因。以经济有效的维修方式确保设备的可靠运行,因此在RCM中,故障模式的分析尤为重要。
故障树分析法(Fault Tree Analysis,简称 FTA)是一种图形演绎方法,是设备可靠性分析过程中比较常见的一种故障分析方法。以液力偶合器为研究对象,在了解和掌握了液力偶合器工作原理和故障模式的基础上,建立液力偶合器工作不正常的故障树。通过故障树,不仅可以科学、全面地分析液力偶合器工作不正常的原因,还可以根据故障树确定的逻辑关系,计算“顶事件”的发生概率,由此采取防止设备发生故障的措施,为可靠性维修提供依据。
以“液力偶合器工作不正常”的顶事件(代号T),作为分析目标。在日常维护过程中,液力偶合器工作不正常的表现形式,主要为振动剧烈(代号M11)、频繁补油(代号M12)、工作油过热(代号M13)、润滑油压力低(代号M14)以及偶合器输出转速不稳定(代号M15)等5种形式。在不断分析回答“怎么会引起这一事件”的问题中,寻找这一事件的产生原因,一直追溯到造成上一级事件的基本原因不能再进一步追溯为止,这些基本原因就构成了故障树的基本事件。故障树中的基本事件不是最终故障原因,而仅仅是最小故障点。
图1 故障树
首先将顶端事件用矩形所示,符号表示,底端事件用圆形符号表示。然后再确定各层事件的逻辑关系,主要由“与”和“或”两种组成,并将各层事件用逻辑符号连接起来,并用行列法或布尔代数方法进行故障树化简,就绘制出图1所示的故障树。
1.基本事件结构重要度分析
(1)利用布尔代数法计算故障树的最小割集。割集,也叫截集或截止集,它是导致顶上事件发生的基本事件的集合。引起顶上事件发生的基本事件的最低限度的集合叫最小割集。如果求出了最小割集,就可以马上知道发生故障的所有可能途径。从这个意义上讲,最小割集越多,说明系统的危险性就越大。
任何一个故障树都可以用布尔函数来描述。一般从故障树的顶事件开始,“与”门用逻辑加代替,“或”门用逻辑乘代替,用下一层事件代替上一层事件,直至顶事件被所有基本事件代替为止。运用布尔代数运算率化简布尔函数,最终得到其最简析,取标准式中每个最小项所构成的集合,便是最小割集。
根据故障树结构图,建立故障树相关事件的布尔函数:
运用布尔代数法计算出“液力偶合器工作不正常”的故障树的最小割集有32个。这说明造成“液力偶合器工作不正常”的可能途径也就有32种。根据可靠性理论知识,最小割集越多,设备可靠性也就越低。
(2)基本事件结构重要度。结构重要度分析是一种定性分析方法,在不考虑基本事件发生概率的情况下,仅从故障树结构上分析各基本事件的发生对顶上事件发生的影响程度。
采用最小割集近似判断法,计算各基本事件的结构重要度大小,方法操作简便,在工程实践中应用最为广泛。设某一事件有k个最小割集,最小割集Er中含有mr个基本事件,则基本事件Xi的结构重要度近似计算见式(1)。
根据计算公式(1)计算造成“液力偶合器工作不正常”的各基本事件的结构重要度。
对基本事件结构重要度进行排序。显然,基本事件X30,X31的结构重要度最大,基本事件X11,X12、X14,X15,X23,X24的结构重要度最小,其余基本事件的结构重要度介于两者之间。也就是说,基本事件X30,X31对顶事件“液力偶合器工作不正常”发生的影响程度也就最大。为提高液力偶合器运行可靠性,在不考虑基本事件发生概率的情况下,首先应该考虑提高基本事件X30,X31的可靠性,降低其故障发生率。
就液力偶合器维护实践而言,首先在设备设计阶段,就将油冷却器排气管设计成3个,这样可以使基本事件X30的故障率降低为只设计一个排气管时X30故障率的1/3。对于基本事件X31而言,主要通过日常巡检(每周两次)和定期更换滤芯(每个运行周期更换一次)等手段,大大提高了基本事件X31的运行可靠性。其他基本事件也都依据其结构重要度顺序设置合理的预防性措施,从而大大提高了设备运行的经济性、有效性以及安全性。在现场实践中,尤其是在缺乏定量分析数据的情况下,基本事件的结构重要度分析就显得非常重要。
(3)顶事件发生概率分析。顶事件“液力偶合器工作不正常”发生概率分析属于定量分析范畴。故障树各基本事件的发生概率如附件一所示。可以依据各基本事件发生的概率,以及故障树的结构,用下列公式计算顶事件发生的概率。
用“与门”连接的顶事件的发生概率为式(2):
用“或门”连接的顶事件的发生概率为式(3):
式中 qi——第i个基本事件的发生概率(i=1,2……n)。
根据以上公式计算顶事件发生概率为P(T)=3.3×10-2。
已知:液力耦合器目标故障间隔期MTBF≥8000 h,平均修复时间MTTR=24 h。所以,液力偶合器目标故障率为式(4):
由于P(T)≥P0(T),说明液力偶合器在现有基本事件的故障率模式下是极不可靠的,必须采取防范措施,使“液力偶合器工作不正常”的故障率降至安全目标以下。要降低顶事件的发生概率,就必须通过降低基本事件的发生概率来实现。由于顶上事件发生概率与所有基本事件发生概率是多重线性函数关系,改变其中某一个基本事件的发生概率对顶事件发生概率的影响程度不尽相同。为此,采用故障树分析中的一个定量分析参数——基本事件的概率重要度。
所谓基本事件的概率重要度,表示第i个基本事件发生概率的变化引起顶事件发生概率变化的程度。基本事件的概率重要度越大,其对顶事件发生概率的影响程度越大。顶事件概率函数对第i个基本事件发生概率求一次偏导,即可得到该基本事件的概率重要度系数。计算公式见式(5)。式中P(T)表示顶事件发生的概率,qi表示第i个基本事件的发生概率。
通过公式(5)计算出所有基本事件的概率重要度系数如表1所示。从计算结果看,基本事件X1的概率重要度系数最大,其次是基本事件X2,X16,X17,X19,X21。
表1 基本事件的概率重要度系数
由于各基本事件发生概率不同,一般情况下,改变概率大的基本事件比改变概率小的基本事件容易。在故障树定量分析中,基本事件的关键重要度是表示第i个基本事件发生概率的变化率引起顶事件概率的变化率的参数,因此,它比概率重要度更合理更具有实际意义。计算公式见式(6)。
通过公式(6)计算出所有基本事件的关键重要度见表1。从计算结果看,基本事件X1,X19的关键重要度最大,其次是基本事件X2,X16,X17,X21。为此,要降低顶事件发生概率,需首先从降低基本事件X1,X19,X2,X16,X17,X21的故障率入手。
通过故障树分析发现,构成故障树的基本事件大体由机械(电器)设备故障或损坏、人的差错、环境不良3部分组成。通过以上分析,对顶事件发生概率有决定性影响的是基本事件X1,X2,X16,X17,X19,X21,降低了这几个基本事件的发生概率,将能迅速有效地减低顶事件“偶合器工作不正常”的发生概率。
1.提高备件可靠度控制基本事件原发故障
一台完整的液力偶合器由若干零部件构成,零部件的可靠度将直接影响到液力偶合器的可靠度。液力偶合器在检修初期发生的大部分故障主要是由于备件失效原因造成的。为此在设备检修过程中,采取加强备件入库出库质量检查,在备件使用前进行备件可用性验证的措施,对于提高备件可靠度,降低液力偶合器原发故障率将十分有效。
对基本事件X16、X21而言,在密封端面O形圈、过滤器滤芯入库时,首先要严格检查备件表面是否光滑、有无毛刺,备件参数是否合格,存储条件是否合理;在使用前需检查备件是否损伤,是否在备件有效期内,使用备件是否具有的互换性、匹配性。通过一系列行之有效的备件可用性检查手段,将会大大提高基本事件X16、X21的可靠度。
2.加强日常巡检及时发现潜在故障
在液力偶合器日常维护过程中,日常定期巡检是提高液力偶合器运行可靠度的重要组成部分。液力偶合器任何潜在故障都会以某种表象特征表现出来。如压力、温度缓慢变化;系统边界轻微渗漏;运行声音异常等。尽早发现潜在故障,将设备缺陷消除在萌芽状态可以有效提高液力偶合器运行可靠性,节约检修成本。在巡检过程中,要注意检测参数的全面性、检测数据在时间上的连续性、并定期对一段时间内巡检记录数据进行定性分析。根据巡检参数的变化情况,依据本文给出的故障树,将会较为准确地找出液力偶合器的潜在故障。一般情况下,设备早期故障纠正措施较为简单,即使不能马上消除缺陷,也会为制定合理的检修计划提供足够的反应时间。
对基本事件X2而言,如果液力偶合器基础松动,其早期表象特征首先表现为振动1倍频参数缓慢增大。在日常巡检过程中,需关注液力偶合器振动参数的变化情况,如果发现振动1倍频有缓慢增大趋势,就需要检查基础紧固螺栓的紧固力矩是否合格。由此将会大大提高基本事件X2的可靠度。
3.合理设置预防性检修周期及时纠正渐进性故障
在液力偶合器运行过程中,不可避免地存在零部件磨损、腐蚀、老化、疲劳等劣化过程。液力偶合器故障率与基本事件的发生概率和使用时间有关。预防性检修是纠正液力偶合器渐进性故障,提高液力偶合器运行可靠度的重要手段。然而,预防性检修周期设置过短,会增大检修成本;预防性检修周期设置过长,会引发纠正性检修,失去预防性维修的实际意义。因此通过基本事件发生概率设置合理的预防性检修周期将显得十分重要。
例如,工作油泄压阀解体检查周期为6C,由于弹簧处于长期的压缩状态,不可避免会产生弹性蠕变。2010-2011两年间,1台液力偶合器曾多次发生工作油泄压阀过调节,引起液力偶合器转速波动的故障。根据公式(7)计算M29的故障率。
表2 中间事件M29故障率变化量
由于基本事件X19故障率远远大于基本事件X18的故障率。当基本事件X19故障率为0.005时,中间事件M29的故障率为0.005。在其他同层次中间事件故障率小于M29的故障率的情况下,中间事件M29的故障率将对顶事件故障率起到主导性的作用。
为此对基本事件X19的检修周期进行调整,每年大修设备再鉴定时对工作油泄压阀进行在线校准调整,从而大大降低了基本事件X19的故障率。当基本事件X19的故障率降低为10-6时,中间事件M29的故障率为10-5,如表2所示。即由基本事件X19(工作油泄压阀过调节)引起中间事件M29工作油压力变化的因果关系将会彻底弱化。
4.加强管理优化技术降低人为失误
研究发现,人为失误所造成的事故约占事故总量的70%~80%。在故障树分析中大部分基本事件也都与人为失误有关。基本事件X1,X17也都是由人为失误引起的。一般来说,在设备运行和检修过程中为人失误在所难免。人为失误率与人的自身因素及工作环境有极大的关系,减少人为失误,可从采取几个措施,如:加强培训力度,增加检修人员对液力偶合器的熟悉程度;规范检修规程,提高规程的可操作性及参考价值;增强规程的执行力度,防止人为随意性失误;加强检修关键点验证,提高检修质量;改善工作环境,关注人员健康。措施实施后,可以最大限度地减少人为失误,从而提高液力偶合器运行可靠度。
通过对液力偶合器进行故障树分析表明,故障树分析法能对设备的故障模式进行全面的分析,找出设备运行可靠性的薄弱环节。当X1,X2,X16,X17,X19,X21的故障率降低到0.0001,“液力偶合器工作不正常”的故障率降至1.9×10-3,低于液力偶合器目标故障率,这将有力保证液力偶合器在一个运行周期内的安全稳定运行。因此,在RCM中用故障树分析法来指导设备的故障分析,寻找设备故障原因是很有效的措施。