朱可嘉,孟雪松,任思琪,赵杰
(中国航空综合技术研究所,计量维修测试中心,北京 100028)
环境可靠性试验设备是环境试验检测机构拥有的集成程度较高的一类试验设备,提供一定测量范围内温度、湿度、振动、气压、电磁、沙尘、盐雾等试验条件中的一项或多项环境加载的试验系统,适用于航空航天、信息电子、仪器仪表、材料、电工、电子元气件等领域的环境可靠性试验。从功能上看,综合环境试验系统通常包括温度气压综合试验、温度振动综合试验、温度湿度振动综合试验、温度气压湿度综合试验、温度湿度振动电磁等。
环境可靠性试验设备是由振动、温湿度、压力等多种环境可靠性条件加载功能单元组成的复杂试验系统,因此,按照子系统、部件、组件、零件、材料等层次,对其功能结构进行分解。如图1所示。以温度湿度振动三综合试验系统为例,其主要包括环境试验箱和振动台两个子系统。其中,环境试验箱子系统又分为制冷、加热、加湿、控制测试、供电、冷却(水冷或风冷)等核心部件。而振动台子系统则可分为控制、功放、台体(感应单元、运动单元),冷却、供电等核心部件。通过结构化分级编码管理的方法,可使故障诊断定位更准确,提高部件、组件级的日常维护与检修效率。
图1 环境可靠性试验设备系统架构
环境可靠性试验设备的运行管理,是对大型复杂试验系统正常高效运行的一系列保障工作的有机组合,正是由于它们的相互影响、彼此联系,共同确保了试验系统的整体运行状态。如图2所示,设备管理作为检测实验室体系运行的一部分,必须遵循体系文件中“设备”有关条款的规定。具体来看,其涵盖了任务计划、质量安全、计量校准、维修维护、备品备件、安装调试、停用、存放及处置等多个过程。开展这些活动的主体,涉及了测试、计量、维保、安调、计划等部门与人员。同时,在设备运行过程中,还需要配备充足的预算经费、能源动力、计量器具、维保工具(耗材),以及管理制度、操作规程、场地条件等资源。
图2 环境可靠性试验设备管理模式
另外,不同的设备运行管理主体,对试验设备运行管理的目标也是不同的,甚至是相悖的。以使用时间为例,设备使用部门为完成试验任务,会要求设备尽可能多地保证开机时间,而设备维保部门则要求设备在合理的时间周期内进行维护保养;就技术状态来看,试验实施人员不会在意实际测量参数是否达到设备要求,但计量人员则必须保证设备标称值和实测值在相关规程要求的误差范围内。因此,环境可靠性试验设备的运行管理是一项多主体、多阶段、多目标约束的系统性工作。
在环境可靠性试验设备管理模式中可以看出,设备维修即是一项技术活动,更是一项管理工作。试验设备维修过程中会受到了来自试验计划、试验操作、动力配套、环境场地、仪器仪表等方面的多重制约,需要通过管理协调来尽可能地确保维修活动的顺利开展。设备维修一般包含了设备日常保养、巡检、故障诊断、部组件维修、应急维修等内容。其中,日常保养、巡检工作可以理解为预先维修,其具有较强的周期性和计划性。要开展试验设备的预先维修,就要根据试验设备运行的实际情况,建立完善规范的设备巡查、检修、保养计划,并制定清晰明确的设备检修清单、保养操作规程等。
另外,设备故障诊断、部组件维修、以及应急处置则主要针对偶发故障开展维修工作。
这就需要对环境可靠性试验设备常见故障的类型、原因、位置、影响等方面进行长期的分析与整理,形成针对不同故障类型的维修策略,并在实施过程中制定有针对性的方案组合。
环境可靠性试验设备的维修体系机制的构建,首先要从故障梳理入手,建立故障诊断程序、分类方法,并形成规范的维修方案编制框架。通过管理者牵头和协调,组织内外部维修技术人员共同参与,形成对常见故障有较强针对性的维修策略及维修方案集。并在实际设备维修过程中,对故障、策略、方案以及维修能力进行迭代和优化,进而大幅提高环境可靠性试验设备维修成效,以及设备整体的可用度[1]。
在环境可靠性试验设备运行管理过程中,考虑设备的可用度,及其可靠性和维修性,根据设备可能出现的运行状态,即停机、降级、备用,一般可将试验系统故障分为停机故障、降级故障、备用故障。另一方面,由于故障发生的结构部位差异,又可分为系统故障、部件故障、组件故障、零件故障、过滤润滑故障等。再有,根据故障模式及影响范围的不同,也可将故障分为离散故障、联机故障、操作故障。对于常见故障可按照关键、重要和一般故障对系统故障进行了分类和编码。如表1所示,为国内外主流设备厂商所的环境可靠性试验系统的常见故障梳理。
表1 环境可靠性试验系统常见故障
实际维修中,根据设备故障原因及其对试验系统的影响情况,可选取替换维修、原位修理、故障隔离等在内的不同的维修策略,以应对不同类型的突发设备故障。
替换性维修主要针对严重的部件、组件、元件的老化损坏,以及耗材的失效故障,其现象是设备部分功能丧失,且无法通过原位修理和故障隔离的方式排除故障。处理方式主要是原型号备件替换或代替型号备件替换。
原位修理主要针对管路、组件的安装与接口异常,以及组件、元件的可恢复性异常情况。主要涉及接口脱落、线路松动、焊点虚接、管路及元件脏堵、管路泄漏、系统散热不畅等方面。具体处置方法包括重新安装、连接、清理、修补等。
故障隔离主要针对部组件参数偏离、功能波动的故障,故障可通过短接、拆卸、屏蔽在内的方式加以隔离,且相关操作不会对该部组件所在的系统或设备整体功能造成影响。
根据环境试验设备停机、降级、备用故障发生时的严酷程度(关键、重要和一般),为确保设备可用性,应在故障发生时,采取有效的维修应对策略。如针对关键备用故障,主要采取预先维修和恢复性维修策略;对一般降级故障,主要采取隔离性维修和恢复性维修策略;对关键降级故障,主要采取恢复性维修策略;对一般停机故障,主要采取替换性维修和恢复性维修策略;对关键停机故障,主要采取替换性维修策略。
1)综合环境试验设备的预防性维修
预防性维修有两个方面工作,一方面是检查关键部组件运行数据是否正常,及时记录异常数值,并组织维修班组进行系统分析,做出异常原因分析与影响评估。另一方面,要根据设备技术手册,定期更换滤芯、油液等耗材。通过周期性预防措施,降低设备故障发生概率,提高设备的可用性。预先维修应该由不同主体共同参与,即试验设备的操作人员在设备日常使用前的数据记录,使用后的设备清理。维修人员在设备运行维护周期内,根据计划定期开展全面清扫、深度检修及耗材更换工作。
2)综合环境试验设备的替换性维修
替换性维修策略主要包括两种,一种是原件替换,即根据故障件的型号规格进行原件替换。这种替换不需查看图纸及征求设备厂家意见,只需根据操作手册标识的型号规格替换。就可靠性试验设备而言,主要包括固态继电器、热继电器、线圈、加热丝、保险、传感器、管路、接(喷)头、阀体、电机、风扇等一些具有标准接口功能及特性的制冷或电气元件。另外一种是由于型号规格已停产或无法采购,进而根据设备图纸、说明以及厂家技术建议,通过定制或直采的方式另外寻找其他型号的替代件,并经过验证或确认,替换后设备故障排除的一种替换件维修。针对第二种情况,就需要实验室设备管理人员及时更新设备技术文件,特别是建立设备常替换件清单,并及时更新。
3)综合环境试验设备的恢复性维修
恢复性维修策略主要针对管路破损、结构裂纹、线路虚接、紧固件松弛(脱落)等情况,在不用替换关键零组件的情况下,可实现故障的排除及修复。最为典型的就是制冷系统补漏,该项维修属于典型的恢复性维修。即通过检测漏点,定位泄漏部位,切管焊接,抽真空保压,加注制冷剂。过程中仅消耗部分材料。
4)综合环境试验设备的隔离性维修
隔离性维修是一种应急性维修,即维修时常说的“短接”。其目的是屏蔽故障单元,确保设备主要功能运行,短期内解决了设备使用问题,长期来看,会对设备设计寿命和部分性能水平产生负面影响。同时,也存在应急使用过程中二次停机的风险。作为实验设备管理人员,不建议经常选择该种维修策略。如必须采用该策略时,也要经过使用方和设备厂家确认,确保设备长期使用的可靠性和性能的稳定性。
可用度是指在指定时间范围内,设备能处于正常工作状态的时间百分比,用于表征功能的持续性,反映的是设备长期工作能力。设备可用度越高,则表明设备具有更强的长期运行能力,且所需的维修成本(包含时间和费用成本)更低。通常情况下,可用度被认为是综合评估设备可靠性和维修性的指标[2]。根据使用场景和条件的不同,形成了不同的可用度及其评估方法,有任意时刻或任意时段的可用度,有反应一段时间内的设备可用情况的平均可用度,也有基于极限思想的稳态可用度[3]。
对于综合环境试验系统而言,其可用度是在系统安装到位后,在保障资源、使用条件和任务要求既定的条件下,当有试验需求时系统能投入使用的能力。根据实际使用情况,综合环境试验系统不能工作时间主要包括系统修复时间Tcm、系统保养时间Tpm、保障延误时间Tpd和管理延误时间Tmd;能工作时间包括试验准备时间Ts和试验实施时间T0。则综合试验系统的可用度可表示为:
实际计算中,环境可靠性试验系统可用度A可以用系统能够完成试验的时间与总工作时间的比值计算。
系统可用度可认为是系统或部件在特定的使用及维保条件下,在给定的时间内能够完成规定功能的一种能力。一般可以表示为能工作时间与全部任务周期(能工作时间与不能工作时间的和)的比值,而将这种比例通过状态概率的方式加以量化,进而形成了可用度的评估模型。系统可用度的高低取决于其本身的可靠性与维修性。
可用度的研究主要集中在两个方面:一方面是以可用度指标为目标函数的优化问题;另一方面是对可用度指标为约束条件的优化问题。
系统可用度是指多部件(分系统),具有多种失效模式下,设备可用的失效相关可靠性模型。
3.2.1 环境可靠性试验系统运行状态
环境可靠性试验系统用于对被测件进行温度、湿度、振动在内的环境可靠性试验,由于根据试验大纲要求,不同条件可根据持续时间,进行相关条件的单独或组合使用。以传统温度+振动可靠性试验任务为例。根据任务执行过程和特点,可形成环境可靠性试验系统运行流程,如图3所示。
图3 环境可靠性试验系统运行流程图
根据试验任务周期运行的特点,可以梳理出系统运行的五个核心过程,包括试验任务准备、系统检查与保养、试验系统运行、试验系统维修、试验系统复位。其中,不论是对被测件进行安装调试,还是对试验系统进行检查和保养,都属于准备状态(R状态)。另外,加上系统正常时的运行状态(N状态),系统维修时的故障状态(F状态),可抽象出R、N、F三种试验设备状态。
3.2.2 环境可靠性试验系统可用度评估
根据试验系统规模的大小,环境可靠性试验设备一般有多联箱和多联台组合。常见的有单箱单台的试验系统、三箱三台的试验系统、以及六箱六台的试验系统。根据系统可用度的概念和评价方法,在大型综合环境试验系统开展三综合试验时,每个子系统内的不同功能单元缺一不可、不可替代,因此,各功能单元间为串联关系。即有:
而各套综合环境试验子系统是相同功能组合的规模累加,在子系统有备用的情况下可替换(环境试验箱一般均有备份机组),各子系统间为并联关系。即有:
某环境可靠性试验系统由一套环境试验箱子系统H和一套振动台子系统Z两个部件组成,只有两个部件都故障后才能对系统进行维修,同一时间只能维修一个故障部件。环境试验箱的故障率为λ1,振动台的故障率为λ2,环境可靠性试验设备的平均修复时间为MTTR,修复率r为1/MTTR。
环境可靠性试验系统状态转化模型如图4所示。其中,状态1为环境试验箱H和振动Z均正常工作,其他状态如表2所示。
表2 环境可靠性试验设备状态
图4 环境可靠性试验系统状态转化模型
则稳态方程有:
根据系统稳态可用度状态转移矩阵为:
则可用度A有:
根据2015年投入使用的一套三综合试验设备的年度运行数据分析,其中,环境试验UC40A故障率有λ1= 0.07;振动台SAI180A故障率λ2= 0.04。又根据环境试验箱的平均修复时间为18.8 h,则环境试验箱的修复率为rh=0.05,振动台的平均修复时间为15.7 h,则振动台的修复率为rz=0.06,因此,系统修复率以低修复率为准,即系统修复率为0.05。则该套环境可靠性试验系统的P1=0.15,P2=P3=0.26,即可用度为:A=P1+P2+P3=0.67。
1)增加系统、功能单元备用数量,提高任务可用度
实验室在环境可靠性设备选型时,应多考虑联箱设计,同时,根据任务条件,备份部分制冷单元或高温(低温)级压缩机组。振动台单元则要考其安装和替换的便利性,并且在经费充足的情况下,尽量选用同一家厂商设备,满足设备在功放柜模块、对中板、板簧、阻尼块、气浮等方面的兼容性和替换性要求。
2)加强任务计划与维修计划协调,提升维修效率
境可靠性试验任务的周期持续性较强,为保证设备故障的可隔离、可维修,需要有针对性地增加预先维修的频次和内容,即在试验开机前,要进行全面检修,而非简单的例行检查。同时,维修计划要统筹好、利用好试验间隔期,尽可能在期间内安排完成检修及抢修任务。
3)规划维修专业与计量的专业保障架构,提高维修水平
环境试验设备的维护和保养,需要根据试验设备的原理,建立机械、制冷、电气、电子、控制专业在内的维修班组,并根据质量体系管理要求,施行班组长技术负责制。同时,按专业对设备期间核查、设备计量检定、及保养与维修过程中所需资源,包括人员、仪表、工具、场地、被检等统一规划和安排。
4)形成面向设备可用度的维修管理模式,优化维修流程
从确保设备可用角度出发,建立科学合理的设备巡查、检修、保养及维修管理制度。搜集整理设备技术资料,编制规范的设备维修手册和设备操作规程,完善设备运行记录、设备保养记录、设备维修记录、设备常见故障目录、维修规程、易损件清单等文件。另外,在严格记录的同时,要依据记录定期对设备可用度进行评估测算,及时掌握设备运行状态,并指导设备维保工作的持续改进。
5)开展设备操作培训,减少误判、误操作情况的发生
提高设备使用单位、人员对试验设备性能和原理的认识,定期组织设备原理、操作规程、应急处置、日常检查与清理的培训交流活动,减少由于操作人员不熟悉设备,而引起的操作或处置不当情况的发生。其中,要杜绝在情况不明情况下的短时间、连续重启操作,防止连续重启给设备造成更为严重的损坏。