马元,王鹏,孙瑞
转辙机是影响铁路行车安全的重要信号设备,由于其结构复杂,影响因素多,故障数据有限,且具有非线性、关联性、随机性等特点,因此出现故障后常常不易判断,还可能会造成较为严重的后果,威胁行车安全,一直是现场电务检修的重点。
为了更好地保障设备稳定运行,若能分析出转辙机故障的影响因素,并以此为基础,建立系统健康度评估模型,再结合转辙机设备关键特征状态的实时信息,进行模型分析与评估,进而制定有针对性的安全控制措施,则可变被动维修为主动维护[1]。因此,本文根据转辙机特性,引入一种基于马尔科夫状态转移的动态权值评估方法[2],通过对样本进行归纳,将各个指标不同程度的故障影响动态关联起来,深入分析系统故障模式、机理及其影响,建立动态退化分布指标体系,使状态预测结果更加贴近实际[3];并在此基础上,针对转辙机设备进行仿真试验,验证了该方法的有效性。
对于转辙机设备,本文定义的健康度HI(Health Index)是指设备在规定的时间及条件下,完成规定功能的能力。该能力越强,其健康度也就越高[4]。将信号设备在t时刻的特定性能,规定为影响其状况的健康指标,用x1(t)、x2(t)、…、xn(t)表示。具体定义为
式中:x为健康度评估因子;F为健康函数;HI的取值范围为0~100。
转辙机设备的健康度评估因子所占权重不是一个恒定的值,会随着时间不断变化,是一个时变的指标。因此,每隔一段时间,需要对转辙机的运行状态和各个健康度评估因子进行重新评估。但是,在转辙机实际运行过程中,很多低权重指标在设备状态恶化的情况下,其重要性才越发突显。为了克服传统设备健康度评估方法不能反映复杂系统非线性特征的缺陷,引入了基于马尔可夫状态转移的动态权值,将各个指标不同程度的影响动态关联起来,通过退化模型,有效而准确地描述转辙机退化过程的状态转移和故障规律的演化。
将健康等级或对应的健康度HI作为综合评估健康状态变化的定量指标,以此掌握转辙机的大致健康程度。HI值越大、越接近100,表明转辙机的健康程度越高,转辙机的状态运行参数越符合正常范围,转辙机的各项功能均正常工作,发生故障的可能性越低;HI值越低,则表明转辙机的健康程度越低,转辙机的某个状态运行参数已经或正偏离正常范围或断崖式变化,系统呈现性能退化趋势,发生故障概率逐步变大。
根据相关研究,参考相似系统的设备健康度等级划分,将转辙机设备的健康状态划分为健康、亚健康、异常、病态和故障5个等级[5],并由此建立转辙机健康度定量指标与健康状态定性评估等级的对应关系,进而对评估对象的维保提出建议,如关注、加强维保、立即检修、更换等。转辙机健康等级划分见表1。
根据现场调查分析,总结出转辙机设备故障原因,进而映射出相应的健康度评估因子[6],见表2。
表2 转辙机故障原因与设备健康度评估因子关系
根据上述关系,总结出转辙机健康度评估因子,即影响转辙机运行状态的评估因素,主要可以分为3类,见图1。
图1 转辙机健康度评估因子
第1类是运行数据,包括检修记录和电气特性曲线等。检修记录反映的是设备历史健康状态,是对每个设备故障检修或日常检修后的记录。当同一个转辙机在其检修周期内进行多次检修后,依据指数递增的规律,将降低其健康度评分。电气特性曲线反映的是设备实时健康状态,与设备的标准参考曲线进行对比,偏离度越大,其评分越低。
第2类是设备基本参数,主要包括生产日期(运行年限)、家族质量史等。设备在使用寿命期内,其健康度与生产日期有关,近似地满足单调递减的线性关系,需采用单调均匀递减的函数,描述其对转辙机运行状况的影响。通过查阅专业资料或专家打分的方式获取家族质量史。
第3类是运行工况,包括环境温度、湿度、大气压力等,该类因素要依据每个站实时或历史的运行环境,对设备的运行环境做综合评估。
通过以上分析,建立各类影响因素对转辙机运行状态影响的模型。动态评估初始时,按照设定的权重,对各个健康度指标进行加权计算,建立设备处于不同状态下的隶属度函数,计算求得转辙机的综合健康度。
使用顺序关系分析法,求取转辙机在各个阶段,各项属性对健康度影响的权重。通常采用以下步骤[7]:属性选取→确定属性序关系→比较判断评估指标→计算权重。
设impn为按照属性在评估因子中的重要程度,给出的第n个属性的重要性权值,impn∈[0,1]。
转辙机各个指标确定顺序关系的方法如下:决策人员根据专家经验,从包含n个指标的集合{x1,x2,...,xn}中,选出其中最重要的一个指标记为imp1,次重要的一个指标记为imp2;重复n次上述步骤的操作,此时剩下的最后一个指标的属性记为impn。如此,按照重要性对n个元素建立了排序:imp1>imp2>...>impn。当各个指标的关系序列完成之后,再根据给定的评估准则,求取每个指标在转辙机健康度评估过程中所占的权重。
定义rn为比较判断评估指标xn-1和xn的重要性程度比值:①若rn=1.0,说明属性xn-1与属性xn的重要性相同;②若rn=1.2,说明属性xn-1比属性xn略微重要;③若rn=1.4,说明属性xn-1比属性xn明显重要;④若rn=1.6,说明属性xn-1比属性xn强烈重要;⑤若rn=1.8,说明属性xn-1比属性xn极端重要。
定义wm为各影响因子的权值,假设根据专家经验,选出其中最重要的一个指标定义为ri,则权值wm为
通过分析转辙机设备构造和故障机理,结合故障数据和专家意见,分析故障演化规律并划分退化模式[8],见图2。将转辙机设备全生命周期的退化状态划分为4种:正常状态、退化状态Ⅰ、退化状态Ⅱ和退化状态Ⅲ。
图2 转辙机退化状态变化
正常状态:转辙机各个部位运行情况良好,故障的发生概率很低。
退化状态Ⅰ:转辙机设备能基本准确执行操作,故障发生的概率在可控范围内。
退化状态II:转辙机出现故障趋势,可能会发生故障,不能精确地执行操作。
退化状态III:转辙机性能恶化,故障趋势严重,故障特征明显,故障概率很高,必须及时检修。
设备可以从正常状态到退化状态Ⅲ逐级退化和逐级进化,但不能越级退化。当设备处于退化状态Ⅲ或者退化状态Ⅱ时,考虑到设备经历维修养护等情况可以越级进化。根据通常的检修流程,设备经过维修、确认之后才会再次投入使用,所以定义设备的运行状态可能发生跳级现象。
设备的退化状态等级高,不代表设备的综合健康度就一定会低;在不同的退化等级下,设备的各单项健康度指标的权值会产生变化[9],设备综合健康度指标也会产生相应的变化。根据式(2),计算出转辙机健康度动态变化权值列表[10],见表3。
表3 转辙机健康度指标权值
1)正常状态。在对所有设备进行初次健康度评估之后,默认设置所有设备的稳定运行状态为正常状态,计算出初始状态下设备健康度指标权值。偶然性的转辙机设备电气特性曲线异常,运行环境变化不会导致设备运行状态的变化,更不会导致设备健康度的急剧下降。正常状态的转辙机如果发生多次曲线异常报警,或连续多天运行环境恶劣,则该转辙机设备的运行状态会从正常状态转移到退化状态Ⅰ,如图2中路径①。
2)退化状态Ⅰ。设备处于不稳定状态,检修记录和运行年限重要性有所上升,权值会增大,达到0.305,而曲线数据、运行环境指标将会减少,家族质量史指标保持不变。
如果正常状态的设备连续发生3次异常报警,或者一天之内有超过6次异常,或者设备连续3天运行环境超过设备额定工作环境临界值,则设备的运行状态会从正常状态退化到退化状态Ⅰ,如图2中路径①。
对于退化状态Ⅰ的设备,如果连续1周运行状态良好,没有出现异常曲线且运行环境不超过设备额定工作环境临界值,则转辙机的运行状态从退化状态Ⅰ恢复到正常状态,如图2中路径②。
若该设备退化到退化状态Ⅰ之后,仍然连续检测到实时电气特性曲线异常,或连续几天运行环境恶劣,则其运行状态将从退化状态Ⅰ退化到退化状态Ⅱ,如图2中路径③。
3)退化状态Ⅱ。设备故障概率较高,处于高度关注状态,曲线数据和运行环境重要性提高,权值增大。其中,曲线数据和设备故障高度相关,其权值达到0.452,而家族质量史、运行年限、检修记录重要性降低,权值将会减少。
对于退化到退化状态Ⅰ的设备,在该设备退化到退化状态Ⅰ之后的第2天,如果连续发生5次曲线异常报警,或者一天之内有超过8次曲线发生异常,并且设备运行环境超过额定工作环境临界值,则该设备的运行状态会从退化状态Ⅰ退化到退化状态Ⅱ,如图2中路径③。
对于退化状态Ⅱ的设备,如果连续5天运行状态良好,没有出现异常曲线且运行环境不超过设备额定工作环境临界值,则设备会从退化状态Ⅱ恢复到退化状态Ⅰ,如图2中路径④;或者进行设备清理维护之后连续3天运行状况良好,曲线均正常,则设备的运行状态会从退化状态Ⅱ恢复到正常状态,如图2中路径⑤。
4)退化状态Ⅲ。设备处于危险状态,曲线数据、检修记录和运行环境重要性持续较高,权值会增大,而运行年限的权值将会极大减少,降为0.057,同时家族质量史将不被考虑,权值降为0。
对于退化到退化状态Ⅱ的设备,在退化到退化状态Ⅱ之后的第2天,一天之内有超过15次曲线发生异常,或者运行年限超过设备使用生命周期,则设备的运行状态会从退化状态Ⅱ退化到退化状态Ⅲ,如图2中路径⑥。
对于退化状态Ⅲ的设备,如果连续半个月运行状态良好,没有出现异常曲线且运行环境不超过设备额定工作环境临界值,则可以从退化状态Ⅲ恢复到退化状态Ⅱ,如图2中路径⑦;或者进行更换元器件返厂维修之后,连续半个月运行状况良好,曲线均正常,还会从退化状态Ⅲ恢复到退化状态Ⅰ,如图2中路径⑧。
根据上述方法设计转辙机设备健康度评估的计算流程,为验证健康度评估算法的有效性,本文采用控制变量法,将取自现场环境下的转辙机各评估因子对设备健康度的影响进行了仿真分析。
1)转辙机设备正常工作下的健康度变化。试验中导入该设备连续600天内产生的动作曲线数据,共有1 393条。在日常的工作环境下进行试验,其中故障曲线有16条,属于设备使用过程中的偶然性故障,保持其他评估因子不变,设备产生的健康度曲线变化见图3(横轴表示运行天数,纵轴表示健康度值,图4、图5同)。从图3可以看到,当设备运行时,设备健康度随着设备的运行年限不断降低,并且仍有下降的趋势。
图3 转辙机设备正常工作下健康度变化
图4 恶劣天气影响下的转辙机设备健康度变化
图5 实时故障曲线影响下转辙机设备健康度变化
2)恶劣天气影响下转辙机设备的健康度变化。选取了连续600天没有发生故障的设备数据进行测试,确认该设备在某一段时间处在严寒环境下,另一时间段处在酷暑环境下,其中设备动作曲线数据共有1 375条,其健康度曲线变化见图4。由于本试验不包含故障曲线,设备运行在较为恶劣环境下时健康度会产生明显的下降趋势,设备的运行环境评分下降,最终导致设备综合健康度下降。之后,在模拟正常设备运行环境时,可以观察到设备的健康度在正常范围内波动,说明设备工作在恶劣工作环境之中,符合预期。
3)实时故障曲线影响下转辙机设备健康度变化。提取600天试验中设备动作曲线数据共1 495条,在正常的工作环境下进行试验,模拟了转辙机设备偶然发生的故障,设备健康度曲线变化见图5。
由试验数据看出,设备在短时间内连续产生多条故障的电气特性曲线时,健康度评估算法会判定设备进入了退化状态,此时,其实时电气特性曲线评估因子占比会提升,便于维修人员注意到设备发生了故障,对设备进行维修。维修后,设备在很长一段时间内工作正常,评估算法会判定设备由退化状态恢复到了正常状态,设备健康度分值提高,此时设备的实时电气特性曲线评估因子占比会下降。
经过仿真试验证明,本文提出的基于动态权值的转辙机健康度评估算法,能够较好地评估设备实时运行健康状态。
基于动态权值的转辙机健康度评估方法,可以准确地评估设备健康度;根据评估结果对维修活动的决策做出优化,可以提高设备管理工作的效率和质量。通过构建科学合理的设备状态综合评估模型,为电务设备检修、维护、管理等提供辅助决策支撑。