城轨信号系统电子设备故障预警与管理研究

2024-01-19 10:41:36梅,刘
铁道通信信号 2024年1期
关键词:特征参数报警预警

李 梅,刘 晓

目前《城市轨道交通CBTC 信号系统行业技术规范—需求规范》等规范对非期望紧急制动率、自动折返正确率、延误15 min 以上故障率、平均无故障时间等运营服务指标提出了要求[1]。虽然信号系统已经通过全生命周期的正向设计来减少故障,但是仍然存在对运营有重大影响的故障,如ATP 宕机、列车完整性丢失、ATP 模式丢失、紧急制动无法缓解、车门无法打开、车载设备重启不成功等。而且通常采取故障后维修的策略,具有一定的局限性,无法规避突发故障带来的线路连锁反应或者紧急事故的发生,也无法保证运营服务能力一直处于高水平。故迫切需要对列车ATP 宕机、列车完整性丢失等进行故障预警方面的研究,以预防发生对运营有重大影响的故障。

故障预警与管理在航空航天、核工业、船舶、汽车等行业已开展多项研究,文献[2]着重分析了机载系统健康管理传感器网络、鲁棒故障特征提取方法、分层聚类和交叉增强校核等智能故障诊断算法,以及基于数据驱动与物理失效相结合的故障预警算法等关键技术;文献[3]提出了一套具有航空装备特色的故障预警与健康管理数据体系架构;文献[4]基于历史数据和实时数据对多个深度置信网络模型进行训练,采用改进的遗传算法对深度置信网络模型组进行融合,提出一套适用于航空电子设备的故障预警方法;文献[5]基于自回归移动模型和神经网络进行了单脉冲雷达设备故障预警研究等。

目前,城市轨道交通信号行业也在逐步开展相关研究,如文献[6]对道岔转换设备、轨道电路、信号机等设备开展了故障预警与监控管理系统研究;文献[7]研究计算机联锁系统的寿命预测;文献[8]给出一种适用于列控车载设备故障预警的体系框架;文献[9]提出一种车载设备健康管理模式;文献[10]介绍基于故障预警与健康管理的高铁信号设备维护技术;文献[11]提出一种铁路机车车载设备数字孪生体的构建方法,实现实时驱动虚拟设备状态显示及设备运行状态分析等功能;文献[12]介绍一种基于双链路监测的地面应答器健康状态动态检测方法。总体看来,城市轨道交通信号系统故障预警技术还在不断的研究与探索中。

城市轨道交通信号系统主要由电子设备与软件构成,本文根据城市轨道交通信号系统运营服务能力要求与信号电子设备的故障模式特点,如文献[13]提到的阻抗、电压或电流无输出,或输出偏大、偏小等,构建适用于城轨信号系统电子设备的故障预警与管理框架,并对不同的故障预警给出相应的维修策略,减少影响运营的故障发生及突发故障引起的紧急事故,降低定期检查成本,提高城轨信号系统电子设备利用率。

1 常用故障预警方法

目前国内外有多种故障预警方法,如自回归模型预警技术、误差反传网络预警技术、基于最小二乘支持向量机的故障预警方法、基于历史数据的趋势分析故障预警方法、基于人工神经网络的故障预警方法等。总体上,故障预警方法可以分为3 类:基于故障历史概率分布的故障预警、基于系统模型的故障预警和基于数据驱动的故障预警。

1)基于故障历史概率分布的故障预警。适用于对故障历史数据进行统计,故障预警需假设故障分布是稳定的,根据设备故障时间,借助模型构建工具拟合其故障概率预测模型,一般产品或系统会服从威布尔分布,可以预测产品或系统的剩余寿命或者某一刻使用寿命下的可用性水平。

2)基于系统模型的故障预警。故障预警需建立符合实际的系统模型来获得系统正常运行时所期望的输出,通过判断模型的实际输出与模拟输出是否一致来预测报警。该方法能够深入研究预警对象本身的特性,实现实时故障预警,但对预测模型的准确度要求高,多应用于航空或机电系统,对于电子系统的预测模型研究相对滞后[14]。

3)基于数据驱动的故障预警。适用于预测对象数学模型建立困难的情况[15],不需要对研究对象建立数学模型,以采集的信息为基础,采用测试或在线检测技术,通过各种数据分析处理方法挖掘隐含信息并进行预测,可以克服基于系统模型故障预警技术的缺点,是目前较为实用的一种故障预警方法。但是在实际运营过程中获取设备的典型数据,如工作数据、故障数据等较困难,且数据也会有不确定性和不完整性。

2 故障预警与管理

2.1 故障预警与管理框架

基于历史数据、环境特征、电子设备失效机理、系统逻辑设计等方面,构建基于数据驱动和模型相结合的故障预警与管理框架,见图1。

图1 基于数据驱动和模型相结合的故障预警与管理框架

城轨信号系统电子设备的故障预警与管理框架主要包括输入数据、分析数据、确定故障预警机制和预警维修4个部分。

1)输入数据。包含导致运营延误的影响数据(图1 中项目管理影响运营数据)、现场故障数据(图1中客户关系管理CRM系统中故障数据、业务流程管理平台BPM 中故障数据、现场故障事件汇报平台数据)、日志数据、报警数据、设计数据(图1 中产品功能架构、逻辑与PCB 设计数据、研发经验)等。

2)分析数据。包含构建故障逻辑模型与确定特征参数、构建故障评估模型、确定故障事件与运行状态关系、构建耗损型组件预期寿命评估模型、确定环境影响因素等。

3)确定故障预警机制。包含故障特征参数误差、故障发生概率、耗损型组件预期寿命、环境参数等故障预警机制,并嵌入运维系统。其中确定环境因素是综合了现场故障数据分析与研发团队的经验。

4)预警维修。确定故障模式清单、预警故障模式与维修措施清单,并嵌入到运维系统中,确保在发生故障预警时能给出建议的维修措施。

故障预警机制采用预测时间内的增量是否超阈值的方式进行确定,例如在规定的预测时间内预先设定一个阈值,当实际监测的值大于该阈值,且大于的次数超过预先设定的次数时,则触发预警机制,并给出对应的维修措施。同时,故障预警应与实际是否发生故障进行比较,如果系统产生预警,但是实际没有发生,应考虑调整故障预警机制;如果系统产生预警,且实际系统也存在故障,则可考虑在其他特定应用项目中应用此故障预警机制。

2.2 构建故障逻辑模型与确定故障特征参数

2.2.1 确定运营延误故障模式

从年度项目管理影响运营数据单中选取对运营有较大影响的现场故障模式作为研究对象,如列车ATP 宕机、列车完整性丢失、ATP 模式丢失、紧急制动无法缓解、车门无法打开、车载重启不成功等故障,对故障相关数据进行收集。

2.2.2 构建故障逻辑模型

通过与设计沟通,采用基于模型的可靠性系统工程技术,以及故障传递关系图或故障树等工具,逆向分析信号系统中导致列车ATP 宕机、列车完整性丢失等故障的电子设备故障原因和故障机理。如紧急制动无法缓解故障原因与故障机理分析示例见图2。

图2 紧急制动无法解除故障原因与故障机理分析示例

2.2.3 提取与修正故障特征参数

根据故障逻辑模型,找到故障发生的根本原因及关联的特征参数。故障特征参数包括阻抗、电流、电压等,选择提取故障特征参数的算法,在运维系统中嵌入特征参数阈值曲线,用于故障预警判断。当设备运行时的特征参数阈值超出阈值曲线时,则给出预警与建议性的维修措施。

2.3 构建故障评估模型

通过对导致ATP 宕机等故障原因的分析,结合现场故障数据与设计数据,构建关键设备故障评估模型。在不满足线性回归时,可应用X-秩回归(RRX)或极大似然法建立累积故障概率模型,如2参weibull模型

式中:F(t)为累积故障概率;β为形状参数;η为尺度参数;t为工作时间。

例如收集某一线路同类型的78 个设备,根据设备现场运行45 048 h(为现场故障数据导出日期减去设备投入运营日期)的故障数据信息,分别计算78 个设备的累积运行时间,见表1。根据在45 048 h 内设备是否发生故障将设备状态区分为F(设备发生故障)和S(设备在截止到故障数据导出日期时还未发生故障)。状态为F 的设备累积运行时间等于此设备发生故障的日期减去设备投入运营日期;状态为S的设备累积运行时间等于现场故障数据导出日期减去设备投入运营日期。表1 中累积运行时间为设备无故障运行时间。

表1 设备累积运行时间

将表1导入reliasoft工具(一款可靠性分析工具,支持所有的寿命数据类型和常用的寿命数据统计分布模型),选择数据类型、环境参数如温度或湿度、初始化参数模型等,则可得到此设备目前故障数据下的拟合故障评估模型为

根据模型可以预测此设备在t时刻发生故障的概率。可设定故障发生概率增量指标作为主动维修条件,当单位时间内故障发生概率增量超过设定的阈值,且超过预先设定的次数时,给出报警。将确定的故障评估模型嵌入运维系统中,故障评估模型构建流程见图3。

图3 故障评估模型构建流程

2.4 确定环境影响因素

根据现场数据与设计数据,确定参与故障预警管理的环境,如温度、湿度、盐雾、灰尘等,并根据是否有防尘、散热等设计数据,确定环境因素的优、良、中等级,并赋予不同的权重。

2.5 确定故障事件与运行状态关系

通过现场维护台收集故障日志信息,并确定故障事件与状态之间的关系。日志数据中一般都包含可能出现的故障信息、大量的相关状态量字段,能够描述故障时刻的列车运行状态及列车防护相关的一些动作状态信息。例如,一个故障事件的发生肯定是某个特征参数发生了异常,但是此时的故障事件还不足以引发报警,在随后的某一时刻该故障事件又引发了另一个故障事件的发生,从而引起报警并可能导致列车ATP 宕机。因此,通过收集大量日志数据样本,以数据驱动方式建立故障与状态特征参数之间的关联模型,通过梳理故障事件之间的关联,确定状态特征参数与报警故障事件的关系,能够在故障事件演化的早期通过主动检查维修避免发生列车ATP宕机、列车完整性丢失等故障。

例如,某产品在板卡设计中对发热高或者关键的组件布置温度传感器,设计1 级温度报警和2 级温度报警(传统设计一般只有1 级报警,然后系统直接宕机,严重影响系统可用性),并定义1 级报警的严重度高于2 级报警。在系统温度达到2 级温度报警阈值,但还未到达1 级报警阈值时,在运维系统给出2 级报警,提示维保人员注意,并检查或者维修温度高的设备。

2.6 构建耗损型组件预期寿命评估模型

耗损型组件预期寿命评估模型构建流程见图4。

图4 耗损型组件预期寿命评估模型构建流程

根据现场数据和设计数据筛选出关键设备失效机理为耗损型的组件,如继电器、控制门的开关、液态铝电解质电容器件、Flash、LED及接插件等,结合经验与实际应用情况确定其预期寿命评估模型,并嵌入运维系统中,如继电器或者开关的预期寿命模型为

式中:L为剩余预期寿命;nr为降额后的循环次数;na为应用中每小时使用的循环次数;t为监测到的设备累积运行时间。

2.7 确定故障预警与维修措施关系

首先确定故障模式清单,结合各平台中的现场故障维修采取的措施与建议,确定预警故障模式与维修措施清单,从而建立故障模式与维修措施之间的对应关系,并嵌入到运维系统中,确保在发生故障预警的同时能给出建议的维修措施。故障预警与维修措施关系建立过程见图5。

图5 故障预警与维修措施关系建立过程

3 结论及建议

为了保证运营服务水平,避免ATP 宕机或者线路级故障的发生,对城轨信号电子设备的故障预警与管理研究越来越受到关注。本文以现场故障、报警、日志、设计等输入数据为出发点,对现场故障原因、故障特征参数、故障事件与运行状态之间的关系,以及耗损型组件的预期寿命分析等方面进行探索,确定故障预警与管理的关键因素,进而给出建议性的故障预警维修措施,从而构建了一套适用于城轨信号系统电子设备的故障预警与管理框架,可为制定故障的主动维修策略提供依据。在研究过程中,遇到了一些困难与挑战,如故障特征参数的选取需要复杂的数据分析来支撑,对数据样本量、数据处理等有较高的要求;在构建故障评估模型时,会面临拟合的模型是否准确,能否反映现场故障发生的真实情况等问题。另外,在确定哪些关键因素能更真实地反映设备的健康状态也是一个难点。

因此提出以下建议:①对于模拟电路,应对故障影响严重的特征参数进行筛选,选择适当的特征参数作为趋势监控对象;②对于数字电路,应对故障影响严重的电子器件或者电路模块考虑周期性自检测设计,从而能在故障事件的远端进行监控,为故障预警与主动维修提供可能;③可开展器件级或者电路模块级的退化、老化失效机理的分析;④对于监控报警的故障模式应提供可能的故障原因,并根据同类原则提供有效的维修方法。

猜你喜欢
特征参数报警预警
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
法国发布高温预警 严阵以待备战“史上最热周”
今日农业(2019年12期)2019-08-13 00:50:02
LKD2-HS型列控中心驱采不一致报警处理
园林有害生物预警与可持续控制
现代园艺(2017年22期)2018-01-19 05:07:01
基于PSO-VMD的齿轮特征参数提取方法研究
2015款奔驰E180车安全气囊报警
机载预警雷达对IFF 的干扰分析
死于密室的租住者
统计特征参数及多分类SVM的局部放电类型识别
电测与仪表(2015年7期)2015-04-09 11:40:04