城轨车辆电子板件衰变检测及健康管理方式探索

2021-03-01 02:46帅,卢勇,张
机电工程技术 2021年1期
关键词:电解电容电源板板件

谢 帅,卢 勇,张 栋

(广州地铁集团有限公司,广州 510310)

0 引言

电子板件性能直接影响城轨车辆的正线运营质量,而随着长期使用,伴随板件上电容、电感、电阻、MOS 管、光耦、二极管等元件性能也会逐渐衰变,这些电路基本元件衰变都会对电路整体性能造成影响,导致电路衰变,严重的甚至导致电路失效。

目前城轨车辆电子板件基本采用故障更换的方式。当设备发生故障,失去正常运行功能后,对其进行维修,该维护阶段简单原始、采购成本低,但是极易导致城轨车辆的正线故障,是引起车辆重大晚点事故的主要原因。根据广州地铁城轨运维管理系统中2018 年的数据,由于电子板件故障导致的车辆3 min以上的晚点故障为总故障的65%,而对于电子板件老化现象较为严重的广州地铁一号线,故障占比更是高达90%,目前的故障维护已经不能满足实际的使用需求。因此,若能在电子板件性能衰变初期,还未对车辆系统造成重大危害时,根据一些监测手段及时预测产品的剩余寿命,制定相应的系统运行维护策略,具有非常现实意义。

近年来,故障预测和健康管理(Prognostic and Health Management,PHM)方法得到广泛运用和推广,包括航空航天、通讯、电子设备、机械制造等行业,PHM 在降低维修保障费用、减少维修次数、降低故障发生风险方面有着良好的运用[1]。目前,关于电子板件性能衰变的研究方法可以按照基于模型的方法和基于数据的方法分为2 类:基于模型的电子板件性能衰变研究方法通过建立电路拓扑结构,实现对电路性能衰变的分析;结合数据驱动方法,利用少量衰变数据预测未来数据,从而实现对电路性能衰减分析[2]。由于城轨车辆电子板件数量多、结构复杂、影响因素多,利用数据驱动的方法,通过对产品的失效时间进行统计分析和特征量提取,根据数据的经验建模方法,预测得出电子板件的剩余寿命。

1 数据驱动PHM方法

目前关于电子板件寿命预测的方法大致分为2类,即基于失效物理(Physics of Failure,PoF)方法和基于数据驱动(Data Driven,DD)方法[2]。基于失效物理的方法在产品失效机理的基础上进行建模分析,往往较为复杂,对改善城轨车辆现场维护而言,很难开展卓有成效的研究和获取较高的实际价值;而基于数据驱动的方法仅仅对产品的失效时间进行统计分析,实际上是一种依赖于数据的经验建模方法,对于分析复杂、条件有限的现场而言,基于数据驱动的寿命预测方法是不错的选择。本文将对数据驱动PHM 的运用流程做介绍,并结合生产实际,对运用过程中的重点和难点加以归纳。

1.1 对象选择

根据城轨车辆电子板件的故障影响大小和故障率大小2个维度绘制四象限分解图,如图1所示。

图1 故障维修模式

针对第一象限故障率高、故障影响大的板件,宜采用预防性维修或者改善板件设计等维护方式,如电压传感器、速度传感器等;针对第三象限故障率低、故障影响小的板件,采用事后故障维修模式(RM)可最大化地平衡安全与成本的关系,如牵引控制单元(DCU)板件、空调控制板件;针对第四象限故障率高、故障影响小的宜采用事后故障维修或者预防性维修(PM)方式,可以从维修成本和减少故障处理时间次数等2个维度考虑,如客室灯管、镇流器、头灯、尾灯等。

较之于RM 和PM 维护方式,PHM 一般用于结构较为复杂、发生频率不高,一旦发生影响很大的电子板件,即位于第二象限的部件,如城轨车辆系统中电子制动单元(ECU)电子板件、中央控制单元(VCU)电子板件等。这类板件往往采购价格很高,因此不适合PM 维修模式;但为了保证板件的可靠性,一旦发生故障将导致严重的后果,因此RM维修模式也不适用;PHM 基于对电子板件的剩余寿命预测,采取能有效降低板件发生系统性故障的手段,既能降低采购成本,又能有效提高系统的可靠性。

1.2 状态监测和数据收集

对于目前大多数城轨车辆电子板件的状态检查维修通常有以下3种:外观检查法、无电电阻值测量法、有电电压及波形测量法[3]。但对于未发生系统性损坏或者宕机的电子板件,通常的方式往往无法做出状态评判,随着科学技术的发展、维修经验的积累和维修大数据的运用,越来越多的手段可以被利用来实现电子板件衰变检测的状态评估。

1.2.1 故障分析和在线监测

城市轨道交通车辆电子板件在出厂生产时,通常为批量化的产品,在原料来源、生产加工工艺、存放环境等方面存在诸多的一致性,因此产品的运用状态、使用寿命、衰变程度都有着一定的相似性。在电子板件批量出现原件衰变前,状态更差一些的板件会有一定的故障表现和参数畸变,这些为研究电子板件的衰变提供了很好的参考依据和警示作用。

2012 年广州地铁A1 型车GTO 门控板故障有5起,但到2013年就多达了23起,对正线的行车造成了较大的影响,而且故障表现基本都可以归结为GTO 门控板的发光二极管功率衰变下降。如果2012年能够及时从5起故障中深入分析故障原因,并采取更换发光二极管的措施,则可有效提高列车的运用效能。因此对故障的有效分析是状态维护管理的良好手段。

而对于电子板件出现的瞬时故障,采用在线监测的手段可有效捕捉故障时刻的相关数字、模拟量,对电子板件的参数畸变分析也大有裨益。2015年广州地铁一号线出现了多起A1 型车在开门后出现溜车的故障,而这些故障极有可能造成客伤事件,最终通过利用多通道示波器在线监测的方法,成功捕捉到了在列车快停稳施加保压阶段,DCU(牵引控制单元)板件板载继电器异常无法断开,导致列车停稳自动开门后仍有保压制动缓解信号给出,造成列车溜车[4],并在后续展开的调查中发现DCU的板载K7继电器存在普遍性能衰变的问题。

1.2.2 维修数据运用

利用电子板件更换维修记录,结合电路结构原理,为电子板件衰变元件的筛选提供了有效的途径。对于电子板件的衰变,必然伴随着越来越多的故障,通过对故障数据的完善利用,对于判断电子板件的故障原因和开展健康管理具有非常重要的作用,随着故障统计数据的增加,电子板件的部件故障的统计分类也越来越具有价值和必要性。

1.2.3 电子板件关键数据测试

电子板件在使用过程中,存在电场、辐射、温度等应力,导致板件中的各个基本电路元件也会随时间发生衰变。在城轨车辆维修车间,在没有专业检测设备和大量计算仿真分析的条件下,电子板件的衰变检测可以使用以下几种方法。

(1)利用示波器、万用表等设备对电路中关键节点位置初态电压、电流值幅值,电压、电流上升率等参数,并与新板件对比测量,寻找差异性。其中,关键节点位置可根据电路结构,重点对无源元件三极管、功率MOS 管、变压器,有源元件芯片输入输出位置等加以测量确定。

(2)利用红外温度测试仪、功率测试仪、诊断测试仪、示波器等设备对电路中关键节点位置稳态温升、纹波电压、功率、通讯频率等参数进行对比测量,对于温度、电流上升率等参数异常的板件进行筛选鉴别。测试过程中应尽可能地达到满载的测试条件,以尽可能地满足对于正线工况的模拟。

(3)利用万用表、LCR 测试仪等对存在外观、发热量或回路电压、电流值异常的回路元件进行进一步的测试。而常见的衰变元件包括电解电容、薄膜电阻、MOSFET、三极管、光耦等。

1.3 特征识别和选择

特征识别是指基于对城轨电子板件的监测和分析,从状态监测数据和事件分析数据中识别出可能与电子板件健康状态相关的特征。性能变量识别方法主要通过对单个或多个状态监测变量进行,采用多种分析方法得到与电子板件元件衰变或故障相关的特征,并将此特征用于故障诊断或预测。

在电子板件衰变检测的实际运用中,结合电路原理图,在状态监测和数据收集的基础上,对电子板件电路的相关节点对比测量,识别出特征值异常的回路和元件。特征值异常的识别应建立在对板件电路结构原理掌握的基础之上,如在电压前级输入部分,重点电压幅值、电压上升率、电压纹波等判断电压输入前级的滤波质量;在隔离转换部分,重点对元件温度、电压纹波及响应时间等重点识别;在芯片输出或变压输出部分,重点对电压输出的零点漂移、输出幅值等重点关注。特征识别和选择同样可通过维修数据的运用,筛选出关联度较高的部件进行参数测试,再通过试验的方式进一步确认异常特征量。

1.4 特征融合

特征融合的意义在于通过统计数据,将同类电子板件衰变做特征异常量的归纳,发现电子板件的最小公约的故障原因,有针对性地开展健康管理,这样既能更明确地确认电子板件系统衰变原因,又能将维护的成本和风险降到最低。

特征值的识别和选择为特征的融合提供了依据,再通过对同类电子板件基本状态的整理,如批次、使用时间、使用环境等,将具有广泛性的异常特征量进行融合,从而确定引起电子板件系统衰变的元件。

1.5 剩余寿命预测

在研究城轨车辆电子板件故障预测之前,需要对电子板件的衰变效应做一定的阐述。

有研究证明,在电路的使用过程中,衰变效应是一个影响电路使用寿命并且是不可避免的效应。在电子板件数字电路和模拟电路这两部分中,由于模拟电路具有模拟量输出抗干扰能力弱、随时间连续变化等特点,使其成为了对电子系统衰变影响较大的部分[5]。城轨车辆电子板件在长期运行中,由于工作时间长和电气柜密封条件不良、温度湿度变化大等外部环境影响,导致性能的逐渐衰变,对于模拟电路来说,电路中基本元件衰变是造成电路性能衰变的主要原因。表1 所示为电子板件中典型的元件以及对应的衰变指标。

表1 电子板件典型的组成部件及对应的性能衰变主要指标

城轨车辆电子板件中电阻、电容、MOSFET、二极管等器件大量使用,大量的研究表明,在典型工作条件下,由元件故障导致电路故障的主要为电解电容、薄膜电阻,MOSFET故障。在实际运用中,对电路中上述主要元器件做失效分析,进而进行故障预测是PHM的一个重要环节。

1.5.1 电解电容失效分析及剩余寿命预测

电解电容的阳极金属氧化膜部分是影响其性能的主要部分。城轨电子板件中多以铝电解电容故障为主,本文以此为分析对象,其等效电路模型如图2所示,在其工作过程中,阳极金属氧化膜会因发生化学反应而不断增厚,等效串联电阻由于其变厚而增大,严重的情况下,电解电容会发生击穿或者功能丧失。其主要表现为电容值C 的减小和等效电阻值RESR值的增大。

图2 铝电解电容简化等效电路模型

根据运用较为广泛的电解电容的衰变模型[6],如式(1)所示:

式中:r 为衰变速率;A 为相关系数;E 为激活能;k为波耳兹曼常数;T为工作时的热力学温度。

由于铝电解电容通常在电路中起着储能和滤波的作用,其工作频率较低,进而在核温为T 时,t 时刻的RESR(t)与其初始值RESR(0)近似关系如式(2)所示:

式中:k 为常数,由电容的材料结构参数决定。

不同的文献中对应着不同的电解电容失效判据。参考关于电解电容失效判据[7-9],结合城轨车辆电子板件的长时间使用、可靠性要求高等特点,综合分析,本文以RESR增大为初始值的2.8 倍或者电容值减小为初始值的80%作为电解电容器的失效判据。根据式(1)的衰变关系,结合RESR的阀值便可得电解电容的剩余寿命。

1.5.2 薄膜电阻失效分析及剩余寿命预测

金属薄膜电阻器的失效模式主要有开路、短路和阻值异常。引起金属薄膜电阻衰变的原因包括材料的结构变化、电阻氧化、腐蚀、焊脚接触不良等[10]。工作环境温度与使用时间是造成金属薄膜电阻器发生衰变的主要因素,其衰变模型可以描述为[11]:

式中:R0为电阻的初始值;为电阻在t 时刻的衰变率;α 为常数;T 为工作时的热力学温度;Eα为激活能;k为波尔兹曼常数,k=8.617×10-5eV/K。

通过对薄膜电阻衰变机理分析,薄膜电阻常表现为随着工作时间增加,其阻值会不断增大。在实际运用中,针对确定的薄膜电阻型号,通过使用的环境温度值和电阻变化值的运用计算,即可预测薄膜电阻的剩余寿命。

1.5.3 MOSFET失效分析及剩余寿命预测

MOSFET在城轨车辆电子板件故障中占有很大的比例,其性能衰变失效将直接影响电路工作效率、温升指标和技术性能,本文将以运用较为广泛的VD⁃MOSFET 为讨论对象。VDMOS 的封装焊接层疲劳被认为是一种主要失效模式,其可等效为理想开关和导通电阻的串联形式,并且可以把导通电阻分为6个部分[12]:

式中:Rs为源区串联电阻;Rch为沟道电阻;Racc为积累层电阻;RJ为相邻两P 阱间的电阻;RN+为N+层的导通电阻;Repi为高阻外延层电阻。

导通电阻增量的经验衰变模型为:

式中:t 为VDMOS 的工作时间;a、b 为衰变模型参数。

因此,将导通电阻Rw作为反映VDMOS 衰变程度的特征参数,依据加速实验结果,结合城轨车辆对电子板件可靠性的需求,以Rw超过0.045 Ω作为VDMOS 的失效判据[13]。实际运用中,根据对应型号MOSFET 的寿命曲线,结合Rw实际测量过程中与阈值的对应关系,便可得出MOSFET的剩余寿命。

1.6 健康管理

电子板件上元器件剩余寿命的预测结果,可作为电子板件是否会发生功能性故障的重要依据,然而现今国内外对电子板件元件衰退致使系统性失效问题尚没有较为确定的评估方法,而基于电子板件的失效物理分析对于分析元件与系统的关系仍存在大量的不确定性问题。因此对于电子板件的维护而言,电子板件其元件状态的故障预测对于板件是否会发生系统性故障预测也并非一成不变。数据驱动的健康管理方式正好能有效平衡技术瓶颈所带来的技术与维护成本之间的关系。

电子板件健康管理的核心目的为降本、增效,决策过程中应充分考虑元器件故障预测结果、电子板件功能性故障历史频率及后果、电子板件元器件更换成本、电子板件整体更换成本及后期维护成本等项点,给出对应维护、维修的决策建议,或对维护、维修进行动态地调整和优化建模等。

图3 电源板前级电压输入回路

2 数据驱动PHM实例

以广州地铁A1 型车制动系统电源板为例,以实例方式介绍数据驱动PHM的运用。

A1 型车ECU(制动控制单元)电源板负责单节车ECU 板件、紧急电磁阀等部件的供电,该电源板为多路不同电压等级输入电源,结构设计复杂,且已持续使用超过20 年,内部元件老化现象严重。ECU 电源板一旦正线发生故障,司机需切除对应车辆的2个B09,造成列车清客和重大晚点,严重影响运营,加之备件紧缺、采购困难、板件老化严重,因此对该板进行故障预测和健康管理具有重要意义和现实价值。

统计从2015年至今共计送修30块制动系统电源板,核查维修记录,返修板件已查明原因的共计24块,其故障点较为分散,如表2所示。

表2 广州地铁A1型车ECU电源板部件故障及次数

根据电路结构,对故障的原因做进一步归类分析,故障次数较多的启动MOS 管(V10),JT1 小板,JT5小板均集中在+110 V电压输入回路或启动MOS管(V10)直接输出回路,从而确定对该电子板件的元件衰变检测重点放在+110 V 前级电压输入回路内,为制动系统电源板的隐患降低和健康管理提供了较好的方向指引。

结合电路结构图,80%以上已查明故障原因的元件都位于DC+110 V输入及邻近电路。利用示波器对比测量V10输入电压,旧板件明显比新板件电压上升率快,电压纹波明显。如图4所示。

图4 新旧电源板前级电压输入电压特征对比

利用热成像仪,故障较多的元件恰恰温度普遍偏高,且对比板件温升的差异,明显有些板件温升过快。如图5所示。

图5 故障电源板温度特征

进一步检查,V10MOS管、JT1板、JT5板损坏故障原因为输入电容异常导致。电源输入级的C5、C6损耗值增加,更换后充电时间增加了55%;C12,C13电容损耗值增加,更换后电压稳定性大幅提高。

经过对另外5块故障的ECU电源板温升检测,都存在空载工作15 min 后比新板温度高至少5~10℃,输入电压缓冲时间短80%,电压纹波明显等特征。更换C5、C16、C12、C13 电容后与新件测量值基本相同。

抽取列车正在运用的5 块A1 型车制动系统电源板做研究,对其电解电容C5、C6、C12、C13 做预测和评估,其衰变规律符合式(2),测试结果如表3所示。

表3 新旧板件C12、C13关键参数测量值

其中,以新件等效电阻RESR作为初始值RESR(0),RESR(t)衰变为初始值的80%作为阀值。

结果表明:50%的电解电容RESR衰变量超过阀值,80%的衰变量超过阀值的90%,100%的衰变量超过阀值的80%。A1 型车制动系统电源板大部分使用时间已超过20 年,如不改善,很可能导致电源板故障爆发,而实际中2018年的A1型车制动电源板故障数量也环比2017年大幅上涨80%。

根据故障预测的结果,同时由于制动系统电源板故障后影响大,考虑到制动系统3年后将全面升级改造、人力成本、维修风险等,采取了以下措施。

(1)第一阶段。利用热成像仪温度异常检测的方式,立即开展既有车辆制动电源板普查整改工作。考虑到备件数量、采购周期及工作量等因素,对板件中温度存在异常的,电解电容C5、C6、C12、C13全部更换,第一阶段共发现14块电源板存在温度异常过高的现象,故障占比11%,经整改后,未再出现过制动系统电源板故障。

(2)第二阶段。根据对电容可靠性模型及可靠性平台仿真分析,故障率将一直呈现故障高发态势,因此待采购的备件到货后,对所有A1 型车制动系统电源板电解电容C5、C6、C12、C13全部更换。

通过对A1 型车制动系统电源板的衰变检测及健康管理,达到了用较小的成本大幅提升车辆制动系统可靠性的目标。

3 结束语

随着城轨车辆电子板件的长期使用,电子板老化、元件性能下降问题逐渐突显,电子板件故障频次越来越高,对正线运营秩序影响较大,尤其是制动、控制、诊断等电子板件一旦发生故障,将导致车辆晚点或救援等故障。目前行业内无相关的理论实践的系统管理体系,通过对关键典型电路板件的衰变规律的检测分析,提出基于电子元器件性能衰变检测的预防性检测维修体系并实践,从而实现对电子板件故障的提前预防,提升地铁正线运行的可靠性。

目前,数据驱动PHM 总体研究框架下的各个行业领域均有良好的推广,同时也面临许多现实的挑战。城轨车辆电子板件的PHM 运用目前仍处在探索阶段,检测手段和系统寿命评估仍有很大的空间进一步完善,但随着近年来中国城市轨道交通事业的蓬勃发展,车辆设备可靠性和维护成本之间关系如果通过技术和流程优化的手段加以简化,必将为管理决策提供有力的支持,最终实现降本、增效的维护策略。

猜你喜欢
电解电容电源板板件
基于车身板件定位切割焊接装置的设计
电解电容对微机保护开关电源寿命影响及其优化策略
Rotork电动执行器板件深度解析和故障维护
基于动态择优组合的板材切割下料算法
亚太区11W和15WLED灯驱动器的设计及其改进
基于CPLD的电源板性能检测系统优化论述
一种小电容交-直-交变频器控制策略
矩形钢管截面延性等级和板件宽厚比相关关系
无电解电容的LED驱动电源研究
DF100A型发射机马达电源板改进