张明明,张和生,刘 洋,沈 迪,袁东辉
(1.北京交通大学 电气工程学院,北京 100044,2.中车长春轨道客车股份有限公司,长春 130062)
2017年6月26日,“复兴号”动车组首发,目前已有大量车组在线运行.动车组的设计寿命为30年,目前处于早期阶段.从动车组实际运用检修数据[1]分析其分布特点,估计早期故障率对其检修和运营维护具有实际意义.本文的电机组包括牵引电机、冷却风机及相关传感器,是动车组的动力单元.故障率是指在统计的走行千米或时间内,一台或多台机车车辆发生故障的次数与累计走行千米或工作时间之比[2].故障率估计需要分析故障并建立相关模型,利用定性和定量方法进行估计.常用方法包括可靠性框图、故障树模型[3]、贝叶斯网络[4]、Markov模型和蒙特卡罗仿真等.
现有动车组故障数据主要用于故障诊断和可靠性评估,较少用于故障率估计.文献[5]对武广线信号系统车载设备故障文本数据使用贝叶斯网络进行故障分类.文献[6]对CRHX型动车组的牵引系统故障数据,采用FP-Growth算法研究设备间的关联失效关系.文献[7-8]结合现场数据,验证动车组的整车可靠性符合指数分布,给出动车组百万千米故障率的定义及计算式.文献[9]给出马尔科夫模型在磁通切换电机系统的应用,但求解过程复杂[10].文献[11]建立电动汽车电机的故障树模型来估计故障率.文献[12]利用扩展有色Petri网中的故障树来降低列车头尾碰撞的风险.文献[13]基于列车网络控制管理系统(TCMS)的历史故障数据,利用动态故障树模型与贝叶斯网络综合的方法,实现对TCMS系统的后验概率估计.
故障树模型是故障模式分析常用方法,可揭示故障致因;贝叶斯网络能够反向推理,可得到故障致因发生的可能性,适用于动车组这样复杂机电设备的故障特点分析.
本文作者基于复兴号动车组早期故障数据,从整体故障、故障类型和高频故障致因三方面分析故障分布特点,建立故障树模型,估计整体故障率,利用贝叶斯网络估计后验概率.论文结果对复兴号动车电机组运用维修、产品设计优化或器件选型具有参考意义.
数据来自复兴号动车组实际运用的故障数据,时间为2017年6月19日至2019年6月9日.
1.2.1 故障的整体分布
根据电机组早期故障数据,研究其在100万km内故障数据整体分布.
故障里程是指发生故障时的里程,将其按从小到大排序,各序号与总故障次数的比值为累计故障频率.整体故障里程与累计故障频率的关系曲线如图1所示.由图1可知,在30万km之前,曲线呈渐缓增长型,该区间的故障占到总故障61.36%,40万km之后曲线近似为一条直线.
图1 故障整体的累计故障频率
(1)
电机组的平均故障里程为34.65万km,说明电机组故障是动车组易发故障,且发生电机组故障的车组占样本车组总数的51.02%.
1.2.2 故障的分类及故障类型分布
通过对故障数据分析,电机组有14种常见早期故障,按照故障位置或故障原因可归为4类,如表1所示.
表1 电机组故障类型划分
由表1可知,冷却风机故障达到了69.32%,而电机本体故障只占2.27%.说明冷却风机故障是动车电机组早期的主要故障类型.
分别绘制电机组四类故障的故障里程与累计故障频率的关系曲线,如图2所示.
图2 四类故障的累计故障频率
由图2可知,有50%的电机本体故障在21.5万km内;65.57%的冷却风机故障在30万km内;53.85%的传感器故障在8.6万~15.2万km.四类故障的平均故障里程分别为43.7万km、33.4万km、31万km和43.7万km.
1.2.3 高频故障致因分析
表1的14种故障现象中:电机空转、速度传感器故障和通风机故障能够找出故障致因;对于原因不明确的冷却风机故障、软件缺陷致风机故障和误报风机故障,根据故障的不同表现划分,作为其故障致因;其他8种故障现象无需细分.
经分析高频故障致因有5种,绘制其故障里程与累计故障频率的关系曲线,如图3所示.
图3 五种高频故障致因的累计故障频率
由图3可知,风机接触器不动作主要集中在13万~29.5万km和72万~84.5万km,分别占同种故障致因的36.84%和31.58%;接线盒故障主要集中在14.5万~19.6万km,占同种故障致因的83.33%;风机全速故障全部发生在2.5万~13.5万km;有50%的温度传感器故障发生在8.6万~15.2万km;电机有异物故障均等分布在1.9万~2.6万km、22万~29.1万km、65万~66.5万km.
复兴号电机组早期故障主要有以下特点:
1)从故障整体来看,电机组故障的平均故障里程为34.65万km,30万km之前的故障占总故障的61.36%.
2)从故障类型来看,电机本体故障仅占2.27%;而冷却风机故障占比高达69.32%;说明早期故障中,冷却风机故障是主要故障类型.
3)5种高频故障致因集中分布在某些区间,根据其分布特点,制定合理的维修方案.
为了估计电机组整体故障率,需先建立电机组的故障树模型.
故障树由顶事件、中间事件、底事件以及逻辑符号组成,没有子节点的节点就是底事件[14];相邻两级事件间存在“与”、“或”、“非”等逻辑关系.故障树定性分析主要是求解最小割集,常用方法有上行法、下行法和质数法[15].最小割集表示系统的危险性,每个最小割集代表一种顶事件可能的故障模式.
通过故障树定量计算估计顶事件的故障率,明确基本事件的故障率,根据相邻两级的关系估计上一级的故障率,逐级向上估计顶事件的故障率.假设某故障树底事件的个数为K,它们的故障率分别为λk(k=1,2,…,K).
当相邻两级事件均为“与”逻辑关系时,顶事件的故障率λ(T)为
(2)
当相邻两级事件均为“或”逻辑关系时,顶事件的故障率λ(T)为
(3)
将电机组故障作为顶事件、4类故障作为中间事件、故障诱因作为底事件,建立电机组的故障树模型.由于4类故障之间不存在耦合关系,因此构成‘或’的逻辑关系.以此逐级向下类推,建立如图4所示的电机组故障树模型,图4中事件与名称对应如表2所示.
表2 故障树事件与名称对照表
利用布尔代数化简法,按照‘与’逻辑关系用‘·’号代替;‘或’逻辑关系用‘+’号代替的原则.经计算图4中的故障树总共有27个最小割集,表明电机组有27种故障模式,说明电机组是一个易失效的系统.
估计电机组整体故障率,首先估计底事件的故障率,由文献[3]平均故障率的定义可知
(4)
式中:Xm表示底事件的故障频次;L表示总走行里程.故障数据中截止日期为2019年6月9日(记为td),因此总走行里程是指所有车组到截止日期走行里程的总和.单个车组到截止日期时的走行里程的估计算法为
步骤1 假设第j组车组的最早故障日期tj1和故障里程Lj1;最后故障日期tj2和故障里程Lj2;
步骤2 两次故障日期的时间间隔tj12=(tj2-tj1)和故障里程间隔Lj12=(Lj2-Lj1);
步骤4td与tj2的间隔tj2d=(td-tj2);
依次估计所有车组到截止日期的走行里程,其走行里程的累加和为总走行里程L.经计算,L=66 836 556 km.由式(4)可估计各个底事件的故障率.
如对事件X1、M1、H1的故障率估计
(5)
顶事件的故障率估计为
(6)
由复兴号动车组电机组的故障树模型求得各事件故障率(单位为×10-6次/km),如表3所示.通过定性分析得到电机组故障树的27个最小割集,说明电机组早期有27种常见的故障模式.通过定量计算,估计电机组的整体故障率为1.319×10-6次/km.对比CRHX动车电机组中期的整体故障率0.467 5×10-6次/km,说明复兴号电机组早期的可靠性水平相对偏低.可根据故障树的结果制定合理的维修计划.
表3 电机组各事件故障率
为实际检修中对电机组故障的快速定位提供理论基础,将其故障树模型转化为贝叶斯网络,利用反向推理估计各节点的后验概率.
3.1.1 贝叶斯理论
贝叶斯网络是一个有向无环图,系统的多个非独立的变量可映射成贝叶斯网络,各变量映射为贝叶斯网络中的节点,变量之间的关系映射为网络的边.贝叶斯网络的边指出的节点为根节点(或父节点),指向的节点为叶节点(或子节点).贝叶斯网络的优点在于将每个变量的概率只同其父节点相关联[16],其反向推理也称诊断推理,在系统故障条件下,可以得到节点故障的概率[17].叶节点与根节点之间的关联强度可用一个概率值表示.
已知B1,B2,…,By,…,BY构成一个完备事件组S,满足
(7)
事件A和By相交,且满足∃y∈[1,Y],使得A∩By≠∅,由全概率公式可得
(8)
由条件概率公式可推出贝叶斯公式为
P(B)P(A|B)=P(A)P(B|A)
(9)
P(B|A)=P(B)P(A|B)/P(A)
(10)
由式(8)和式(10),可得贝叶斯公式为
(11)
3.1.2 故障树的贝叶斯网络化
贝叶斯网络两大要素分别为结点和联接强度,将它们分别对应故障树的事件和逻辑门[18].故障树中‘与’、‘或’、‘非’门向贝叶斯网络的转化如图5所示.
图5 几种逻辑的贝叶斯转化
故障树模型转为贝叶斯网络,如图6所示.
图6 电机组贝叶斯网络
故障树模型估计的结果作为贝叶斯网络各节点的概率;将具有连接关系的相邻节点故障频次的比值作为连接强度.利用贝叶斯网络的反向推理,求各节点的后验概率.
由贝叶斯公式(10)求H2、M2、Y1、X6的后验概率为
(12)
同理,可求其他节点的后验概率.
求得各个叶节点的后验概率如表4所示.
表4 贝叶斯网络的各节点的后验故障概率
对比表4和表3可知,在电机组发生故障时,事件X7、X12、X13和X14相较事件X10、X21和X25发生故障的可能性大,以此对其他事件的可能性排序.因此在电机组的检修工作中,可依据贝叶斯网络的结果排查故障致因.
1)30万km内电机组故障占其100万km内故障的61.36%,说明动车组在早期行驶千米数内更容易发生电机组故障.这些故障中电机本体故障占2.27%,冷却风机故障占比达到69.32%,说明冷却风机故障是最主要的故障类型.
2)故障树估计复兴号电机组的整体故障率为1.319×10-6次/km,对比CRH某型动车组电机组中期故障率0.4675×10-6次/km,可知复兴号电机组的早期可靠性水平相对偏低.
3)故障树结果可为制定维修计划提供参考,贝叶斯结果可为故障排查顺序提供依据.