项 颖
(青岛四方庞巴迪铁路运输设备有限公司 市场和检修部,山东 青岛 266111)
随着动车组技术的飞速发展,越来越多的动车组行驶在祖国的大江南北。动车组列车每天运行时间长、里程长,在运行过程中不可避免地会遇到各种各样的故障。因此,对故障进行快速诊断、及时分析出故障发生的根本原因并针对性地及时处理解决所发生的故障是确保动车组可靠运行的根本保障。故障原因分析根据故障发生的性质、位置、现象等不同的维度有各种不同的分析方法,本文主要介绍CRH1型动车组列车网络控制系统(TCMS系统)所报故障的一些典型的故障原因分析方法。
CRH1型动车组TCMS系统采用MITRAC电脑系统,用于列车的通信和控制。MITRAC电脑系统是一种分布式电脑系统,是由庞巴迪公司为地铁、动车组等所设计的通用电脑系统。MAVIS软件是针对MITRAC系统所设计的一款离线故障分析软件,所分析的数据是由车载诊断系统(TDS)所记录的车载故障/环境数据(ODBS)。MAVIS软件对车载ODBS数据进行的是基础分析,提供了故障发生的位置、时间、描述以及故障发生前后相关的环境数据等信息。然而有很多故障还需要结合其他的手段进行综合分析,才能找到问题的根本原因。下面介绍2种比较典型的TCMS系统故障分析方法的应用。
动车组列车有一类比较典型的故障是网络通信故障,往往此类故障的故障点可能很小,但给动车组造成的影响却较大。
例如,2019年1月25日,CRH1B-1059型动车组在汉口站停靠时发生列车网络通信故障,经主控复位、蓄电池接触器断电复位、网络电源断路器复位后,仍然不能恢复正常。列车回库后,通过MAVIS软件对下载的ODBS数据分析发现,自12:49:42开始至12:51:28这段时间内,1、2、5、6、7、8车报出大量MVB网络设备通信故障,部分数据节选见图1。
图1 CRH1B-1059型动车组部分网络通信故障数据
结合列车网络设备拓扑原理图以及MAVIS软件对故障发生期间ODBS数据进行分析。分析发现,在这段时间内,6、7、8车共有24个设备发生了MVB网络通信故障,具体见图2中标黄的设备。从图2可以初步看出,故障可能发生在标记红色箭头线路的区段之内。
DX.数字量输入输出单元;VC.列车控制单元;BCC.充电机控制单元;AX.模拟量输入输出单元;BCU.制动控制单元;DCU95/96.外门控制单元;ACU.空调控制单元;GW.网关;DCU49/M1、DCU4C/M2.电机变流器;DCU41/L1.网侧变流器;DCU51/A1.辅助变流器。
由于MVB网络通信受干扰所报出的故障通常为闪报,即受影响的设备故障时而发生时而结束,无法准确判断故障点的位置。通过对一个小区段故障数据的进一步梳理,发现有一些设备的网络通信故障一直没有结束,因此可以尝试把故障已经结束的和没有结束的设备进行区分以进行进一步分析。图3为故障已结束和未结束的设备区分,在12:49:42—12:51:28内,MVB网络通信故障未结束的设备被标记为红色。
由图3可以发现,从6车DX7A以后,所有设备均发生MVB网络通信故障,且故障持续存在,说明故障点很有可能在DX7A或DX7A与DCU93之间的连接电缆上,这样就在大量的网络通信故障中缩小了故障点的范围,为后续的故障查找大大节约了时间。后续经过对现车仔细检查发现,故障是由于DX7A的MVB插头X2的1点虚接导致,验证了之前的分析是合理的。
图3 MVB网络通信故障已结束和未结束的设备区分
结合ODBS数据和列车网络拓扑原理图对故障进行分析,是调查故障原因通常所采用的思路。这需要对整车系统的原理有较好的理解,同时也要不断在动车组运用维修过程中积累大量的实践经验,才能为后续的故障调查提供有力的技术保障。
某些故障只在特定的情况下发生,通过分析ODBS数据很难发现触发故障的原因,因为故障可能跟当时列车的工况、司机或机械师的操作等其他状态密切相关。这种情况下,可以通过在现车做一些试验对故障进行模拟和再现,同时利用监控软件DCUTerm实时记录列车相关参数的变化,以便为后续的故障分析提供数据支持。
例如,2017年4月24日20时03分,CRH1E-1061型动车组在运行途中发生15车2轴轴温超温A类报警(故障代码:2225),列车因轴温超温停车,机械师下车点温正常,司机发现智能显示单元(IDU)上显示该轴轴温已恢复正常。按照《应急故障处理手册》要求,司机按下IDU轴温界面的“复位报警器”按钮后解除A类报警,同时缓解了最大常用制动。在发车之前,该轴再次报出轴温超温报警故障,30 s后TCMS系统自动施加最大常用制动。司机点击IDU轴温界面的“释放联锁”按钮后,“释放联锁”按钮显示被激活,最大常用制动缓解,司机继续行车。后续途中再次发生2次因温超温故障导致动车组施加最大常用制动停车的情况,第3次停车后司机主控复位,再次点击“释放联锁”按钮后,缓解最大常用制动,继续后续交路运行。
按照动车组对轴温超温的控制逻辑,当“释放联锁”按钮显示被激活后,后续再发生因该轴超温故障将不再施加最大常用制动。此次故障造成较大影响是因为后续途中该轴又连续2次发生轴温超温报警,司机虽然按照《应急故障处理手册》要求在IDU上操作“释放联锁”按钮,而且“释放联锁”按钮也显示处于被激活状态,但实际动车组最大常用制动并没有被真正旁路掉,而直接导致动车组后续在途中2次被迫停车。
动车组回库后,通过ODBS数据记录及相关环境数据无法分析出“释放联锁”按钮被激活后动车组仍然施加最大常用制动的原因。鉴于此类问题可能跟列车的工况、司机的操作等因素密切相关,因此考虑通过现车模拟故障再现的方法进一步调查故障原因。
使用DCUTerm软件对动车组的运行速度、15车2轴的轴温信号进行更改,使动车组故障与运行途中一致,并试验“释放联锁”按钮的各种工况。经模拟发现,不同工况下使用“释放联锁”按钮会出现以下不同的情况:
(1) 当动车组轴温尚未达到超温值或者达到超温值尚未触发报警时(超温持续超过30 s后报警),按“释放联锁”按钮无效,“释放联锁”按钮灰色维持不变;
(2) 轴温超温触发报警,但尚未触发常用制动时(报警后30 s触发),按下“释放联锁”按钮,“释放联锁”按钮由灰色变为白色(表示“释放联锁”按钮被激活),报警后30 s仍然触发最大常用制动,并且轴温下降到正常温度后,最大常用制动依旧无法缓解;
(3) 当轴温超温触发最大常用制动后,且轴温仍在超温范围时,按下“释放联锁”按钮,可以解除制动联锁,“释放联锁”按钮由灰色变为白色(表示“释放联锁”按钮被激活),后续无论该故障轴温如何变化均不会引起动车组自动触发最大常用制动;
(4) 当轴温超温触发最大常用制动的同时按下“释放联锁”按钮,“释放联锁”按钮由灰色变为白色(表示“释放联锁”按钮被激活),轴温下降到正常温度后,常用制动缓解。当该轴轴温再次超温时,再次触发最大常用制动,此模拟试验结果与动车组运行途中发生的故障现象一致。
现车模拟故障时通过DCUTerm软件进行相关状态的监控如图4所示。
F2225.超温报警;F2273.轴温预警;PLFSBHB.施加最大常用制动;PLRELIDU.IDU“释放联锁”按钮激活;PLRELINT.释放联锁(主控);PLXRELIN.释放联锁(本地);PLXRELLK.IDU“释放联锁”按钮;PLOVTTRN.轴温超温状态;PLXNEWOT.列车有新的轴温超温报警;PLXSPD0.列车速度为0;PLFSB505.下降沿延时;PLFSB510.上升沿延时;CTAI2204.轴温;BLXPRS11.制动缸压力。
软件逻辑中关于“释放联锁”解除、激活及施加最大常用制动的逻辑见图5。
PLFSBPX.互锁及常用制动模块;PLXRESET.主控复位;PLOVTMM. 列车超温警报。
通过上述软件逻辑分析可知,如果需要缓解由于轴温超温所施加的最大常用制动需要满足以下任意一个条件:
(1) 在列车静止状态下,故障轴超温的状态持续恢复正常;
(2) 通过点击IDU“释放联锁”按钮,激活释放联锁功能并被锁存。
由于故障轴的轴温有时处于超温状态,有时又恢复正常状态,第1条与实际情况不符。因此只有通过点击IDU“释放联锁”按钮来激活释放联锁功能并锁存。结合模拟试验的结果发现,在车速为0、轴温仍然处于超温状态且恰好有新的轴温超温报警工况条件下,在轴温超温报警后第31~36 s内操作“释放联锁”按钮,此时虽然IDU显示释放联锁被激活,但控制系统内的释放联锁功能并未真正激活,下降沿延时和上升沿延时会通过RS锁存器屏蔽IDU“释放联锁”按钮的信号,此时施加最大常用制动的指令仍一直显示被激活,因此无法实现旁路后续超温导致的最大常用制动的功能,如图6所示。( )
图6 “释放联锁”信号被屏蔽
如果在有新的轴温超温报警后第36 s以后操作“释放联锁”按钮,释放联锁功能被激活并锁存,施加最大常用制动的指令也同时被取消,列车最大常用制动被缓解,如图7所示。
图7 释放联锁功能被激活
通过结合现车模拟试验和深入分析,不仅找到了故障的根本原因,还发现了软件逻辑设计中存在的一些缺陷,也为软件优化设计提供了实践检验的结果和优化方案。因此,通过现车模拟试验查找故障或者是进行功能验证的方法也值得大力提倡。