徐 磊 殷培强 李文正 尹龙龙
(中车青岛四方车辆研究所有限公司电子事业部,266031,青岛//第一作者,工程师)
在现代城市轨道交通列车运行控制过程中,列车通信网络发挥着不可替代的作用,不但负责信息传输,而且还要执行某些重要的控制逻辑,因此,列车通信网络通信质量的稳定性至关重要。本文结合现场普遍发生的列车通信网络故障,进行深入分析,找到问题发生的根源,进而提出整改建议。
目前,国内城市轨道交通列车多采用MVB(多功能车辆总线)作为列车线及车辆线的通信介质。MVB是IEC 61375标准中定义的一种总线形式,主要用于列车内各子系统设备的互联。由于国内城市轨道交通列车多采用固定编组方式,基本不存在重联运营的工况,因此MVB总线既用作列车总线,也用作车辆总线。
所有子系统的控制器均通过其自身的MVB-EMD(EMD为用于中距离传输的电介质)通信接口接入到MVB网络。其中,关键子系统如牵引控制系统、辅助电源控制系统、制动控制系统、信号系统、车门系统等均具有硬线接口,以便在网络控制系统故障时,进行紧急牵引操作。
列车总线和车辆总线采用A、B路冗余传输,以保证数据传输的可靠性。MVB总线的传输速率为1.5 Mbit/s, 可以传输过程数据、消息数据和监视数据。
在列车司机室控制台上安装有HMI(人机界面)。HMI通过MVB获取列车及设备信息,实时显示车辆参数、系统运行状态,并实时提示车辆故障信息。通过HMI可以进行时间、列车号、轮径等参数的设置。HMI还可以实时显示列车网络的通信状态,在显示屏的通信状态界面上,红色表示通信异常。
在列车司机室安装有RPT(中继器)。RPT是满足IEC 61375标准的0类设备,是冗余管理的MVB-EMD中继设备,其主要作用是进行信号的放大和中继传输。相对于以往常用的“串型”拓扑结构,目前所采用的“T型”拓扑结构能够在一定程度上隔离通信故障,提高网络通信质量。RPT前面板上会设置指示灯,用于表征通信状态及故障。
在现场实际使用过程中,一般通过HMI和RPT来指示和定位故障。
造成列车通信网络故障的原因多种多样。从表面上来看,故障主要表现为整个网络通信不稳定、多个设备频繁离线,或者某一个设备离线。对于第一种故障情况,故障原因往往较为复杂,这里不做详述,本文将重点针对第二种故障情况进行研究和分析,结合现场实际发生的故障深入探究。
在某项目调试过程中,紧挨着RPT的设备D3频繁离线,硬件更换之后,故障仍然存在。通过排查MVB线路及连接器,没有发现明显异常,每段线路阻抗均为(1±10%)×120 Ω,符合IEC 61375标准要求。故障线路拓扑示意如图1所示,总线主BA和离线的从设备D3分别位于中继器RPT的两侧。
图1 故障线路拓扑示意图
借助专用差分信号采集探头,将示波器接入线路,通过协议分析仪配合端口触发进行波形抓取。发现设备D3的端口0x350在进入RPT之前回复从帧正常,但是经过RPT之后,从帧消失。为了排除RPT自身原因,更换RPT后再进行试验,故障依旧存在。
测试波形如图2所示。绿色波形为测试点在RPT左侧网段的波形,橙色波形为测试点在RPT右侧网段的波形,黑色圆圈(①)中的数据帧为主设备BA发送的进入RPT之前的0x350端口的主帧,黄色圆圈(②)中的数据帧为经过RPT处理之后的0x350端口的主帧,绿色圆圈(③)中的数据帧为从设备D3回复的0x350端口的从帧。正常情况下,在红色圆圈(④)位置,应该会出现经过RPT处理之后的0x350端口的从帧,而此时并没有出现。
图2 现场通信故障测试波形
从整个线路的通信状态来看,RPT对其他所有设备的端口数据转发均正常。将测试波形进行局部放大,如图3所示。从图3中波形可以看出,主从帧之间的线路空闲时间约为1.76 μs,线路出现了比较明显的干扰,噪声幅值超过600 mV,这明显超出标准规定(按照IEC 61375标准,EMD数据帧尾振铃幅值要在300 ns内衰减到100 mV以下)。
图3 现场通信故障测试波形局部放大图
为了判断是否是因为线路干扰严重导致RPT无法正常转发0x350端口的从帧,笔者在实验室环境下进行了对比测试,测试波形如图4所示。由图4波形可见,几乎不存在噪声。在实验室环境下,RPT确实能够正常对0x350端口从帧进行转发。在列车通信网络系统中,造成线路噪声的原因多种多样,比如整车电磁环境、MVB连接器压接工艺处理、线路中各设备通信板卡的MVB一致性参数等。在如此复杂的环境下,任何一个环节没有处理好或者几种情况发生了耦合,都有可能出现上述的线路噪声。而如果想要彻底滤除线路噪声,从笔者的项目经验来看,在工程应用中几乎不可能实现。至于如何降低MVB通信线路噪声,在此不做详述。
图4 试验室模拟测试波形
通过前文描述可以发现,问题的关键点在于主从帧之间这段时间,一个与之相关的参数是源设备延时(t_source),该参数是表征源设备性能的重要参数。简单来说,该参数是指某个源设备从收到主帧到响应从帧之间这段时间延时,理论上来说,响应时间越短说明该设备性能处理速度越快。IEC 61375-3-1—2012中的6.2.3节对该参数进行了详细描述,并且详细说明了从帧响应的t_source时间需介于2.0 μs和6.0 μs之间,推荐值为4 μs。但是仔细研究之后发现,标准对于这段时间的起止点并没有太明确的定义。从对从帧响应时间的要求可以看出,该时间起点为主帧校验序列之后,终点为从帧起始分解符之前,包含3部分,分别是主帧终止位时间(T_ED)、线路空闲时间(T_LI)以及从帧起始位时间(T_SB)。其中,t_source=T_ED+T_LI+T_SB。
标准中关于终止位的描述详见IEC 61375-3-1-2012中的5.1.6章节和标准中该章节的图32所示,T_ED约为2 BT(按照IEC 61375标准定义,2 BT≈667 ns),即1.33 μs。
标准中关于从帧起始位的描述详见IEC 61375-3-1-2012中的5.1.5章节和标准中该章节的图31所示,T_SB约为1 BT(按照IEC 61375标准定义,1 BT=667 ns),即0.667 μs。
将T_ED、T_SB数值带入上述t_source计算公式可得出T_LI的范围约为0到4 μs之间,即0 从标准定义可以看出,t_source只是针对能够响应从帧的源设备的要求,但是RPT并不在此范围内。标准中关于RPT的性能要求描述详见IEC 61375-3-1-2012中的5.3.1章节。其中,与本文所描述问题相关的标准中的第一条,从字面上理解为,RPT能够识别数据帧的初始方向并能保持稳定时间T_ST=2.0 μs,即RPT在从A侧向B侧转发数据帧结束后的2.0 μs时间内将无法转发B侧发来的数据帧。这正是本文中描述的列车通信故障所处的工况:主设备BA与从设备D3分别位于RPT的A、B两侧,中继器从A侧接受了主帧转发到B侧,然后又将B侧发来的从帧转发到A侧。 笔者认为,该参数的定义初衷受当时硬件性能的限制,随着硬件性能参数的提升,该时间也在缩短。本文中提到的RPT的该时间参数为1.5 μs,因此在试验室环境测试时工作正常。 经过上述分析,发现IEC 61375标准中存在矛盾之处,如果T_LI小于T_ST(如果RPT与源设备距离较近,可忽略线路延时),将导致RPT在某些特定工况下无法正常转发数据帧,而T_LI由t_source决定。通过简单计算可得知,t_source应大于4 μs,那么其取值范围将变为4 μs 再回到本文描述的这种列车网络通信故障,由图3可以看出,线路噪声在主帧结束后约0.7 μs后才降低到了200 mv以下,因此,对于RPT来说T_LI时间只剩下不到1 μs,远小于T_ST时间。至此,本文所描述的这种特定工况下的列车网络通信故障的原因已经找到。 前文的分析中,详细描述了这种列车网络通信故障产生的原因,既有线路通信质量的原因,又有源设备与RPT配合的原因。根据笔者的项目经验,给出针对这种故障的解决方案。 (1)优化整车电磁环境,减少对MVB通信线路的干扰。 (2)规范MVB连接器制作工艺,特别注意电缆屏蔽处理。 (3)在前期的MVB一致性测试中,增加对于t_source试验项点,了解网络中所有控制器通信板卡的t_source参数,尽量将该参数修改至4 μs (4)提高RPT接收器的不灵敏度。根据笔者的项目经验,提高到350 mV以上能够滤除多数干扰。 城市轨道交通列车通信网络系统是一个复杂的集成系统,影响该系统工作的因素很多,可能发生的故障也多种多样。本文介绍了现场调试过程中遇到的一种典型故障,分析了故障原因,提出了相应的解决方案。在现场的故障处理过程中,应充分利用协议分析仪和示波器等仪器设备,深入分析故障的根本原因,只有这样才能最终解决问题。 另外,IEC 61375标准已经颁布多年,各厂家生产出了各类通信板卡,在城市轨道交通及高铁列车中广泛应用,然而,在实际工程应用过程中,仍然存在参数匹配问题,需要继续深入研究。2.3 解决方案
3 结语