陈志强
(1.北京全路通信信号研究设计院集团有限公司,北京 100070;2.北京市高速铁路运行控制系统工程技术研究中心,北京 100070)
多功能车辆总线(Multifunction Vehicle Bus,MVB)是针对车辆内部功能设备数据通信的现场总线[1],是列车通信网络系统(Train Communication Network,TCN)的核心部分之一。目前国内的CRH和谐号系列和CR复兴号系列动车组均大量采用基于MVB标准的网络控制系统,总线通信系统的高效可靠传输是列车设备正常运行的基本前提。由于列车车载设备众多,总线信道环境一般较为恶劣,受到的干扰较多,为提高总线通信可靠性,文献[2-3]侧重于从总线传输原理的角度出发,在设计阶段尽量提高总线的抗干扰性和通信性能,即在源头预防总线通信故障的发生。文献[4-6]侧重于列车设备的运营维护及检修维护阶段,通过测量定位和消除总线故障。作为一种具有实际意义的提高通信可靠性的方法,文献[1]规定了MVB总线可采用冗余通信方式,详细定义了冗余总线的物理层连接方式、切换策略以及链路层数据中冗余信息的定义。文献[7-9]进一步对冗余总线的实现机制、冗余切换方法、冗余切换测试方法进行研究和说明。
总线不同部件失效会导致不同的故障现象,单线MVB总线的故障模式分析相对简单。对于MVB冗余总线,由于同时存在两路独立的MVB总线,两路总线的故障现象并不完全一致,故障情况较为复杂,不能简单等效于两路单线故障的叠加。目前尚未有文献对此进行研究。本文将结合总线拓扑结构,对不同部件不同失效情况下的MVB冗余总线故障模式进行深入分析与总结,用以指导后续MVB冗余总线的应用与故障排查。
MVB总线冗余线缆的连接方式如图 1所示,单个DB9连接器中存在A、B双路总线,每路总线采用RS-485差分信号传输方式,如图1中A路总线的RS-485差分总线对为A.Data_P和A.Data_N信号线,各MVB设备按照RS-485差分总线连接标准跨接在双路总线上。接收数据时,各设备同时接收A、B双路总线信号,按照自身接收情况选择质量较优的一路作为信任总线。另一路作为观测总线。信任总线上传输的数据被采信和使用,观测总线作为备用。若检测到当前信任总线存在通信质量问题,设备将原先的观测总线设置为信任总线,原先的信任总线设置为观测总线。各设备对信任总线/观察总线的判断、选择与切换是独立的,彼此没有相关性。譬如某一时刻设备1选择A线作为信任总线,设备2可能会选择B线作为信任总线。当设备1进行信任总线/观察总线切换时,设备2的不会受到任何影响。发送数据时,无论设备信任总线为A线或B线,各MVB设备都会同时往A/B总线发送数据,确保所发送数据会同时出现在A、B双路总线上。
图1 MVB总线冗余连接方式Fig.1 MVB bus redundant connection mode
根据设备种类的不同,MVB总线设备的冗余实现方式大体上分为两类。第1类为Class1-5设备,这些设备具备完备的MVB总线控制器功能,可实现总线链路层完整的编解码功能。一种典型的Class 1类型设备的实现框图如图2所示。在数据发送部分,编码模块产生的输出信号同时控制A、B两路总线输出驱动电路,也即模块所发送的数据在A、B两路总线上完全相同。第2类为Class 0设备,典型的即为MVB Repeater设备,这类设备主要用于增加总线的通信距离。为降低数据延迟时间,MVB Repeater设备只会在总线物理层对波形进行信号调理、再生和放大,不会在链路层实现完整的数据编解码功能,实现方式较为简单。一种典型Class 0设备Repeater的实现框图如图3所示,A、B两路总线处理通道完全是独立且互不相关的,A、B两路输出电路的驱动信号也是独立的,Repeater设备发送的A、B两路总线数据并不一定完全相同。
图2 MVB Class 1设备冗余总线实现示意图Fig.2 MVB Class 1 equipment redundant bus implementation diagram
总线故障模式与总线拓扑结构紧密相关。MVB总线设备分为主站设备、从站设备和Repeater设备3类,其组成的典型总线拓扑结构如图 4所示。整条总线由总线子段1、总线子段2组成,两条子段都是冗余总线,并通过一个总线中继器Repeater互联互通。主设备作为整条总线的主站管理设备,位于总线子段1中。从设备11、12位于总线子段1,从设备21、22位于总线子段2,图中的S11、S12表示组成总线子段1中的各个总线段,S21、S22表示组成总线子段2中的各个总线段。值得说明的是,实际应用中为扩展总线通信距离,往往会采用2个总线中继器Repeater,但由于Repeater的功能仅仅是物理层信号的重塑与放大,不参与实际通信,在充分考虑Repeater给通信数据带来延迟的前提下,将2个Repeater简化为模型中的1个Repeater是合理的,不影响分析结论。
结合上述总线拓扑结构,在考虑单点失效的情况下,总线各部件的失效以及其导致的故障模式分析结果列举如下。
1)线缆故障
a. 线缆屏蔽层不理想,或者屏蔽层线缆接地不理想
影响:导致各设备接收到的总线波形失真,通信质量下降,误码率明显升高,且出现错误的端口呈现均匀分布,各从设备的信任总线选择会在A路总线和B路总线间来回切换。
b.单路线缆出现了断线或连接器缩针
影响:若S11出现了A路总线断线或连接器缩针,B线总线良好,从设备11、从设备12、从设备21、从设备22均无法在A线上接收到主帧轮询信号,总线子段1和总线子段2的A线会处于静默状态。根据MVB冗余总线的切换策略,所有的设备都将使用B线作为信任总线,A线作为观测总线,不影响正常通信。
图3 MVB Class 0设备冗余总线实现示意图Fig.3 MVB Class 0 equipment redundant bus implementation diagram
图4 MVB总线典型拓扑结构Fig.4 MVB bus typical topology
若S12出现A路总线断线或连接器缩针,B路总线良好,则从设备12、21、22无法在A线上接收到主帧轮询信号,从设备12、21、22会使用B线作为信任总线,A线作为观测总线。虽然从设备11仍可以从A线收到主帧信号,但无法从A线上接收到从设备12、21、22发送的从帧信号。若从设备11只关注主设备发送的主帧从帧信号,则从设备11可使用任意总线作为信任总线。若从设备11需要使用从设备12、21、22的从帧信号,则从设备11会使用B线作为信任总线,A线作为观测总线。无论哪种情况,均不影响正常通信。
若S21出现A路总线断线或连接器缩针,B路总线良好,则从设备21会使用B线作为信任总线,A线作为观测总线。若不接收从设备21发送的从帧,从设备11、12、22会在A、B中随意选择信任总线。若需要关注从设备21发送的从帧,从设备11、12、22会使用B线作为信任总线,A线作为观测总线。无论哪种情况,均不影响正常通信。
c.双路线缆出现断路或连接器缩针
影响:若S11出现双路总线断线或连接器缩针,所有从设备无法接收到主帧轮询信号,总线A线和B线处于静默状态。根据冗余总线切换策略,所有设备的信任总线会在A线、B线之间来回切换,整个系统无法正常通信。
若S12出现双路总线断线或连接器缩针,从设备12、21、22无法收到任何主帧,其信任总线会在A线、B线之间来回切换。虽然从设备11可以收到完整主帧,但其从A线、B线均无法接收到从设备12、21、22发送过来的任何从帧数据。因此从设备11会从A线、B线中任意选择一路作为信任总线进行工作,整个系统无法正常通信。
若S22出现双路总线断线或连接器缩针,从设备21、22无法收到任何主帧,其信任总线会在A线、B线之间来回切换。从设备11、12会从A线、B线中任意选择一路作为信任总线进行工作,整个系统无法正常工作。
2)主站故障
a.主站发生设备失效
影响:主站设备失效时,整个总线上不再出现轮询主帧信号,或者出现错误的轮询主帧,整个总线系统将无法正常工作。
b.主站发送的轮询主帧周期出现抖动
影响:总线系统可以进行通信,但通信性能会下降,数据通信实时性不一定能得到保障。
c.主站单路发送电路驱动能力下降或失效
影响:若主设备的A线驱动能力出现下降或失效,B线功能正常。虽然Repeater可以对A线的错误物理波形进行过滤和修正,但不可能彻底修复。A线主帧轮询数据的缺陷会导致所有从设备使用B线作为信任总线,A线作为观测总线。整个系统通信正常。
d.主站双路发送电路驱动能力下降或失效
影响:整个总线上不再出现轮询主帧信号,或者出现错误的轮询主帧,整个总线系统将无法正常工作。
3)从站设备
a.从站发生设备失效
影响:单个从帧设备的失效不影响其它从站设备之间的相互通信,总线上的轮询主帧仍会保持正常传输。
b.从站单路发送电路驱动能力下降或失效
影响:如果从设备11的A线发送电路驱动能力下降或失效,其他从设备将无法从A线上获得从设备11发送的从帧信号,但可以从B线上获得A线发送的从帧信号。其余所有从设备会将B线设置为信任总线,将A线设置为观测总线,整个系统保持通信正常。
c.从站双路发送电路驱动能力下降或失效
影响:如果从设备11的双路发送电路驱动能力下降或失效,其他从设备将无法从总线上获得从设备11发送的从帧信号,无法获得设备11发送的数据。对于A线和B线,由于都没有设备11的从帧信号,无法进行对比,其他所有从设备会自主选择一条总线作为信任总线。
4)Repeater故障
a.Repeater的单路出现了故障,导致无法正常转发所有总线数据
影响:如果Repeater的A线发生了故障,B线保持正常。因为总线子段2的A线没有主帧信号,B线存在主帧信号,从设备21、22会选择B线作为信任总线,A线作为观测总线。从设备11、22会自主选择一条总线作为信任总线。整个系统保持通信正常。
b.Repeater的双路出现了故障,导致无法正常转发所有总线数据
影响:总线子段1的A线、B线均存在正常的主帧信号,总线子段2的A线、B线均没有主帧信号,从设备21、22的信任总线会在A线、B线之间反复切换,从设备11、22会自主选择一条总线作为信任总线。主设备、从设备11、从设备12之间的通信正常,从设备21、从设备22不能与其他设备进行通信。
c.Repeater单路出现异常情况,导致对某一或某几个特定端口主帧数据出现处理错误,无法转发主帧轮询数据帧
影响:如果A线存在某一或几个特定端口主帧轮询信号的缺失,B线一切正常。从设备被动地响应主帧信号的轮询,但由于A线并不是完全缺失主帧信号,而仅仅存在部分主帧信号缺失,从设备将无法检测到A线存在故障。所有从设备将会自主选择一条总线作为信任总线,若存在选择A线作为信任总线的从设备,会导致通信间歇性出现故障。
d.Repeater双路出现异常情况,导致对某一或某几个特定端口主帧数据出现处理错误,无法转发主帧轮询数据帧
影响:总线的A线和B线均存在某一或某几个特定端口主帧轮询信号的缺失,从设备会被动地响应主帧信号的轮询,但由于总线并不是完全缺失主帧信号,而仅仅存在部分主帧信号缺失,从设备将无法检测到当前信任总线存在故障,所有从设备将会自主选择一条总线作为信任总线,主帧轮询信号的缺失会导致通信间歇性出现故障。
高铁应用中广泛采用MVB冗余总线以提升通信可靠性,总线不同部件的失效会导致不同的故障模式。MVB冗余总线的故障现象较为复杂,需要经过较为复杂的分析才能进行故障定位,给实际应用带来了不便。本文通过构建MVB冗余总线拓扑结构,采用穷举法对不同部件不同失效情况下的MVB冗余总线故障模式进行深入分析与总结,所得结论对于设计MVB总线控制电路、优化冗余总线切换逻辑、提升总线通信质量、定位总线故障原因都具有重要指导意义。