黄宗庆
(1.中国铁道科学研究院, 北京 100081;2.南宁铁路局, 南宁 530026)
列控中心接口故障分析
黄宗庆1. 2
(1.中国铁道科学研究院, 北京 100081;2.南宁铁路局, 南宁 530026)
列控中心是列车运行控制系统的核心设备,其通过不同类型的接口与其它系统连接,传递相关控制信息,因此列控中心接口技术对整个列车运行控制系统十分关键。列控中心接口故障可能涉及的系统较多,对行车的影响大,技术又比较复杂。针对这一情况,文章以列控中心与联锁、调度集中、ZPW-2000轨道电路的接口为例,分析其接口构成、通信机制,从而掌握每一种接口类型的特性,以便更好地处理接口故障;再以一些典型列控中心接口故障为例,结合多种诊断方法,分析故障发生的原因,制定排除故障的方法和步骤,并提出故障处理措施。最后,结合列控中心现场应用情况,提出减少接口故障的建议与意见,从而大幅减少列控中心接口故障,即使出现故障,也能及时得到正确地处理。
列控中心; 接口; 通信; 故障分析
列控中心(TCC)是中国列车控制系统(CTCS)的核心设备,是列车运行控制的神经中枢。车站TCC设置于联锁车站,与联锁系统、轨道电路、调度集中(CTC)、临时限速服务器、LEU、集中监测、相邻站TCC有接口。它通过CAN总线与轨道电路连接,控制轨道电路发码功能,实现区间方向及闭塞控制;通过与CTC接口向行车人员反馈闭塞分区状态、方向、编码及设备状态;再通过安全数据网,接受调度指挥系统下达临时限速命令和联锁系统当前的进路实时信息,实现应答器报文实时组帧、编码、校验和向LEU发送,通过有源应答器向列车动态传送,从而实现对列车运行的动态控制,如图1所示。
图1 列控中心与其他系统的接口示意图
从图1可见,列控中心是信号系统的核心安全设备,其与多个系统进行通信,各系统间信息交互频繁,一旦出现通信中断,必然会对行车组织造成重大影响,因此列控中心与各系统的接口技术十分关键,接口故障的处理也就显得尤为重要。但是列控中心与其他系统之间的接口构成各不相同,尤其是各系统之间的接口涉及不同通信机制和通信协议,这给我们在日常维护和故障处理带来了一些困难。本文就列控中心与联锁、CTC、轨道电路等系统的接口构成进行一些探讨,并对常见的接口故障进行分析,得到一些收获并提出建议。
2.1 列控中心与联锁系统接口
TCC(列控中心)与CBI(联锁系统)间采用RJ45以太网接口连接,设备与通信网络均按冗余配置,TCC与CBI之间数据传输采用UDP协议,如图2所示。
图2 列控中心与联锁系统通信接口
TCC与CBI间应采用RSSP-I安全通信协议。TCC与CBI间按250 ms至500 ms固定周期交互数据。每系每个端口与外部设备两系的对应端口(本系A口与对方两系的A口,本系B口与对方两系的B口)均建立通信链接。双系同步时,主备系设备向外部设备的主备系发送相同的应用数据,备系数据仅用于通道检查。
TCC与CBI间若接收方接受一条来自某连接通道的正确数据,即可认为该通道连接恢复。若不能从某一通道接收到正确数据时,应自动采用冗余通道接收的数据。列控中心与联锁通信连续中断 3 s 后,列控中心判定与联锁通信中断。当列控中心、联锁两系的通道均持续6 s以上不能正确接收到对方的主机信息时,即认为双方间的通信完全中断,须执行安全措施。通信中断后,列控中心按照车站无进路,进站信号机红灯断丝,无改方命令处理。同时控制进站口及到发线有源应答器发送默认报文,出站口应答器发送正常限速报文。
2.2 列控中心与CTC系统的接口
由车站列控中心负责收集其所管辖范围内的中继站信息,然后将本车站及其中继站的综合状态信息转发给CTC系统。CTC系统根据调度要求在车务终端上显示各站的综合状态信息。车站TCC或无岔TCC与CTC间应采用RS-422电缆双通道交叉冗余连接,并采取隔离措施,如图3所示。
图3 列控中心与CTC通信接口
TCC与CTC间应采用RSSP-I安全通信协议。TCC与CTC间按500 ms固定周期交互数据。仅本地设备的主系向外部设备的主、备系发送应用数据消息;本地设备的备系仅向外部设备发送通信检测数据。双系同步时,主备系设备向外部设备的主备系发送相同的应用数据,备系数据仅用于通道检查。TCC与CTC间通信还应包括接口版本校验功能,若接口版本校验未通过,则该数据不可用,系统输出报警。
若CTC在10 s内没有接收到TCC的任何消息,CTC应认为与TCC的通信中断,按照所有状态信息安全处理并输出报警。若TCC在6 s内没有接收到CTC的任何消息,TCC应认为与CTC的通信中断,输出报警。若接收方接受一条来自某连接通道的正确数据,即可认为该通道连接恢复。若不能从某一通道接收到正确数据时,应自动采用冗余通道接收的数据。
2.3 列控中心与轨道电路接口
列控中心通过CAN总线与轨道电路连接,CAN总线通信采用分时间片,主从式同步传送方式,只允许从节点或从节点到主节点,不允许从节点之间互传信息。列控中心通过冗余双套化轨道电路通信盘与ZPW-2000轨道电路移频柜进行连接,CANA和CANB为冗余关系,接口通信拓扑结构如图4所示。
图4 列控中心与轨道电路接口通信
列控中心与轨道电路通信采用ISO11898 CAN2.0B标准协议,并使用扩展结构格式。列控中心主机产生编码数据帧,经通信盘下发至轨道电路设备,用于控制发送器输出信号的编码命令;接收器产生状态数据帧,经通信盘上传至列控中心,用于表示轨道电路当前状态(占用或空闲),并作为下一周期编码计算的依据;此外,列控中心发送同步帧,仅用于系统同步。采用固定工作周期方式,一个工作周期的长短根据系统规模和技术要求来确定,一般设置在250~500 ms。接口的工作过程时序关系,如图5所示。
图5 TCC与轨道电路通信盘通信的时序图
系统通信的基本过程如下:
(1)列控主机在一个周期开始时,首先发送编码数据帧;
(2)通信盘经过解包,向柜内设备转发编码数据帧;
(3)编码数据帧发送完成以后,列控主机发送同步帧;
(4)通信盘转发同步帧;
(5)发送器、接收器接收到同步帧后,分别进行延时,发送状态数据帧;
(6)通信盘经过打包,向列控主机转发状态数据帧;
(7)在通信间隙,列控主机根据上一周期的状态数据,进行编码计算;发送器根据编码数据帧的内容,产生列车控制所需要的调制信号;接收器根据编码数据帧的内容,处理从钢轨上返回的调制信号;
(8)转到(1),开始新的工作周期。
若TCC任一路总持续3 s没有接受完整且通过校验的某移频柜的数据,则TCC应认为与该移频柜通信中断。若接收方接受一条来自某连接通道的消息,即可认为该通道连接恢复。若不能从某一通道接收到有效数据时,应自动采用冗余通道接收的数据。
当列控中心主系与轨道电路通信盘的两路通道均故障,而备系与轨道电路通信盘的通信仍正常时,应执行切机处理。列控中心双通道均故障至切机完成,时间不应超过2 s。当列控中心认为轨道电路通信盘完全中断时,应将所有相关区段置为占用状态,并向监测传达相应的报警信息。
3.1 列控中心与联锁接口故障
3.1.1 故障描述
DXXX次列车通过A站(无配线站)时,B站(主控站)联锁与列控中心通信故障,被控站A站出现红光带,造成DXXX次列车A站机外停车,B站联锁机重启2次后恢复正常。此后一段时间内,该故障现象重复发生。
3.1.2 故障原因
联锁机以太网板缺陷,偶尔会出现工作不稳定、底层数据收发不正常,造成联锁与相关列控中心的通信异常。
3.1.3 故障分析与处理
列控、联锁厂家在B站进行数据抓包,通过捕获的数据分析,发现联锁两系相继死机,实际原因为B站联锁撤销对A站X进站信号机LXJ和TXJ的驱动后,获取相应的采集状态延迟时间,超过了联锁系统检测混线故障时间,导致联锁与列控系统通信中断。分析网络数据,列控中心发出请求后,联锁系统未能及时应答,不能建立安全连接,导致列控中心与联锁系统安全通信中断。通过进一步检测网络数据,发现联锁系统以太网板发出的数据偶尔会不连续,甚至出现过发出的数据不对称。最终确认为联锁系统以太网板设计缺陷,其底层数据收发不正常。该故障原因比较隐蔽,并存在自动恢复的情况,常规分析难以找到准确的故障点,导致故障重复发生,针对这种情况需要认真观察,有计划地进行硬件更换。造成故障的深层原因主要是:列控、联锁厂家执行接口设计标准时,两者通信机制不能完全匹配。铁总运[2015]75号《高铁列控中心接口暂行技术规范》规定,各厂家按照执行后,此种故障将会大为减少。
3.2 列控中心与CTC接口故障
3.2.1 故障描述
XX站出现“列控系统故障”报警信息,列控系统由A机主控切换为B机主控,调阅列控系统通信状态图,显示列控A机与其他系统通信全部中断。
3.2.2 故障原因
列控系统A机通信板故障,造成列控A机离线。
3.2.3 故障分析与处理
出现报警信息后,分别调阅列控维修机与CTC维修机的通信状态图,发现故障信息出现时,通信状态图上显示列控A机与其他系统通信全部中断,列控系统由A机主控切换为B机主控,初步判断是列控A系故障。进一步检查发现列控A系的主板及与CTC通信板(该板既负责与CTC通信,也负责与列控维修机通信),发现列控A系主板上5号灯(代表与CTC通信板连接状态)一直亮红灯,其它灯位显示正常,检查列控A系CTC通信板,发现该板RUN灯亮红灯(表示该板件故障),基本确认是CTC通信板故障,更换备用板件并重启后,故障现象消失,最终确认是由列控A系CTC通信板损坏导致该故障。本故障从通信状态图上看,列控A系通道全部中断,很容易误以为是列控A系主板出现故障,其实不然,状态图上A系通信全部中断的原因是其与列控维修机通信中断,导致维修机无法得到其正确的状态,只能做全部中断显示。掌握到列控CTC通信板不仅负责与CTC系统通信,还负责与列控维修机通信的情况,分析起来就一目了然了。
3.3 列控中心与轨道电路接口故障
3.3.1 故障描述
某日XX站出现列控中心与轨道电路通信异常报警,调阅列控系统通信状态图,显示列控B机与轨道电路通信异常。
3.3.2 故障原因
列控中心与通信盘连接使用的航空插头针脚损坏,与插座接触不良,造成列控B机与轨道电路部分通信中断。
3.3.3 故障分析与处理
出现报警信息后,分别调阅列控维修机与轨道电路维修机的通信状态图,发现故障信息出现时,通信状态图上显示列控B机与轨道电路通信中断。进一步检查发现列控B机的轨道电路通信模块CAN表示灯灭灯,表示CAN总线故障或无数据传输,在检查DP指示灯,亮灯;可排除通信模块和ICU通信故障。进一步检查与轨道通信盘之间的通信,检查过程中发现列控中心与通信盘连接使用的航空插头针脚损坏,与插座接触不良,更换新的航空插头后,故障现象消失,通信状态图恢复正常。本次故障处理,时间比较短,主要得益于故障分析与现场检查同步进行,相互印证,从而快速确定故障原因。
3.4 故障处理综合点评
(1)处理列控中心接口故障时,要善用相关的监测工具,特别是列控维修机上的通信状态图,结合对应板件上的状态指示灯,明确故障类型,快速缩小故障范围,找到故障点及时处理。
(2)对于一些疑难故障,特别是一些故障现象出现后自动恢复,持续时间比较短,且故障发生频率不高,难以当场捕捉到故障现象。针对这类故障,一方面要通过排除法来缩小故障范围,明确一些重点可疑对象,有选择地对一些设备进行更换,并加强对其的实时监控;另一方面要借助特殊设备仪器,对相关的数据进行采样分析、对比,在更深层次上查找原因,从而现实从根本上解决问题。
(3)日常维护中要高度重视调阅及网管工作,许多列控接口故障出现的前期,总会有一些数据传输异常或相关报警信息,并且列控中心接口基本都有冗余配置,一个通道出现问题,都会自动转到备用通道,只要及时发现并处理,就不会对行车造成影响。
(4)从现场反馈的信息来看,列控中心与其他系统的接口故障主要集中在新开通的线路,主要原因:①软硬件设计有缺陷,试验过程中未检测出来;②施工过程中,管理不严,导致部分精密设备损坏。采取措施:①对列控软件仿真、模拟、连挂试验进行严格把关,确保试验彻底,无漏项;②设备管理单位对施工进行全程介入,保证施工质量,杜绝列控接口设备野蛮拔插。
(5)由于列控中心的接口涉及到多个系统,现场的一些维护管理人员可能对一两个系统(例如列控、联锁等)比较熟,但是对整个信号系统如何紧密联合协作并不掌握,特别是对各个系统间的通信机制是如何运作还缺乏了解。因此,我们还需要加强相关的培训,特别是一些跨度较大的综合性的培训。因为处理高速铁路信号系统接口类的故障,不只要专,还得要全,只有放眼全局,才能从繁杂的现象中找到重点,找到突破口,从而解决问题。
列控中心接口技术发展至今,标准化、模块化是今后的大势所趋,但是由于与列控中心连接的其他系统,在设备类型、通信机制、通信协议上有较大差别,导致各信号系统间的接口类型各异,对现场的维护管理和故障处理带来了较大的挑战。本文结合现场情况,对列控中心接口故障及日常管理上提出了一些切实可行的方法和行之有效的措施,但还是期望列控中心接口技术早日实现突破,实现所有接口统一,从根本上扼制接口故障多发的情况。
[1] 铁总运[2015]75号,高铁列控中心接口暂行技术规范[S]. Tie Zong Yun[2015]No.75,Interim Technical Specification for Interface of High Speed Train Control Center[S].
[2] 科技运[2010]138号,列控中心技术规范[S]. Ke Ji Yun[2010]No.138,Technical Specification of Train Control Center[S].
[3] 郭永泉,王勇.CTCS-2级列控系统接口故障机制探讨[J]. 现代城市轨道交通,2008,5(5):20-22. GUO Yongquan,WANG Yong.Discussion on CTCS-2 Train Operation System Interface Fault Mechanism[J].Modern Urban Rail Transit,2008,5(5):20-22.
[4] 王燕芩.车站列控中心与CTC通信接口的分析[J].铁道运营技术[J],2011,17(3):8-9. WANG Yancen.Analysis of The Communication Interface Between The Station Train Control Center and CTC[J].Railway Operation Technology,2011,17(3):8-9.
[5] 王文芳.列控中心与计算机联锁数字接口通信的研究[J].铁道运营技术,2011,17(4):16-18. WANG Wenfang.Research on The Digital Interface Communication Between The Train Control Center and The Computer Interlocking System[J].Railway Operation Technology,2011,17(4):16-18.
[6] 胡彦朝.车站列控中心接口系统功能概述[J].科技资讯,2012,10(17):28-30. HU Yanchao.The Function of The Interface System of The Station Train Control Center[J].Science and Technology Information,2012,10(17):28-30.
[7] 肖鹏,高建强,李远刚.CTCS2列控系统中心接口分析[J].铁道工程学报,2007,24(2):74-77. XIAO Peng, GAO Jianqiang, LI Yungang.Interface Analysis of The Train Control Center[J].Journal of Railway Engineering,2007,24(2):74-77.
[8] 丁若.CTC与列控中心通信故障的处理方法[J].铁道通信信号,2010,46(4):58-60. DING Ruo.Processing method of Communication Fault in CTC and The Train Control Center[J].Railway Communication Signal,2010,46(4):58-60.
Analysis on Interface Fault of Train Control Center
HUANG Zongqing1.2
(1.China Academy of Railway Sciences,Beijing 100081; 2.Nanning Railway Bureau,Nanning 530026,China)
The train control center is the core equipment of the train operation control system. The control system is connected with other systems through different types of interfaces. So the interface technology of the train control center is very important for the whole system.The train control center interface fault may involve multiple systems, has large impact on the traffic, its technology is more complex. In order to solve the problems, the paper analyzes the characteristics of each interface type, such as the interface structure, the communication mechanism and the ZPW-2000 track circuit, and then analyzes the causes of the fault and the methods of troubleshooting. Finally, combined with of the field application of the train control center, the suggestion to reduce the fault of the interface is proposed.
train control center; interface; communication; fault analysis
2015-12-01
黄宗庆(1986-),男,在读研究生,助理工程师。
1674—8247(2016)02—0001—05
U284.59
A