夏朋亮
(中国铁路西安局集团有限公司西安高铁基础设施段,西安 710000)
CTCS-3(简称C3)无线连接超时处理涉及通信、信号两个专业,影响因素较多,是目前国内较难解决的一个问题,国内许多高校及相关科研单位正在努力研究。C3无线连接超时是指车载设备与RBC通信过程中,由于GSM-R网络、车载ATP或无线闭塞中心(RBC)等原因,引起车载与RBC通信异常中断,RBC无法对列车进行控制。C3无线连接超时是影响C3级列控系统安全稳定运行的重要问题,由无线连接超时引起的C3降至C2级,严重影响高铁的运输效率。因此,通信、信号维护单位应准确分析、判断C3超时原因,及时消除造成超时的隐患,进一步减少超时对列车运行的影响。
C3级列控系统主要由车载列控系统(ATP)、铁路专用移动通信网络(GSM-R)、无线闭塞中心(RBC)3部分及其他地面设备组成。RBC根据轨道电路、联锁进路等信息生成行车许可(MA),并通过 GSM-R 无线通信系统将MA、线路参数、临时限速等信息传输给ATP车载设备,同时通过GSM-R 无线通信系统接收车载设备发送的位置和列车数据等信息。CTCS-3列控系统无线超时,即车载在T_NVCONTACT时间内未收到任何来自RBC的应用层消息。无线超时发生后,车载ATP将通过DMI提示司机无线连接超时,同时控制列车输出最大常用制动。
以西安局管内RBC为例,郑西RBC的通信日志,主要包含RBC与地面子系统之间(RBC-CTC、RBC-CBI、RBC-TSRS和RBC-RBC)以及RBC与车载之间的通信日志。在发生C3无线连接超时后,基于车地闭环监测链,综合对比分析RBC设备地面数据及各接口监测数据,其各接口监测位置如图1所示,确定故障点,提出处理措施建议。基本分析步骤如下。
图1 各接口监测位置示意Fig.1 Locations of interface monitoring
1)检查RBC地面设备,确认设备对应各板卡是否运行正常,与其他连接设备是否通信正常。
2)下载RBC日志数据,并分析RBC-CC传输层(L4层)和网络层(L3层)的日志数据,查看车地双方是否按照规范发送相应数据包,以及对方是否正常收到所需的数据包,确定C3数据层面的拆链原因。
3)下载RBC业务监测数据,分析是否启动定时器等,与RBC日志数据分析进行对比,再次确认超时原因。
4)将数据发送各自厂家协助分析,进一步确认超时故障原因。
5)通过综合对比各个接口的数据和RBC地面数据来最终确定超时原因。
以西安局管内高铁发生的无线连接超时典型故障为例,简述故障发生时数据分析方法及处理措施。
1)2021年7月19日15:12,由兰州局CRH 380B-5829-01车担当的G3181(300T)次运行至徐兰高铁线茂陵东辅助所—杨陵南站间下行线1 111 km 100 m处,因无线连接超时由C3级降为C2级运行。
如图2所示,从日志数据分析看,14:12:27 CC系统日志显示:CC开始重启。CC启动时,CC系统时间较北京时间有8个时区差异,此时时间未经校时不准15:13:15 CC系统日志显示:CC启动完成并进行系统校时。
图2 西宝RBC1 CC1 syslog日志Fig.2 Syslog log of RBC1 CC1 of Xi’an-Baoji High-speed Railway
由于CC1重启,CC1与外部通信中断,重启后与外部通信逐渐恢复。原因为西宝RBC1 CC1板卡异常重启,造成RBC1 CC1与外部通信中断,引起G3181次无线连接超时。
2)2021年4月30日16:03,G833次(西安动车段CRH380AL-2591号,广州南至西安北,西安机务段值乘)运行至徐兰高铁线临潼东站—西安北站间下行线1 070 km 500 m处无线连接超时,由C3级转C2级运行。
查看RBC5的CC日志,发现郑西RBC5发生3系宕机。原因为RBC5收到该车尾部(即最小安全后端)进入C2区域的位置报告,判定C9308次列车的C3/C2等级转换流程已完成,并为该车更新基于BSL1应答器的MA,但该MA中又包含C3/C2等级转换执行应答器信息。RBC5按照MA中的C3/C2等级转换信息再次启动C3/C2等级转换流程。由于该车已完成C3/C2等级转换,RBC 5按照其安全处理逻辑判断列车编号无效并触发宕机。最后通过修改郑西RBC5软件问题得以解决。
3)2021年8月27日18:40,G2024次(郑州动车段CRH380B-5802,300T)运行至杨陵南站至茂陵东辅助所间上行线K1118+500处无线连接超时,C3转C2模式运行(未停车),19:03运行至西安北站—临潼东站间上行线K1065+500处恢复C3级运行,未影响列车。
综合分析RBC日志和RBC业务监测数据:18:21:54~18:40:57 L3层大量连续出现FALC Loss of alignment信息(表示从MSC来的物理层帧有异常),车-地信息交互异常,18:39:27 RBC主动发送安全连接断开。
结合通信关于机械室2 M缆施工如更换2 M缆倒切有关RBC业务时,由于2 M同轴电缆芯较为灵敏,往往会出现因通信不畅而导致无线连接超时,依据RBC侧数据分析经验,可提前预判网络通信不好所引起的无线连接超时,如图3所示。
图3 大量FALCFig.3 large amount of FALC
C3级列控系统日常的无线连接超时现状,依据国铁集团和中国铁路西安局集团有限公司电务部关于C3无线通信超时分析的要求,为规范西安高铁基础设施段C3无线通信超时分析流程,减少无线连接超时对高铁运输的影响,深入分析查找C3无线通信超时问题原因。按照“谁发现、谁发起”的原则,对发现的无线连接超时报警信息,由发起方及时联系配合方进行配合分析,确定其故障原因。
RBC工区值班人员每日定时对RBC设备状态及各终端进行巡视检查,发现无线连接超时报警后,及时对报警前后时段的数据进行下载和初步分析,分析报警原因并逐级汇报,并将下载的RBC数据发给各自厂家协助分析。值班人员应第一时间联系西安通信段核心网工区,提出获取MSC侧RBC与GSM-R网络通信的相关数据。同时询问相关站段核心网工区和RBC工区的初步分析结果,若无法获取相关数据,将联系结果逐级反馈并最终由电务部协调解决。
无线连接超时发生后,由电务维修技术中心组织电子检测维修队及各自厂家对RBC数据进行初步分析,确定无线连接超时发生的关键项点和初步原因。电子检测维修队由当日值班干部组织RBC工区人员及各自厂家技术人员进行分析,查找故障原因。通过对RBC的CC日志数据、CC的 L3层日志数据、通信ORI接口数据等方面进行分析,确认无线消息包的收/发及在网络中的传递情况、RBC的处理逻辑、车载设备是否正常挂断的结论。
结合数据分析结果,如果为RBC设备问题,根据影响范围采取立即申请隐患要点、立即更换不良设备或在不影响正常使用情况下天窗内处理。如果分析与RBC设备无关,则通知通信段及车载设备车间进一步分析查找原因。电子检测维修队形成故障报告,经段主管领导审核后,由段生产监控中心上报局集团公司安监室和电务部。
结合西安局管内高铁的实际情况,部分无线连接超时依然分析不出具体原因。依据每年全国C3无线超时(空口监测)数据统计,其中RBC相关问题占整体C3超时问题的13%左右。目前GSM-R网络中已经监测的接口有PRI、A、Abis、Um和IGSM-R共5个接口,但对于RBC侧的监测仍然是空白。RBC作为主要的行车安全设备,一旦发生故障,影响范围较大。为了更好地解决C3无线超时问题、深入分析RBC相关原因、完善RBC侧监测手段,西安高铁基础设施段新增加RBC业务监测系统。系统主要监测RBC收/发的数据,能够进一步准确判断C3无线超时问题发生的位置,也为分析RBC侧问题提供数据支撑。
MSC与RBC之间通过传输设备连接,既有PRI接口监测在MSC侧,通过PRI接口数据无法判断数据从MSC发出后,经过传输到达RBC之前是否产生变化,增加RBC侧业务监测系统,便于确定MSC发出的数据经过传输到达RBC之前是否发生变化,综合对比PRI接口、RBC业务监测及RBC记录数据来定位数据出现异常的具体位置。具体RBC业务监测的数据如图4所示,目前汇总RBC不明问题如下:
图4 RBC业务监测数据示意Fig.4 Monitoring data of RBC services
1)在PRI接口查看上行方向数据无异常,RBC发送FRMR帧拒绝;
2)列车ATP控制电台起呼,起呼失败或RBC无应答;
3)RBC突然发送DISCONNECT;
4)在PRI接口未看到RBC发送的有效数据。
以上几种情况,利用既有接口监测数据无法准确定位原因,需要综合RBC业务监测数据来确定RBC侧是否正常。
导致C3无线连接超时的因素较多,但ATP、GSM-R、RBC三者是关键影响因素。依据日常无线连接超时分析经验,大部分因RBC侧导致无线连接超时的原因如表1所示。
表1 C3无线超时原因分析类别(RBC)Tab.1 Cause analysis of wireless connection timeout of CTCS-3 system by fault type (RBC)
由于引起C3无线连接超时的原因较为复杂,涉及到的网元众多,往往包含信号和通信两个专业。目前各路局对于无线连接超时类故障的分析及定位,往往是通信侧、车载侧和地面RBC侧等各自分析,不能做到对整个分析过程的全面梳理,从而导致分析过程单一化、片面化,故障点定位不够准确。因此要对各方面分析进行融合,以准确分析定位无线连接超时故障原因。当前不断对硬件设备进行优化,增加更多的分析手段和应对措施,以确保一旦发生超时,尽可能快地分析出结果,确定其故障原因。本文仅供初次分析人员参考,对分析处理无线连接超时问题具有一定的指导意义,其分析方法与总结将在日后进一步完善和优化。