郭海财
目前,在TDCS系统内部新增加了一项列车占用丢失报警功能,可以实时监控列车运行状态,给调度员提供行车指挥参考信息。然而该功能在试运行阶段,存在许多误报警,且大部分是由于软件故障、硬件故障、网络故障等问题导致。为确保TDCS设备的功能可靠稳定,对2013年所有TDCS不良情况进行了统计分析,查找关键因素,提出整改方案。
2013年,对管内TDCS设备故障进行了统计,其中网络故障41次占总不良反应的69.5%,硬件故障15次占总不良反应的25.4%,软件故障2次占总不良反应的3.4%,其他故障1次占1.7%。硬件故障中,4次分机故障是由于雷击导致,11次终端故障都是由于工控机配置较低引起,上半年已将配置低的工控机全部予以更换。于是,解决网络故障就成为减少TDCS设备不良反应的关键因素。
进一步统计分析网络故障,路由器问题、协转问题和通道自身问题是引起TDCS设备网络故障的主要问题,因此,要从这三个方面查找故障原因。
根据详细统计内容分析,大部分路由器表现出来的问题,都是由于通道无法迂回引起的通道故障。针对此现象,采取提报施工计划的形式,采用“遍历法”对所有网络通道进行测试,以判断路由器问题产生的各种原因。
杭州电务段管内的网管图如图1所示。根据图1的环网,制作试验表格,对每两站的通道逐段断开测试,测试结果见表1,表中只列出了存在问题的栏目,序号保留试验表格原序号。
根据测试结果,与厂家共同查找中心服务器、路由器以及车站路由器配置,发现沪昆一台、二台的一部分站点与站点之间通道发生不通时,就会发生从杭州维护中心ping不通一些车站的路由器的情况,但是可以ping通这些车站下连的终端,这样的网络问题是由于早期网络规划遗留的。萧甬台的网络问题是由于路由器配置不完善和局部配置错误产生的。
协转属于协议转换设备,不需要进行内部设置,只要安装时严格按照拨码开关设置,通信就没问题。对2013年更换下来的协转进行统计分析,发现有6个是由于即将到使用寿命(大修周期为10年),有9个是在三季度高温时段更换下来,经返厂分析,是由于夏天机房温度过高,导致协转电路板工作不稳定。
图1 杭州电务段管内的网管图
通道主要包括主通道和连接头 (2M头子)。根据2013年详细记录分析,有1次是由于电缆断线导致主通道不通,其余7次是由于2M头子松动和虚焊导致通道不良。
另外还有一些通道不良是由于雷击导致路由器损坏,不属于主要原因。
1.路由规划。此问题可以通过重新规划中心路由器,使重分布明确。此外还有一个快速解决方案,就是局部站与站通道断开时,可能有一些路由器telnet不上去,但是信息还是会回到中心,可以通过参照网管软件的开图,从另一侧telnet到需要的路由器上,然后尽快恢复故障线路。
2.配置错误。图1中的H车站与中心切断后,H车站到绍兴的沿途站就访问不到中心,这是因为绍兴与绍兴东的eigrp配置错误,邻居关系建立不起来,通道环路是单向的,一端断了就不会从另一端与中心通信。在绍兴路由器上修改配置如下:
表1 TDCS通道试验表
int lo1
ip add 192.23.67.50 255.255.255.252
int s0/0
en ppp
ip unn
no sh
3.配置不完善。中心访问不到图1的J车站和宁波的站点,这是因为路由缺失问题导致的。需要在中心与站点更改的配置如下:
中心地址是172.23.62.161路由器
iproute 192.23.67.18 255.255.255.255.255 192.23.62.5
iproute 192.23.67.0 255.255.255.255.252 192.23.62.5
iproute 172.23.67.192 255.255.255.224 192.23.62.5
iproute 172.23.68.0 255.255.255.224 192.23.62.5
iproute 172.23.67.160 255.255.255.224 192.23.62.5
中心地址是192.23.62.5路由器
iproute 192.23.67.18 255.255.255.255.255 192.23.62.1
iproute 192.23.67.0 255.255.255.255.252 192.23.62.1
iproute 172.23.67.192 255.255.255.224 192.23.62.1
iproute 172.23.68.0 255.255.255.224 192.23.62.1
iproute 172.23.67.160 255.255.255.224 192.23.62.1
J站
iproute 172.23.62.160 255.255.255.224 192.23.67.18
宁波站点
iproute 172.23.62.160 255.255.255.224 192.23.67.1
1.使用寿命。在日常检查巡视中,注意查看路由端口状态,发现丢包较为严重的车站,查询协转使用时间。对即将到达使用寿命的,提前安排进行更换,以避免发生通道故障,导致信息传输不畅,引起占用丢失误报警。
2.温度过高。协议转换器的最适宜使用温度是20℃~30℃,夏季温度高,为了不影响设备正常使用,且还兼顾节能环保,在夏季由信号工区在每天的10:00-16:00期间,将机房空调温度设置于25℃以下,以确保协转稳定传输。此方法在夏季使用效果明显。
3.通道自身问题。在日常设备巡视检查时,将2M头子作为检查重点,发现丢包严重现象,立即联系更换协转,若还不能得以恢复,建议对2M头子进行重新制作。每年配合通信部门对2M网络进行测试,在挂误码仪测试时,重点检查2M头子接触是否良好,是否会引起网络误码,并向通信专家请教维护2M头子相关知识,以提高其稳定性,确保网络可靠运行。
通过以上解决方案,管内网络问题整治效果明显,产生网络故障的问题没再发生。根据统计,2014年6~8月也未发生由于温度过高导致的协转不良。2M头子经过全面整治后,运行也相对稳定,未发生不良接触。
占用丢失报警功能的开通,使TDCS系统已经不再是单独的复示作用,而是作为一项主要行车设备,实时跟踪列车运行轨迹。TDCS功能的增强,对于维护部门来说,既是一种责任,也是一种挑战。要通过日常的检修,发现问题,解决问题,不断摸索前进,总结出一套适合设备稳定运行的维护手段,以确保铁路运输安全畅通。
[1] 董昱.区间信号与列车运行控制系统[M].北京.中国铁道出版社.2008.6.
[2] 谭浩强.Cisco路由器使用技术[M].北京:中国铁道出版社,2006.
[3] 中华人民共和国铁道部.铁路信号维护规则技术标准[M].中国铁道出版社,2008.