自动转报系统主用通信链路故障的处理

2017-08-15 19:00李丽
神州·中旬刊 2017年6期

李丽

摘要:大连空管站自動转报系统是负责本地飞行航班动态、气象、情报信息、客运信息等相关信息的传递工作,属于中国民航自动转报系统网络中的一个网络节点。主要与沈阳建立通信传输链路进行转报业务数据信号的传递。主要传输链路包括:帧中继同步链路、ATM链路、VG链路、拨号链路共四条,通信原则为主用帧中继链路,备用ATM链路、VG链路,应急为拨号链路。在对设备进行巡检中发现帧中继设备电源模块突发故障,导致自动转报系统大连至沈阳DYX主用同步链路中断。

关键词:传输链路;自动转报系统;帧中继

一、背景描述:

1、事件经过:

大连自动转报系统是民航自动转报网络中的一个网络节点,主要与沈阳自动转报系统之间通信传输链路共有4条,主用通信链路是通过FRS-800设备作为中继系统的同步传输链路,链路标识为DYX。网络传输室值班员巡检中发现转报系统出现DYX断线告警提示。值班员进入机房对设备进行检查,发现协议转换器指示灯灭,状态显示异常。为确保转报信号传输正常,值班员迅速将DYX同步链路切换为备用ATM链路,进行信号传输,确认收报报文正常且无漏发、漏收报文出现。随即,当日值班人员根据应急处置程序立即电话通知当日科值班领导,详细报告故障现象。

2、处理过程:

在确认转报业务信号正常传输后,对故障情况进行详细排查,首先排查传输链路问题。同步链路租用的是联通2M业务,与联通值班人员进行沟通后,确认联通通信链路正常,排除通信链路原因造成业务中断。

值班员同时对FRS-800帧中继设备进行检查,发现帧中继设备两块电源指示灯均熄灭,帧中继设备处于停机状态,至此,确认为帧中继电源故障,造成该设备断电,DYX链路业务中断。与此同时,值班员发现机房空调发生故障,温度高达30多度,紧急联系空调维修人员检查设备并且进行抢修。

为保障安全生产,联系沈阳相关部门测试备用及应急系统链路工作状态,确认收发报文均正常后,将备用、应急链路均接入主用自动转报系统。

3、故障抢修:

确认帧中继设备电源模块故障后,将电源模块取出,检查电路板,发现电路板已经出现焦黑现象,无法进行维修。科值班领导立即联系厂家人员以及其他单位调拨备件,由于该设备已经运行16年,硬件老化严重,并且硬件缺乏,无法调拨备件;同时,厂家对故障电源也无法进行修理,只能自行寻找维修地点。

通过多方的寻找,确认中南网络公司可以对该电源模块进行维修,值班人员立即将故障电源送修。

B号电源模块两个月后修复到货,进行上架测试,帧中继设备可开机单电源运行,DYX链路恢复正常。A号电源模块目前仍在中南进行维修。值班员拔出帧中继故障电源。

二、设备及人员资质

1、故障设备

FRS-800(美国ECI公司)于1998年3月投产。上线运行时间过长,备件严重缺乏,每日每两小时对该设备进行一次巡检。

2、故障原因分析

FRS-800帧中继设备自1998年3月份投产使用以来,已连续工作十八年,硬件设备器件老化严重,是造成此次故障的直接原因。将故障电源设备拆开后,其内部电容器件已经发生漏液现象,导致电源模块烧坏,无法正常供电。

此次故障抢修过程中,还有一些其他原因也应该引起足够重视:

(一)核心机房总长超过40米,机房中间位置区域,空调制冷效果最差。根据以往经验中间区域温度比其他区域温度至少高1-2度,如果空调设备故障无法制冷,对机房中间区域位置摆放的设备影响最大,设备容易因温度过高而产生故障或者缩短寿命。

(二)FRS-800系统1998年3月投入生产,至今工作十八年,且一直为主用同步中继链路传输设备,硬件服役时间过长,厂家对该系统硬件已经不支持维护保修工作,备件严重不足,不适合再作为重要中继链路的传输系统。

(三)硬件厂家对故障电源不能正常维修,在故障修复期间增加了处理难度,需要自行寻找维修地点,大大的拖延了故障设备恢复时间。

3、后期处置及经验总结

(一)FR设备由于其故障率较高,已不适于作为主用同步链路保障通信工作。故障发生后上报相关请示,建议上级部门统筹考虑,开通其他同步链路取代FR设备。同时对部门负责的设备进行统一排查,安全风险评估,对于运行时间过长,硬件老化严重,备件严重缺乏的系统进行整改工作,将风险降至最低。

(二)鉴于FR设备仍属于单电源工作,其提供的DYX链路存在不稳定因素。网络传输室对自动转报系统中继链路进行了重新的划分,明确了在链路故障情况下的使用次序:主用ATM链路,备用VG链路和帧中继同步链路,应急拨号链路。

(三)结合网络设备巡检,对于目前大连-沈阳的几条中继链路提出了整改意见:(1)加快ATM同步链路的改造(2)新建中国移动等第三运营商提供的基站业务,用于取代拨号链路作为应急链路。

(四)值班人员应加强机房巡检,特别对于空调温度和工作状态灯,应予以足够的重视,一旦发现故障情况以及报修后勤并进行记录后续值班跟踪。

(五)值班人员应进一步进行应急预案的学习,发生故障后,第一时间启动应急预案,保障安全生产服务。

(六)开展自查、自纠工作,对网络传输室所负责的全部设备进行安全检查,查找目前运行系统运行过程中存在的危险源、排查安全隐患,制定切实可用的安全风险保障措施。

参考文献:

[1]自动转报系统网络拓扑

[2]网络传输室应急预案

[3]网络传输室维护规程endprint