NUMEN空管自动化系统日常运行中的故障处理与分析

2019-03-25 08:13任彦龙
科技视界 2019年2期
关键词:硬件故障处理软件

任彦龙

【摘 要】空管自動化系统作为民航空管部门实施对空指挥的核心系统,通过处理雷达信号、ADS-B信号、MLAT信号等监视数据,为管制员提供空中飞行态势的显示和各种飞行冲突及各种异常的告警,通过处理飞行计划和动态电报,为管制员提供飞行计划和飞行动态相关信息以及管理手段,在确保民航空管对空指挥任务的安全实施中发挥着重要的作用。随着国内航班量的快速增长,空中交通管制流量的不断加大,空管自动化系统在空中交通管制中占据着越来越重要的地位。

随着空管装备的升级换代,国产空管自动化系统作为应急、备用以至主用空管自动化系统的应用愈来愈多。因此,探讨国产空管自动化系统结构及工作方式,研究解决日常工作中常见问题的方法,对提高空管自动化系统的自动化程度、保证民航空管安全生产具有现实意义。当前国内研发空管自动化系统厂家主要有南京莱斯信息技术股份有限公司,其主要产品为牧羊人2000(NUMEN2000),牧羊人3000(NUMEN3000)等,主要应用为区管备份系统,中小型机场主用系统和备用系统;四川川大智胜软件股份有限公司,其主要产品为CDZS-ATC-MH系列,主用应用为太原、呼和浩特主用系统和其他现场备用系统;成都民航空管科技发展有限公司,其主要产品为AirNet系列,主用应用为成都区管和西安区管备份系统,南京、哈尔滨、拉萨等地主用空管自动化系统。石家庄现场使用的是南京莱斯信息技术股份有限公司生产的牧羊人2000(NUMEN2000)产品,本文结合实际工作案例,主要介绍系统中经常出现的几类典型的故障及处理方法。

【关键词】空管自动化系统;国产系统;NUMEN2000;故障;软件;硬件;故障处理

中图分类号: V355.1 文献标识码: A 文章编号: 2095-2457(2019)02-0245-003

【Abstract】As the core control system implemented by civil aviation air traffic management  department,ATC system provides controllers with flight situation display,various flight conflicts and abnormal alarms by processing surveillance data such as radar signal,ADS-B signal and MLAT signal,and provides flight plan and flight dynamic related information for controllers by processing flight plan and dynamic telegram.Information and management means play an important role in ensuring the safe implementation of air command tasks in civil aviation air traffic control.With the rapid growth of domestic flights and the increasing flow of air traffic control,air traffic control automation system plays an increasingly important role in air traffic control.

With the upgrading of air traffic control equipment,domestic air traffic control automation system has been used more and more as emergency,backupand main air traffic control automation system.Therefore,discussing the structure and working mode of domestic ATC automation system and studying the methods to solve common problems in daily work are of practical significance for improving the automation degree of ATC automation system and ensuring the safe production of civil aviation ATC.At present,the main domestic manufacturers of air traffic control automation system are Nanjing Les Information Technology Co.,Ltd.,whose main products are Shepherd 2000(NUMEN2000),Shepherd 3000 (NUMEN3000),etc.They are mainly used in district management backup system,main and backupsystems of small and medium-sized airports;Sichuan ChuanDazhisheng Software Co.,Ltd.,whose main products are CDZS-ATC-MH series,The main application is Taiyuan,Hohhot and other  standby systems;Chengdu Civil Aviation Air Traffic Management Technology Development Co.,Ltd.Its main products are AirNet series,the main applications areChengdu District Management and Xi'an District Management Backup System,Nanjing,Harbin,Lhasa and other main air traffic control automation systems.The Shepherd 2000(NUMEN2000) produced by Nanjing Rice Information Technology Co.,Ltd.is used in Shijiazhuang.Based on practical work cases,this paper mainly introduces several typical faults and their treatment methods in the system.

【Key words】ATC Automation System;Domestic System;NUMEN2000;Fault;Software;Hardware;Fault Handling

0 引言

NUMEN2000空管自动化系统是南京莱斯信息技术股份有限公司生产的优秀的成熟空管产品,在民航河北空管分局已经稳定可靠的使用了一段时间。NUMEN2000自动化系统采用开放的系统架构,由多个节点同时连接在三个交换机构成的三层局域网组成,A/B网保证正常应用,C网提供应急保障。系统内部采用标准TCP/IP和UDP/IP通信协议,对外采用标准通信接口。节点设备可以分为两类:服务器与终端。主要的系统功能都由独立的功能模块在服务器中实现,由技术保障人员维护;而管制员在日常工作中使用终端来进行航空管制。服务器主要包括RFP(雷达前置处理机)、DCP(数据通信处理机)、RDP(雷达数据处理服务器)、FDP(飞行数据处理服务器)、DARD(旁路雷达处理服务器)、DRF(网络数据记录服务器)、DBMS(数据库服务器)等等,终端主要包括SDD(雷达数据显示席)、FDD(飞行数据显示席)、FDOP(飞行数据操作席)。在实际运行过程中经常会经常出现各种各样的问题,有的是软件功能不正常,有的是硬件故障,有的是附属设备或供电异常等。虽然生产厂家根据现场工作需要和个性化需求对系统进行了优化和定制,现场维护人员也接受了专业培训,并定期对系统进行维护,但由于实际运行过程中受诸多因素的限制和人为因素的影响,系统时常会出现各种功能异常,导致系统功能受限,影响管制人员的使用。经过分析,主要归结为软件故障、硬件故障、附属设备故障这三类故障。所以,熟知系统运行过程中可能出现的故障现象和处理方法对日常运行有很大的帮助,下面列举几个实际工作中遇到的故障案例,结合分析过程,供大家参考。

1 软件故障案例描述

1.1 故障现象

2018年7月21日,系统监控席告警,观察为飞行服务室飞行数据操作席图标变红,显示该席位故障,同时飞服值班员反映在飞行数据操作席进行计划操作,FDOP进程突然自行退出,维护人员在监控席重新启动该席位FDOP进程,进程正常启动,到现场检查席位工作正常。与飞服值班员了解操作过程:因重复性飞行计划生成次日计划时,石家庄至鄂尔多斯个别计划未自动生成,人工将该计划从重复性飞行计划列表中添加至次日飞行计划列表中,保存过程中,FDOP进程退出。现场做测试,现象确实如值班员所述,

1.2 处理和分析

在重复性飞行计划列表中任意选择两条计划做同样操作,添加成功,FDOP进程没有退出。比较三条计划,导致FDOP进程退出计划未见参数异常,只是计划航路比较长,航路点比较多。将此问题反馈给厂家,同时将计划数据、系统日志文件和CORE文件发送给厂家,并告知计划比对结果。厂家使用现场数据在测试平台进行故障现象重现,并对系统日志文件和CORE文件进行了详细的分析,最终确定为软件问题,次日计划航路(ROOT)航路点内存设置不足,当前设置为航路点数不能超过13个,而石家庄至鄂尔多斯航班计划航程较长,航路点数已超出13个,所以添加改计划到次日计划并生效时,会导致FDOP进程异常,自动退出。后期厂家对该程序航路点内存进行扩容并添加保护措施,可以添加长航程计划,即使超出容限,系统将不允许添加,但进程不会退出。软件升级后该现象未再出现。

2 硬件故障案例描述

2.1 故障现象

2016年1月16日,监控人员发现监控席告警,进近管制席图标变红,后自行恢复正常。维护人员到现场做检查,初步判断偶然因素导致主机重启,继续观察。后发现该主机自行关机并重启,不断循环。

2.2 处理和分析

维护人员进入机房检查设备供电,未见异常,该主机机型为惠普ML350 G6为双电源供电,检查双电源模块,也未见异常。检查前面板状态指示灯,发现一指示灯(右数第二个指示灯)状态异常,主机正常工作时为绿色(如图1所示),现主机启动完成后为黄色,怀疑为主机本身硬件问题导致重启。

查阅惠普ML350 G6手册,该灯为②指示灯(如图2所示),提示该灯为黄色表示系统性能降低,要确定该组件是否处于性能下降状态,请查看系统板指示灯。将该主机断电,打开机箱,重新加电。发现系统板⑥指示灯(如图3所示)为黄色(正常应为绿色),手册提示为处理器2 DIMM已出现错误。DIMM含义为双列直插式存储模块,俗称内存条,也就是说主机处理器2的内存条出现错误,导致主机重启。维护人员分析因该系统为2012年投产,投产时间不长,硬件不应处于性能下降状态,怀疑为内存条松动,尝试重新拔插内存条。

重新插入处理器2内存条后,主机加电启动,启动完成后未再出现重启现象,最终确认为内存条松动导致主机启动异常。进一步分析应为换季维护过程中,对主机开箱,使用大功率吹风机除尘,导致内存条松动。

3 附属设备故障案例描述

3.1 故障现象

2014年7月25日,塔台协调管制席不能打印进程单,且打印机出现红色指示灯闪烁并伴有异常声音。

3.2 处理和分析

NUMEN2000空管自动化系统使用IER400型进程单打印机,维护人员到现场做检查,发现该打印机卡纸。将打印机关机断电,清理卡纸,后重新加电开机,打印机自检。自检过程中,切刀没有复位,根据实际工作经验,自检中切刀复位会有“嘀”的提示音,而自检过程中没有提示音。打开前面板做检查,切刀张开并没有闭合,切刀不能自动复位打印机将不能正常使用,更换备件打印机,保证工作使用。之前曾多次遇到该型打印机切刀不复位的情况,几次开关机切刀或能自动复位。故障打印机安装到测试席位,多次开关机切到仍不能复位,后经反复研究测试,发现IER400打印机碰到切刀不复位情况,若在手工复位等操作后仍未见好。则可以采取以下步骤:

将前面板螺丝拧松,打开前面板。将printhead support即下图中数字1部件打开。

打印机加电,此时会看到切刀并未自动复位,手动将切刀复位,切刀呈打开状态。前面板红绿指示灯会交替闪烁。

等到前面板显示“printhead部件需要按压下去(笔者翻译)”提示时,将该部件按压下去。

再等片刻会显示“paperout”。这时可以将打印纸塞进去,打印机自动送纸。

切刀将纸切断后,会有“cutter jam”提示,按下“online”键即可解决。切刀复位后,手工打印进程单正常。维护人员曾多次联系厂家工程师,回复为固件缺陷,多个现场均出现该现象,可以升级固件。升级固件后问题有改善,但并未解决根本问题。

4 结束语

通过上述三个案例可以看到,空管自动化系是一个综合的信息处理系统,是一个多种硬件组成的系统,是一个软件和硬件组成的系統,维护空管自动化系统需要方方面面的知识,只有深入透彻的了解系统的工作原理和结构组成,遇到故障才能及时准确的找出原因并迅速解决,这就需要维护人员勤动手,积极参与故障的处理,积累经验,在遇到问题时才不会手忙脚乱。

【参考文献】

[1]HP ML350服务器使用手册指南(g6).

[2]NUMEN2000空管自动化系统维护手册 南京莱斯.

[3]IER400进程单打印机使用手册.

猜你喜欢
硬件故障处理软件
禅宗软件
软件对对碰
并行硬件简介
大型化工装置仪表自控系统的故障处理研究
谈软件的破解与保护