汪勇
(上海民航华东通信网络发展有限公司,上海,200335)
华东DDN 网是一个主要覆盖华东十大空管分局(空管站)和部分地方小机场的、主要为空中交通管制提供雷达、转报、甚高频等基础信息服务的广域网络,该网络从1997 年开始建设,运营服务至今超过二十年;当前随着各地空管基础设施的建设,其网络规模目前还在增加,且其服务范围已经延伸扩展到了中南(广州)和华北(北京)区域。该网络主要采用VANGUARD 公司系列路由器,支持vanguard7330、6840、6455、6435、3860 等多个系列,其网络结构总体为双星型结构,划分为核心层、汇接层和接入层三个圈层,其中核心层在上海虹桥,汇接层节点在各空管分局站,接入层在各空管分局站和地方小机场。
华东DDN 网的主要网管软件采用传统基于HP OPENVIEW 系列的管理软件,进行日常运维操作。
广域网数据支持系统(华东DDN 网子系统)[1]是在基于华东空管广域网络的基础上,周期性地轮询和提取对象网络的实时状态信息,并加以提取、分析与展现的软件系统。该系统目前部署在民航华东DDN 网的网管环境中,全天候不间断运行,有效地弥补了传统HP OPENVIEW 网管系统在以下等方面的不足:
(1)无法对网络所有中继端口通断信息进行百分之百有效监控;
(2)无法对网络中继误码信息进行主动持续有效监控;
(3)无法对业务端口的状态(误码、丢包、排队)信息进行主动持续有效监控;
(4)无法对网络较长一段时间的历史状态信息进行存储,便于故障发生后进行追溯;
(5)用户界面不友好,无法快速有效地定位是哪个区域的设备发生故障;
(6)无法快速有效地按业务进行实时路由查询[2]。
该系统较全面地解决了上述问题,在相当程度上提升了该空管业务网络的保障水平。除了日常进行周期巡检报警等功能之外,该系统也是一个数据存储系统,它将网络7×24 小时的重要中继线路状态信息和业务状态信息形成结构性数据,存储在数据文件中,在需要时可以按用户的多维需求进行提取和呈现。本文即介绍该系统的数据分析和统计模块。
该系统其软硬件模块架构如图1 所示。
图1 空管广域网数据支持系统(华东DDN 网子系统)功能模块图
该数据支持系统数据存储模块包含数据文件主要有以下两个:
(1)中继状态数据文件matx.mat
该文件为矩阵式数据[3]存储文件,通过数据结构化设计,当一次周期巡检完成并完成数据存储时,矩阵数组自动扩充一新列,该新列包含中继通断的设备节点号、端口号、中继通断具体时间,以及当前误码数量等信息。
(2)业务端口状态数据文件tbmx.mat
该文件为矩阵式数据存储文件,通过数据结构化设计,当一次周期巡检完成并完成数据存储时,矩阵数组自动扩充一新列,该新列包含业务端口(TBOP 端口或PAD 端口)的设备节点号、端口号、端口收发数据量、端口CRC 数量、端口LOST 数量、端口排队数量,以及当前SVC 是否建立等信息。
上述两个数据文件的大小随着软件运行时间的增长而线性增长,以一列新数据10K,一天执行24次数据更新计算,如果软件不间断7×24 小时不间断运行一年,单个数据文件约占空间90M,两个数据文件不到200M,开销可控。
基于加载以上两个数据库文件,系统软件通过对各种信息进行定向、分类和过滤,可以对网络状态信息进行按照符合用户习惯的方式进行多种方式呈现。其展现主要有以下两个模块:
图2 中继端口通断统计模块示意图
中继通断统计首先要确定时间区间(时间区间格式为XXXX 年XX 月XX 日),在确定时间起止区间后,系统将呈现在该段时间内的曾经发生过的历史中断信息。时间区间确定后,按照运维人员的关注点,中继通断统计有三种模式:一是以时间轴展开,将发生中断的中继端口的设备信息、端口信息、station 信息,以及中继通断具体时间点(精确到秒)按时间先后顺序从左到右打印到屏幕;二是全排序模式,即是在用户给定的起止时间内,将曾经发生中断的端口按中断次数从高到低排序输出,用户可以关注发生次数较高的线路和端口;三是按运营商和不同的地区分类,呈现各地区的不同运营商(电信与联通)在规定时间段内的中断次数,如上图2 所示。
图3 中继端口误码统计模块示意图
类似地,中继误码统计首先要确定时间区间(时间区间格式为XXXX 年XX 月XX 日),在确定时间区间后,系统将呈现在该段时间内的中继误码数量的走势信息。时间区间确定后,中继误码统计有两种模式,一是全网统计输出模式,即将网络中所有中继端口按误码绝对值的高低、误码运行趋势以及误码高低抖落按照一定的算法排序,将排序指标由高到低输出相关端口的误码随时间走势并以不同的颜色曲线加以标识,如图3 所示,通过图形输出的信息,我们可以将误码高位运行、误码趋势增加以及误码高低大幅抖落的端口进行重点关注,查找误码发生的原因并进行有效排查,大幅提升网络维护的质量;二是单端口模式,用户除输入起止时间信息以外,还需要将中继端口信息输入(格式为:节点号+端口号),执行后系统将该指定端口在时间区间内地误码走势输出,此种模式非常适合用来结合其他设备信息对故障进行事后追溯分析。
业务端口的状态信息较为丰富,以常被用于传输雷达信号的TBOP 端口为例,软件会存储每个TBOP 端口的收发数据量、CRC 数量、LOST 丢包数量、QUEUE 排队数量、以及虚电路通断和建链时间等信息。类似地,业务统计端口模块在用户确定起止统计时间段后,可以对全网所有TBOP端口进行上述相关指标的图形趋势输出、排序模式输出,以及对单端口的相关指标单独输出。这样,我们就可以比较精确地掌握业务端口故障高发的分布并加以关注,这在以前的网管系统中是难以实现的。
空管广域网数据支持系统(华东DDN 网子系统)兼具有网络管理和专家系统的特点,是对传统网管软件的一个非常有效的补充,该系统完全由运行维护人员设计和开发,切合生产实际,开发周期短。按照预想,未来该系统要在专家系统功能方面更近一步,需要更大范围内或者以更高频率,去获取和存储网络状态大数据;以及在此基础上,利用更加专业的手段和方法(例如采用人工神经网络等工具),更加深入地进行数据挖掘工作。目前新的数据分析功能模块还在设计和实现中。