基于“天镜”的吉林省气象信息网络监控系统研究与实现

2022-12-02 03:57全秋浩刘星辰
气象灾害防御 2022年4期
关键词:链路吉林省气象

冯 超 全秋浩 杨 鹤 刘星辰

(吉林省气象信息网络中心,吉林长春 130062)

1 引言

随着气象业务系统的新增及观测、预报的不断发展,综合监控运维能力已经是信息化发展尤为重要的部分。气象综合业务实时监控系统是中国气象局基于全国气象业务系统监控现状,利用边缘计算、大数据计算框架、数据中台和分布式存储等技术建设的统一技术架构的国、省两级气象综合业务实时监控系统,“天镜”系统拥有开源的监控系统框架,监控系统实现了横向涵盖观测、信息、预报、服务、政务等业务和管理领域,监控范围覆盖业务系统的网络、数据流程、应用状态等,实现国、省监控级联,对监视数据进行采集、存储、分析和服务。

2016年中国气象局发布的气象综合业务实时监控系统在吉林省进行了部署应用,目前该系统已经实现了数据全流程以及气象核心业务系统的集中监控,在中国气象局和吉林省本地已有的业务建设基础上,结合目前吉林省业务实际需要,进一步完善了“天镜”系统本地化的开发设计[1-3],建设具有本地化实用性的省级综合业务实时监控系统。基于“天镜”的吉林省气象信息网络监控系统,结合省级运维管理需要及市、县级运维需求,实现省级和市、县级气象信息网络本地化集中监控,实现全省信息网络可视化实时动态显示,提供一套实用的网络监控系统服务,提高业务集约化,实现“全流程、一体化、可视化”能力的吉林省气象信息网络监控系统[4-6]。

2 网络现状

目前吉林省气象部门广域网络实现了双线路通信,分别为联通MSTP专线和移动虚拟隧道VPN线路,其中联通线路带宽省、市为8M,县级为4M。移动虚拟隧道VPN线路省级出口带宽为300M,市级为50M,县级为30M。气象业务网络承担着吉林省气象观测数据的传输、预报服务类产品的下载、省市县三级全省高清可视频会商及所有核心业务系统的网络支撑工作。一直以来全省气象报文类传输是通过联通MSTP专线进行的,省、市、县三级高清可视频会商业务和其他业务通过移动VPN虚拟互联网专线进行传输,在保证报文类传输的前提下,同时实现了联通和移动双线路互为备份。当有一条线路中断时,业务自动切换到另一条线路上。2018年经过全省气象业务网络升级后解决了全省网络带宽瓶颈问题,有效缓解了全省网络传输的带宽压力,同时提高了全省业务网的高可用性和稳定性。目前全省气象广域网拓扑图如图1所示。

图1 吉林省气象部门广域网络拓扑图

网络升级后原有的吉林省气象广域网络核心设备监控系统已无法满足全省网络监控需要,需对原有监控系统进行升级和开发,且原有的全省气象广域网巡检方式也无法满足处理网络故障的实时性,从而影响了传输质量,因此根据升级后的网络开发了一套基于“天镜”的吉林省气象信息网络监控系统。

3 系统设计与实现

3.1 总体架构

针对目前吉林省广域网络现状及业务实际所需,基于“天镜”系统具有良好的监控可视化效果及告警功能,已经替代CIMISS系统中MCP子系统的全部功能。能够满足网络设备的监控、报警以及对监控信息的可视化,完全能够实现网络设备的自动发现、设备管理、实时监控、信息查询、告警等工具模块[7-9]。能够将异常信息及时通过日志、企业微信群等方式反馈给网络管理员,并第一时间实时处理问题,从而更好地保证业务系统稳定运行,使全省网络运维管理人员和值班人员更直观、更及时地查看到网络故障信息,从而提高全省气象广域网的网络可用性和稳定性,有效保障全省气象资料的传输和业务系统的稳定运行。

系统采用B/S架构,省级集中部署,省市县级用户只要连通网络即可Web网页登录系统查看本地气象广域网络的监控信息(图2)。

图2 吉林省气象信息网络监控系统架构

3.2 系统主要实现功能

3.2.1 监控系统管理模块

监控系统包括对全省广域网络的拓扑管理、网络设备管理和网络链路监控、网络流量监控、网络故障、网络性能的实时监控及网络事件管理、短信告警等功能,并可以根据查询条件生成报表导出。通过拓扑自动发现设备,根据设备类型和厂家类型组织设备,并根据设备类型和厂家显示相应的数量;用户可以根据需要添加或变更设备的相关信息,比如网络设备型号及网络设备报修电话,设备的维护人员以及联系方式、行政级(省、市、县),设备所属地,以便于短信告警。管理员可以使用远程管理功能,从Web拓扑图中直接打开一个桌面SSH工具(如putty),直接远程管理这些设备,并可以通过Web页面下载网络设备的日志[10]。

3.2.2 网络拓扑和链路监控模块

监控系统支持网络拓扑交互,提供放大缩小全屏展示、刷新节点状态、展示全部等地图式操作功能,并可以保存拓扑图,支持在拓扑上显示设备与链路的性能负荷。用户通过IP、设备名等关键字快速搜索与定位设备后查看相应设备的信息。并在拓扑图上显示当前设备的节点数、在线数、离线数。链路监控上,主要包括可用状态、丢包率、丢包延时的监测,将鼠标悬浮在链路上,可以浮动提示链路的信息,包括两端设备、端口、带宽、速率等信息,可以直观地查看链路使用率;支持将两个设备间的多条链路汇聚显示。同时在设备监视上,将鼠标悬浮在设备名称上,可以浮动提示设备的信息,包括型号、CPU使用率、RAM使用率等,点击设备可以进入到设备的详情中,可以看到设备的基本信息以及设备下的端口信息;通过一个设备概况窗口组件,呈现设备的基本信息,基本的性能情况,可以呈现设备在指定时间段内的在线率、Ping响应时间波动,也可以呈现设备上所有端口,在指定时间段内的性能情况。

3.2.3 监控系统告警模块

告警关联信息配置,即事件台在定义事件时,针对此事件定义告警规则。系统支持每次符合条件触发、周期内发生多次产生事件、周期内一直产生事件3种告警触发策略。通过监测器的配置,可以设置链路带宽利用率、网络设备的CPU阈值,且能以企业微信、短信等多种方式发布告警消息,并根据设备的所属地区给相应的网络管理人员发送告警短信,以便告警得到及时处理,并在故障恢复后发送恢复状态的短信。省级管理员可以通过后台配置设备或链路的短信告警规则、告警级别、告警人员、短信告警内容的模板。用户可以查看告警的发送记录[11]。

3.2.4 运维管理平台模块

为省市县三级建立分权限的用户,省级用户作为管理员可查看省、市、县三级网络状态,查询全省设备或链路的告警信息,包括短信告警信息,并拥有后台配置管理权限,对告警、统计等规则进行统一管理。市级用户可查看本市整体的拓扑情况,可查询本市设备或链路的告警信息,包括短信告警信息。监控系统提供用户对设备历史数据的查询,可以查看端口的性能指标趋势,支持时间段的查询,默认统计12h的数据,查询设备的性能与属性数据。对设备和链路监控提供对象统计,比如节点连通延时TOP10、端口速率TOP10、CPU使用率TOP10、内存使用率TOP10、最新时间列表等。可以对设备的告警情况进行统计。

3.3 系统硬件设计

监控系统主要部署网络采集模块,包括Network、Agent、Metric等。模 块 主 要 部 署 在4台Centos 7.5.1804服务器上,每台服务器有5块10K SAS 600GB硬盘,2块4端口GE网卡,2块10GE双端口光口网卡,8通道2GB高性能SAS Raid卡,冗余交流电源,125G内存,采集模块安装在Opt空间上,“天镜”网络采集系统用两台代理服务器作信息采集,系统为Centos 7.5,内存300G,需要在系统上部署Agent以及相关采集代理服务。

3.4 网络设备配置

在吉林省广域网络联通MSTP路由器、移动VPN路由器上开启SNMP协议,首先设置联通MSTP路由器上SNMP参数及团体名,本次设置的团体名为Jlqxwlk。在路由器Config模式下输入Snmp-server Community 0 Jlqxwlk RW即可开启SNMP协议。以德惠市气象局为例,其联通MSTP核心路由器操作命令为LT_dehui_config#snmpserver community 0 Jlqxwlk rw;移动VPN核心路由器操作命令为VPN_dehui_config#snmp-server community 0 Jlqxwlk rw。配置成功后保存配置,然后通过SNMP软件测试是否开启成功。

4 监控程序设计与实现

4.1 网络拓扑监控程序设计

网络拓扑监控的目的是监控省、市、县之间的气象专线网络连通情况,网络拓扑和网络链路监控展示情况。展现基于吉林省地图的内外网网络架构,突出地理位置与数据流向的关联,围绕总控视角、分控视角联动呈现、逐层展示。提供决策数据可视化呈现的全面态势,展现网络链路类数据集合,如网络链路吞吐、延迟、丢包以及告警等汇总类相关信息[12]。网络拓扑监控通过获取配置在省级“天镜”通用版中Network模块里的设备信息,包括各个设备节点间的连接关系、各设备的运行状态、各线路间的连接状态等信息,整理统计返回给前端,通过eCharts渲染移动、联通的拓扑图。

4.2 网络监控软件设计

网络监控采用Java语言进行开发,Java语言具有简单性、跨平台性、面向对象、安全性、多线程性、分布性、可移植性、解释型、高性能、动态性、简单性等特点,并且提供JDBC访问数据库的方式。本系统选择MySQL作为开发数据库,MySQL是一个关系型数据库管理系统,同时MySQL是开源的支持大型系统的数据库,支持多线程,充分利用CPU资源,使用标准的SQL数据语言形式,跨平台,支持多个操作系统(Windows、Mac OS、Linux等),支持多种语言,为多种编程语言提供了API。访问MySQL数据库采用的是JDBC技术,相关的配置文件为:

通过上述配置即可建立网络监控与数据库之间的数据交换,实现网络监控对数据库的读写操作,完成网络监控配置数据在数据库的存储与读取。以上配置中Localization为“天镜”二次开发数据库,存放了二次开发的大部分数据,包含网络监控模块的配置信息。

4.3 告警信息推送界面

当有网络故障出现告警时,通过调用阿里云短信推送接口,将生成的告警信息推送至配置库中的相关运维管理人员(图3)。

图3 吉林省气象信息网络监控系统告警信息推送界面

4.4 监控系统可视化

网络监控系统可视化监控界面主要分为联通MSTP线路和移动VPN线路两个部分。联通MSTP专线其网络拓扑是由县局到市局,再由市局到省局;移动VPN线路其网络拓扑为县局、市局均直接到省局。省级用户登陆后进入本省综合视图界面,可查看全省、各地市的网络状态;查询全省设备或链路的告警信息,包括短信告警信息;拥有后台配置管理权限,对告警、统计等规则进行统一的管理[13]。地市级用户登陆后进入本地市网络监视页面,可查看本市整体的拓扑情况。

5 结语

(1)本文依托“天镜”系统,结合本地业务实际需求,通过“天镜”统一的服务接口实现本地业务监控建设,系统采用数据中台等关键技术设计,采用SNMP协议实现网络设备的自动发现和监控功能。

(2)利用Network模块关联各个设备节点的连接关系、运行状态等信息,最后通过eCharts渲染广域网络拓扑图。开发实现了企业微信、短信告警等功能模块,为全省业务网络运行状态提供了及时、高效的监控告警信息。

(3)建立了省、市、县三级可视化网络监控系统界面,实现了全省网络运行状态可视化动态实时显示,为省、市、县三级用户提供了一套统一规范化的监控服务系统,网络管理人员可以通过监控系统实时查看网络故障所在节点,查看本地网络运行状态,及时判断网络故障和传输状态。

(4)该系统已投入业务使用,解决了网络故障处理的实时性,为气象业务传输提供更稳定、更有效的网络支撑,为业务运行保驾护航。

猜你喜欢
链路吉林省气象
气象树
吉林省教育厅新年贺词
天空地一体化网络多中继链路自适应调度技术
吉林省“十四五”食品安全信息化建设的几点思考
《内蒙古气象》征稿简则
吉林省梅河口老年大学之歌
吉林省完成1.4万公里农村公路“畅返不畅”整治
大国气象
美丽的气象奇观
基于数据包分割的多网络链路分流系统及方法