基于SNMP协议的GNSS基准站网络云监控系统*

2022-08-30 01:07苏日亚
地震科学进展 2022年8期
关键词:管理站基准代理

苏日亚 刘 芳

(内蒙古自治区地震局,内蒙古呼和浩特 010010)

引言

“中国大陆构造环境监测网络”(简称陆态网络)是“十一五”期间建设的,以卫星导航定位系统(Global Navigation Satellite System,GNSS)观测为主的,主要用于监测中国大陆地壳运动、重力场形态变化、大气圈对流层水汽含量变化等,具有科学、工程和应用方面价值的综合网络[1]。各省地震局共同担负了260个GNSS基准站的运行维护任务[2]。GNSS基准站地理分布广且每一站点内运行着多个不同类型、不同型号的设备,运维工作量大且复杂。目前,网络管理标准主要有国际标准化组织(ISO)制定的CMIS(Common Management Information Service)/CMIP(Common Management Information Protocol)协议和Internet工程任务组(IETF)制定的SNMP(Simple Network Management Protocol)协议[3]。相对于ISO网络管理标准,SNMP协议简单、实用、易实现、成本低,广泛应用于校园网、油田、气象、电力、船舶等各类网络管理中[4-6]。SNMP协议可以为不同种类、不同厂家、不同型号的设备定义统一的接口,运维人员可通过管理统一接口上的数据而屏蔽底层物理空间中管理不同设备的复杂性,从而对网络节点进行信息查询、容量规划、故障定位等。基于SNMP协议的GNSS基准站网络云监控系统采用虚拟化技术为业务系统提供快速上线、无宕机连续运行和资源的高效利用等能力[7],从而解决对不同物理设备的统一监控难点和传统机房存在的一项业务占用一台服务器、服务器宕机业务即中断等缺点。

1 系统功能架构

GNSS基准站采用H3C MSR 30-10路由器为核心的网络,路由器下连5个分支VLAN网络,分别规划为总流量、气象仪、IP电话、摄像头、NAS存储。基于SNMP协议的GNSS基准站网络云监控系统采用客户端/服务器(C/S)架构模式,由SNMP管理站和代理两个功能模块构成[8-10]。图1为系统功能架构图,SNMP代理运行于被管理设备上,用于采集设备端口流量、CPU负荷、网络利用率等信息。被监控设备开启设备自带SNMP协议后即成为SNMP代理,可通过SNMP协议读取设备端口信息。SNMP管理站运行在远端服务器上,负责收集SNMP代理反馈的设备数据,并对数据进行存储和处理操作。运行在地震行业网私有云平台上的SNMP管理站,借助云平台提供的Web接口,实现底层物理资源的高效利用、服务器快速上线和业务的无故障运行。本文中,系统主要对内蒙古地震局所维护的16个GNSS基准站进行了监控(表1)。

表1 系统监控的GNSS基准站分布情况Table 1 Distribution of GNSS reference stations monitored by the system

图1 基于SNMP协议的GNSS基准站云监控系统功能架构Fig. 1 Functional architecture of GNSS reference station cloud monitoring system based on SNMP protocol

2 系统设计与实现

2.1 SNMP代理

SNMP代理是运行在被管理设备上的进程,默认状态下SNMP进程处于关闭状态。被管理设备开启SNMP进程后即可实现SNMP代理功能,向管理站发送设备状态信息[11]。图2为被监控设备配置SNMP代理功能的流程图。SNMP代理和管理站之间需定义同一个团体名才能通信,起到权限设置作用。SNMP协议现有3个版本:v1版本提供基本功能,v2版本增加密码验证功能,v3版本提供安全性传输功能[12-14]。为了数据的安全可靠传输,SNMP代理可选择同时支持3种版本。SNMP管理站与代理之间除读/写通信外定义了Trap操作,在设备出现异常时SNMP代理按照Trap指定地址主动向管理站发送消息。地震行业网内登录GNSS基准站路由器,在H3C MSR 30-10上开启SNMP协议并设置一个名为“private”的团体名,且赋予其读写权限后便可完成设备的SNMP代理功能[15]。GNSS基准站路由器0/0、2/1、2/2、2/3端口下对应连接光纤收发器、监控摄像头、IP电话、编解码器等设备。路由器端口开启SNMP协议直接监控对应设备,不指定端口则监控路由器本身ID。

图2 SNMP代理实现流程Fig. 2 SNMP agent implementation process

2.2 地震私有云上搭建SNMP管理站

作为SNMP代理的客户端,SNMP管理站向SNMP代理发送请求报文并接收SNMP代理反馈的信息。FusionCompute是华为公司推出的一款虚拟化引擎,将多台服务器的计算资源、存储资源、网络资源虚拟化成共有资源,用户通过统一接口对共有资源进行再次分配利用[16-17]。地震行业网内利用FusionCompute虚拟化引擎实现私有云平台,将SNMP管理站部署于私有云上,实现云监控能力。

2.2.1 私有云上服务器部署

图3 为地震私有云平台逻辑架构,每台服务器安装FusionCompute虚拟化引擎后,主机的CPU、内存、逻辑磁盘、本地磁盘等资源被虚拟化并合并成共有资源,通过图4用户Web接口为监控系统规划并分配资源。表2是地震行业网数据机房内待虚拟化的物理设备情况,表3是6台华为Tecal RH2485 V2服务器安装FusionCompute虚拟化引擎后完成的虚拟资源情况,表4是通过私有云平台Web接口为SNMP管理站服务器分配的虚拟资源。运行在私有云上的SNMP管理站不受物理服务器故障影响,底层物理设备发生故障时,监控系统将无缝切换至私有云其他正常运行的服务器之上,实现监控业务的“零宕机”运行。

图3 地震私有云平台逻辑架构Fig. 3 Logical architecture of earthquake private cloud platform

图4 地震私有云平台管理界面Fig. 4 Management interface of earthquake private cloud platform

表2 物理资源Table 2 Physical resources

表3 物理资源虚拟化Table 3 Physical resource virtualization

表4 业务系统分配资源Table 4 Allocating resources for business systems

2.2.2 PRTG实现SNMP管理站

PRTG(Paessler Router Traffic Grapher)是一款通过SNMP协议获取服务器、路由器、交换机等设备流量数据并产生图形化报表的软件[18]。PRTG通过SNMP协议与SNMP代理之间通信,获取GNSS基准站被监控设备流量信息并产生图形化报表后以页面的形式反馈给运维人员,从而实现对整个网络的监控和维护[19]。PRTG软件实现了SNMP管理站需要完成的3项操作:目标设备连接、监控信息配置和绘制信息发布。

(1)连接目标设备。在PRTG软件安装界面,添加扫描器后选择扫描器类型为“standard snmp traffic sensor”标准SNMP扫描器,用于监控路由器和交换机。在选择窗口中对GNSS基准站设备信息进行设置,设置信息包含GNSS基准站名称,路由器IP和SNMP团体名称(与SNMP代理设置相同团体名)。设置完毕后,PRTG扫描器开始自动连接目标设备。

(2)配置监控信息。设置PRTG要监控的信息, “带宽” “统计数据” “扫描器生成的图表信息(包括自动建立新图表,实时绘制图表,一小时平均图,30天平均图、365天平均图)” 等。

(3)发布绘制信息。设置PRTG“Web Server”信息后将PRTG服务器设置成Web服务器,运维人员通过任何一台地震行业网内主机浏览器页面都可访问PRTG监控的结果。

3 功能测试

基于SNMP协议的GNSS基准站网络云监控系统,实现了对分布在不同地区、不同设备的远程实时监控,且系统部署于地震私有云上,实现了业务系统的快速上线、无宕机运行和服务器资源的高效利用。经功能测试,基于SNMP协议的GNSS基准站网络云监控系统主要实现了表5所列功能。

表5 基于SNMP协议的GNSS基准站网络云监控系统主要功能Table 5 Main functions of GNSS reference station network cloud monitoring system based on SNMP protocol

以内蒙古区域内GNSS基准站网络监控为例。图5是基于SNMP协议的GNSS基准站网络云监控系统对内蒙古区域内分布在不同地区的16个GNSS基准站进行实时监控的页面。Web页面每5分钟轮询一次设备并更新状态,提供Web页面告警方式。图6是GNSS二连浩特基准站端口2/2(端口2/2连接卫星接收机)的流量监控图。页面展示设备在不同时间段内(1小时、24小时、30天、365天)的数据流量分布情况,运维人员通过监控页面直观获取设备的当前和历史运行情况,快速发现故障、定位故障、分析出故障原因。2019年3月17日开始端口输入流量逐渐减少(图6),但未突降为0,且无设备宕机告警,排除设备线路中断和接收机设备故障可能,初步判定为天线接收故障。运维人员实地排查,于20日更换天线接口后流量恢复正常,预判结果正确,大大减少了排查故障和故障修复时间。

图5 基准站监控界面Fig. 5 Referenc station monitoring interface

图6 不同时间段流量分布Fig. 6 Flow distribution in different time periods

4 结束语

自2014年将基于SNMP协议的GNSS基准站网络监控系统应用于内蒙古自治区区域内GNSS运维工作至今,充分发挥了SNMP协议在网络监控、故障定位方面的优势。2022年将该监控系统部署于地震私有云上,实现了服务器“零宕机”和硬件设备及机房空间的高效利用。该系统主要有以下3点优势:

(1)安全性高:系统支持提供安全性传输功能的v3版本SNMP协议,因此,安全性能更高。

(2)操作便捷:系统采用人机互动式界面,极大地简化了操作流程,维护人员可以迅速掌握系统操作流程。

(3)准确高效:系统的云监控与基准站信息实时同步,因此,系统的统计数据可以及时更新维护,确保相关数据准确高效。

实际应用中发现,该系统在故障告警方面存在不足,需要改进的地方: ① 采用单一的网页告警方式,运维监控灵活性差; ② 目前,故障发生后仅区域主要运维人员能够接收到故障信息,系统未能实现故障信息的分类联动发送。

猜你喜欢
管理站基准代理
甘肃莲花山国家级自然保护区野生药用植物保护对策
下期要目
对标一流 坚决打赢汾河流域治理攻坚战——访山西省生态畜牧产业管理站站长杨子森
应如何确定行政处罚裁量基准
复仇代理乌龟君
滑落还是攀爬
108名特困生有了“代理妈妈”
胜似妈妈的代理家长
燃气轮机燃烧基准温度估算方法
浅析运输管理站的档案管理应如何与时俱进