校园网络实时监控系统的研究与实现

2017-06-16 05:07李吕生
科技创新与应用 2017年17期
关键词:网络管理

李吕生

摘 要:文章以校园网络管理系统的研究与实现为研究课题,针对作者在这次研发中参与的部分工作进行描述。以故障管理模块中的故障监测为例,简单介绍了日常工作中遇到的部分网络故障问题,分析了SNMP网络管理系统的结构和收集被代理网络设备信息的重要性,详细说明了自动完成检测网络故障的步骤。

关键词:网络管理;故障监测;SNMP

引言

由于某民办高校的网络管理经费有限,我们结合长远规划及现有网络架构情况,针对网络管理系统展开自主研发。在参考同等高校的网络设备监控管理模式的同时,也综合自身情况研发了一套满足当前校园网络设备管理需求的系统,有效解决设备厂商不统一、跨区域、结构复杂、故障漏报等问题。本系统采用基于SNMP协议研发,对校园内的网络设备进行智能监控,实现网络设备24小时自動监测。当交换机或链路出现异常情况时能够实时检测到故障,为网络管理人员提供可靠的故障监测结果,减少排查工作量,及时解决问题,保持网络稳定运行。

1 在工作中遇到的问题

结合在高校网络中心工作的这几年经验,总结了一些日常较常见的网络故障,如设备硬件问题、系统软件问题、环路问题,攻击问题,病毒问题等等。网络异常问题的发生,都会影响设备的运行和参数的变化。通过故障问题的分析,对故障监测的研究带来一定的帮助。

1.1 网络设备故障

网络设备故障一般分为硬件故障和系统故障,当硬件或系统发生故障时,都会造成网络异常或网络中断现象。

(1)硬件故障主要是设备在运行过程中散发大量热量,如果热量无法散发,设备的温度就会过高,导致网络不稳定出现丢包或延时等情况。严重时烧坏设备电源或主板。网络设备运行环境潮湿,网线和水晶头将会氧化或发霉,导致接触不良、端口损坏或信号衰减等情况,无法上网或网络延时。

(2)系统故障主要是设备系统出错或配置不当等导致系统出现错误。先判断问题,需要重启的根据流程重启,如果重启后还没消除错误的,再补丁或升级系统。配置不当也会导致交换机丢包、无法获取IP等情况。

1.2 广播风暴问题

广播风暴问题在校园网络中比较常见,由各种原因造成的广播风暴,都会产生大量数据包,并且占用大量带宽,导致网速变慢或网络瘫痪。产生广播风暴的原因主要有:

(1)端口问题。网络设备端口异常,引起端口不停发送大量的数据包,产生了大量无用的数据包,而造成大量广播风暴。

(2)环路问题。环路产生的原因是路由协议设置不正确或一根网线的两端插在同一个交换机上造成的,导致产生大量广播数据包不断循环,即使用户可以成功获取IP地址,也无法上网。

(3)网络病毒及ARP欺骗。网络病毒在入侵主机后,通过网络进行传播,占用网络带宽,产生大量的广播风暴造成网络堵塞;ARP欺骗主要是伪造数据包,会造成网络不稳定,严重导致网络瘫痪。

2 研究思路与SNMP体系结构

2.1 研究思路

建立一套针对校园网络独特的实时网络设备监控系统,对设备进行实时监控和故障检测,自动收集和分析网络设备性能指标及相关信息。系统实现故障有效自动监测,监测到的故障节点通过网络拓扑图显示设备存活状态,实现WEB界面化管理,可方便各级网络管理员能够及时了解和掌握整个网络状态及故障信息,有利于网络管理人员对故障的排除工作。

校园网络实时监控系统故障监测模块的搭建根据校园当前环境综合考虑,本系统采用SNMP的模型结构。后面将详细介绍SNMP协议、MIB管理信息库的结构及原理、数据收集和网络故障自动检测的实现步骤等。系统结构如图1所示。

2.2 SNMP体系结构

网络管理的研究非常广泛,主要针对平台化、自动化、智能化、分布式等方向研究,但在采用协议和算法各有不同。被监控、监测的网络设备包括:交换机、路由器、服务器等等,考虑到目前的网络设备普遍都支持SNMP协议,而且SNMP协议在大型及复杂的网络结构中易于实现和扩展性,数据通信产生的流量少,不会造成网络堵塞,所以本系统采用SNMP协议,对校园现有几个厂商的网络设备进行故障监测。先分析基于SNMP的体系结构组成部分:

(1)基于WEB的网络管理平台

基于WEB的网络管理平台主要是根据SNMP协议收集被管理设备的信息,通过Web服务器来实现对浏览器界面进行监视和管理。平台化具有较强的移动性,在特定的区域内都可通过网络进行管理,极大方便网络管理人员对整个校园网络的运行状态进行监视。

(2)代理Agent

对支持SNMP的网络设备进行相关的SNMP配置,打开SNMP功能接受WEB的网络管理平台管理及监控。SNMP代理主要收集设备性能及其他运行状态的信息,并且记录到MIB管理信息库中。WEB的网络管理平台向被管理设备代理的MIB信息库发出查询请求,根据请求代理MIB返回相应的结果。另外,被管理设备也会主动向网络管理系统发送Trap报告。

(3)相关网络协议

关于支持SNMP协议的网络设备,网络管理平台与网络设备之间通过SNMP协议进行互相传递信息。另外对于不支特SNMP的网络设备可以采用其他协议如LLDP链路层发现协议、OSPF路由邻居协议、STP生成树协议、ARP地址解析协议等相关协议。

(4)MIB管理信息库

MIB管理信息库采用的是对象标识符OID及树形结构。通过SNMP协议遍历被管理设备中MIB的对象。MIB-2包括了11个对象组,比MIB-1增加了3个对象组。MIB管理信息库设定了网络设备被访信息,而且对象组还定义了被访对象属性。MIB对象记录了端口状态、连接信息、差错率等。

3 动态数据收集研究

动态数据的收集主要是实现全自动收集不同厂商网络设备的运行状态相关信息,深入了解网络设备的SNMP协议和MIB库,不同厂商的设备MIB库有所不同。动态数据的收集协议分别为:一种是基于SNMP协议收集相关信息,另一种是通过ICMP、RIP、OSPF、DNS等网络协议收集相关信息。目前采用网络管理系统通过SNMP协议向被代理Agent设备收集SNMP报文。SNMP报文包括各项相关的参数,其中具有5种PDU协议,主要用来建立网络管理系统和被代理Agent设备之间的信息的传递。其中get-request、get-next-request、get-response为网络管理系统向被代理设备传递信息,被代理设备接收端口为161。另外set-request、trap被代理设备向网络管理系统发送报文,网络管理系统接收的端口为162。收集数据操作方式分为:循环定时收集和管理人员操作收集。循环定时收集是在管理平台设置收集的间隔时间,根据间隔时间循环收集,对收集到的数据进行故障分析。管理人员操作收集是通过管理人员对管理平台的收集功能进行操作,这种操作方式也可以称为实时收集,但只用于临时的监测。

4 故障监测实现

4.1 故障发现

本系统监测故障模块是对被管设备动态中的接口利用率、丢包、延时、性能信息进行自动监测。监测主要通过阈值、Trap报文、MIB库的对象等方式实现,然后监测的故障节点在网络拓扑图上显示。如图2所示。

(1)监测阈值。根据设定的规则对网络设备运行状态的各项参数阈值进行监测,主要包括延时、丢包率、接口利用率、CPU和内存利用率等。对各项阈值的设置,是根据现场的网络环境及设备性能指标进行合理配置。如果某端口出现延时时间过长,通过实时监测端口信息来计算当前值是否达到预设阈值,当前值超过预设阈值时,可能故障将要发生,并提供故障预测功能。

(2)监测陷阱Trap报文。被代理设备启动SNMP功能,而SNMP功能内设有Trap模块具有主动发送Trap报告功能,它是用来向网络管理平台发送特定的重要事件。当被管网络设备运行状态发生异常情况或当前阈值超过预定的阈值范围时,触发Trap规则主动向网络管理平台Trap信息接收器发送警报。网络管理系统运行时Trap信息接收器自动开启,并托盘后台进程运行,当Trap信息接收器接收到Trap报告后,通过算法对Trap事件表进行取值分析,根据设定的规则对故障信息进行分类。

(3)MIB库的对象监测。网络管理系统通过SNMP协议读取被管网络设备的MIB库的各项对象参数信息,对MIB库的对象包括路由表、接口利用率、CUP温度等相关的信息,根据设置的间隔时间循环对MIB库中的各项变量信息进行监测,分析MIB库的对象组参数,掌握当前网络运行的状况。

(4)故障在网络拓扑监视。网络拓扑是通过可视化图形监视整过校园的网络设备的连接情况,并且具有各节点的网络设备的性能状态、接口利用率等相关信息。网络拓扑图嵌入故障监测信息,对检测到网络异常通过动态网络拓扑图中呈现出来,方便网络管理员监视和管理。

4.2 故障监测实现

实现校园网络设备的故障监测主要由三部分组成:(1)故障监测主要对阈值、MIB库、Trap报文的检测。(2)故障分析主要对收集到的MIB库的信息和Trap报文进行处理。(3)故障输出主要对接口利用率、丢包、延迟、环路等故障通过图标显示,而且部分故障直接在网络拓扑图上提示,网络管理员通过管理界面能及时发现校园网络的故障,也可以根据实际需求选择全校所有网络设备、汇聚层、接入层或单台交换机,进行查看当前或选择某时间段的运行状态。网络故障监测实现流程图如图3所示。

监测校园网络中心核心交换机的接口利用率为例,检测到核心交换机每一个接口的详细信息,根据数据传输双向性的原理,对接入和发送的数据进行计算。如果接口的利用率小于80%时,警报线段显示绿色,表示端口正常状态。当某一个端口的利用率达到80%-90%时,警报线段显示黄色表示利用率预警状态。当端口利用率91%-100%时,警报线段状态显示红色表示端口利用率过高处于严重状态。当端口的利用率过高会造成网络拥塞并且出现丢弃包现象。在监测过程中网络处于运行状态,监测的结果将以数据表显示,如图4所示。

5 结束语

本文从日常网络故障存在的问题、SNMP的体系结构、SNMP协议、MIB管理信息庫、动态数据收集来研究故障监测。SNMP协议在本系统中起到关键作用,MIB管理信息库的实时收集为故障监测提高时效性。通一个网络管理平台的故障监测模块掌握整个校园的网络运行状况,通过故障监测及时发现网络存在的问题,方便网络管理员日常管理和维护。在测试运行中效果非常好,故障监测数据自动完成、及时、准确。另外校园网比较庞大而复杂,由于实时采集网络设备动态数据等要求较高,对于网络特殊的异常情况导致部分信息收集不及时需要进一步研究。

参考文献

[1]魏楚元.大型园区网络建设与管理[M].北京:机械工业出版社,2015.

[2]肖众.高校校园网网络运维管理系统研究与实现[D].河北工业大学,2014.

[3]杨丽.基于WEB的网管系统的智能配置设计与实现[D].北京邮电大学,2012.

[4]权卓.基于SNMP的分布式网络管理系统的设计与实现[D].西安电子科技大学,2010.

猜你喜欢
网络管理
虚拟服务器技术及其在网络管理中的应用
新时期企业网络管理的现状及对策研究
企业网络管理系统的构建方法
网络管理技术的应用分析
基于生本理念的校园无线网络管理策略研究
加油站网络管理系统设计研究
网络管理技术的发展及应用
试论推动新一代网络管理技术发展的动因