文/ 曾敏 胡国南 王贤川
随着网络规模的不断扩大及应用和业务类型的不断增加,对网络自身实施有效的性能监控,全面客观地反映网络的真实运行状态,已成为不容忽视的问题。使用专业的网络监控软件对网络设备进行集中式监测已经成为网络管理的发展方向。利用监控系统,网络管理人员能够及时发现并主动响应网络异常,监测网络性能,指导网络结构优化,提高管理维护的工作效率,提升网路服务的质量,从而保障网络的稳定运行。
校园网是各高校基础建设的重要组成部分,为高校的信息化建设奠定了坚实基础,在高校的教学、科研及社会服务等各方面担负起重要的历史使命,校园网络的可靠与稳定在很大程度上决定了学校各项工作的正常运转。随着高校扩招后的快速发展,以及数字化校园建设的步伐,校园网络的规模也在不断扩大,网络设备数量增多,型号多样化,导致网络问题日益复杂化,问题层出无穷,传统的网络管理方法已经不能满足现时的需求。
研制和建立一个不仅能全面监控校园网络的运行状态,而且能够将网络管理从事后救助转向事前预警的,融机房环境、网络设备、应用系统为一体的智能化运维管理平台,已成为各高校网络建设与管理的重大需求。
计算机网络的安全、高效、稳定运行是网络运维工作的终极目标。在7×2 4小时的网络运维工作中,能在合理的范围内,对异常事件的预警进行分析,依据预设的规则自动处理一般事件,并根据事件的危害程度选择管理员通知方式(邮件、手机短信等)。对异常事件出现的频率进行统计分析并提供异常事件报表,有效降低网络管理人员的工作强度。对分期建设的系统之间融合如一体,保持向下兼容性。各系统协同工作,最大限度发挥同一品牌设备的兼容性优势,共享信息资源平台和软件管理平台,实现校园网的有效服务与管理。
第一,能够实时监控网络机房运行环境。中心机房的基本设施与配套设备(如:供电系统、U P S电源、精密空调、环境温湿度、漏水监测、消防监测与联动、安保等),必须得到实时的监控,以便提前预防,及时处置故障。并且能够监控和记录中心机房内所有机器的使用情况,对系统资源消耗情况(内存、C P U的利用率)给予警示,具有实时跟踪屏幕和进程状态的功能,可以对所监控的机器正在运行的进程进行控制。
第二,能够及时对网络设备运行状况进行管理。目前,校园网络设备(包括:路由器、交换机、安全产品、服务器、存储、无线联接设备与P C电脑等)种类、数量多而品牌杂、购置时间跨度大,且分布在不同物理位置,需要有一个能够监控于多种品牌设备的可视化的网络管理软件,便于全网的监测与故障的响应。
第三,能够及时对网络运行状况进行评估。随着校园计算机网络规模日益的扩大, 网络结构越来越复杂,加之网络设备和应用系统自身的脆弱性以及被外界的侵拢,极易发生各种各样的故障,需要管理者及时对潜在事故和故障进行发现、追踪、分析、定位直至问题的解决。需要有一个对整个网络系统运行状况的诊断、评估和快速处理的机制,以提高网络稳定性和可靠性。
智能网络运维管理平台主要是架设在核心设备上,如图1所示,对整个网络设备进行监控,系统收集各个网络设备资料,包括应用服务器、数据库服务器、各种品牌的网络设备、机房动力和环境设备等,纪录设备运行状态,分析纪录正常运行的数据,和当前设备状态信息进行对比,发现异常后进行报警,并为管理员提供解决手段,确保网络设备正常运行。
智能网络运维管理平台主要由监控报警主系统和管理分析主系统组成,如图2所示,其中监控报警主系统包括对网络线路、桐庐动力环境、网络设备和服务器的监控管理,管理分析主系统包括网络流量性能分析和故障诊断、告警管理、日志查询和报表分析系统。
网络线路监控管理
监控上网线路、D D N 和 V P N 专网的流量、延时、丢包率等情况,提前发现线路问题,及时定位引起问题的原因和对异常情况进行处理。网络管理员通过线路流量性能报告、丢包率和延时报告以及网络设备端口错误包情况等指标来评估线路带宽使用率、质量等,同时可以预先了解企业对线路带宽的整体需求,规划额外的容量。
机房动力环境监控管理
可监控机房的各项环境参数,包括温度、湿度、烟雾、漏水、红外线感应、供配电系统及其它智能设备,如空调、UPS、蓄电池组、门禁系统等。要实现机房中智能设备的监控,必须结合 FS 智能设备监控器(独立硬件);实现动力环境监控,要结合 FS 综合环境监控仪(独立硬件)和各类传感器探头。监控系统通过 TCP/IP 、Modbus 协议通过智能设备监控器(硬件)和综合环境监控仪(硬件)对进行动力和环境参数进行监控。
网络设备监控管理
监控和管理Cisco/Juniper/Fortinet/Watchguard/Sonicwall/H3C/HUAWEI/ 联想网御/ 天融信/ 深信服/ 安达通等著名品牌的路由器、交换机和防火墙网络设备,包括设备接口流量、接口错误包等性能指标,设备 CPU 负载、内存使用量、并发会话数等运行状态参数。网络管理员能通过对网络设备的监控可提前预知网络设备潜在的故障或者异常流量对设备造成的影响,提前发现问题,及时定位引起问题的原因和对异常情况进行处理,避免故障的发生或将影
响减少到最低。服务器监控管理
硬件状态监控:监控和管理 IBM、DELL、HP、SUN、联想、浪潮、方正、同方等服务器的硬件状态,如风扇转速、温度、电压和 CMOS 电池容量等(需服务器支持 IPMI),并实现远程开关机。
性能监控:无论服务器上运行的是 Unix、Linux或 Windows操作系统,都可以监控服务器上的 CPU 负载、内存和磁盘使用量,网络接口流量、接口错误包等性能指标和运行状态参数。
应用服务监控:对服务器上运行的 HTTP、HTTPS、FTP、Telnet、FTP、ICMP、IMAP、Mysql、Pop3、SMTP 和任意 TCP端口上的应用服务进行监控,通过服务器的响应速度来提前预知服务异常和可能存在攻击。
目录及文件监控: 通过独创的目录、文件内容检查技术,确保服务器上的如 w e b网站的内容等在受到黑客威胁,文件内容被修改、增加文件或者删除文件时能迅速通知管理员,让管理员能及时处理,避免造成跟企业声誉等有关的影响。
针对 windows 服务器的监控:通过对 WMI 的支持,可监控 windows 服务器的事件日志、MS Exchange Server、SQL Server、LDAP、IIS、Media Server、Terminal Server等服务的可用性。
网络流量性能分析和故障诊断系统
通过抓取内部网络访问互联网的流量(或者特定的流量,如总部到分支的专线的流量),可以监控网络出口总流量和整体I P协议分布情况,每台计算机整体流量统计情况、当前占用带宽的情况、访问应用协议的情况、当前会话情况等等,发现网络内存在的 a r p 欺骗问题、攻击和被攻击问题、发现可能有蠕虫病毒的计算机、发现使用B T或者其他工具进行大量下载和上传而影响网络其他用户正常使用互联网的计算机等。告警管理系统
通过事前的运维管理,主动反映网络故障隐患,让管理员对网络和服务器的管理工作由被动管理变为主动管理,真正实现无人值守的网络运维管理。系统支持多种报警方式,包括手机短信、电子邮件和监控终端屏幕、蜂鸣器、电话等。用户可以非常灵活的设定报警规则,包括对联系人进行分组;任意设定报警的时间段;任意设定报警间隔,对不同级别的管理员应用不同的策略。
日志查询和报表分析系统
通过 syslog 协议接收和储存被监控的网络设备、服务器等日志信息,并提供对储存日志信息按设备名、程序模块(Facility)、日志等级(Severity、Level)等进行查询和管理。同时,可以设置监控包含特定关键字的日志信息,实现手机短信、电子邮件等报警。系统提供详尽的报警记录和通知信息发送记录,并且提供详尽的性能曲线、可用性趋势图和分析表,报警柱状图和分析表等。
智能网络运维管理平台可以对网络和业务应用实施深入而全面的监控,把网络拓扑发现、资源管理、设备管理、终端管理、性能管理、故障分析、异常流量监测、服务器管理、数据库管理、W E B 监控等融为一体。通过可视化、仪表化、智能化的网络导航管理模式,将复杂的网络管理工作简单化、人性化,让网管软件带动用户来熟悉与掌控自己的网络,大大降低了用户技术入门的门槛,让校园网管理人员能够轻松驾驭网络。这必将成为未来高校进行网络运维管理的发展方向。