作者/姜金智,中海油信息科技有限公司
网管系统在企业网中的应用
作者/姜金智,中海油信息科技有限公司
为了提高基础网络的稳定性和安全性,对网络设备进行有效的监控和管理,我们一般采用网管系统来解决此问题。网管系统一般是通过SNMP协议来对网络设备进行管理,然后将设备状态集中展示,当网络设备出现问题进行告警,以便网络管理人员能够快速处理故障,提高网络整体可用性。
网管系统;SNMP;网络设备
随着信息化的飞速发展,信息系统的应用已经深入到各个企业的方方面面。而承载各种应用的基础网络,则面临着新的考验。信息系统应用发生宕机事件,会严重影响各企业的办公效率,甚至影响企业收入。而组成基础网络的路由器、交换机、服务器等硬件系统的稳定性和安全性,更是保证信息系统应用能够正常运行的先决条件。
要让基础网络硬件设施能够更加可靠的运转,必须进行主动化管理,防患于未然。如果能够做到故障的提前预测,将故障消灭于萌芽状态,将系统管理员从“救火队员”的身份解救出来,则能降低网络中断对用户带来的损失,提升用户满意度。
为了提高基础网络的稳定性和安全性,对网络设备进行有效的监控和管理,我们一般采用网管系统来解决此问题。网管系统一般是通过SNMP协议来对网络设备进行管理。SNMP全称Simple Network Management Protocol,也就是简单网络管理协议。SNMP是基于TCP/ P协议族的网络管理标准,是一种在IP网络中管理网络节点(如服务器、工作站、路由器、交换机等)的标准协议。SNMP能够使网络管理员提高网络管理效能,及时发现并解决网络问题以及规划网络的增长。网络管理员还可以通过SNMP接收网络节点的通知消息以及告警事件报告等来获知网络出现的问题。SNMP已经出到第三个版本的协议,分别为SNMPv1、SNMPv2、SNMPv3。SNMPv1和SNMPv2通信不加密,所有通信字符串和数据都以明文形式发送。SNMPv3提供了认证和加密功能,提高了信息的完整性和安全性。
SNMP管理的网络主要由三部分组成:被管理的设备、SNMP代理、网络管理系统(NMS)。被管理的设备也就是我们的基础网络设备,包括路由器、交换机、服务器等,网络中被管理的每一个设备都存在一个管理信息库(MIB)用于收集并储存管理信息。通过SNMP协议,NMS能获取这些信息。SNMP代理是被管理设备上的一个网络管理软件模块,拥有本地设备的相关管理信息,并用于将它们转换成与SNMP兼容的格式,传递给NMS。NMS运行应用程序来实现监控被管理设备的功能,也就是本文在重点内容:网管系统。
网管系统是协助网络管理人员进行内外网管理、设备监测维护、人员网络监控等的工具,其中包括综合管理软件,也有运行维护、监控、流量分析等有针对性的各类细分软件。我们对网管系统的调查发现,中国网络管理人员将大量的时间用在频繁进行低级工作,比如机器的检修、网络通断检查、观察交换机和路由器运行情况等,并常常会陷入非常忙乱的状况,处于一种救火队员的状态。网管软件就是在这种形势下产生的,它能协助网络管理人员摆脱这种状态。
网管软件在欧美已经不是什么新鲜事物了,但在中国却因为种种原因(主要是对网络管理的重视程度一直不高)还处于新兴阶段。在IT发展迅速、企业对IT依赖程度逐渐增强的今天,选择网管软件作为网络管理人员的工具,不仅可以提高管理能力、增强网络设备及工作人员的效率,还能依托越来越完善的软件功能,来制定公司IT战略并更灵活地进行设备增减,保证工作和业务在不断变化中的流畅运作。
网管系统能够提供从业务系统角度来管理整个IT架构的功能。可灵活定义业务系统和业务系统子模块、应用系统以及网络设备、主机设备之间的逻辑依赖关系。对逻辑依赖关系的编辑,提供增加、删除、复制、移动等操作,并支持批量操作以及图形化展现业务拓扑的能力。具备采集和监控业务应用系统的关键日志和关键性能参数功能,包括对业务应用系统进程、日志文件、服务端口响应等指标的监控。对业务应用系统能够监控分析页面的响应时间。监控业务流程的响应时间,能够通过监控URL页面响应时间进行趋势分析,支持阀值报警以及定时监控页面可用性、响应时间的功能。
当被管理对象的运行状态发生变化时,超过预定义的阈值就会产生事件。如果该事件满足故障级别定义,则会产生故障报警。产生的告警能够通过短消息、邮件、页面告警和语音报警等方式发送给网络管理人员。
网管系统可以提供统一的管理和展现页面。在系统管理范围内的所有网络设备、主机、应用系统、存储架构、虚拟架构、中间件以及应用系统都可以按照多种方式进行展现,并且在展现视图中以明显的颜色来表示被管资源的状态、主要性能信息以及当前的告警状态等。可将业务用户、应用系统、IT资源形成有效的影响度关联视图,并支持以大屏方式展现,一目了然地了解当前应用系统的运行状态、用户影响范围以及相关IT资源的运行情况等。
网管系统能够对各种查询结果进行某一维度的统计分析,并能将统计分析以结果文本列表、图形方式(直方图、曲线图、面积图等)或报表方式显示、打印或转存为Excel、PDF报表方式输出,以供网络管理人员查询。
网管系统建设完成后,可以将日常IT运维中大量的重复性工作,由过去的手工执行转为自动化操作,从而减少乃至消除运维中的延迟,实现“零延时”的IT运维。全天候自动巡检与及时报警实现了IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。自动化运维不仅仅是代替人工操作,更重要的是深层探知和全局分析,帮助网络管理人员在现有条件下实现性能与服务最优化,同时保障投资收益最大化。使网络运维人员从繁重的日常巡检、关注IT资源细节运行状态的工作中解脱出来,做到故障的提前预测、及时告警、精确定位,提高网络的稳定性和安全性,最终保障各种信息系统应用的正常稳定运行。
* [1]张宇,刘向峰,王薇,吴秀华.基于CIMS的移动通信网管层次式解决方案[J].沈阳农业大学学报.2011(05)
* [2]常春霞,王传杰,肖文栋.基于CIMS体系结构的TMN移动通信综合网管[J].电脑开发与应用.2011(02)
* [3]张宇,石勇,肖文栋,许勇军.层次式移动通信网管CIMS解决方案[J].电脑开发与应用.2005(07)