李华松 马迅飞 张进铎 张俊 赵叶平
摘 要: 以高性能计算机机房监控为背景,为提高机房的运维水平,从监控的便捷性、可靠性角度出发,构建了一套基于SNMP协议的新型集中监控管理系统。通过获取MIB值,实现对机房内众多节点设备的交互及管理。测试表明,该系统运行良好,能够有效地对机房设备实施监控管理,为正常的生产活动提供有力保障。
关键词: 计算机机房; 运维; SNMP协议; MIB值; 集中监控管理
中图分类号:TP393 文献标志码:A 文章编号:1006-8228(2015)11-40-03
Abstract: Take high performance computer room monitoring as the background, to improve the operation and maintenance level of computer room, from the perspective of the convenience and reliability of monitoring, a new centralized monitoring and management system based on SNMP protocol is built. Test shows that the system runs well, can effectively monitor and manage equipments in computer room, and provides a strong guarantee for normal production activities.
Key words: computer room; operation and maintenance; SNMP protocol; MIB value; centralized monitoring and management
0 引言
机房作为信息服务的基础载体,其安全可靠性越来越重要。由于机房子系统多、管理复杂,而且专业运维人员稀缺,因此,实现机房的科学化运营管理难度较大。通过智能化手段,实现机房设备的集中化管理,可降低运维人员管理压力,降低运维成本。
机房监控管理系统是随信息化建设应运而生的,它是机房环境监控管理服务与计算机网络技术、多媒体信息技术、自动化技术结合的完美体现。以系统工程的观点对机房的环境结构、服务需求、设备内容和管理模式四个基本要素以及它们的内在联系进行优化组合,从而可提供一个稳定可靠、投资合理、高效方便、舒适安全的机房环境监控系统。
SNMP(简单网络管理协议)能够很好的监管机房的各种动力设备(空调、UPS等)和环境设备(温湿度、烟感等传感器)[1]。目前,SNMP已经成为事实上的行业标准,在国内也得到越来越广泛的应用。
1 SNMP网络管理协议
1.1 SNMP协议简介
SNMP由一组网络管理的标准组成,包含一个应用层协议、数据库模型和一组资源对象。SNMP网络架构由三部分组成:NMS(管理者)、Agent(代理)、MIB(管理信息库),图1是SNMP网络管理体系结构示意图。NMS是网络中的管理者[2],是一个利用SNMP协议对网络设备进行管理和监视的系统,它既可以指一台专门用来进行网络管理的服务器,也可以指某个设备中执行管理功能的一个应用程序;Agent是网络设备中一个应用模块,用于维护被管理设备的信息数据并响应NMS的请求,把管理数据汇报给发送请求的NMS;MIB是被管理对象的集合,被管理的对象指的是任何一个被管理的资源,MIB定义了被管理对象的一系列属性,包括对象的名称、对象的访问权限和对象的数据类型等。SNMP的目标是管理互联网上众多厂家生产的软硬件平台。
管理者和被管理对象之间的通信包括以下操作:Get操作,管理者读取被管理对象MIB的值;Set操作,管理者远程设置被管理对象MIB的值;Trap操作,被管理对象主动向管理者报告预制的特定事件。在正常运行状态下,管理者采用主动轮询的方法,监测下属所有被管对象工作状态的信息。当超过MIB预先设置的阈值后,被管理对象向管理者发出异常事件的报告,管理者在接收到异常情况报告后,对事件进行诊断,获取更多关于异常情况的信息。
1.2 MIB及自定义实现
管理信息库MIB指明了网络元素所维持的变量(即能够管理进程查询和设置信息)。MIB由对象识别符(OID: Object Identifier)惟一指定,MIB给出了一个网络中所有可能的被管理对象的集合数据结构,它是一个树形结构。SNMP协议消息通过遍历MIB树形目录中的节点来访问网络中的设备[3]。
MIB值负责整个系统的配置及运行所需的基本数据。本系统中的机房MIB值包括动力和环境两个方面。UPS的MIB值可以依据RFC 1628及厂商提供的MIB值获得[4];精密空调、温湿度等的MIB值可依据厂家提供的资料获得。
2 监控系统设计及实现
本设计是以一个机房为设计原点,在保证本地监控功能的基础上,充分考虑多点集中监控,以及分布式管理等功能需求。对单个机房设计采用嵌入式网关服务器,对本地机房内动力环境设备进行本地化监控管理[5]。
通过制定策略的方式,满足用户的各项联动管理需求。当监控对象发生故障时,能够以短信、电话、邮件等方式实时发出对外报警。同时,嵌入式网关服务器还具备联网管理功能,服务器可通过专用数据接口,将本地监控对象的实时参数上传至上层监控平台,以满足用户联网监控管理需求。
2.1 系统架构
本系统由三部分组成:现场设备采集层、管理服务层、远程Web浏览层。现场设备采集层由各监控对象和协议转换模块组成,主要进行通讯协议转换和设备终端数据采集。管理服务层用于对设备采集层的数据进行集中分析、存储,通过管理服务器,实现对底层动力环境监控对象的集中监控管理,管理服务器由多台集中管理服务器组成,各站点设备信息以网络方式上传至集中监控平台。远程Web浏览层通过IE浏览器或客户端方式,实现监控系统平台的访问。
本系统的总体逻辑结构如图2所示。
2.2 子模块搭建
本系统主要由UPS、精密空调、温湿度传感器等子模块组成。UPS通过通讯接口RS232和通讯协议与现场监控主设备相连,采用总线方式传递其工作参数、运行状态等信号;精密空调通过提供的远程监控通讯RS232/RS485接口和通信协议连接至监控主设备,也是采用总线方式传递工作参数、运行状态信号;温湿度传感器布设在机房内的重点区域,避免因局部区域制冷量不够使设备温度过高而宕机。
2.3 软件实现
本系统使用Visual Studio 2010作为软件开发平台,使用C#语言开发。在程序命名空间中引用SnmpSharpNet开源组件,方便在程序中使用SNMP协议。
3 系统测试及分析
通过测试得到如图3所示的UPS的运行状态图,以及如图4所示的精密空调的运行状态图。
从图3和图4中的数据和状态信息不难分析得出,系统运行准确、稳定、可靠。
4 结束语
上述结果表明,基于SNMP协议构建的集中监控管理系统能够正确、可靠的运行,并且在高性能机房监控上具有十分理想的监控效果,可以预料,该解决方案必将有非常重要的应用前景。但同时对于监控服务器上资源的合理分配和使用尚需作进一步研究,系统规模扩容后的性能尚需进一步监测。
参考文献(References):
[1] 李明江.SNMP简单网络管理协议[M].电子工业出版社,
2007.
[2] 郭军.网络管理[M].北京邮电大学出版社,2003.
[3] 熊英.基于SNMP的MIB库访问[J].计算机与现代化,
2007.139(3):90-92
[4] J.Case. UPS Management Information Base [OL].May
1994.http://www.ietf.org/rfc/rfc1628.txt.
[5] 王玮.基于SNMP网络管理系统的设计与实现[D].北京邮电
大学,2011:20-22