李 伽,张红丽(宜宾学院网络与多媒体管理中心,四川宜宾644007)
高校网络机房智能监控系统设计
李伽,张红丽
(宜宾学院网络与多媒体管理中心,四川宜宾644007)
以高校网络核心机房监控为背景,设计一套网络机房智能监控系统,其组成包括监控管理平台、监控单元模块及远程监控终端.通过基于TCP/IP协议的监控管理平台有效地监控机房内动力系统、UPS系统、空调系统等的正常、稳定状态,保证网络及各个应用系统的正常运行.并提出了将该系统与网络监控平台SolarWindsOrion网管系统进行整合,搭建新型网络监控平台的措施和建议.
网络机房;智能监控系统;应用研究;SolarWindsOrion
Li J,Zhang HL.Design of the IntelligentMonitoring System in Network Server RoomsofUniversities[J].Journal of Yib⁃in University,2015,15(6):97-102.
随着高校信息化建设的不断发展,网络信息系统的设备和规模也在不断扩大,学校教学、科研、管理等应用系统对网络的依赖性也越来越大,这无疑对网络系统运行的可靠性、稳定性提出了更高的要求.高校网络机房是校园网络重要的组成部分,是数据交换、存储的中心,更是校园网的核心枢纽.传统的分散管理、人工值守方式因很难做到对机房环境问题的实时发现和快速响应而不能满足学校信息化建设发展的需求.随着控制技术的发展和管理水平的提高及一体化管控概念的提出,实现机房环境的智能监控已是一个必然趋势和要求,研究和应用智能化机房监控系统对校园网络安全稳定运行具有重要的现实意义.
信息化时代给人们带来方便、快捷的资讯,而网络机房为信息化数据的处理、存储、交换提供运行环境和传输枢纽,如何让机房内的动力系统、空调系统、温湿度环境、水浸烟感监控等物理环境参数的管理更加方便智能,保障数据传输的安全性及稳定性,一直是网络管理的研究重点.网络设备环境智能监控是利用现代传感技术、数字信息处理技术、数字通信技术、计算机技术、多媒体技术和网络技术,实现单位网络设备、环境信息的采集、处理、传输、显示和高度集成共享,实现网络设备环境自动化、智能化监控,为网络运行的安全、高效打下基础[1].
1.1传统机房监控方式及其弊端
高校机房建设是一个随着信息化建设的发展逐步建设的过程,在前期建设的机房中由于缺乏统一规划和相关设计规范,普遍存在监控信息点单一、分散,设备落后,整合难度大的特点,如温度、湿度、水浸等监控设备都是各个机房单独配置,不能统一监控;电力系统及UPS系统没有进行实时监控,采取人工定期巡检的方式不仅增加了值班人员的工作量,而且不能及时发现和处理问题;使用的民用空调不具备设备运行状态监测功能且运行极不稳定,故障频发,无来电补偿功能,每次停电后都必须人工到现场开启空调;对机柜内的设备无能耗使用情况监控,单路电源超负荷运行无告警提示,因过载造成电源短路后,不能及时发现隐患,稍有不慎,就会给机房甚至整个校园网络带来毁灭性的灾难.
1.2智能监控系统建设目标
前期在机房建设及管理中出现的问题也为后期对机房智能监控系统的建设提供了经验.网络机房设备运行环境的重要性使得在进行机房智能监控系统建设时考虑该系统必须能对网络机房设备环境实施有效的管理,以机房实现无人值守、远程实时集中管理为目标.要能远程对机房进行电力系统、UPS系统、温湿度情况、烟感水浸、空调情况等进行查询和控制;若出现故障,可通过短信方式及时通知机房管理员,机房管理员也可以通过Web远程访问机房的数据,了解机房所有设备的工作状态及环境状况.智能监控系统在为机房内网络设备的正常运行提供符合标准的运行环境的同时,也为网络机房的管理提供一个高效、及时的管理途径.
1.3智能监控系统设计原则
机房智能监控系统的重要性决定了在设计机房监控系统时必须参考机房建设的相关标准,如《电子计算机机房设计规范》(GB50174-93)、《电子计算机机房施工及验收规范》(SJ/T30003-93)、《计算机机房活动地板的技术要求》(GB6650-86)、《计算站场地安全技术》(GB9361-88)、《电气装置安装工程接地装置施工及验收规范》(GB50169-92)、《中华人民共和国公共安全行业标准》(GA/T75-94)、《安全防范工程程序与要求》、《中华人民共和国计算机信息系统安全保护条例》等.同时,机房智能监控系统设计还应遵循系统工程原理,在对系统设备的运行参数和工作状态进行集中智能监控的同时,具备先进性、可靠性、方便性、扩展性的优点.
1.4智能监控系统设计架构
本智能监控系统基于校园网,采用分布式架构,校内的每个机房为一个监控节点,该节点支持RS485、RS232、SNMP等协议,经过系统配置可以对每个机房的状况进行远程监控、管理(如图1).智能监控系统整体采用开放式架构,整个系统数据在校园网内基于TCP/IP协议进行传输,为终端用户提供Web访问服务应用.
图1 智能监控系统设计架构
网络机房监控系统要实现对机房内动力系统、空调系统、温湿度系统、烟感水浸系统等的监控,并通过短信方式进行故障报警,因此智能监控系统由监控管理平台、监控单元模块、远程监控终端组成.
2.1监控管理平台
监控管理平台是一个新型数据中心平台,以服务器为载体,通过内置的数据库和应用软件实现对机房动力环境、基础设施等的实时监测及动态管理,用户可通过网络轻松实现智能监控管理.智能监控管理平台集成模块化、标准网口连接、即插即用;集图像、门禁、环境、动力、设备和视频监控于一体;支持多层次(机房级、机柜级、设备级)监控;操作系统安全、稳定、不易被病毒入侵;支持多层次的权限管理(区域、设备类型、系统管理、操作和浏览).
2.2监控单元模块
监控单元模块负责采集网络机房内被监控单元的数据,并对数据进行传输、处理或者控制操作,再将结果回传到智能监控管理平台.监控管理平台根据机房内应用情况配有动力系统监控模块、空调系统监控单元模块、服务器机柜监控单元模块、环境监控模块等.
2.3远程监控终端
监控系统以互联网的标准协议TCP/IP协议为应用基础[2],智能监控管理平台和每个智能监控单元都具有Web功能,只要计算机支持网络服务就可以成为一个功能完备的远程监控终端,机房管理员可以随时对机房环境和监控数据进行监控和管理.
高校机房是大型的数据中心,承载着核心业务,重要性高.它要求可靠性高,不允许业务中断.智能监控系统能为机房的正常稳定运行提供保障,按照功能可以分为动力系统、空调系统、服务器机柜系统、环境控制系统等.
3.1动力系统
动力系统由机房供配电系统和UPS系统构成.智能监控平台能对机房供配电系统的三相电压、电流、功率、电度等常规电量参数进行实时监控,当机房供配电参数超出设定阀值时,系统会通过短信告警平台发出报警信息.UPS系统只有具备高可靠性,才能为机房提供稳定而持续的电力供给.采用纯在线式UPS系统,能确保输出稳压、稳频、滤波、不间断;UPS系统提供冗余供电系统,提高机房供电系统的稳定性;采用双母线供电方式,大大提高供电可靠性,保护负载;每个UPS模块都有独立的控制系统,控制系统故障不会相互影响;并联均流采用分散式民主均流控制,成熟稳定,可靠性高;旁路模块内置DSP控制器,可以在系统异常时独立控制负载由旁路供电;内置手动维修旁路,可以实现保证负载带电的同时维修所有的部件;多项报警参数的合理配置(如图2)确保了机房供电系统的稳定运行.
图2 UPS报警参数设置界面
3.2空调系统
空调是机房恒温恒湿的保证,是机房内设备运行稳定的前提.空调系统需要具有高效节能、稳定、长寿命的运行特点,并且具有恒温恒湿调节功能,满足机房精密环境调节需求.空调系统选择风冷型专用空调,在机房精密环境中为保证空调系统运行的稳定性,采取一主一备的运行方式,同一时间仅一台空调工作,周期性循环,主备空调自动切换.灵活的主备机切换功能实现机组自动切换及轮值功能.根据智能监控系统的管理要求,系统选配标准RS485监控接口,在计算机上可远程监视机房空调运行状态,设定机房空调的开关、温度、告警重要等级等,可实现邮件通知告警、短信通知告警方式.另外,通过智能监控系统,可以把各个机房的空调系统加入到监控管理平台(如图3),方便对空调系统的集中管理,全面监控各个机房内的空调系统运行状况.
3.3服务器机柜系统
服务器机柜是承载服务器的工具.选取的服务器机柜的前后门网孔通孔率达75%,以满足高功率密度的散热需求;结构设计稳定,承重达1 300 kg;兼容性结构设计确保与所有符合EIA-310标准的19英寸设备兼容;可靠的电源分配管理系统保证服务器运行的稳定性,为机房内各种设备提供安全可靠的电源;机柜内的配电插排-PDU采用竖直安装方式,不占用机柜水平安装空间.
选取的智能型PDU除基本功能外,还可以对有功功率、视在功率、功率因数、耗电量等电能参数进行统计,并通过智能监控平台进行显示和存储.具体如下:电能计量功能:自动记录整条PDU电能用量;告警阀值设定功能:智能监控平台可自定义设定总负载电流的上、下限数值;系统告警功能:当发生总负载电流超过告警阀值设定值,发生系统故障时,将自动告警等.
图3 空调监控系统
服务器机柜系统运转过程安全、稳定、通风性能好,智能PDU实时采集数据,若对服务器机柜内增加设备时,负载的增加通过监控管理平台可直观查看,保障了服务器机柜的耗电量在一个安全的范围.
3.4环境监控系统
环境监控系统由温湿度、烟感、水浸传感器和视频监控构成,通过网络将传感器采集到的数据传输到监控管理平台,管理平台根据设置的设备安全阀值触发报警,如图4所示.
图4 环境监控系统
温湿度传感器主要用于监测机房不同位置的温湿度情况,在每个机房配置6个监控点,用于监控机房不同位置的温湿度情况.烟感传感器用于监测机房是否有线路短路、着火等异常情况.水浸传感器监测机房是否有漏水、浸水现象,在机房内配置水浸感应线用于检测精密空调是否漏水、门窗周围是否有浸水现象.机房内设置多点视频监控,可随时随监控机房内的设备状态,并将视频监控数据及时传输到监控管理平台,管理员可通过监控终端实时查看机房内情况,有效地提高了防火防盗安全系数.若机房内监测点出现异常情况,智能监控平台会发出告警通知,机房管理员可通过平台上的环境参数报表查询机房内实际的环境状况.
智能监控系统经过前期需求调研、功能分析、现场安装调试并经过了近两年的使用,运行稳定,监控效果良好.机房智能监控系统自投入运行以来,为学校机房设备的稳定运行提供了可靠保障,为网络机房实现无人值守奠定了坚实的基础,同时在使用中也总结了该系统需要完善和改进的地方.
4.1智能监控系统应用分析
智能监控系统是一个安装容易、使用方便、可靠性、可维护性高,扩充性强的系统.使用智能监控系统能有效降低机房维护成本,提高维护效率.智能监控系统将分散的机房维护工作由人工定期巡检变为主动提醒模式,大大减少维护工作量和降低维护人员数量,提高维护效率;管理员可远程打开IE浏览器通过视频监控画面核实和处置,最大程度保障机房防盗安全需求.智能监控系统灵活的报表架构设计能为机房管理者提供个性化定制、拓展业务范围,支持机房管理员自定义,表格、矩阵、图表的混合报表模式和多种文件格式,满足机房管理不断增长的业务需求.系统的UPS管理业务能实时检测电池电压、电流,生成电池曲线报表,检测电池剩余容量、预测放电时间,判断蓄电池是否合格,协助管理员做好蓄电池更新维护工作.机房智能监控系统的使用还能延长机房寿命.机房服务器使用寿命受环境影响很大,智能监控系统实时监测机房空调状态和环境温度,如发现异常情况,将及时通知管理员检查维护,保证机房重要设备常年处于良好运行环境,延长机房核心设备使用寿命[3].
4.2智能监控系统完善改进建议
由于信息化建设发展的日新月异,作者在使用智能监控系统时也在思考其设计和功能需要完善与改进的地方.
4.2.1整合现有监控系统,搭建新型监控平台
机房智能监控系统能全面地监控机房环境状况,但是不能监控机房内网络设备(如路由器、防火墙等)的使用状态.为了监控机房内网络设备的运行状况,搭建了网络设备监控平台,这两个平台在前期使用过程中只能单独使用,不能整合.如果能在监控平台建设中考虑统一化、网络化方向,将会大大提高平台的使用效果,让网络机房监控工作更加高效、安全.因此,可尝试将网络监控平台SolarWinds Orion网管系统与机房智能监控系统进行整合.
SolarWinds Orion网管系统是一个兼具高性能和高可用性的成熟网络管理平台,使用SolarWinds Orion网管系统,可以通过实时查看Web浏览器中的网络监控页面[4],及时发现并处理网络问题.支持SNMP协议的服务器、工作站、路由器、交换机等网络设备都可通过SolarWinds Orion网管系统进行管理.为了将机房智能监控系统与网管系统进行整合,以便对机房环境及所有网络设备实施全面有效的管控,对机房监控设备的接口类型、支持协议、通信参数等作了详细了解,对如何与网管系统进行整合的对接方案作了技术性测试.经测试,对支持SNMP协议的设备的整合是可行的,整合后的拓扑图如图5.
图5 智能监控系统与SolarW indsOrion网管系统整合
下一步将继续思考如何将其他接口类型不同的设备进行整合.
4.2.2系统设计考虑前瞻性
机房环境监控的重要性决定了机房建设规划的重要性.学校各个机房建设时间不同,每个机房的场地、辅助设备也不尽相同[5],因此在设计机房环境及智能监控系统时要先了解机房的设计及机房内设备的选型,以发展的眼光作好规划,让系统能够根据实际发展情况灵活配置,并能够支持多种远程处理方式.同时,绿色、环保是人们关注的重点,在今后的机房设计中也应该体现这一理念.
高校信息化的发展让机房内的高昂设备愈积愈多,且趋于复杂化.为了减少设备故障带来的经济损失和人力投入成本[6],采用机房智能监控系统是必然的选择.机房智能监控系统的应用节省了机房管理任务的人力和物力,保证了机房设备和环境数据的实时准确监控,为保证设备安全稳定运行提供了有效手段,同时也为学校信息化建设打下了坚实的基础.
[1]李青梅,张文旭,束雄英.单位网络设备环境智能监控系统设计与实现[J].科技咨询,2012(2):39-41.
[2]刘伟.谈通信机房动力及环境监控系统设计[J].信息通信,2013 (5):173.
[3]李玉环.通信机房监控系统的研究[J].中国新技术新产品,2013 (7):90-91.
[4]闵军,李太凤,李伽,等.SolarWindsOrion网管系统的建设和管理精解[M].北京:清华大学出版社,2009.
[5]李全忠.计算机机房运行物理环境自动监控系统设计与实现[J].电子世界,2012(2):33-37.
[6]郝章勇.关于机房动力环境监控系统的应用研究[J].科技与企业,2014(8):146.
(编校:李青)
Design of the IntelligentMonitoring System in Network Server Roomsof Universities
LIJia,ZHANGHongli
(Network and Multimedia ManagementCenter,Yibin University,Yibin,Sichuan 644007,China)
With themonitoring of the network core server rooms in universitiesas the background,a setofmonitoring sys⁃tems of the network server rooms,which is composed ofmonitoring and management platform,monitoring unitmodule and remotemonitoring terminal,is designed.Themonitoring andmanagementplatform which is based on TCP/IP agree⁃ment isapplied to effectivelymonitor the normaloperation of the power system,UPSsystem and the air-conditioning sys⁃tem,so that thewholenetwork and variousapplication systems in the university can beguaranteed.Based on the previous study,the paper proposes some measures and suggestions on integrating the system and the network monitoring plat⁃form—SolarWindsOrion Network System,henceestablishing a new networkmonitoring platform.
network server room;intelligentmonitoring system;study ofapplication;SolarWindsOrion
TP29
A
1671-5365(2015)06-0097-06
2014-12-01修回:2015-01-14
李伽(1973-),女,实验师,硕士研究生,研究方向为多媒体设备维护管理
网络出版时间:2015-01-15 17:08网络出版地址:http://www.cnki.net/kcms/detail/51.1630.Z.20150115.1708.001.html
引用格式:李伽,张红丽.高校网络机房智能监控系统设计[J].宜宾学院学报,2015,15(6):97-102.