◎王旭 张建业 陈涛
电力信息机房智能化监控系统方案研究与设计
◎王旭 张建业 陈涛
电力信息机房智能化监控系统帮助运维人员实时掌控机房的整体的可视化信息,动态环境信息、动力信息、设备运行参数,能够提高运维人员工作效率,丰富运维手段,强化机房的信息化管理。通过平台的应用可以实现机房管理可视化、模块化、数字化、报表化,能够帮助企业进一步提高信息化管理水平。
随着电力公司信息化建设逐步推进,机房规模逐步变大,其重要性也日益重要。机房动力环境设备主要包括供配电﹑UPS﹑空调等,一旦这些机房动力环境和设备出现故障或灾害,就会危及机房内主设备的安全正常运行。本文将在机房及动环监控三维可视化管理﹑进入机房人员动态定位跟踪﹑机房自动巡维﹑设备连线管理等多个方面对机房建设与改造提出新的解决思路。
信息化机房作为电力公司信息化的枢纽,其安全稳定运行直接关系公司信息化工程的安全,目前机房内建成了侧重各专业需要的动力环境监控系统,对机房内电源设备﹑环境状况进行采集监控以及视频监控,并设置告警规则,通过语音﹑短信等方式告知监控运维人员,但目前没有统一的机房动力环境设备﹑视频设备的监控平台,需要通过动力环境设备﹑视频设备自带的监控系统查看设备的监控状态,并且这些机房动力环境设备﹑视频设备的监控数据﹑监控页面等由于各方面的原因,无法与其他系统共享,因此告警规则等方面也没有办法进行统一配置和管理,导致告警不可控或告警的可用性比较低。主要存在以下问题:
现场运维信息化程度低:在现场动力环境维护信息的载体是图纸﹑表格﹑文本,通过电话与通信调度监控人员进行沟通,协同处理现场问题,致使效率低下﹑准确性不高。
机房监管相关信息查询﹑展现方式单一:目前对于信息机房动力环境量﹑门禁﹑视频等相关信息,只能通过电脑登录各自系统进行查询,操作繁琐,且依靠人脑将这些信息关联起来,缺少将这些数据进行综合展现的平台,此外缺少通过移动终端方便地使工作人员在任何时间﹑任何地点查看机房监管相关信息的手段。
现场运维工作难以进行绩效考核:由于信息机房物理设备日益增多,同时各种动力环境设备的数量还在不断增长,维护和优化的工作显得日趋紧张。但是在现场运维时,维护人员是否按要求保质保量的完成运维工作的要求,目前缺乏有效的监督手段,运维工作质量无法保证。
机房相关监控系统各自为阵,存在信息孤岛现象:缺少有效手段将其数据(如动力环境量﹑门禁﹑火灾﹑视频﹑工作票等)进行融合,并在此基础上进行综合联动,综合展现,从而进一步保障信息机房安全﹑稳定地运行。
信息化机房可视化管理及智能运维平台项目,它的着眼点为“智能化”﹑“自动化”﹑“立体化”﹑“集成化”的进行机房运维,关注细节到设备级﹑接口级的运维管理。平台融合动力环境采集数据﹑机房资产数据﹑设备连接关系数据﹑日常运维数据等多维数据源,以尽量用工具方式分析判断机房的运维情况,减少人为干预机房及设备,实现机房进行自动巡维,进入机房人员动态定位跟踪,机房无死角可视化管理,机房业务分类管理等。
机房及动环监控三维可视化管理
机房是立体的空间概念,包括配电﹑制冷﹑消防﹑通信机柜﹑布线等多种环节,平台通过3D建模技术实现机房的桌面化3D呈现,可实现楼宇可视﹑机房可视﹑机柜组可视﹑机柜可视﹑设备可视﹑端口可视,实现所见即所得,根据需求在各设备3D模型上分布设备IP﹑温度﹑湿度﹑告警等静﹑动态信息。
动环监控系统分布于各机房内部,是通过对机房动力设备和环境等信息量的采集实施监控,传统的动环监控是抽象化的监控方式,即通过设备分类与列表陈列方式提供动环系统的数据与分析内容。随着现有传输网络的改善,仅有的数据监控已经不能完全满足信息化发展的需求,本项目结合机房可视化技术,实现了动力机房﹑信息机房的可视化展示﹑数据分析﹑业务联动等内容,可视化效果见图1。
图1 动力机房与信息机房3D可视化管理
可视化管理能够提高运维人员对机房细节的了解程度,提高运维能力,增加运维手段;操作方便,形象,模型成像角度多维;信息展示及存储静态与动态结合,实时与历史共用,统计与分析并重。图2所示为信息机房IT设备可视化管理的部分内容,可细致到接口与丝印级别:
图2 IT设备接口级可视化管理
进入机房人员动态定位跟踪
机房是安全保密性要求非常高的场所,人员出入都有严格的管理,但人员进入机房后的行为管理是更重要的及追求细节的管理需求。机房IT设备往往分割成以服务器,网络设备,制冷设备,配线单元等不同区域,进入机房的运维人员尤其是定点厂家的运维人员需要进入的是指定的区域空间﹑指定的机柜甚至是指定的设备进行运维操作,平台提供人员机房内动态定位跟踪功能,根据人员佩带的电子标签识别装置,安装于机房侧面及角落内的无线定位设备通过实时计算获得人员的定位信息并自动显示在机房3D模型中,可对人员限定行走区域,超过区域则平台会显示告警信息提供给运维监管人员。
配合机柜门禁管理及机柜室内定位技术则可进一步监管到人员动态操作行为,如驻留时间﹑开门动作﹑移动IT设备动作,并形成记录及报表。如图3所示。
图3 利用机房空间定位实现人员动态定位跟踪
机房定期巡维是运维人员日常管理的日常重要职责,平台提供自动巡维功能,结合机柜微环境管理,IT设备动态运行信息提取功能及机房3D可视化呈现手段帮助运维人员获得量化的巡维数据,提高机房运维效果及运维效率,减少甚至摆脱靠运维人员目测方式进行巡查,提供数字化运维数据及报表。巡维策略可根据实际需要选择巡维路线设定﹑告警优先巡维﹑巡维周期配置等多种组合方式。
设备连线管理
平台提供端口级别的设备连线管理功能,机房规模越大设备连线关系就越复杂,通常情况下运维人员会用标签形式将机房布局布线进行归类,形成EXCEL表格等形式的统计信息,表格的维护﹑查找往往比较费时费力,尤其在工作交接过程中容易形成纰漏。平台的设备连线管理功能有效地解决了上述问题,对连线关系形成可视化展示及后台记录,让运维人员一目了然的看到设备间的连线方式,连线种类,设备的连线布局,并可根据策略输出连线关系报表,让运维人员对连线的管理从台账式管理进入到桌面化管理阶段。
图4 网络拓扑及连线可视化管理
机房IT设备资产管理
平台提供智能化﹑报表化的机房IT设备资产管理,依托机柜室内定位技术可实现IT设备资产精确定位﹑IT设备资产自动盘查﹑IT设备资产自动追踪﹑IT设备资产快速查找﹑IT设备资产信息动态录入等多种功能,为运维人员提供可量化﹑可备份﹑可溯源的IT设备资产管理手段,提高运维人员工作效率,减少人力工作并提高IT设备资产管理的准确性及实时性。如图4所示。
核心设备状态管理
机房的服务器﹑交换机﹑路由器等设备是运维人员最为关心的核心设备,需要高的关注度,其动态的运行状态的提取﹑分析﹑预警是帮助运维人员管理核心设备的重要辅助手段,平台提供核心设备状态管理功能,通过核心设备的SNMP管理协议提取核心设备的运行信息并根据参数阀值的设定形成预警及告警信息。也可通过带外console口管理器的形式通过核心设备的console口提取参数信息。参数信息可选择性的布置在机房3D模型空间内,可模板式的配置在自动巡维功能中进行巡维关注并产生告警及预警内容。
图5 信息化机房业务域划分规则图
结合动力关系的业务分类管理
动力系统支撑机房的各类业务,而机房的业务又是由各设备支撑的,各设备间的端到端的连接关系构成了业务拓扑,业务服务于具体的机房运维系统,如安防系统﹑政务系统等。信息化机房可视化管理及智能运维平台通过设备﹑端口﹑场景三大要素并结合其供电关系构建机房业务域,依托设备间端到端的连接关系串联起支撑业务的设备(逻辑域),关联动力数据﹑业务数据,并根据具体业务特性设计可视化场景予以管理与呈现,从而形成关联动力信息的可视化业务管理。图5为信息化机房业务域划分的物理支撑规则图。
机房运维经验库管理
机房的运维是长期的不间断的过程,问题总有发生,解决,再发生,再解决的过程,运维人员总有调岗变动的时候,运维经验的规范化积累及传承就是提高运维人员水平从而保障机房运维管理水平的重要因素。平台提供机房运维经验库管理功能,对各种IT设备建立了依据设备种类及厂家索引的设备图形库,提供高清的前面板﹑后面板图形展示;根据IT设备库的索引一一对应建立IT设备电子文档库,用于运维人员放置对应设备的说明书,操作指南等文档;根据IT设备库的索引一一对应建立IT设备运维经验文档库,对任何IT设备曾发生的运维事件根据标准化表格进行记录,形成可传承的信息载体。
系统包括:系统采集层,包括对动力设备﹑环境设备的遥测﹑遥信等量的采集,并可辅助实现遥调以及遥控。如图6所示。
数据存储层:数据存储层主要从数据量以及系统响应速度方面考虑,资源(设备)类数据﹑用户数据﹑配置数据等涉及到频繁联合查询的放在功能强大的关系型数据库(比如oracle﹑sqlserver),而数据实时性高,数据量大的性能数据存采用分区表的形式存储。
数据访问层:数据访问层一方面是连接展现层和数据存储层,以及数据采集层和数据存储层的桥梁。另一方面把展现层和数据存储层分开,可以方便的接入第三方采集系统的数据。
数据展现层:数据展现层是对监控数据的多形式展示,方便用户从不同的维度了解系统的运行状态。主要包括监控中心﹑告警中心﹑三维机房﹑安全管理﹑视频监管和设备管理等重要模块。
图6 总体架构图
业务架构。平台业务架构依据业务范围与开发范围确定,完成动环监控平台(包括监控中心﹑告警中心﹑设备管理﹑视频监控﹑门禁监控﹑安全管理),动环数据采集系统以及智能视频监控系统(包括机房视频实时监控模块﹑智能分析模块﹑预置位管理模块等)。
动环监控平台采用B/S结构,动环数据采集系统采用C/S架构,和动环监控平台以数据方式集成;智能视频监控系统采用B/S架构,通过页面的方式和动环监控平台集成。
应用架构。机房综合监管平台应用架构依据业务范围与开发范围确定,完成动环监控平台(包括监控中心﹑告警中心﹑设备管理﹑视频监控﹑门禁监控﹑安全管理),动环数据采集系统等。
部署方案。平台部署包括动环监控子系统(包括动环监控﹑视频智能分析)的部署,以及视频数据采集服务﹑视频智能分析服务﹑动环数据转换服务﹑数据库访问服务等的部署,至少需要两台应用服务器。未实现动环设备监控的机房,需要根据监控设备的多少判断是否需要多串口服务器。整体部署架构如图7。
图 7 部署架构图
本方案的设计与实现可以解决信息机房动环量﹑共作票﹑视频等信息的汇集与综合展示,在此基础上进行联动和对工作人员在机房异常行为的分析,通过移动监管子系统可实现工作人员在任何时间任何地点掌握信息机房的全面信息,确保信息机房安全稳定地运行,具有较高的推广价值,为公司信息化建设提供更高的安全保障。
新疆电力科学研究院)