浅谈数据机房基础设施的智能化运维管理

2021-08-03 08:58:06公安部第一研究所刘静徐常星李滑冰
中国安全防范技术与应用 2021年3期
关键词:动环机房数据中心

■文/公安部第一研究所 刘静 徐常星 李滑冰

关键字:数据机房 基础设施 运维 智能化

1 引言

随着信息技术及其应用的不断发展,数据中心的规模越来越大,数据机房内的模块数量从几个增加到数十个,IT设备数量从上百台增加至上万台。数据机房作为信息化核心,其运维管理问题越来越得到重视。为加强数据中心的运维管理工作,确保数据中心安全、可靠、持续和高效运行,为业务系统稳定运行和信息资源综合利用提供坚实的基础支持,研究如何完善运维流程,提高管理效率,有效保障设备稳定运行,最终实现数据中心机房运营维护的智能化将是必然发展趋势。

2 数据机房的现状分析

数据机房一般由机房区、辅助区、支持区、管理区等功能区组成,数据机房的基础设施主要包括机房、弱电系统、安防系统、电气系统和空调系统等。

北京某地数据机房在建设初期规划了动力、环境、消防、视频、门禁、安防等众多子系统,对机房内所有基础设施、设备及环境进行监控和管理。通过监控系统采集数据中心机房众多设备的数据参数和机房内的环境参数,以此来判断机房设备是否出现故障或异常情况,以便运维人员作出正确判断。随着众多业务的进驻,除数据中心机房内涉及众多不同品牌型号的基础运维设备外,业务系统设备及业务用户的增加,导致机房资产及人员管理的难度不断增大。各子系统的离散、割据,不能满足运维管理信息的数据共享与应用,资产的人工管理模式效率低下,已无法满足运维管理需求。

3 设计内容

针对该数据机房面临的各子系统割据分散、资产管理效率低下的问题,需采用先进的科学技术,并结合管理手段来解决。

技术上依据云计算和物联网等技术构建智能运维平台。其解决方案的主要思想是将数据中心机房分层,包括采集层、平台层和应用层。采集层利用物联网等技术搜集IT设备、动环设备、智能化设备等数据中心机房内的所有信息化基础设施的基本属性信息、隶属关联关系、健康运行状态等信息。平台层将这些信息统一存储、查看和分析处理,实时监控其各项指标、性能及事件。应用层根据各应用场景,实现集成监控、预测分析、智能运维等功能。

3.1 整体设计

运用智能PDU、RFID等监控和检测设备采集数据机房人和事的实时数据,整合各类运维监控系统,形成集成化的统一对外服务,运用数据分析手段对收集的运维数据进行分析,形成数据机房运行状况的实时态势。

将机房区域、通道、机柜、列头柜、设备、空调、UPS、电池组、发电机、水电各处节点等实体建立3D模型,并整合到实验平台进行可视化展示,作为数据查询、查看的窗口。

将设备故障维修记录、运维日报、月报电子化记录管理等形成知识库,建立应急预案管理库作为重大活动保障之需。

平台整合并接入了动环监测、楼控系统、智能PDU、RFID模块、视频监控、出入口控制、服务器、交换机等数据,根据该数据机房管理流程和使用特点,通过对相关数据的关联、融合、分析,结合数据机房3D模型,实现动环、资产、人员、预案、监控、能耗等应用的统一可视化服务。

3.2 数据处理流程

数据流程如图1所示,以电子档案管理数据库为中心,将数据流分成三部分,一部分来自监控设备推送的数据,一部分来自用户在管理过程中产生的基础数据,最后一部分为系统输出的具有业务加工痕印的数据,即用户关心的信息。

图1 运维平台数据流程描述

监控设备采集的数据具有鲜明的实时性、冗余性高等特点。数据传输过程中采用消息中间件搭建消息总线,用以满足传输量;存储上采用内存数据库,以满足高速读写的需要;接收的消息数据用于实时计算被监控对象的状态,并在系统界面上实时展示或告警提示。随着时间流失,内存数据库定时将其数据写入全文检索库便于日后查询和检索,同时根据分析主题需要,将内存数据库中的数据按照分析主题进行整理并写入数据仓库,保存在关系型数据库中。

用户在管理过程中产生的基础数据,主要是依靠人工或其它辅助设备(如身份证读卡器)录入人员、资产、设备、应急方案等数据,数据量适中,传输量不大,因此可直接存入关系型数据库,并定时写入全文检索库,以便检索。

用户指令需通过消息总线传递到被监控设备。

系统输出数据是对设备和用户管理数据进行加工后生成的数据,是试验平台向用户传递机房运维管理过程的重要信息。传输量跟用户访问量相关,系统设计时从并发性、支持用户的在线数、延迟性等方面进行规划,以达到低延迟、高并发的目标。

4 功能实现

数据中心机房运维管理平台根据运维管理工作的需要,除具备权限管理、日志管理、界面展示等基本功能外,还可实现3D立体可视化展示、数据管理、动环监测管理等功能。

在3D立体可视化展示过程中,能高仿真展示完整机房,并能展示设备实时数据。智能运维管理平台系统能从园区逐层展开直至被管理的设备,层级包括:园区—数据楼或动力楼—楼层—机房—动力设备—用电设备。

在数据管理功能项下,具备对实时数据及历史数据进行保存、查询、编辑、导出等功能。

动环监测管理包括对机房环境的温湿度监测、动力系统(配电系统、UPS电池、发电机等)监测、能耗的采集与统计等。在数据机房的动环管理过程中,借助物联网技术,实现对机房全环境及重要设备的温湿度精确监测,并设定每个温湿传感器的温度及湿度的上下限值(包括预警与报警),当监测到的数据超过设定的限值时,可立刻报警通知值班人员或相应主管人员。

5 结语

随着数据中心容量的增加、规模的扩大以及新型设备与技术的引入,数据中心运行与维护的难度也在加大,借助信息技术及物联网等技术手段,可以解决数据中心机房运维管理遇到的难题。未来,数据中心机房将结合业务实际,建立完善的运维管理体系,提高数据中心全面保障能力,从而有效加强数据中心的运维保障能力,最终实现运维目标。

猜你喜欢
动环机房数据中心
舰载发射装置动环断裂故障分析与改进
核心机楼动环系统组网探讨
基于国产化龙芯的动环数据采集系统
酒泉云计算大数据中心
民航绿色云数据中心PUE控制
电子测试(2018年11期)2018-06-26 05:56:24
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
基于云计算的交通运输数据中心实现与应用
热载荷对机械密封动环振动特性的影响分析