数据中心智慧运维管理的设计与讨论

2022-04-22 05:44张嘉平
智能建筑电气技术 2022年1期
关键词:数据中心运维人工

张嘉平

(北京国安电气有限责任公司,北京 100093)

1 数据中心智能化建设与运维的背景及现状

数据中心运维管理从技术角度通常分为三个阶段。

(1)第一阶段:人工管理阶段

这个阶段是指数据中心的整体运维管理全部依靠人工处理,人工记录运维管理日志还有数据中心中各种表格及文档的存储。运维管理的方式主要依靠人工手动书写记录和储存,是一种相对古老和原始化的运维管理方式。

(2)第二阶段:平台化管理阶段

这个阶段又被称为流程化管理阶段,是指数据中心在运维过程中,逐步摆脱人工手动处理的方式,是依靠建筑智能化各子系统软件平台上的规范化操作,整个过程中依据一定的操作流程进行系统化运维管理,这种流程化的平台操作方式能够充分实现对于机房资源的统一调配,也更加方便数据中心的统一化、集中性管理,在运维管理日志、机房表格和机房文档的整理效率也有极大提升,保障高效率的同时又可降低出错的概率。

相对人工管理阶段来说,平台化管理阶段已经是数据中心运维管理方式的一个大跨越。

(3)第三个阶段:自动化管理阶段

该阶段又被称为智慧运维管理阶段,是一种依靠自动化、智能化为主要运维手段的数据中心管理方式,如果说平台化管理阶段仍然属于半人工管理的范畴,那么智慧运维管理阶段可以说是人工辅助智慧化平台的阶段,大部分人工操作已经由大数据及人工智能所替代。

2 数据中心智慧运维管理设计

当前的数据中心智能化发展背景正如上文所提到的,还处于起步阶段,物联网技术和人工智能技术的研发深度还有待强化,自动化、智能化的数据中心智慧运维管理模式还在逐步摸索的过程中,模式框架以及管理体系构建都停留在理论阶段,对于实际落地实行还有很长的路要走。

数据中心智慧运维管理模式的有效构建离不开人工智能、物联网和机器人等技术手段的研发进化,这些技术手段的成熟与否直接决定数据中心智慧运维管理模式的落地施行效果,只有技术成熟才能大大增加智慧运维模式落地的可能性。对于数据中心智慧运维管理策略,首先要进行需求挖掘,有需求才能有生产,数据中心的管理人员可以依靠在日常管理工作中挖掘需求,寻找人工管理的每个环节可以被人工智能替代的部分。

数据中心智慧运维管理的发展趋势可以从以下几个方面进行分析。

2.1 基于物联网技术的设备资产管理

数据中心设备数量种类繁多,传统的资产管理系统会给每个设备贴上以条形码和二维码为主要形式的标识,这样的做法有利于在工作中可以准确识别每台设备的身份功效,但仍旧过分依赖于人,无法做到对设备的实时管理。而利用基于iBeacon的电子标签,可以准确识别每台设备的身份,传统的资源管理系统在这个过程实施时需要以人工的方式对这些具有标志的设备进行及时更新,并对设备状态和信息进行记录,但物联网技术可以实现依靠智能巡检技术对这些设备进行日常巡检和管理,实现脱离人工管理手段。iBeacon技术在识别过程中可以完全实现零接触,当设备贴好标签投入机房使用时,智能巡检设备就可以对设备数据芯片进行识别,从而实现对机房设备设施的智慧管理。

2.2 数字孪生技术与智能布线管理系统的结合

智能布线管理系统,是用来管理综合布线的硬件和软件的系统,通俗称为电子配线架系统或者智能配线架系统。系统前端通过安装在综合布线配线架端口内的传感设备,将端口的连接状态采集到区域监控单元,一个区域监控单元通过监控连接到其的配线架的端口通断情况,进而监控到该区域中连接IP设备的情况。

智慧运维管理平台通过IP网络和各弱电间内的监控单元通讯同步,将所有的连接状态信息汇总起来建立对基础设施实时准确的配置管理数据库(CMDB),并在图形化的用户界面利用数字孪生技术实时呈现出来,使管理者对于整个系统一目了然,免去管理者手工维护数据库系统的复杂性。另外,平台可以向区域监控单元发送现场操作指令以实现自动流程化的操作,避免人为误操作的发生。

通过智能基础设施建立智能基础设施管理系统,软硬件平台工作在物理层和网络层。与网管软件不同,网管软件工作在网络层,虽然可以向网管员反馈逻辑链路的故障,但不能确定故障的物理位置,而智能基础设施管理系统可以做到这一点。该系统能够实时、准确、方便、图形化地提供综合布线系统端到端的链路连接情况,并且实时监控其状态,提供电子化流程操作,自动更新和记录所有的信息到数据库中,节省维护操作的复杂性,提高维护的效能。

2.3 智能巡检机器人

信息技术的高速发展,使得数据中心的数量和规模随着数据量的增多而扩大,人工管理模式已经不适应当前数据中心的发展趋势,而智能机器人技术的研发正在逐渐帮助运维方走出这个困境。例如,其可以辅助人工在数据中心进行日常巡检工作,减少人工劳动强度;具有可见光与红外视频图像采集功能,工作人员可通过上位机软件操作智能巡检机器人移动到指定位置、控制云台自由转动,可实现近距离地观察拍摄目标物体,将监控范围覆盖到盲区;机器人可拍摄出现场各种设备高清图像和红外热成像,并将采集到的信息经无线局域网实时传输到主控室,在主控室的工作人员便可根据图像判断出现场各种设备是否安全。当发现设备有异常情况,工作人员可在第一时间查清问题原因,并采取相应措施。另外,智能机器人还可搭载气体检测仪、温湿度传感器、交互式实时对讲平台等设备,对机房内温度、湿度环境、设备工作状态、设备运行温度、空气含氧(O2)量浓度、环境空气烟雾颗粒物(PM2.5,PM50,烟雾)以及有毒与可燃气体(CO,H2S,CH4)浓度大小进行监测,在巡检中通过将监测到的数据传递到管理平台,经由大数据进行分析,从而达到故障风险预估的效果,亦可辅助消防系统做到消防的早期预警。

2.4 利用AR技术进行安全防范

AR实景地图用于以最直观方式展示机房实景。其特点为可以有效地提升视频监控的管理和使用效率,帮助管理人员快速、实时了解机房实况。该技术的核心能力为对指定区域内的所有监控点进行统一管理,通过视频快捷调度,明确区域内的监控资源和监控范围,实现视频监控的直观、可视化的呈现。系统采用C/S架构部署,并配合WEB客户端完成部分预配置功能,它通过将视频监控资源以AR标签叠加在地图上,实现位置信息与实时画面的同步,能够即时呈现指定区域的监控视频。图1所示为AR监控示意图。

图1 AR监控示意图

结合视频监控系统及人脸识别、行为分析等技术,当有未授权的访问者进入或发现偷盗行为时,告警事件可即时呈现告警信息定位、现场视频、抓拍时间等数据,并通过标签以画中画方式的“预警联动、人脸联动”,进行实景指挥、目标布控和追踪,有利于快速响应紧急事件。

3 结束语

猜你喜欢
数据中心运维人工
人工3D脊髓能帮助瘫痪者重新行走?
高速公路智能运维平台
浅析数据中心空调节能发展趋势
人工,天然,合成
人工“美颜”
关于建立“格萨尔文献数据中心”的初步构想
2017第十届中国数据中心大会榜单
配电线路的运维管理探讨
基于一体化的变电标准运维模式
人工制冷