童燕君,彭 秋
(华信咨询设计研究院有限公司,浙江 杭州 310000)
数据中心动力与环境监控系统(简称动环系统)的持续运行可以对动力参数进行实时收集,同时了解最为真实的环境状态。在发生各类故障时,系统会及时记录最新的报警信息,更是在系统运行参数变化中完成故障情况分析,有力促进管理人员相关工作的开展[1]。管理人员可以结合动环系统提供的最新数据分析设备的实际运行情况,科学规避一些潜在风险,从而保证通过智能化控制推动其持续发展。
目前,数据中心项目的建设可能会存在部分硬件无法兼容的问题,而且软件也存在不同程度的兼容问题,无法充分发挥动环系统的应有作用[2]。除此之外,数据中心的规模不断扩大,不同用户的需求也凸显出多样性,而原有的硬件与软件并不具有相应的可扩容性,软件的升级工作也无法有序开展,使动环系统的持续发展遇到巨大挑战。
现阶段,运维人员需要的往往是实时数据,实时数据采集的需求开始增加,而动环系统所具有的采集与后续的分析能力略显不足,监控平台往往只是对数据进行简单采集,对于进一步的分析有一定困难[3]。此外,大部分监控系统多是完成“监”的任务,却不能进行科学控制,从而暴露出只监不控的问题。
数据中心动环系统的硬件结构包括数据采集层、数据管理及展示层以及被监控设备层等部分,如图1所示。动环系统的监控对象主要有供配电设备、空调、新风机、排风机及温湿度等,涉及不同类型的设备,从而保证完整记录与系统运行相关的数据[4]。管理功能需要完成供配电设备监测、环境监测、视频监控管理和告警管理等工作[5]。在整个系统运行的过程中,计算机技术、传感器技术和数据库软件等的全面融合可以保证各类信息得到及时共享,系统具有一定的可扩展性,同时兼容性也得到相应提升。
图1 监控系统硬件拓扑
由于动环系统能够将数据中心的状态进行最直接和最全面的体现,所以其常规建设尤为重要,同时系统要求也较为严格[6]。
首先,在系统连接方面必须满足数据中心机房规模不断扩大的需求(如图2所示),同时二级监控主机与末端监控传感器的部署也应相应优化。
图2 动环系统连接
其次,系统自检要求也极为严格,需要系统将收集到的实时数据传递至监控终端,对于异常情况应采用相应的告警,使运维工作人员可以及时查阅历史数据,保证不会出现漏报或者因系统突发故障而出现一些错报情况。
最后,动环系统的建设需考虑可扩展性的提升,不仅需要考虑监控范围的不断扩大,还应对监控能力做到强化。根据实际监控要求新增部分监控,保证数据采集具有全面性,同时考虑到用户体验的有效提升,应在原有界面上增设总览窗口,才能全面掌握全局的监控参数[7]。
动环系统的发展需考虑从数据存储的可靠性出发,提高数据处理能力,积极使用先进技术,保证其智能化发展方向。
基于先进技术的融入,监控管理一是需要运用AI智能技术,大力研发智能传感器,同时运用先进技术实现数据无线传输,从而对系统未来发展带来有力推动。工作人员可以将AI智能技术与动环系统中的业务层有效结合,也能够优化采集层与传输层,最终将智能的基层采集设备能力做到针对性提升。AI算法的运用可以在定制化设计中优化原有监控系统,运用AI技术完成各类数据的分析,为正确控制决策制定提供数据方面的支持,发挥出可监也可控制的重要功能。二是需要借助云存储技术,为动环监控系统的稳定运行带来足够动力。在具体的工作中,由于一些数据量极大的复杂数据可能受到硬件设备的限制无法进行本地存储,此时云存储技术的融入能够使用快速的数据存储方式,将系统自身所具有的数据吞吐量做到极大提升,不仅可以快速读取重要数据,同时也能够完成高质量的检索[8]。在此基础上,各类业务系统也可以与云存储技术结合,从而满足二次开发的需求,特别是重要数据可以存储在云端,不会受到物理因素的影响,保证数据具有安全性。
由于监控系统的建设时间不同,这会直接导致数据中心所获取的实时数据存在一定的差异,而且在后续共享时也可能失败。因此,监控数据共享能力的不断提升是动环监控系统获得持续前行的关键所在,技术体制的统一也是实现协作共赢的重中之重。
具体而言,一是需要统一名称,即对动环系统中的监控组件进行统一方式的命名,保证其具有规范性。在此基础上,各监控点位所具有的名称得到统一,监控传输信号也更加便捷,运维人员可以结合数据变化情况对发生故障的位置进行精准与快速的定位,从而在第一时间内完成抢修,不会使问题扩大化[9]。二是统一告警等级,这是因为数据中心的级别设置是从设备业务的范围入手,根据设备的重要程度来完成。例如,核心数据的设备动力环境出现问题将启动一级告警;重要的存储设备动力环境存在问题时启动二级告警;一般特点的基础型设备动力环境出现问题时启动三级告警[10]。
在芯片技术不断发展的前提下,监控系统底层设备的集成能力得到极大提升,且基础监控设备的采集范围也大幅提升,实现系统底层设备数据分析与处理能力的有效强化。数据中心动环系统在未来的发展需凭借先进理念的融入,从应用模式方面进行突破。
一方面,重视智能报警。由于数据中心的规模不断增大,未来系统所需监控的对象可以通过基层监控设备所具有的数据采集功能来实现,从而保证数据采集具有高效性与全面性。在必要情况下,监控系统可以完成电力电缆工作情况的监测,从不同角度监测电气情况,向值班人员及时提供可靠的重要数据。除此之外,监控终端的报警信息也可以与消防机关进行联动,在关键情况下完成智能报警。
另一方面,做好数据筛选。相关技术人员需将嵌入式操作系统安装在末端数据采集器中,系统在完成相关数据采集时,末端会马上对收集到的实时数据做好预处理,通过实时分析掌握数据变化的情况,从中筛选出有价值的重要数据,将其分类后完成上传操作。监控平台自身的数据接收能力在设备高效运输和先进技术的共同支持下得到了极大提高,且分析速度也大幅提升。在未来的发展中,可以对基层采集设备进行大力研究,使基层采集设备的能力不断强化,动环系统业务定制能力也将得到有效提升。
目前,数据中心动环系统的运行还存在不同程度的问题,同时其发展也遇到了一些困难。为此,相关部门必须从多角度考虑,重视动环系统的运行及工作调整,突破发展瓶颈,结合时代发展和社会进步对数据中心动环系统提出的新要求,对AI智能等先进性技术加以利用,使得动环系统的运行凸显出更高的准确性,也保证该系统的应用具有极强的可拓展性,推动数据中心高密度和大规模的持续发展。