苏 杨,黄海松,余 萱,刘维嘉
(1.贵州电网有限责任公司信息中心,贵州 贵阳 550002;2.贵州大学现代制造技术教育部重点实验室,贵州 贵阳 550002)
随着信息和数据产业的发展,越来越多的IDC 以及大型数据中心建成。数据中心主要研究方向是:提高数据中心自动化维护效率以降低成本以及提高绿色节能以降低能源浪费。对于大规模数据中心,机房存在的能耗过高、节能管理不当等问题已经日益显著[1],目前数据中心耗电量超过全国总耗电量1.5%,且以6%复合增长率增加,但是超过80%的能耗浪费率使得数据中心的能源成本占到50%。针对数据中心自动监控,国内外主要集中在短距离的无线网络传输方式上,比如通过ZigBee 或wifi 将数据集中到上位机交互,缺点是传输距离受限,会产生信号干扰以及数据量较小。
建立热能管理能效评价指标是实现评估、控制机房能效的重要方式,建立环境控制量与能效指标的预测模型,通过模型求出工况下最优的空调系统设定参数以达到能效控制。PUE 指标一直作为机房能效评价常用指标,但是并不容易建立准确的控制模型。RUI 作为一种较新的评价指标被提出,但是在工程应用中并没有很好的实践示例。这里重点研究了大型数据中心大数据、可靠的近/远端监控方式和能效控制的应用。
采集系统参数:动力系统电压、电流、UPS 系统电压、后备时间、机房精密空调系统的工作参数以及状态参数(压缩机压力、电热头温度、风扇状态、出口温度、回风温度、新风机开关状态);各机柜节点参数:温度、湿度、烟雾报警、电子门磁、水侵传感器。这些参数给入系统控制中心单元(Center Control Unit)与上位机通信,实现集中控制系统实现参数监控。另外,中心单元获取的安防参数中的烟雾报警、水浸报警及动力参数中过压、欠压、UPS 启动参数,通过GSM 网络以短信报警方式发送给管理员实现无人值守报警。系统结构,如图1 所示。系统能够根据工况条件设定空调系统参数包括制冷温度、送风流量等,使得机房的RUI 达到最优值,达到节能绿色的目的。数据中心上位机将数据上传给网络服务器中的数据库,通过访问web 应用服务器获取与服务器上数据库的交互接口,实现广域网上对数据中心的监控。
图1 系统概述图Fig.1 System Overview Diagram
控制中心单元(CCU)主要设计功能是采集机柜数据与上位机通信,同时向管理人员手机发送烟雾、水浸、过压、欠压、UPS 启动报警信息,是系统数据采集的重要部分。中心模块的主控芯片采用STM32F407ZGT6,中心单元移植LwIP 协议栈,通过tcp/IP协议与上位机通信。LwIP 可在保持TCP/IP 协议基础上减少对RAM 和ROM 的占用,实现在嵌入式设备上运行时的轻量化和可靠性[2,3]。定义了两个DMA 描述符用于完成接收/发送FIFO 和内存之间的数据传输,分别用于接收/发送以太网数据[4]。定义结构体进行协议栈数据包及网络接口的管理[5]。中心控制单元的短信报警功能采用SIM900A 芯片与主控制器串口通信,通过AT 指令以Text 短信方式将报警信息发送给指定管理员手机。基于LwIP的中心控制单元经过长时间测试使用,具有很好的稳定性,丢包率最高低于10%,能够满足数据中心日常使用。机柜内模块布置,如图2 所示。中心控制单元模块及传感器,如图2 中1 所示。门禁电磁发,如图2 中2 所示。
图2 中心控制单元模块布置图Fig.2 Central Control Unit Module
系统热能控制,如图3 所示。建立能效评价指标有利于进行能效管理评估和优化,以PUE 和RUI/SHI 指标进行分析和仿真优化并实验验证。PUE=数据中心所有设备总耗能/所有IT 设备总耗能。PUE 用于实际工程中监控指标,但在对能效管理仿真中,PUE 参数并不能直接求解得到,将使用新的指标来作为替代参数进行仿真和优化,并找到PUE 和RUI 指标联系,用于实际工程评价和控制。
图3 数据中心热能控制示意图Fig.3 Schematic Diagram of Thermal Energy Control in Data Center
式中:Q—数据中心所有设备的发热量;δQ—冷空气经过机柜之后的焓变。定义是分别为:
式中:mi—通过第i 个机柜的冷空气质量流量;(Tin)i、(Tout)i—第i个机柜冷空气进入处温度和机柜出口温度;Tavr—制冷设备冷空气出口处平均温度。
SHI 越低,说明系统热循环更低,制冷设备的制冷量使用效率更高。对于RUI,δQ 还可以表示为:
式中:mj、(Tin)j—第j 个制冷设备进风口处的质量流量和温度。此处用冷空气从制冷设备出风口经过机柜设备到制冷设备回风口处的总熵增。
RUI 越高,则数据中心能效评价越高,越绿色节能。RUI/SHI中的参数便于仿真求解,但是作了很多理想化处理,包括出风管道与流体不发生热交换,冷空气在机柜中与空气的混合是均匀的,但是RUI 或SHI 依旧是可信度很高的评价指标,用于系统的仿真也有很好的便捷性。
采用Flotherm 进行仿真,设定仿真机房是6.0*4.0*3.0m,空调制冷功率4kW,设备热负荷功率(2~3)kW,通过将仿真得到在满足数据中心机柜工作温度在(25~30)℃的换热条件下RUI 指数与制冷温度、送风流量、热负荷功率关系。制冷温度、送风量和RUI 关系,如图4 所示。可以得出,仿真得到RUI 设定温度在满足机柜温度要求时最佳为14℃左右,送风流量随着热负荷功率和设定温度不同,有一个最优值。
根据仿真所得数据样本,对三个变量(热负荷功率、制冷温度、送风量)进行归一化处理之后进行非线性回归,得到变量与RUI 学习模型为:
式中:xloa、xloa、xflo—热负荷功率、制冷温度、送风流量;θi—学习模型中各变量权重。以±5%RUI 作为可接受误差范围,以10 组测量样本作为测试集验证模型的回归正确性,得到学习模型的预测正确率为90%。
图4 RUI 仿真数据图Fig.4 Simulation Data Graph of RUI Index
根据学习模型的凸优性,可以得到在极值点处对应模型最佳送风流量和最优理论RUI 值。则RUI 关于自变量xflo的偏导数存在:f(xflo)=0
此时的xflo为设定送风流量。
将仿真结果应用到实际能效管理中。数据中心实验机房尺寸6.0*4.0*3.0m,热负荷估算为2.5kW,空调4kW,设定制冷温度为14℃,根据推导的送风流量xflo表达式求得为1900m3/h,通过各中心单元数据得到,各机柜温度为(23~26)℃,满足设计要求。理论计算RUI 为87%,采集各机柜出口温度计算得到实际RUI 为62%,实际PUE 为2.01,优化前数据中心采用人工经验设定,测定PUE 为3.21。可以看到,优化的效果明显,理论年度节省电能达到28000°。通过实验数据得到理论RUI 值与实际PUE 关系可粗略记为:PUE=1.1/RUI
通过上式,设计的管理系统可以计算得到理论PUE 值。值得提出的是,由于优化前机房的层高、架空地板高度、机房房间选择等都已一定,使得PUE 优化没有达到最优值[8]。提出的能效模型和计算方法将作为系统一部分,采集数据中心热负荷参数在上位机中给出日常机房热能管理中制冷温度、送风流量的参考值,并通过采集到的各节点温度参数以及功率参数计算得到RUI/SHI 及PUE 值。
前文中心单元的LwIP 提供了RAW 接口,用于完成TCP/IP通信,本节将各机柜中心单元作为web 服务器,通过web 浏览器对各服务器进行访问(B/S 框架),达到数据监测和控制的目的。另外,设计了广域网络结构,将局域网内本地数据库数据上传到网络数据库中,访问web 应用服务器,通过服务器内的数据库JDBC 接口获取数据,实现在广域网上的数据中心监控[9]。网络结构图,如图5 所示。利用CGI 和SSI 完成浏览器在局域网内对各服务器节点的页面访问和数据交互,达到在局域网上参数监测和控制的目的,并将数据储存到本地数据库和网络数据库以实现在/离线监控。广域网内通过访问网络web 应用服务器及数据库实现数据交互。Web 应用服务器选用TomCatV7,数据库选用MySQL5.5 版本。数据库设计power_tb、environment_tb、alarm_tb、control_tb 分别用于存储动力参数、环境变量、报警参数以及控制参数,数据库模块中数据存储表的部分设计,如表1 所示。
图5 系统网络结构Fig.5 System Network Architecture
表1 数据库部分数据Tab.1 Partial Sheet of Database
通过访问web 应用服务器获取访问页面,达到远程监控,如图6、图7 所示。系统数据页面用于显示数据中心各子站点的动力数据、微环境数据、能效参数,集散控制页面用于实现对子站点门禁开关和温湿度控制阈值设置,数据记录页面用于显示查看子站点的采样数据,显示了各采样时间的数据以及数据统计分布,数据包括温湿度、动力参数、报警,采样时间为5min。
图6 系统数据页面Fig.6 System Data Page
图7 数据记录页面Fig.7 Data Record Page
(1)设计实现了基于LwIP 的数据中心机柜中心控制及网关单元,实现了数据中心机柜动力参数、环境参数、精密空调参数以及安防参数采集、与上位机通信和安防报警的功能。(2)以RUI/SHI 作为数据中心能效评价标准仿真得到指标与热负荷功率、制冷温度、送风量数学关系,通过预测模型计算得到特定工况下的空调系统设定参数,实验结果显示优化后的节能效果明显。(3)设计实现了基于B/S 框架局域网、广域网的集中监控和数据存储。设计实现的监控管理系统具有成本低廉,稳定性好的特点,在数据中心参数监测和控制上有很好的实用性。