吕建忠
(温州市创力电子有限公司)
随着全球气候日趋变暖、能源日趋紧张、能源成本不断上涨,高能耗数据中心正面临着降低能耗、提高资源利用率、节约成本的严峻挑战,如何有效的利用电能受到越来越多的数据中心管理人员的关注,并成为未来数据中心的必然发展趋势。
目前数据中心建设和维护的重点,已逐渐从限制空间转换到考虑建筑物的承重性,而现在就开始考虑用电量了,IDC机房用电量管理需求可以归纳为以下5个阶段的演进历程(如图1所示):
图1 IDC机房用电量管理演进历程
(1)用电安全可靠:保证电源的可靠供应及用电使用的安全性;
(2)精确计量:精确的列柜级、机柜级、服务器级电量计量及机柜微环境监测;
(3)决策分析:计量数据整理、加工、处理形成合理化建议;
(4)动态自动控制:通过错开高峰期控制、维护通知控制、过载控制实现设备动态控制;
(5)良性循环:形成标准化建设指导意见,提高机房能源利用率与机房管理效率。
目前IDC机房的用电量管理仍停留在初级阶段,部分数据中心已向计量方向迈进,但是仍停留在粗犷式列柜级计量层面,如何实现IDC机房设备用电量的精细化管理;如何对用电数据统计分析实现对设备自动的、智能的、动态的控制;如何形成标准化的规划、建设、节能指导意见,最终推广并实现IDC产业的能源高利用率、管理高效率、投资高回报率是值得我们思考的。本文从5个方面就目前IDC机房用电量管理系统应用进行介绍和阐述。
数据中心增容、扩容的速度非常快,要保证安全、稳定、可靠的电力供应要有整体的概念。变压器、配电系统、发电机组、UPS系统、布线系统等是否满足整体供电容量的需求、是否均衡安全可靠、是否满足未来业务发展需要,将关系到数据中心的用电安全,任何单一一个系统薄弱都将无法满足供电安全要求,必须马上对该环节进行改造扩容。
数据中心中每个机架都有预设限制电流,如果机架服务器总体电流即将超过限制电流,用电量管理系统则应该提出预警,告知机架电流即将超标,请用户控制服务器数量。
目前数据中心的服务器上下架管理仍处于不可控状态,而IDC用电量管理系统监控程序则能在工作人员增加或移除设备时向系统做出预警,使服务器、设备柜的变更过程变得可控。
这一层次的需求满足需建立在用电安全可靠的基础上,如果用电的安全可靠都不能保证,那么精确计量就无从谈起,精确计量主要从以下两个方面着手:
(1)数据计量
传统IDC机房中计量仍停留在列柜级的计量阶段,这种计量层面难以了解机房中电量具体消耗在什么地方、电量消耗中哪些是基础设备消耗掉的、哪些是服务器消耗掉的。现在创力已经实现了深入到服务器一级的电压、电流、有功功率、功率因素等参数的精确计量及机柜内微环境温度、湿度、风压等的检测、服务器内微环境温度的检测,能够自动统计某个时间段(分、小时、天、月、季度、年)某列柜某设备柜某服务器的用电量数据及环境量数据或者某范围的设备的总用电量,并生成用电统计报表。
这些数据也可通过智能口上传到用电量管理系统,为决策分析提供理论基础、为收取电费提供依据、为用电容量控制提供数据。
(2)固定资源统计
目前数据中心基础设备(机房空间规划、电缆铺设、建筑结构、气流组织、冷却系统、配电系统)、服务器设备与能耗管理三者之间未产生任何交集,各自只做到基础设备在降低能耗上的解决方案及服务器设备在降低能耗上的解决方案,还未有一种能够将三者都考虑进去的全方位解决方案。创力用电量管理系统则统计了服务器配置、服务器群配置、房屋位置、结构、周围环境、市电种类、电缆长度、空调配置,为分析基础设备、服务器设备和用电成本之间的关系提供基础数据(如图2所示)。
图2 创力用电量管理系统
用电量管理决策分析系统有了前面的精确计量提供的基础数据后会对数据进行进一步整理、加工、处理,为管理者提供更加有用的决策建议。
系统可实现任意时刻(时段)某服务器、某设备柜、某段设备柜,某列头柜的用电功率、用电总量的分析,并对数据进行各项横比、同比、环比,再综合历年同期数据的增长变化趋势以及本年度各月增长加速曲线,预测下时期内某个(某段)设备的电量。
经过对数据的横向比较、同比、环比,可以对空调、照明、高低压配电、发电机组、UPS系统的耗能异常分别进行告警和分析,例如运行了多年的空调设备,会附着很多油腻的灰尘。这些灰尘会造成蒸发器局部堵塞,使风量降低、冷量减小、制冷效果下降,同时耗电量增加,这时如果实测空调用电量超历史同期空调用电量5%(可设)用电量管理系统将发出告警,结合引起告警的原因(如根据历史清洗时间确定蒸发器未及时清洗等),按算法给出及时清洗蒸发器等,保持蒸发器通畅等合理调整建议。
用电量系统能为同IDC机房同时期提供节能测评数据,为相似工况的基础设备能量消耗、服务器设备能量消耗提供评估数据,为以后筛选高效率动力、节能设备提供依据。
由于IDC机房内安装有大量不同规格的服务器、变频空调等非线性设备,致使供电系统中产生了较多的谐波。过多的谐波严重影响了供电系统电能质量,并对现网运行的相关设备产生危害,同时谐波通过在供电系统内流动发热,会浪费电能,用电量管理系统通过分析供电质量,如果设备谐波指标不符合相对应要求,可提出在设备定货时应配定相应的滤波设备或增加相应的治理谐波设备的建议。
在系统对数据进行分析并给出合理化的建议后,就需要人为或者自动的去关闭、开启、优化设备来实现用电量的智能管理,实现电量的动态控制,最终在保证设备性能的前提下使电能得到最合理的分配。
这时的用电动态控制就类似水利、公路的错峰设计,错峰通过水库或其他调节水体的措施,使两个以上不同水源地的洪峰相遇的时间错开。错峰,不同支流上同时流过的水会多些;而不错峰,对干支路的宽度要求就高些。用电量的动态控制是电源的硬件和系统设置的集合,可以帮助节省能量、使系统性能最大化,或者使二者达到平衡。动态控制可以对任何电源计划的设置进行更改,例如三种默认计划(“已平衡”、“节能程序”和“高性能”)。如果这些计划不满足您的需要,可以方便地以其中一个默认计划为基础来创建自己的计划,这种方式可以避免触碰机房机柜的电流限制,合理利用了电网的波峰波谷特性,采取了动态控制后,同样的电力条件下,机柜可以摆放更多的服务器。
在IDC的服务器托管业务方面系统增加了电费缴纳管理,给用户提供了一套完整的用电计费、收费、缴费等管理手段(如:每个柜有限制电量,限制之内标准收费,限制之外高标准收费;按时段收费,用电高峰期一个收费标准,用电波谷期另外一个收费标准)。并可与运营管理收费系统相连接,实现电费的自动结算。为提高服务水平、加强用户管理提供了手段。
在决策分析给出合理化维护经验后系统会以短信、语音、工单等方式通知维护人员,如果设备用电出现异常或者设备微环境出现变化都会及时通知人员及时处理,设备的险情能得到最大程度的控制,避免异常情况扩大。
系统能够提供一个用电量管理告警管理界面,在该界面中可以记录下告警产生的原因、处理的方法及注意的事项等告警相关的所有信息,在系统产生某告警时,系统会根据告警信息自动的去知识库中查找到和告警信息相关的记录信息,并根据记录内容提醒维护人员进行相关的操作,维护人员可以把本次的处理的心得输入到用电量管理知识库中,并根据告警信息量建议下月数据中心用电控制管理的工作任务。
在实现了某机房最佳的动态科学管理后,加强IDC产业可持续的运营管理能力;对于该机房得到的经验库,系统形成合理的IDC机房空间规划标准、省电节能的服务器设备规范、IDC机房空调节能标准、IDC机房配线工程规范等等标准化建设提供了指导意见,大大提高IDC产业管理效率和能源利用率。