施 磊,叶震宇
(1.中国移动通信集团山东公司济南分公司,山东 济南 250101;2.中国移动通信集团山东公司 青岛分公司,山东 青岛 266000)
随着“碳达峰”和“碳中和”战略的出台,对数据中心能耗指标做出新规定,不仅对新建数据中心的审批收紧,更对存量机房的能效提出要求。“碳达峰”“碳中和”是我国实现可持续性高质量发展的内在要求,是一场广泛而深刻的经济社会系统性变革[1]。“十四五”时期是我国实现“双碳”战略的关键窗口期,既要推进对现阶段能耗大户的能效优化转型,实现节能减排,又要积极布局绿色能源体系,实施可再生能源替代行动。在“双碳”战略背景下,节能减排是重中之重,空调系统作为核心机房的基础设施,对于设备安全可靠运行乃至系统的节能具有非常重要的意义[2]。
数据中心及老旧通信机房作为典型的能耗大户,面临的节能任务更加艰巨与紧迫。有关数据显示,我国数据中心用电量已经占到了全社会用电量的2.6%左右。随着数据流量呈指数级增长,数据中心设备功耗也在不断攀升,电能消耗和运营成本居高不下的问题愈发突出,其能耗问题将成为重点整治对象。主设备及配套设施的电力消耗是数据中心及老旧通信机房运行过程中碳排放的主要来源,在数据中心能耗结构中,主设备能耗占45%~55%,空调设备能耗占35%~45%,电源及其他设备能耗占10%~15%。除了主设备外,空调系统也是数据中心的节能重点[3]。
通过对大量互联网数据中心(Internet Data Center,IDC)、数据机房的现状和电源使用效率(Power Usage Effectiveness,PUE)指标进行调研,发现大部分在用的老旧机房PUE值都较高。在对机房内设备功耗和空调系统负载容量比的统计中发现,空调系统的制冷能力完全可以满足设备散热需求且有一定的富余,但在节能优化过程中,关闭部分空调时会立刻引起机房内某些设备和区域的高温告警,使富余部分的空调无法关闭,无形中增加了机房的功耗,这也是该部分机房PUE值较高的直接原因之一[4]。
在对老旧机房的调研过程中,分析造成空调系统能耗较大、PUE值较高的原因,并针对存在的共性问题提出了对应的绿色低碳改进措施。
对于机房内温度的调控,最简单的控制方式之一就是对机房内空调各项运行参数进行设置。空调运行参数设置的合理与否直接影响制冷效果及空调能耗,科学合理的参数设置有助于实现空调系统的节能降耗。
(1)温度设置过低(低于23 ℃),冷量过剩,能耗增加。改进措施:确保设备安全运行的前提下,将回风温度上调至25 ℃以上。
(2)空调冗余,未关停,冷量过剩,能耗增加。改进措施:通过采用CFD仿真机房内气流组织来判断冗余空调的失效,在确保设备安全稳定运行的前提下锁定失效(关闭)空调,并根据现场梳理结果设定空调关停级别,关停冗余空调设备。
(3)冬季环境温度较低时,散热效果最佳,制冷效率提高,可减少运行空调数量。改进措施:同样在确保设备安全稳定运行的前提下关闭部分空调设备,提高回风温度设置。
通信设备运行对机房温湿度、洁净度等环境要求严格,机房精密空调通过调整气流方向、送风风量及送、回风温度等保障机房环境满足设备运行维护要求。在空调系统的运行过程中,运维人员往往忽略空调庞大的系统和复杂的参数,简单地认为只要空调配备的容量大于等于热负荷,就可以判定空调对环境具有一定保障效果。但事实上,现网中的空调系统即便制冷量理论上可以满足设备散热需求,但是气流紊乱或不足往往会导致设备局部过热,冷量不足问题频发[5]。为了满足散热需求,往往会配置过量的空调,造成能耗浪费。科学合理的气流组织不仅可以保障设备安全稳定运行,还能达到节能降耗的目的。除此之外,通过实践证明机房空间、机柜设备、地板等实施的气密性,也直接影响着机房空调制冷和气流方案的实施效果。
(1)架空地板静压箱出风口存在无效出风,地板不完整,底座未封堵。改进措施:修复静压箱出风口,修复缺失地板,镂空底座做好封堵。
(2)无设备区域设置通风地板。改进措施:封堵通风地板或换成普通实心不通风地板。
(3)机房门、竖井等未密闭,孔洞未封堵密闭。改进措施:对未封闭位置进行封堵密封处理。
(4)封闭通道,机柜内空余U位挡风盲板缺失。改进措施:在机柜内的空余U位安装挡风盲板。一方面,挡风盲板有效限制了机柜内热空气的流动线路,隔离了机柜内中下层和中上层的冷热气流,避免了中上层服务器进风口在吸入冷空气的同时吸入中下层排出的热空气;另一方面,挡风盲板避免了冷空气通过空余U位直接穿过机柜进入热通道,提升了服务器进风口的冷风利用率,降低了服务器因冷风不足而引起排风扇加速运转所需的能耗。机柜增挡风盲板气流组织如图1所示。
图1 机柜增挡风盲板气流组织
部分机房精密空调系统实际运行时长已超过更新周期为8年的相关规定要求,这些超期服役的空调设备存在老化、故障率高、告警频繁、性能下降、制冷量衰减以及能耗不断升高的问题。
改进措施:从多维度综合评定优先级,先替换优先级高的;对于暂时无法完成替换的,继续积极争取资源,同时加强对该部分空调的日常维护和清理,最大化发挥其作用。
当机房局部过热并超过设备安全运行的温度时,会带来宕机的风险。设备长期处于高温运行,磁盘磁带会因热涨效应造成记录错误。随着温度的升高,计算机的可靠性逐渐降低,使用寿命也逐渐缩减。机房过热现场及仿真实例如图2所示。
图2 机房过热现场及仿真实例
为了消除局部过热问题开启较多的空调,导致空调机组能耗增加,冷热气流掺混,热交换不充分,制冷系统过剩运行严重。
改进措施:优先采用地板下精确送风、风管精确送风、优化周边空调制冷能力及位置的方式,提高机房内气流流通及热交换能力。
通过大量调研分析PUE较高的原因,探讨在用老旧通信机房中常见的空调系统方面的共性问题,提出高效且低成本的绿色低碳节能措施。不同的绿色低碳节能措施应用场景不同,应结合实际情况进行分析并选择适宜的措施。老旧机房的条件较为特殊,大多建设时间久远、设施老旧、现场情况复杂且对安全性的要求较高,节能改造的难度很大。通过采取有效的节能改造措施,从而实现降本增效、节能降碳,助力达成“双碳”目标。