陈炎昌 阿里巴巴 IDC技术架构师
大话数据中心:能量模型和技术革新
陈炎昌 阿里巴巴 IDC技术架构师
由于数据中心机电系统相对复杂,往往很难通过一套简单的图或者表来描述和对比相关技术应用的情况。本文的目的是提出一种新的方法论图谱来解释数据中心的技术应用情况。本文并未深入探讨专业知识,而是希望从数据中心设计的宽度和高度上提供思路及参考。
数据中心;能量模型;技术革新
近几年,数据中心行业发展除了部件级厂家一直在基础技术应用发展外,拥有巨大规模的互联网公司对成本、效率追求也推动着产业链进步,令数据中心行业增添不少色彩。无论是传统数据中心,还是互联网数据中心以及各种绿色数据中心,笔者发现目前行业上缺乏一个能够很好地描述数据中心技术并且易于比较的模型。例如,Facebook数据中心、国内BAT公司数据中心、谷歌数据中心等,运营商租赁机房怎样能够简单明了地摆在一起进行横向比较?很多人可能会知道一些技术点的差异,例如Facebook是新风自然冷,BAT公司和国内运营商现在用高压直流为主、交流UPS为辅,国内BAT也有搞天蝎机架等,这种技术点的对比,难以形成更直观的理解。同时,由于数据中心机电系统相对复杂,往往很难通过一套简单的图或者表来描述和对比相关技术应用的情况。而本文的目的,就是提出一种新的方法论图谱来解释数据中心的技术应用情况。本文并未深入探讨专业知识,而是希望从数据中心设计的宽度和高度上提供思路及参考。笔者主要想分享两点:
(1)如何用一张图,一套方法论,简单、清晰地描述一个数据中心的技术。
(2)数据中心现在的电气和暖通技术图谱是什么。
笔者在本节将会引入新的概念,叫做能量模型。什么是能量模型?先抛开那些非数据中心机电基础设施的话题,例如服务器、存储、网络、应用层面等。笔者对能量模型的定义,就是能量传输到关键设备然后耗散的模型。从这个最基本的原理出发,把能源获取的形式考虑进去,包括热电三联供、太阳能、风能等新能源,可以得出如图1所示的能量转换过程图。
图1 能量转换过程流程图
简单的能量转换流程图,体现电力既需要供给计算机等关键负载,也需要给散热设备供电从而排走废热。接下来,把供电系统、散热系统以层级进行分解,这种层级的关系至少包括:
(1)Component,计算机设备的部件级。
(2)Server,计算机设备级。
(3)Rack,机架级。
(4)Row,行/列级。
(5)Room,房间级,MV/LV ROOM,中压/低压配电室。
(6)Building,楼宇/楼层级。
配合电能和热能的能量转换,以及上面的层级,就会得出一张能量模型图谱(见图2)。
对于图2所示的图谱,只需要把相关设备技术在合适的层级表示,就可以得到一个数据中心的能量模型。笔者用比较常见的中大型数据中心作为案例进行剖析,具体参见图3。
图2 能量模型图谱
图3 中大型数据中心能量模型
通过如图3所示的能量模型不难发现,一般数据中心的电力通过发电机和市电切换的ATS、UPS和电池,到最后的服务器内部,由PSU和VR转换给相关设备所需工作电压。而设备的热量,通过散热片、服务器内部风扇排出后,会通过房间精密空调、冷冻站设备、冷却塔排出室外。
同样,这个能量模型不仅适用于中大型数据中心,也适用于非常小的网络间和IT设备间。以现在国内小型网络通信间、CDN节点、边缘计算用的机柜式Mini机房为例,通常这类设备为单个机架集成UPS、电池、空调、配电、管理软件等,图4为某厂商产品示例。
同样,可以把这种解决方案按能量模型通过图5表示出来。
另外,国内互联网数据中心、天蝎机架、高压直流等方案的能量模型可参见图6。
需要值得注意的是:
●高压直流的电池在直流母线上,交流UPS在能量路径上有所不同。
●如果改成中压发电机,ATS切换需要在中压母线上。
●天蝎机架,服务器内部不再有PSU,转而采用机架级别统一的PSU,同时服务器内部也没有风扇,采用机架级别的风扇背板,有关天蝎机架的相关标准规范,可以查阅www.opendatacenter.cn的相关内容。
笔者从简单原理逐步引入整个能量模型的核心思想,同时对国内一些常见数据中心技术应用组合进行了举例,用能量模型进行了分析。需要明白的是,能量模型并不能很好地反应数据中心设计的Tier可用性等级。笔者将会以能量模型为核心方法论,展示现阶段主流技术以及创新技术的形态。
图4 某厂商产品示例
图5 某厂商解决方案能量模型
图6 国内互联网数据中心、天蝎机架、高压直流等方案的能量模型
能量模型,不但反映了一个数据中心的应用技术组合,而且还可以就电气系统或者散热系统单系统,进行更深入的技术探讨。笔者就目前出现的不间断电源架构系统上,对现有的方案以及正在发生变化的技术革新进行横向比较(见图7)。
图7 对现有的方案以及正在发生变化的技术革新进行横向比较
对7种方案,笔者也给出对应案例,具体参见表1。
能量模型的每个层级都代表市场。从能量模型中也可以发现,实际上互联网公司的创新,在电源本质上并没有任何的改变。在不同层级上做后备电源UPS和电池备份,意味着整合不同的产业链资源。生产制造商都在想方设法让自己可以在更多层级里提供解决方案,例如从房间级到机架级,同时也在各自能力最强层级里尽量优化电源的效率。层级越低,可能因为型号繁多导致难以标准化,纵使看上去规模大也未必能形成技术和成本优势。
表1 根据方案描述给出参考案例1
谈完电气系统,再来看散热(制冷)系统的变化,类似上面电气系统的分析方法,散热系统也按照层级以及应用技术展开对比,具体参见图8。
根据能量模型图,给出6种案例,具体参见表2。
通过能量模型,只要把电气系统方案和散热系统方案进行组合,就会得出多种方案。所以,不妨把那些看上去酷炫技术的数据中心拆解出来分析一下其机电系统,基本就是这几种形式进行组合。实际上,机电设备本来就是基础行业和学科,暂时在物理学(电磁学、热力学)、化学(储能)上没有突破性进展,目前技术创新更多是技术改良以及整合供应链。拨开大数据、云计算等云雾,数据中心基础机电设施仍然还是那些技术,不同的是,技术应用场景会不断变化。
进一步地,可以把若干技术横向和纵向组合在一起,就可以在能量模型上做出各种模块化。从技术上来说,这些模块化如何定义设备涵盖范围,简单而言就是如何把它们圈起来,是通过集成交付也好,还是产品集成研发也好,最终目的就是做到一起而已(见图9)。
图8 散热(制冷)系统能量模型
这种模块化的方式,对技术本质基本没有任何创新,更多收益来自供应链,在交付上。笔者并非想否认做模块的价值,只是希望读者更深入地理解能量模型能够分析得出什么,以及怎样看待技术问题的思路。
表2 根据方案描述给出参考案例2
图9 若干技术横向和纵向组合在能量模型上做出各种模块化
数据中心由于专业繁多,很多人往往只专注于自己的领域而没有站在更高的角度思考技术的影响及技术的价值。本文的目的,引入能量模型的新理念去思考整个技术架构和产业变化。通过本文介绍的能量模型的示例可以看出,即使互联网公司如何创新研发,暂时也没有突破技术本质的边界,差异的只是技术的表现形式。因此,无论是作为用户,还是设计院、集成商亦或设备制造商,要清楚地知道在能量模型里,自己需要什么不需要什么,商业和技术能力边界在哪里,哪些是自己有竞争力的。选择合适的技术和成本模型,比单纯追求模块化和创新更有价值。
2016-09-20)