数据中心机房UPS供电模式可靠性分析

2020-12-25 03:08王凯
智能建筑与智慧城市 2020年12期
关键词:可用性串联并联

王凯

(北京清控人居光电研究院有限公司)

1 引言

随着物联网、5G网络、智慧城市等新兴技术的发展,数据中心做为大数据和云计算的核心载体,其“城市大脑”的重要性也日益提高。其中,UPS(Uninterruptible Power System)配电系统作为数据中心的重要组成系统,其配置类型和供电模式的可用性、适应性、扩展性、可维护性及建设成本,受到越来越多设计师和运维人员的关注。

2 UPS配置类型

根据《工业与民用供配电设计手册》第四版第2.6节,UPS的配置类型大致分为单台、并联和冗余等三个大类[1];按照供电方式又可细分为后备式(离线式)、互动式、双变换(在线式)、串联冗余、备用冗余和并联冗余等类型。

对于后来衍生出来的双总线供电模式,可保证每一套电源的独立性,这种UPS配置也被称为2N或2(N+1)模式。

3 可靠性与可用性

3.1 定义

在工业产品领域的“可靠”与“可信”,并不是人们通常认为的可以依靠、真实可信,而是有一套完整的定义和度量方法。

GB/T 2900.99-2016《电工术语 可信性》中规定,可靠性(Reliability)是在给定的条件和给定的时间区间,能无失效地执行要求的能力;可用性(Availability)是处于按要求执行状态的能力。

下面引入几个常用的度量指标和公式:平均故障间隔时间(MTBF)、平均故障修复时间(MTTR)、可用性(A)、可靠性(R)、失效率(λ)。

关于式(1)的可用性公式,很容易理解,通常大家习惯用N个9来表征系统的可用性,比如99.9%、99.99%等。假设一个系统的宕机时间(Downtime)等于MTTR,其余时间均为正常运行(Uptime),系统可用性想要达到5个9,需要宕机时间不大于5min/a;可用性想要达到6个9,需要宕机时间不大于31s/a[2]。

其实一般情况下,数据中心的系统可用性指标不需要设置的过高,依照相应的规范要求设计即可;比如城市照明控制系统的可用性,依据CJJ/T 227-2014《城市照明自动控制系统技术规程》第4.2.11条,“中心级系统故障恢复时间应小于2h,平均故障间隔时间(MTBF)应大于 30000h”,按式(1)计算,其可用性约为99.9933%。

3.2 串联与并联的可用性

上节描述的是一个组件的可用性计算,当系统中具有多个组件时,根据现代控制理论和概率学公式,串联与并联的可用性如下[3]:

串联冗余的可用性

比如有两个一模一样的产品组件构造的系统,每个组件的可用性均为0.9,则根据式(4)、式(5)可以得出,并联时的可用性为0.99,串联时的可用性为0.81;所以串联冗余系统的可用性较低,已经很少使用了。

3.3 可用性与可靠性的区别

根据2.1节给出的定义,可靠性是指从系统开始运行到某个时刻,这个时间段内正常运行的概率;可用性是指系统在执行任务的任意时刻能正常工作的概率。比如A系统每年因故障中断十次,每次恢复平均要20min;B系统每年因故障中断2次,每次需5h恢复。

根据式(1)、式(2)计算,A系统的可用性为0.999618,可靠性为0.740818;B系统的可用性为0.998858,可靠性为0.904837。

可以看出,虽然A系统的可用性比B系统高,且A系统的总故障修复时间较少,但其可靠性比B系统要差很多。

4 UPS配置的可用性分析

图1 UPS单路供电系统组件

通过上节的计算,可以看出并联系统的可用性较高,依据GB 50174-2017中对于“冗余”和“容错”的定义,两者都是重复配置,但冗余是针对系统中的组件、单元、模块或路径,而容错是针对整个系统的。简而言之,两个以上的重复单元可称为冗余,但两个以上的重复系统才可称为容错;所以,N模式为基本需求,N+1或N+X模式为冗余需求,2N或2(N+1)模式为容错需求。

4.1 UPS供电系统的冗余模型

数据中心的供电可靠性,不仅要考虑UPS的冗余,其后端的隔离变压器、UPS配电柜、机架负载电源、转换开关等,也应纳入分析计算。

以图1这个满足基本需求的简化模型为例,整个供电系统由4个组件组成:①UPS;②隔离变压器;③配电柜;④负载电源。当采用冗余配置时,根据⑤转换开关的位置,可以把常用的冗余系统分为:仅有UPS冗余、变压器冗余、配电柜冗余以及完全冗余(即容错)等四种模型。

4.2 UPS冗余模型的可用性分析

为量化分析不同的UPS冗余模型,以及冗余组件的多少对于系统供电可用性的影响,以上节中的5种模型为例,分别进行可用性计算。

为简化计算,冗余模型中采用的几个组件,其基础数据MTBF和MTTR如表1:

通过对上节模型的分析,根据式(4)、式(5)代入表1的数据,可以计算得出下表:

可以看出,随着UPS系统的冗余组件逐渐增加,系统整体可用性也逐渐提高;在使用机架式ATS的模型中,可用性已达到6.3个“9”;在完全冗余配置的模型中,可用性可以达到7.7个“9”。

冗余组件的增加,意味着单点故障的减少,同时系统的可维护性也随之提高;年宕机时间也从1.2h,最多可减少到0.72s。

提升UPS的系统可用性,不仅是意味着成本的增加,也意味着需要更多的设备安装面积和线路敷设路由;所以在机房建设之前,应充分了解业主需求,并根据使用功能、投资规模以及建设周期等,进行准确定级,以确定选择一个经济、合理的解决方案。

5 数据中心的技术标准和认证体系

数据中心的基础建设,可以分为供电、制冷、消防、监控、防雷、接地、布线、装修等多个子系统,其中任何一个子系统的分级,都应以数据中心的整体等级需求为准。

表1 组件的基础数据

表2 UPS冗余模型的可用性分析

目前国内外主流的数据中心设计标准和认证体系,主要有国家标准GB50174-2017《数据中心设计规范》、国家认证标准CQC 9218-2015《数据中心场地基础设施评价技术规范》、北美标准ANSI/TIA-942B-2017 《数据中心电信基础设施标准》、Uptime Institute认证《Tier Standard for Data Center Design,Construction and Operational Sustainability》。

GB 50174-2017将数据中心分为A、B、C三级,分别为容错系统配置、冗余要求配置和基本需求配置。TIA和Uptime Institute,他们都将数据中心划分为4个等级,两者对4个等级的定义是一样的:基本需求、冗余组件、在线维护和容错[5]。

国标中的C、B、A级可分别对应Tier I、Tier II、Tier III和 Tier IV。 当 然,两种标准的对比仅是一个粗略的、简化的对应关系,在实际建设和认证中,两者并没有对等性。Uptime认证的Tier分级标准,与国标GB 50174相比,更多的是针对实施结果的考核,而不是基于建设标准的考核,虽然在全球已经得到了很多用户的认可,但是在国内通过设计、建造和运维认证的项目还比较少,有待进一步推广。

6 结语

数据中心机房的UPS供电系统配置模式,是项目设计和建设过程中的一个重要环节,供电系统的可用性将直接影响数据中心的安全运行。本文列举了几种不同的UPS配置类型及冗余模式,并分析计算了每种供电模式的可用性,可以为数据中心设计及运维人员在可用性评估过程中提供参考。

猜你喜欢
可用性串联并联
核电站DCS可用性测试应用研究
识别串、并联电路的方法
基于辐射传输模型的GOCI晨昏时段数据的可用性分析
机构知识库网站可用性评价指标的计量学分析
并联型开关稳压电源的常见故障与维修
柴油发电机并联控制器的思考
轮滑苦与乐
分布式并联逆变器解耦电流下垂控制技术
串联攻坚弹后级引信自适应起爆方法
关于数字图书馆网站的可用性框架研究