1. 中国建筑设计研究院机电院,北京 100044; 2. 中国农业银行信息技术部,北京 100036
胡 桃1 / 于智勇2
障是由电池失效引起的,电池在保修期中失效的比例达到5%。电池(特别是阀控电池)可以在2天内就由好变坏, 例如图1 所示的电池。可以看到其内阻在两天内爬升剧烈,此电池已失效。整组电池的性能往往受最差电池的影响,失效的电池对于组内其他电池也是一个负面影响;设计寿命10年的电池实际使用往往只有46年的时间(特别是在UPS系统)。
设置昂贵的电池但不进行有效的监测,其后备电源的可靠性远不及具备了高质量电池监测的廉价电池系统,因此日常对蓄电池的监测维护十分重要且必不可少。
近年来数据中心的建设已成为电信业、金融业、互联网业等行业的建设热点,大型、超大型的数据机房不断涌现。在数据中心建设中花费巨大财力配置大量的UPS和发电机,作为市电断电或发生异常等电网故障时的后备电源,24h全天候待命,其对数据中心供电系统的保障具有十分重要的核心意义。
UPS的核心组成是蓄电池,UPS能否正常工作运行取决于蓄电池是否正常。据统计,UPS系统超过75%的突发电源故
障是由电池失效引起的,电池在保修期中失效的比例达到5%。电池(特别是阀控电池)可以在2天内就由好变坏, 例如图1 所示的电池。可以看到其内阻在两天内爬升剧烈,此电池已失效。整组电池的性能往往受最差电池的影响,失效的电池对于组内其他电池也是一个负面影响;设计寿命10年的电池实际使用往往只有46年的时间(特别是在UPS系统)。
设置昂贵的电池但不进行有效的监测,其后备电源的可靠性远不及具备了高质量电池监测的廉价电池系统,因此日常对蓄电池的监测维护十分重要且必不可少。
图 1 电池内阻曲线
自上世纪80年代以来,人们便开始研究电池的物理化学特性,设想通过测量代表电池性能的参数,预知电池的状态变化。经过20多年的反复验证,电池的欧姆值的趋势变化,能够准确地反映电池内部结构和状态的变化,为预判电池故障提供准确的依据。
如图2所示是一组采用电池监测系统监测的电池曲线,这组电池中,25号电池和49号电池的内阻发生异常,其数值超出了整组电池正常内阻值的125%,并触发报警。对这组电池进行放电试验,如图3可见,25号电池和49号电池的放电曲线显示放电电压落后,电池容量不足。
图2 一组监测中的电池的内阻值曲线
图3 一组监测中电池的放电曲线
通常情况下,用户每个季度或每半年才对电池做一次比较全面的人工电池检测,有的甚至没有检测。与其他电子设备不同的是,电池作为一种电化学设备,其性能状态很不稳定,容易在短时间内发生很大变化。即使是每周、每月进行定期检测都无法保障电池在下一次检测到来之前状态依旧良好。常规的电池测试已无法满足预防应急供电故障的需要,因而为电池系统配备安装实时在线式电池监测系统,对于提高数据中心供电可靠性具有十分重要的现实意义。
以下为按IEEE推荐的蓄电池维护规程 (IEEE 1188),传统监测与在线实时监测系统的比较:
IEEE 1188月度人工维护 在线式电池监测系统系统电压,充电电流,温度,通风和目测电流和温度的实时监控没有通风和目测季度每月检查的基础上电池单体内阻,负极温度,电池连接电阻半年电流和温度的实时监控电压每小时测一次电池单体欧姆值每天测一次每月和每季的基础上单体电池电压电流和温度的实时监控电压每小时测一次电池单体欧姆值每天测一次年度在所有上面内容的基础上电池单体间及连接配件的电阻容量测试电流和温度的实时监控电压每小时测一次电池单体欧姆值每天测一次负载放电时给出放电性能曲线
1)便于安装:考虑到UPS的使用特点和使用场合,电池监测系统的安装应考虑以下两个因素:
(1)设备停机时间:数据机房在正常的运行中,若要合理安排重要用电设备的停机时间是比较困难的,因为这可能造成业务中断,导致经济上的损失;同时,操作人员的人身安全以及相关机电设备的安全也必须得到足够的重视。如果用户能够通过交替关断电池组的方式逐步完成安装,似乎能避免上述情况,其实不然。根据铅酸蓄电池的使用特点,如果一个电池系统包含两个并联电池组,可供电15min左右。在关断其中一个电池组,保证另一组在线的情况下,系统所能提供的用电时间是远远少于7.5min的;大多数情况下,甚至少于1min。因此,由于安装工程所带来的供电中断对整个用电系统的影响是十分巨大的。
(2)施工难度:在实际施工现场数据线连接十分复杂,在安装过程中很容易出现故障,难以排查,而且需要更多的维护和检查。而对电池监测系统的要求是:一定要比电池系统更加稳定可靠,否则由电池监测系统引发的频繁误报警,会使用户忽视真正的故障警报。因此最有效、最安全的解决方案是使用光纤作为通讯媒介,避免大堆电线带来的故障排查困难和安全隐患。
2) 扩展性:一套优越的电池监测系统应当有很长的使用寿命,一定能够经历很多代电池的使用时间。为了配合电池系统的更换、升级以及后备电源系统改造,电池监测系统本身的可扩展性和灵活性显得非常重要。因此,监测系统应当具有模块化的设计,只需要增添个别模块就可完全覆盖改造后的电池系统。
3)兼容性:通过技术改进和产品升级,从而提高产品性能和质量在任何领域都是必不可少的,而由此带来的兼容性问题也是不得不考虑的。对于使用寿命很长的电池监测系统来说,更新后的系统一定要能够与以前的所有老系统完全兼容。在使用初期来看,这一点的重要性好像并不突出。但当用户在使用监测系统若干年以后,需要对新增添的若干组、每组若干个电池单体进行监测时,从成本及安全性的角度出发,新老设备的兼容性就显得十分重要了。
4)灵活性:电池监测系统应能够监测含有不同额定电压单体的电池组,当将12V电池单体构成的电池组添加到2V电池单体的电池系统时,无需另外单独购买一套与其配套的电池监测系统。
5)测量频率:为了确保最佳的系统可靠性,系统应具备每天进行欧姆值检测的功能。同时,在进行欧姆值测量时,所使用的电流应当非常小,这样才能保证不会对电池性能造成影响。
1)以Cellwatch电池监测系统为例,图4为Cellwatch电池监测系统现场拓扑图。
图4 Cellwatch 系统现场拓扑图
Cellwatch监控系统的基本组成单元有三部分:iBMU(集成电池监控单元)、CU(控制单元)和DCM(数据采集模块、见图5)。DCM和电池连接,用来采集电池的内阻、电压,并把这些信息通过光纤汇总到CU,CU再汇总每组电池的电流和温度测试信号,之后通过RS485把信息传送到iBMU进行数据分析和图形处理。任何复杂的大系统都是这几个部分的组合,配置灵活。
图5 Cellwatch数据采集模块(DCM)
图6 Cellwatch电池监测系统组成单元
图6 是Cellwatch基本组成部分的结构图。
正是这种模块化的设计和拓扑结构,使Cellwatch系统具有了以下优势:
(1) 没有繁杂的线缆、线路条理清楚、连接线最少。
(2) 兼容各种电压等级的蓄电池。
(3) 安装容易、使用方便。
2) Cellwatch的软件监控界面如图7所示。
图7中每一个模块代表一颗电池,绿色表示电池性能良好,红色为系统报警,表示该模块所代表的电池单元(包括电池本身和连接条)发生故障, 需要维护。
把鼠标放置在单个模块上就可以看到其所代表电池的浮充电压、内阻值,见图8;而且如果把鼠标放在模块之间的地方,还可以看到整组电池的浮充电压和内阻值,见图9。
系统还能实时记录整组电池的浮充电流和温度,如图10。如遇放电,系统亦会以23s的采样间隔记录单体电池的放电电压,如图11。放电曲线和每日测试参数均以文件的方式保存在系统中。
图7 Cellwatch 软件监控界面
图10 Cellwatch 系统记录的电流和温度曲线
图11 Cellwatch系统记录的放电电压曲线
图8 单个电池的浮充电压和内阻值
图9 整组电池的浮充电压和内阻值
著名的墨菲定律提醒我们:在重要的系统中绝对不能忽视小概率的危险事件,任何一次事故都可能给我们带来巨大损失。作为对供电质量要求极高的数据中心用户,选用高可靠性在线式电池监测系统十分必要。系统可以根据今天电池的监测数据,帮助用户确信电池明天能否正常工作;能及时检测出电池组中的不良电池单体;能够每天提供单体电压及单体欧姆值;节省人力成本,大大提升了用户的管理水平,并真正消除了用户后备电源可能存在的隐患。