计算机网络运行过程中的机房电源故障与处理

2013-08-15 00:47姚卫兴
通信电源技术 2013年2期
关键词:中断机房蓄电池

姚卫兴

(浙江省台州电业局,浙江 台州317000)

网络技术的飞速发展带动了以多种用途为基础的机房发展。在这种情况下,对于机房而言,其维护方面的工作就显得相当重要了。根据IDC统计发现,计算机故障中超过45%的故障是由于机房电源发生故障而造成的。电源作为机房计算机网络及其相关设备正常运行的基础,一旦发生故障,将会导致网络系统发生瘫痪。对于网络机房而言,其电源系统主要包括UPS系统、电池组、外接市电设备以及配电线路等。UPS系统作为一个无间断的电源系统,具有储能装置、逆变器以及电源保护等相关设备。

1 机房USP概述

1.1 UPS电源

UPS实现了交流电向直流电方向的转变,而后再实现直流电向交流电的转变。配电柜输出的正常交流电时,UPS负责将其整流为直流电,并对蓄电池进行充电,以及逆变后实现直流电的重新转换,并将所转换过来的交流电为负载供电。逆变过程可以消除电涌,瞬间高、低电压,电线噪声,暂态过电压以及频率偏移等干扰,不断改善机房电源的质量,以确保所提供给计算机系统高质量电源。工作实践发现,在计算机联网中所应用的光纤收发器等均需配对使用,相同的设备在网络机房中较用户端而言,其使用寿命要高得多,这当然主要是由于UPS电源所提供的稳定性保护。一旦配电柜输出的交流电发生断电的情况时,蓄电池所储存的直流电将会立即发生逆变,并将其转换为交流电为负载供电,来确保供电过程的连续性。UPS除了提供断电保护等功能,以确保机房设备的顺畅运行以外,也能够有效减少突然性的断电过程对相关设备所带来的损坏。

1.2 蓄电池

由于UPS的蓄电过程主要是通过电池组实现的。通常而言,一节电池为12 V,先通过串联电池达到所需电压,然后再通过并联电池达到所需电流。例如,若需96 V的电压,则可串联8节电池,若需更大的电流,可以并联两组或三组的8节电池。

1.3 浮充及均充

对于蓄电池而言,其充电状态分为浮充和均充两种,通常蓄电池处于浮充状态。若电池使用时出现容量、电压以及比重不均衡的情况,则会造成蓄电池所输出电压偏低及电量偏小的情况发生。因此,应确保电池组中各单体电池处于充足电状态,此过充电过程即所谓的均充。当其需要恢复“功力”时,则进入均充状态。

2 机房电源的常见故障及其处理措施分析

2.1 机房外接供电系统发生中断

通常而言,机房是将市电作为其常规的电源,机房外接供电系统发生中断主要指的是市电发生中断,因而无法对机房设备提供电源。机房外接供电系统发生中断的时候,UPS设备可以自动进行机房备用供电系统的切换。而备用供电系统中使用较多的有油机和蓄电池两种供电系统。其中,蓄电池仅可以暂时进行供电,在其电力耗尽之前应恢复市电或油机供电方式,否则将会导致机房网络发生中断。

为了确保外接供电系统发生中断的情况下,机房仍可进行正常工作,需要机房维护工作人员对UPS设备、油机以及蓄电池等相关设备进行定期的检查和维护,以确保市电发生中断时可以自动进行备用电源的启用。除此以外,维护工作人员还应了解蓄电池对机房网络供电的持续时间,在蓄电池电量耗尽之前确保油机供电的切换或市电的恢复。若蓄电池电量不够,应考虑进行某部分次要设备的关闭,以尽可能减少电量的消耗。

2.2 UPS设备空开导致供电被切断

对于大型网络机房而言,其UPS设备的空开主要包括了机房的总空开以及局部设备的电源空开。UPS设备空开所导致的供电切断情况主要分为如下两种类型:一种是局部设备的电源空开导致机房的部分设备电源发生切断,另一种是机房总空开所导致机房所有设备电源发生切断。

一般来说,引起UPS设备空开的原因基本包括如下两种:一是由于机房电源的负载偏大所引起的,二是由于机房某些设备的运行发生异常而引起的。一旦机房部分或所有设备的运行过程发生终止,维护工作人员首先应看设备电源中断与否,若中断且此类设备为同一UPS设备空开所控制,应当立即查看UPS设备空开是否已切断供电。若已经确认空开断开,则应当维持断开的状态,并将此空开所控制设备电源分别进行断开,对其进行逐一查看,看设备是否存在异常现象,例如设备出现温度偏高或有烧焦气味产生。若有异常,则说明是由于设备导致供电切断,此时应当立即进行备用设备的更换,而后打开UPS设备的空开。若无异常发生,也应打开UPS设备空开以恢复系统供电。待供电恢复以后,应先进行1~2个非核心,且功率相对较小设备的开启,看其是否可以正常工作。若无法正常工作,则说明此设备发生故障或者电源发生故障。若能正常工作,可关闭此设备,并根据先主要后次要、先小功率后大功率的次序,依次进行设备的开启。并对UPS设备的负载状况进行密切观察。若设备开启时出现故障则应立即进行备用设备的更换。若UPS设备负载偏大,则应停止设备的开启。若所有设备均开启,且可以正常工作,没有故障设备或是负载偏大等情况发生,则表明UPS空开是由于某些设备暂时的工作异常所引起的,应注意对设备的运行状态以及机房环境进行维护。

此外,进行机房建设过程中应注意对网络运行有影响的关键设备进行电源开关分散连接,尽量防止其由同一UPS设备空开所控制。当机房负载偏大而导致电源出现故障时,可关闭相同电源控制下的非关键设备,以尽可能减小电源负载,确保网络核心业务的连续性。

2.3 机房设备供电稳定性不足

机房设备供电稳定性不足主要指的是向机房设备所提供的电源电压稳定性不足,即UPS设备所输出的电压不够稳定。维护工作人员可以借助于UPS设备运行显示软件来对UPS输出电压进行实时监控,也可借助于万用表来对设备的电源电压进行直接测量。通常来说,机房设备供电电压的稳定性不足将会造成设备运行状态的稳定性不足,甚至降低设备的使用寿命,并对整个机房网络的运行造成严重影响。一旦发现机房设备供电稳定性不足,应立即通过UPS设备进行备用电源的手动切换,待供电系统检修并恢复正常后,再进行供电系统电源的切换。

3 机房电源系统的维护建议

(1)为了保证电源系统安全可靠的运行,宜加装一套动力及环境监控报警系统,此系统对所有的输入电源(包括交流电源、直流电源)、输出电源(包括总的各路输出及分路输出)和环境温度湿度全部采样、比较后,对异常情况输出灯光、喇叭及画面报警,引起值班人员的重视,及时对报警设备进行处理和检修,进而达到设备的安全稳定运行。

(2)报警输出的灯光、警铃及画面设置在值班机房及值班休息室内。

(3)对蓄电池必须定期进行充放电试验(一般为一个季度或半年进行一次)。蓄电池的寿命与环境温度有很大关系,在20℃环境下蓄电池的储存时间不要超过6个月;在30℃的环境下,不要超过3个月;在35℃的环境下,不要超过2个月。如果蓄电池储存的时间更长,每6个月要给蓄电池充电一次。

(4)每月对市电的各相输入、输出电流定期测试,并做好记录,还需进行必要的比对,发现负荷的不对称及隐患,从而进行补救,排除可能出现的故障。

4 结束语

综上所述,UPS作为计算机的重要外设,在保护计算机数据、保证电压和频率的稳定,改善电压质量,防止瞬时停电和事故停电对用户造成危害等方面起着非常重要的作用。虽然机房电源发生故障在所难免,但是,

通过对机房网络进行有效的运行管理,同时注意提高故障的诊断技术水平,可以有效避免计算机运行过程中机房电源严重故障的发生,因此,必须对此方面给予足够的重视,以确保机房网络及业务的正常进行。

[1] 丁桂萍.浅谈计算机的维护与故障的维修[J].新课程,2011,(01):115.

[2] 田育新,孙立萌,孟颖悟,但星亭.热插拔技术在机载计算机电源系统中的研究[J].航空计算技术,2009,39(05):104-106.

[3] 姚信安,宋飞,胡世平.高性能计算机系统电源设计[J].计算机应用,2012,(04):24-25.

[4] 姚信安,宋飞,胡世平.超级计算机电源设计及实现[J].计算机应用,2012,(A01):170-173.

猜你喜欢
中断机房蓄电池
平疫结合的CT机房建设实践
基于VPN的机房局域网远程控制系统
基于FPGA的中断控制器设计*
Linux中断线程化分析及中断延时测试
浅谈一体化机房系统
跟踪导练(二)(5)
千里移防,卫勤保障不中断
聊聊蓄电池的那点事儿(1) 汽车蓄电池的前世
蓄电池去哪儿了
N通信公司机房节能技改实践