电信动环监控系统易忽略的问题及解决方案

2021-04-27 07:19林胜龙
广东通信技术 2021年4期
关键词:动环电表机房

[林胜龙]

动环监控系统是电信通信系统及近年大量建设的互联网数据中心极其重要的支撑系统。经过30多年的发展,大大减轻动力维护人员的工作强度,提升业务效率。但经过多年的建设和使用发现仍存在忽略的隐患及改善的问题。对这些问题的重视才能避免偶然性致命的故障。

1 监控系统网络通信的稳定性问题

电信机房除接入网设备间、无线基站外,监控系统数据传输网络已全面使用城域网传输。但在某些局站特别是偏远中小型局站,动环监控传输网络与营业厅或办公网络共用汇聚交换机。而部分汇聚交换机使用无保障的交流供电。在设计时未能考虑到一旦出现市电停电,发电机又无法及时自启动时,通过此类型交换机接入的监控系统将全面瘫痪。维护人员不能及时判断监控系统的通信故障是网络故障引起的还是由于电力系统故障引起的。

在监控系统规划设计时,应考虑监控系统上联接口应接入到有电源保障、可靠性高的核心网络设备中,且监控系统其他网络接入设备均应使用UPS(Uninterruptible Power System,不间断电源)保障或电池保障的直流设备供电。保证即使出现市电故障或电源设备故障,在故障初期能及时反映出现场的实际问题。改造方案如图1所示,原有动环监控交换机至接入交换机的虚线连接拆除,改为动环监控系统交换机到汇聚交换机的实现。

图1 动环监控系统网络改造图

2 监控电源及低压智能电表取电问题

在建设动环监控系统时,监控系统自身的电源均来自UPS或高频开关电源。在大型的通信局站或IDC(Internet Data Center,互联网数据中心),由于规模较大建设周期长,设备分批投入使用。监控系统亦随着被监控设备的增加而不断扩大,监控采集设备也增多。因为建设时间的差异及工程项目大小不同。在设计上容易忽略或缺失监控电源容量的考虑。监控施工单位往往就近接入原有的监控设备电源,从而形成整个监控系统通过单一的总电源获取电能。随着监控设备增多,设备老化,容易出现单点故障,最终整个监控系统因为某个设备故障而崩溃。改造前监控系统供电方案如图2所示。

图2 单一供电的动环监控系统

针对这个问题,在规划监控系统时应作出安排。现在通信电源系统已采用分散供电为主。一个局站已具有多套电源系统。在进行配套电源系统监控接入时,亦应当增加监控系统的电源分布,使监控系统形成多个供电点,减少各个监控子系统的范围,从而减少监控系统掉电的风险范围。改造后供电方案如图3所示。

此外动环监控系统十分重要的监测设备是低压设备,特别是市电进线系统。近年来低压配电设备均配备智能电量仪表(简称智能电表)提供给监控系统获取市电数据。而设计监控系统时,忽略了一个因素。大部分智能电表取电来自监测的市电。当市电掉电时,智能电表也因此失电而无法工作。对监控系统而言只能监测到智能电表通信故障,而不是直接的市电的电量信息。同样柴油发电机的低压配电柜也存在类似问题。

图3 分散供电的动环监控系统

对于智能电表的上述问题,应从智能电表电源入手。对于重要或全部的智能电表供电应来自有保障的监控系统电源。即使在设备电源关闭或不工作时,监控系统仍能监测当时的电量数据。

3 监控系统软件部分的缺陷和不足问题

3.1 电源系统由集中供电改为分散供电,空调系统由集中供冷改为分散供冷。

设备的数量亦随之大幅增加,监控系统的测点数量也大幅增加。监控系统并发处理告警的能力是否足够,对监控系统在关键时刻运行有很大影响。如遇到极端气候导致大面积停电,单一局站或区域并发数千条告警时,系统告警判别能力,上报时间是否及时,是否出现遗留和延误都需要在设计时考虑及投入使用前测试确认。

在建设监控系统选择监控系统供应商时,应考虑根据其网络及软件架构,内部数据处理方式,判断其提供的监控软件和架构是否具有大规模并发告警的处理能力,并在验收时通过模拟进行测试确认。大规模并发告警不常见,但一旦出现如系统能力不足将直接导致系统瘫痪。

3.2 监控软件平台架构不够灵活

随着企业的减员增效,人员压缩、运维制度的改变导致同一机房存在不同管理人员的情况。目前监控系统难于分离出不同维护单位的数据。同时,维护和管理体系中的人员也有各自的数据需求。维护人员更关心设备运行的实时数据、状态和告警等信息。管理人员更着重设备的容量、负荷、资源和系统的趋势信息。

如果监控软件平台使用监控数据与用户前端界面无需紧密关联的方式。用户前端界面可以根据业务需求和人员需求进行设备的选择配置。灵活地配置出不同人员终端监控不同的设备数据。

3.3 监控平台的界面的用户友好性需要提高

一般监控系统以动环设备方式显示运行数据,未能显示出设备间的关系及层次影响关系。需要使用人员对现场设备和环境比较熟悉。但作为软件系统如果能减少使用人员分析的时间,从而缩短故障处理的时间,可以提高系统的利用价值。

监控系统应可以根据需求切换不同的应用界面,如告警出来时可提供供电拓扑图有助维护人员评估当前设备故障影响的范围并选择适当的备用方案解决问题。后续透过切换设备详细测点分析及定位问题设备的故障原因。

3.4 监控软件缺少工程维护模式的快速切换,实现相关设备的快速屏蔽。

无论IDC机房或传统机房都会经常性的对设备进行保养、维护、维修、工程改造等各种固定的或临时性的设备关停。如中央空调系统、柴油发电机组机油更换、电池更换、UPS或直流电源电池充放电测试、高低压设备维护等。在进行这方面操作时,难免会触发监控系统的告警。为避免因为维护或工程原因带来的告警影响正常设备的监控,监控软件应实现在维护或工程状态的设备快速屏蔽。并且对已屏蔽设备,有故障设备,正常通信的设备应能有所区别显示。此外已屏蔽告警的设备应有时间段设置,避免脱离维护或工程状态的设备长期处于屏蔽状态而脱离监控保护。

4 动环监控建设时缺少能耗管理的数据采集及数据分析考虑

随着电信企业对通信机房及设备节能越来越重视,早期建设的监控系统更着重采集被监测设备的运行状态和数据的采集,而忽视设备能耗的数据采集。到现在增加节能系统需采集电能数据时,由于动环系统或设备未在新建时加装智能电表,设备投入使用后加装智能电表往往需要停电才能实现,给在用设备带来风险。特别时IDC机房,由于用户不同或重要程度不用,服务器设备不是所有设备都是双电源保障。即使配备装电源设备,客户亦不轻易容许任何一路电源断电。为改造带来困难。

在新建机房时,考虑节能系统需要,中央空调主机、各类水泵、水塔、风机、精密空调、机房IT用电的配电柜配备电能计量功能的智能电表。同时为方便维护及维修。对智能电表的操作或更换应无需断开配电开关即可操作。另一方面目前IDC建设亦重视PUE值的计算,各系统的智能电表测量令系统PUE值的计算更准确。

节能系统对中央空调运行数据采样其中一项是要采集中央空调中的水流量数据。该数据在原有动环监控系统中极少进行采样,即使是中央空调主机设备厂家也很少能提供。因为增加水流量检测数据往往需要对水管进行破坏性加装传感器,即使使用超声波的水流量传感器也因为价格高昂,而且不破坏水管也要破坏水管的保温层而难于实施。所以在新建中央空调系统时需将水量流量检测纳入监控系统采样清单中。

对节能系统来说,高耗电的设备主要是空调设备,要实现节能又要保障机房温度在合适范围内,这就要求业务机房安装温湿度监控设备应在兼顾性能和造价基础上确定安装位置和数量。为提高机房送冷的效率,目前业务机房已大量使用冷热通道封闭系统。温湿度监测设备应均匀分布,高效地实现接近实际的空间温度采样。

5 动环监控系统适应的未来发展需考虑的问题

动环监控系统从最初的实现动力设备运行监控、环境监控功能,逐步趋向附加更多的增值功能。利用过动环监控网络及数据采样,实现节能、设备的资源管理、监控数据分发。从单一的设备监控,向智能设备巡检,立体化展示、监控数据的大数据分析、专家系统故障分析方向发展。所有这些增值功能都需要建立在前端数据采集完备,准确的基础上。在动环监控系统规划建设时,应根据未来的这些功能需求特点,做好设计规划。在当前资金受限时,需要考虑未来增加功能时预留接口,能快速简便的实现。

特别是监控软件方面,现场维护人员与管理人员的需求同时兼顾好。现场维护人员更希望直观快捷的定位问题所在,最好能提供问题的原因和解决方法。管理人员则希望了解设备总体运行情况,掌握设备的利用率,设备资源情况,维护人员处理故障的效率考核等。另一方面如IDC使用服务的用户也会有获取租用机房或机柜的设备环境运行情况的需求。监控软件系统设计时应考虑提供灵活的软件接口实现数据的分发,又要保证系统的效率和安全。

电信企业除了功能需求外,系统投资方面也提出了越来越高的要求。如何经济地投入实现最多的功能,避免重复的设备投入也是在规划时统筹考虑的。各动力系统设计时都独立的进行,而动环监控时贯穿在各个系统之间的,在设计时考虑监控接入问题对节约投资是大又可为的。如配电柜哪些必须采用智能电表,哪些可以采集机械电表等最大节约投资及减少后期改造式的投入。

猜你喜欢
动环电表机房
核心机楼动环系统组网探讨
巧判电表测量对象
基于国产化龙芯的动环数据采集系统
电表“对”与“错”归类巧掌握
Cartoons
动环系统统一监测
N通信公司机房节能技改实践
某IDC机房结构设计
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造