浅析通信局站动环监控系统的标准化:中国电信动环监控系统升级和标准化工作相关问题探讨

2014-02-28 06:17宋亚军侯福平
电信科学 2014年3期
关键词:动环统一全省

宋亚军,侯福平

(1.中国电信股份有限公司连云港分公司 连云港222006;2.中国电信股份有限公司广东研究院 广州510630)

1 通信局站动环监控系统的演进

20 世纪90年代中后期,电信公司开始在本地网内进行动力设备远程监控系统的建设。初期的功能主要是完成通信局站内动力设备的监视和控制,以实现局站无人值守,并遵循多监少控的原则,避免出现意外事故。随着通信网络规模逐渐增大、通信网络不断革新以及动环监控系统技术的成熟,动环监控系统的建设目的和应用功能也发生了非常大的变化。经过近20年的发展,逐渐形成了目前以各个本地网为中心独立进行动环系统集中监控的网络体系。其中包含一个本地网监控中心(supervision center,SC),若干个以县公司(区局)为单位的监控站(supervision station,SS)的二级结构系统。同时也分化形成了各种增值应用,如各种动力设备的管理、资源系统的管理、图像监控、智能门禁监控等。

在中国电信集团公司(以下简称中国电信)维护体制的不断变革中,通信电源专业在管理方式上充分利用动环监控系统的远程监控能力,逐渐实现了从机房专业值守到综合值守乃至少人、无人值守的过渡,形成了一点值守、多点维护及专业技术支撑的机制,有效地提高工作效率和维护工作水平。

随着集中维护体制的完善和集中监控中心的建立,本地网监控中心成为通信网络运行监控的第一责任人。各专业系统的监控信息被集中到一起,形成了本地网一级的集中监控系统,统一完成对整个通信网络的监控及故障维护的派发。2007年后,现有的通信局站动环监控系统已经逐步完成了与综合告警系统和综合调度系统的对接,实现了障碍的自动派单闭环管理。

2 江苏电信动环监控系统现状

由于之前中国电信股份有限公司江苏分公司 (以下简称江苏电信)在动环监控系统建设过程中,各本地网缺乏统一的建设标准,在省公司集采之前就已经进行了相关系统的建设。而且这十几年来一直缺少必要的评估体系,导致现在全省的动环监控系统品牌和数量较多,系统及硬件设备运行的稳定性和维护量也参差不齐。

目前江苏电信全省13个本地网共建设了31套动环监控系统,其中徐州、连云港和宿迁3个本地网只建设了一套系统,其他本地网均建设了两套或两套以上的监控系统,还包括同一监控商在一个本地网建设两套网管的情况,监控商包含艾默生、中兴通讯、中达、高新兴等9个品牌,详细如图1所示。

按照中国电信最新的局站类型分类,江苏电信动环监控系统目前共覆盖22 512个场地,接入网以上局站的总覆盖率在78%左右,见表1,覆盖率还有待进一步提升。

图1 江苏电信各本地网动环网管现状

表1 江苏电信动环监控系统按局站类型分类统计

江苏电信按监控系统生产厂商分类统计情况如图2所示。目前接入艾默生公司动环监控系统的局站共计12 200个,占54.2%,居主导地位。从长远发展来看,为便于维护管理,全省应在近几年内借系统更新升级的机会,逐步进行整合,按照监控商综合能力和系统稳定性,择优取舍,保留2~4个厂商的具有可持续性发展的动环监控系统。

图2 江苏电信动环监控系统按生产厂商分类统计

3 全省动环监控系统集中的必要性

动力专业作为通信网络运行的基础和心脏,承担着通信网络安全供电保障的责任。随着技术的进步以及电信网络的迅速发展,电信网络中的通信电源和空调设备已经具备了一定程度的可靠性和先进性,为通信机房的少人值守和无人值守创造了条件。

为贯彻中国电信“集约化运营”的维护体制改革要求,适应通信网络中动力专业在省一级乃至更高级别的统一监控、分级管理、分等级维护的集中维护管理原则,同时为了使在网运行的动环监控系统有一个规范性标准,便于省一级监控中心能对各本地网进行统一管控,能快捷地对各本地网在网动力设备和机房环境的运行状况进行查询、统计、分析,有必要在条件具备的情况下,建设全省动环监控系统管理平台,并建立统一的设备运行评估体系。

目前江苏电信交换、传输和数据专业均已完成了省管平台的建设,纳入到省公司NOC统一监控管理。按照江苏电信网络集中监控的要求,完整地对全网的电信设备进行管控,作为以上专业的基础支撑专业,动环监控系统的省一级集中的方向是不可动摇的。

从横向比较来看,其他运营商如江苏移动、浙江移动等均已完成了省一级动环监控系统监控中心平台的建设,提供了许多经验和教训。江苏电信理应充分借鉴这些成功经验,吸取教训,少走弯路,切实做好省一级动环监控系统监控中心平台的建设,将原来本地网一级动环集中监控逐步过渡向省一级集中,以适应中国电信的转型发展战略。同时,为中国电信在其他省份进行动环监控系统的集中进行探索并积累经验。

4 建设省一级动环监控系统主要存在的问题

由于近年来中国电信和江苏电信对动环监控系统的管理没有统一的规范,各本地网在日常维护工作中普遍存在重设备、轻监控的情况,导致目前动环系统存在着不少问题,已经限制了动环监控系统向省一级集中的目标实现,这些问题主要包括以下几点。

4.1 命名不统一

这里的命名包含监控局站名称、设备名称和监控信号名称。命名不统一主要体现在以下两方面。

(1)动环监控系统与动环监控系统之间

由于缺乏统一的命名原则,各本地网都使用自己的命名习惯对局站、设备和监控信号分别进行命名,同时各监控系统之间也没有对命名进行统一规范,各个本地网的监控系统也都是经过多次增容扩建才达到目前的规模,不同工程建设阶段的施工人员在数据配置时也都是按照自己的使用习惯进行分别命名。

(2)动环监控系统与其他监控系统之间

在同一本地网交换、传输、数据和无线其他专业的网管系统和动环监控系统中,对同一个局站的命名也不统一,有些场地、固网与基站等的名字是类似的,在查阅障碍或进行远程操作时极易混淆,甚至导致通信事故。

由此可见,如果在没有统一命名情况下进行省一级的动环监控系统集中,不但将会使监控人员无法迅速准确查阅指定局站、指定设备或信号的监控数据,而且将导致集中监控系统平台的界面呈现无序杂乱。

4.2 告警等级不统一

目前江苏电信其他专业的网管监控大都分为4个告警等级。而全省几个主流厂商的动环监控系统的告警等级均不一致。例如,艾默生、中兴通讯监控系统分为紧急、重要和一般3个告警等级;中达系统分为一级告警和二级告警2个告警等级;高新兴分为4个告警等级。也就是说,同一条信号在不同的监控系统中的告警级别都不一致。

同样,各个本地网对同一条信号的告警等级规定也不统一,同样的设备运行状况,在不同的本地网会出现不同的告警现象。

很显然,在告警等级及告警等级名称未统一的情况下,省级监控中心将无法对同一条信号进行统一的管控。

4.3 数据存储不统一

目前各本地网对数据存储周期及存储阈值没有统一的标准,将对今后的业务报表查询及数据扩展应用带来不便,因此必须针对不同的信号制定全省统一的数据存储规范。

4.4 监控模式不统一

江苏电信自2000年左右大规模建设动环集中监控系统至今,由于缺少统一的建设要求,目前全省的动环监控系统在局站的监控范围、监控的组网方面都具有较大的随意性。由于电信的传输网络资源比较丰富,在本地网内也就形成了哪种方便用哪种的数据传输模式,而没有制定统一的原则。

4.5 监控硬件不统一

由于近10年以来全省在动环监控建设上的投资额不足,目前各本地网的监控硬件基本涵盖了各监控厂商各个年代的产品。以主流的艾默生动环监控系统为例,全省使用的硬件产品基本可以看成艾默生公司的发展史,从BMS-1、PEC、IDA等非智能硬件到IPLU、SDA、IDU等智能采集处理器都有使用,而且由于各本地网对动环系统扩展应用的使用需求较少,在日常的工程建设和维护中也疏于升级改造。

另外,由于近年来集采价格的逐渐走低,各监控商使用的监控硬件故障率逐渐升高,尤其是一些智能化的底端监控采集器,设备运行稳定性越来越低,这与维护人员的逐渐减少形成一对不可调和的矛盾。

5 省级动环监控系统的标准化及升级

针对以上存在问题,在全省动环监控系统集中之前,首先必须对本地网的动环监控系统进行标准化改造。同时,在其他运营商进行告警标准化经验的基础上,尝试进行动环监控系统所有信号的标准化工作,主要从以下5个方面展开。

5.1 局站类型和名称的标准化

局站按照集团公司最新的分类原则分为A类局站、B类局站、C类局站、D类固网局站、D类无线基站和其他局站共计6大类,并按照局站类型在局站命名中分别添加本地网简称和局站标识符。

为使全省动环监控系统集中后能方便地定位局站所在的本地网和局站类型,有必要对全省的监控局站ID进行统一分配。按照全省集中后本地网的局站数量,局站ID可定为11位。前6位可借鉴国家标准GB/T 2260-2007《中华人民共和国行政区划代码》规范的代码,后面6位为局站编号。

局站编码的5位数字中,第一位定义为局站类型(局站类型编码见表2),后4位编码可以考虑自动生成,生成后就不再变动;也可预先编好。同一个区县的局站编码不得重复。

表2 局站类型编码说明

为达到全省动环监控系统集中的目的,全省所有监控局站的ID必须唯一,这就要求省公司要根据各本地网的监控局站规模,为各本地网划分局站ID段,局站ID应该明确区分本地网及局站类型。同时,该局站ID应该在其他所有专业的网管中保持统一。

局站ID分类见表3(其中XX为各地市、区县行政区划代码,详见国标GB/T 2260-2007《中华人民共和国行政区划代码》)。

5.2 设备类型和名称的标准化

按江苏电信全省汇总意见,目前在网运行的电源空调和节能设备(系统)共分为28个大类,增加动环监控系统自身一个虚拟设备,并按照局站(机房)级别和设备类型共同区别生成设备编码,见表4。

根据局站等级和局站内电源空调设备的数量,并考虑动力设备的属性特点,将所有电源空调设备重新统一命名,为方便监控人员快速识别并考虑日常维护工作中可以易于对报表导出的告警进行多维度分析,在设备命名中开头突出显示主设备类型,括号内力求体现设备在机房内的安装位置及设备的主要信息。

表3 江苏电信动环监控系统局站编码

示例:开关电源(4F_2#艾默生_M810G);蓄电池组(4F_2#艾默生_2#南都1000);专用空调(2F_1#佳力图MEAU702)。

5.3 告警类型和名称的标准化

按照全省网络集中监控的要求,动环监控系统的告警等级统一确定为4个告警等级。

一级告警:将引起电源系统和空调系统退出服务、导致业务退服的动环类告警。

二级告警:可能造成电源和空调系统整体退出服务或运行性能下降的告警。

三级告警:电源和空调系统中发生设备部件故障但不影响整体运行性能的告警。

四级告警:电源和空调系统中设备发送的维护提示。

其中,一级到四级告警在监控台告警模块(单元)中分别以红色、橙色、黄色和蓝色的警灯予以标识。

在动环监控标准化实施的具体过程中,江苏电信在集团公司电源支撑中心、省公司运维部的领导下,经过全省动环监控专业团队的共同努力,牵头起草了《江苏电信动环监控数据配置规范》和《江苏电信动环监控信号字典表》,制定了以上各种名称的命名规则,并对告警信号的等级、告警信号名、告警门限值、告警开始时延、告警结束时延、告警ID等信号属性进行了规范,并确保在各个监控厂商的动环监控系统中均能实现。

表4 电源空调设备编码

5.4 历史数据和告警数据的标准化

根据信号对动力维护的重要程度,确定每条信号的存储周期、存储阈值,而告警的告警等级、门限值和时延等,均根据《江苏电信动环监控信号字典表》统一确定。

5.5 告警信号关联过滤上报标准化

为进一步减少无效告警,提高监控效率和派单效率,制定告警关联过滤规则。根据动力专业维护的特点,主要针对市电停电、高频次告警及监控中断情况进行告警关联过滤。

6 省一级动环集中监控系统集中后的整体架构

以江苏电信为例,从全省各本地网维护现状出发,结合全省目前动环监控系统的构成和动力专业的维护特点,建议按照规范的3层结构进行全省集中监控系统的建设:

·省公司建设一套省动环网管平台(province supervision center,PSC);

·各本地网建设一套本地监控中心(local supervision center,LSC);

·各监控局站建设现场监控单元 (field supervision unit,FSU)。

具体到PSC与LSC的网络架构,结合“一级监控,两级维护”的维护体制改革,并充分考虑计算机“云技术”的迅猛发展,有以下两种组网模式方案可供选择,如图3和图4所示。

两种方案的主要区别在于各本地网的动环网管事实上集中在各本地网还是在省中心,应该说这两种模式都能满足PSC的集中监控和管理功能,但对PSC服务器运算性能、省中心和本地网的动环系统维护能力和要求提出了不同的要求,因此在PSC建设过程中应充分考虑这方面的因素来选择运用。

6.1 省动环网管平台

省动环网管平台是面向多个LSC管理的高级监控层次,通过开放的数据协议,连接下属的多个LSC对象,从而实现对全省的动环监控系统进行全方位的管控。结合当前办公的特点,该监控最好基于Web页面的呈现方式,而不再是需要安装数据库的客户端模式。

PSC接收所有本地网LSC的上行数据,可通过文字、声音等各种人机界面,真实反映监控对象的当前状态和告警信息,也可以发送命令实现对被监控对象的远程控制,当然PSC作为管理者的身份,最主要的功能是根据需要制定各种分类统计报表,对历史数据进行统计分析。

PSC主界面主要呈现各种告警信号的当前分类统计数值,必须但不限于包含按以下分类进行呈现:

图3 全省动环系统集中后系统组网方案(一)

图4 全省动环系统集中后系统组网方案(二)

·按本地网统计当前告警量;

·按告警等级分类统计告警信息;

·按设备类型分类统计各设备的告警量。

6.2 本地监控中心

本地监控中心(LSC)是面向区域级的设备对象管理和表现的监控层次,连接区域内的FSU,在此层次对监控的基本功能进行实现。

不管各本地网目前建设了几套动环监控系统,但在全省动环系统集中之前只建设一套LSC,其好处是监控人员和维护人员面对的是一个统一的平台,易于操作,便于管理,从长远来看,维护成本较低。

LSC可通过文字、声音和短信息等各种人机接口方式,真实反映被监视对象的当前状态和告警信息,同时保存历史数据,进行数据统计分析,发送命令实现对被监控设备的远程控制,同时把相关数据上报给PSC。

LSC与其他动环网管的组网建议采用C接口方式进行组网。

若LSC与PSC是同一个厂商建设,可以采用级联的方式进行组网;若不是同一个厂商建设,它们之间可以采取C接口通信方式进行组网。

在LSC的建设上,为避免某一家监控商或软件商独大,而造成在以后的使用和维护中陷于被动的局面,可以考虑制定统一的建设规范,让两家以上的监控商或软件厂商参与建设。

6.3 现场监控单元

现场监控单元(FSU)是监控系统的最小子系统,由若干监控模块(supervision module,SM)和其他辅助设备组成,面向直接设备数据采集、处理的监控层次,负责对现场各种电源和空调设备等智能和非智能设备以及各种环境量的采集并上传,可以包含数据采集、数据处理、数据中继等功能,同时接收LSC下行传送过来的控制命令,并传送给被监控设备。

目前江苏电信在FSU的建设和动环监控系统接入方式上还缺乏统一的标准,各本地网在底端的数据采集无论在动环监控的覆盖区域、采集上报硬件的选购还是动环监控的传输路由上都存在较大的随意性,这种情况将极不便于省监控中心对本地网的管控,不利于全省动环监控系统平台新功能的开发运用。

因此,最终动环监控系统的标准化工作必将延伸至FSU建设和系统接入方式的标准化工作中,这也就要求必须结合电信机房的特征,充分考虑现有的网络架构和传输资源,尽早确定FSU的统一建设规范。

7 结束语

目前,随着通信网络的迅速发展,中国电信的通信局站规模和数量不断发展壮大。而同时,企业正在转型发展和维护体制改革,为达到减员增效的目的,后端维护人员越来越少。这就要求相应的设备运行要愈加稳定,对设备的监控管理要实时、有效。通信局站动环监控系统作为对电源空调和机房环境的监控管理系统,必须要与时俱进,尽一切可能满足维护人员的需求。

被需要的不仅仅是一个简单的动环监控系统,按照维护体制改革的需求,未来需要一个统一的动力维护管理平台。不仅局限于电源和空调设备的远程监控,而且应当利用这个平台有效地实现通信局站电源空调设备的监控和维护,例如资源管理、能耗统计、维护作业计划、机房安防等功能,从而有效地提高通信电源专业维护的水平和效率。这都要求尽早确定LSC和PSC的建设规范和具体要求。

1 YD/T 1363.1-2005.通信局(站)电源、空调及环境集中监控管理系统,2005

2 吴晓成,侯福平.服务器虚拟机技术在通信机房监控系统的应用.中国通信学会2013年中国通信能源会议论文集,北京,中国,2013

3 刘云.论全方位动力监控.电信科学,2012,28(5A)

猜你喜欢
动环统一全省
核心机楼动环系统组网探讨
基于国产化龙芯的动环数据采集系统
坚持严管和厚爱相统一的着力点
碑和帖的统一,心和形的统一,人和艺的统一
上半年全省工业实现“双过半”目标
统一数量再比较
2018年全省一般公共预算收支情况表
全省齐心协力共打抗洪抢险救灾攻坚战
动环系统统一监测
滨江:全省首推工位注册