胡智超,龙俊兵,刘 炼
(中国电信股份有限公司武汉分公司,湖北 武汉 430023)
运营商通过网络后台和客户投诉数据发现,运营商D类接入网机房的紧急告警处理平均时长为211 min,离地区监管部门规定的小于等于200 min的硬性规定有明显的差距,面临较大的压力,如图1所示[1]。
图1 10—12月紧急告警处理时长与运营商标准差距
针对5个相同网元规模的地级分公司进行了数据调取和初步分析,如表1所示。
表1 5个相同地市公司故障平均处理时长 单位:min
通过数据可以发现,A地区运营商的平均处理时长高于其他4个相同的地市运营商。
对接入网机房2020年10—12月处理时长200 min以上的紧急告警工单数进行统计,并按照设备进行分层筛选,查找处理时长过高的原因,如表2所示。
表2 通信机房内不同专业故障数量统计
按照数据分析显示,在D类接入网机房的告警处理时长中,电源专业故障引起的处理时长占比为77.24%,是处理时长过高的主要原因。
针对电源故障处理流程中的5个组成部分进行系统分析。
“系统派单、通知时间、到场时间、分析时间、处理时间”得到数据如表3所示。
表3 电源故障5个维度的处理时长统计
综合分析表3中各维度的处理时长,认为有进一步压缩的空间和手段[2]。针对数据结果,模拟论证优化流程及故障处理后的数据如下文所述。
(1)工单升级环节:占比12.35%,预计可缩短10 min,降低33.3%;
(2)通知时间环节:占比10.7%,预计可缩短6 min,降低23.08%;
(3)到场时间环节:占比32.92%,预计可缩短20 min,降低25%;
(4)分析时间环节:占比13.17%,预计可缩短7 min,降低21.88%;
(5)处理时间环节:占比30.86%,预计可缩短15 min,可降低20%
按照分析数据与原始数据对比,得到优化方法后的各流程处理时间如表4所示。
表4 电源故障五个维度优化处理后的时长统计
综上各处理环节的时间评估,优化处理方法后的紧急告警处理时长可以达到小于等于200 min的指标要求[3]。
针对电源故障的5个处理流程,结合日常维护的关键指标及故障处理手段,分析影响处理环节过长的8个末端原因如下:①派单错误;②维护人员技能不足;③蓄电池组性能差;④考核不到位;⑤工单管控不到位;⑥空调未启动;⑦负载未分类。
我们针对7个末端原因,确定主要原因的筛选方法及指标如表5所示。
表5 7个末端原因的筛选指标
经过对7个末端原因的逐条指标确认,得到了3条影响专业故障处理时间过长的主要原因:①蓄电池性能差;②空调未启动;③负载未分级。
(1)蓄电池组性能差
通过研究讨论,提出2种备选方案,如图2所示。
图2 蓄电池性能差方法筛选
对两种备选方案试验验证如表6所示。
表6 蓄电池优化2种方法效益对比
(2)空调未启动
针对空调未启动的问题,提出2种备选方案如图3所示。
图3 空调未启动方法筛选
对两种备选方案试验验证如表7所示。
表7 空调未启动2种方法效益对比
(3)负责未分级保护
负责未分级保护的问题,共提出3种备选方案如图4所示。
图4 负载未分级保护3种方法筛选
对3种备选方案试验验证如表8所示。
表8 负载未分级保护3种方法效益对比
3.2.1 提高蓄电池组容量测量手段
(1)对蓄电池组的单体电池进行电导测量,判断单体电池性能
利用现有工具对电池普量电导,如图5所示。
图5 蓄电池电导测试仪
测量后对发现的性能低下单体电池,制定更换步骤(图6)所示,确保更换过程中,人身和设备的安全性。
图6 蓄电池故障处理方法
(2)通过核对性放电,分析整组电池性能
对电池放电电流及时长均采用数据报表自动分析,放电过程中的数据运用电子云文档记录,放电后的数据分析采用各厂家的放电曲线进行透视,简化放电过程中的人为分析和记录过程[4]。数据分析标准化,存储云端化(见图7)。
图7 蓄电池组放电报表
3.2.2 空调未启动
(1)摸查待改造的D类接入网机房空调非标柜二次线
对所有待改造的D类接入网机房空调非标柜的二次线路查勘和分析,发现由于部分D类接入网机房原有非标柜中的接触器长期工作,使用已有10余年,存在线圈发热起火、接触器吸合不到位过热的安全隐患,如图8所示。
图8 空调非标柜整治
(2)确定对改造更换流程和应急方法
翻看各接入网机房的空调非标柜说明书,并在摸排线路的基础上,确定在原有柜体内给消防控制单元使用的一对常闭线中并联24 V驱动部件,达到非标柜自动启动的功能。并对该方案进行了实验,如表9所示。
表9 空调非标柜整改流程
3.2.3 负载未分级保护
(1)分布式电源设备选型
经过与各大分布式电源厂家进行沟通,初步筛选出 4种可满足D类接入网机房的负载分类要求,满足重要设备的后备供电时间。4款产品的信息如表10所示。
表10 分布式电源选型
进一步根据分布式电源的设备大小和扩容性,选择了其中2款产品。并分析了2款设备的技术参数。
①A厂家,设备容量6 kW,安装尺寸2U,一路输入和二路输出,配置一个旁路开关。
②B厂家,设备容量6 kW,安装尺寸2U,一路输入和二路输出,配置一个旁路开关。
(2)分布式电源安装方法
对照设备安装标准,制定了分布式电源安装步骤如图9所示。
图9 分布式设备更新流程
设备安装完毕后,制作重要设备标签,对使用分布式供电设备的机体表面张贴A级电源标记,方便后期维修人员利用机房内的负载分级标签,快速摸清设备重要性,降低紧急告警维修时长[5]。
D类接入机房在通信网络单元的重要性不断提升,亟需规范机房故障处理流程。抢修处理流程的规范指导意见出台,特别是对于自然灾害及人为事故发生后的故障处理意见。笔者认为对于故障抢修的时间压缩,还是要在接入网机房的建设初期,增加各项事故抢修解决方案设计,避免机房的建设与维护出现脱节,改变过去由于安装的原因导致无法进行维护抢修,影响区域内的用户通信,造成企业的无形价值损失。