粒度可调的数据业务预警监控手段

2014-02-10 02:39
电信工程技术与标准化 2014年10期
关键词:数据业务信令粒度

(中国移动通信集团浙江有限公司湖州分公司,湖州 313000)

粒度可调的数据业务预警监控手段

季靓

(中国移动通信集团浙江有限公司湖州分公司,湖州 313000)

随着用户对数据业务的依赖性逐渐超过了话音业务,以往的性能预警监控手段已无法满足当前的需要,造成从问题发现到问题处理的历时过久,这已成为影响用户感知的难题。通过部署GB接口信令跟踪平台,并设置短时无流量小区统计的功能,可以高效地实现数据业务预警监控。该方法的时间粒度可根据需要自行调整,从而在数据业务时代满足了网络运营维护的需求。

数据业务;预警监控;时间粒度

在日常运维中发现,阿尔卡特朗讯的GSM无线设备具有若干缺陷,但设备商未对这些性能缺陷推出有效的补丁,使得因设备缺陷引发的投诉无法得到彻底根治。例如小区及PCU偶发性能吊死,导致无法上网并引发用户投诉。虽然阿尔卡特朗讯在软件升版工程中提供了个别补丁,但未能根治该问题。

目前,阿尔卡特朗讯无线网络设备(BSC及MFS)主要的性能分析软件工具是设备商提供的ARP(Analyzer for Radio Performance),其统计周期为1 h。但是受限于硬件设计和数据采集的瓶颈,某时段的性能报告通常要到下个时段的半点才能获取。在可能的运维场景中,从基站发生故障到问题发现的耗时短则0.5 h、长则1.5 h。而在此期间无流量隐性故障已经给用户造成了恶劣的感知、甚至引发了批量投诉。随着全网流量的激增,该问题日渐突出,引发的投诉量呈逐月递增趋势。

因此,在设备商未能提供有效解决方案的前提下,如何有效缩短基站无流量的隐性故障从发生到发现的时长,是关系到运营商如何去提升用户感知和增强网络维护水平的新问题,需要新的思路来加以解决。

1 预警监控方案部署

湖州移动在2011年底部署了GB接口的信令跟踪平台,并具备了一定的GPRS业务端到端分析能力。根据上述问题的需要,可以在该系统架构上衍生出一项时间粒度可调的数据业务预警监控功能,从而缩短无流量故障从发生到发现的时长。

如图1所示,为部署的GB接口信令跟踪平台及网元结构的示意图。数据采集服务器可以进一步加载无流量预警监控的识别功能,软件功能设计思路即从GB口实时采集全网基站的数据业务性能,以流量为例;服务器定期对不同时段采集的流量大小做比对;自动发现数据业务性能隐患,识别新增无流量小区后输出至维护人员。该方案可以协助网络性能分析人员有效定位无流量异常小区,及早发现PCU设备软件吊死等设备缺陷的发生。这也是跟踪平台部署之后的应用创新点之一。

图1 GB接口信令跟踪平台架构示意图

可以根据维护的需求,来自定义该功能的时间粒度,定制的监控手段可以实现15 min~1 h不等的时间颗粒度。以湖州移动的设置方案为例,对全网设置了最小时间颗粒度仅15 min间隔的小区无流量预警方案,这一时间间隔远远低于阿尔卡特朗讯方案的1.5 h的时间粒度,从而帮助维护人员快速发现问题。以图2为例,在效果最显著的情况下,发现问题的时间间隔从1.5 h缩短为0.25 h,最佳的效果可以缩短83%。

图2 方案应用的典型情况示意图

2 预警监控方案个性化应用

小区无流量告警模块还可以同时运用在以下工作场景,以满足各地实际需求,实现个性化的应用。

(1) 新基站开站场景:将新开通站点纳入性能监控的对象范围,在开站后查询扇区短时无流量异常情况,可以迅速发现是否存在问题。山区等用户数量稀少的地区不适用该场景。

(2) 高承载规模网元(如BSC、MFS)的工程割接场景:将实施割接的网元所辖的基站扇区纳入性能监控的对象范围,在割接完成后查询短时无流量异常情况,可以迅速发现是否存在问题。夜间用户行为习惯的变化应考虑对输出结果做适当校准。

(3) 小区故障处理的效果验证场景:故障小区实施排障解决方案后,查询短时流量情况,即可大致判断排障方案是否有效果。

(4) 小区休眠、数据业务假死等隐性故障的发现场景,是前述的主要应用方向。

可以发现,顺利实施该预警监控手段要求两个关键点:GB接口流量数据的高效采集与比对,该项工作由信令跟踪平台硬件结合加载的软件模块共同完成;后台分析人员跟进输出的报表做进一步分析和修复操作,剔除常规无流量小区、对剩余的有异常无流量小区做GPRS重置复位等修复性操作,该项工作由专业组完成,根据人员配备、工作量与需求紧迫性来灵活掌控。

3 实际运行效果

目前湖州移动实行15 min粒度的无流量小区预警,每15 min以报表方式自动输出结果供分析判断,也可根据实际情况或需求的变化,将时间粒度自定义调整为30 min或20 min。预警模块的输出报表如表1所示。

表1 预警模块的输出报表

以短时无流量的扇区12 712和30 142为例,10:30性能预警功能提示为短时无流量小区,经分析不属于山区等常规无流量小区后,分析人员对以上2个小区做GRPS初始化操作、重置了扇区的GPRS数据业务功能。在下个时段的15 min粒度报告里,这2个小区因为产生了2G数据流量,而不再呈现于10:45输出的报表中。以上设备性能隐患得到了快速的排查。

该预警监控手段对地市公司提升生产效益有明显的帮助。WAP投诉数量对比情况如图3所示。

(1)可以提早发现问题、缩短业务退服时长。该方法自启用后,经过运行与完善,数据网故障的处理效率得到了一定提升,每周能发现约120站次的小区GPRS性能吊死情况,其中一半频次发生在凌晨至早上8点之间,对用户感知的影响不大;另一半频次发生在工作时间及晚忙时,通过运用该手段,故障小区的数据业务退服累计时长可以缩短60 h/周以上。

(2)可以提早发现故障隐患、避免形成批量投诉。通过统计本地的GPRS投诉量,可以发现该预警监控手段成效明显。在GPRS流量每年同比大幅增长70%的背景下,该预警监控功能在启用后当月的GPRS投诉量即环比下降了45%,随后各月的同比下降幅度在22%~60%不等。借助该预警监控手段,为投诉总量的改善贡献了60例/月,从而有效提升了用户感知。

该预警监控手段对压缩运维成本、提升经济效益也有一定的帮助。该预警监控手段依托于信令跟踪平台,利旧了原有的服务器硬件,由后台数据业务性能分析人员掌握和使用,实现了“零投资”和“零成本”。而它能够减少60例/月的投诉量,使原本紧缺的投诉现场处理人员花更多时间精力投入到DT/CQT等主动性测试当中,相当于节约了0.5个人力与车辆资源。

图3 WAP投诉数量对比情况

4 结论

该数据业务预警监控手段,可以有效发现休眠小区和无流量异常小区。目前的设备话务统计报告的输出时间间隔过长、无法满足实时预警监控的需求,而该方案可以有效缩短从问题发生到问题发现的时延,来快速恢复数据业务,改善用户感知并减少投诉数量。在效果最显著的情况下,发现问题的时间间隔从1.5 h缩短为0.25 h,缩短了83%。

大数据时代,数据业务对运营商收入的贡献比重日益增加,该方案能够帮助网络运维效率进一步提升。

[1] 韦薇,张扬. 信令监测系统架构规范的演进[J]. 电信工程技术与标准化, 2011(4).

[2] 张扬. 信令监测系统存在的问题以及优化方案[J]. 电信工程技术与标准化, 2012(10).

Dynamic method for monitoring general data service

JI Liang
(China Mobile Group Zhejiang Co., Ltd. Huzhou Branch, Huzhou 313000, China)

There is one obvious defect of the conventional monitoring method for GPRS, its interval is too long for early warning. Since data service is growing more and more important than voice service, it’s urgent to cut short the interval for early warning GPRS failure. By deploying GB interface signaling platform, it’s feasible to collect statistics of abnormal data traff c. And the interval for collecting statistics is dynamic and adjustable. In this way the capacity for network maintaining would be improved.

data service; monitoring method; time interval

TN915

B

1008-5599(2014)10-0065-03

2014-08-16

猜你喜欢
数据业务信令粒度
上海市交通发展研究中心交通项目评审及交通大数据业务简介
粉末粒度对纯Re坯显微组织与力学性能的影响
SLS字段在七号信令中的运用
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
基于粒度矩阵的程度多粒度粗糙集粒度约简
双粒度混合烧结矿颗粒填充床压降实验
LTE网络信令采集数据的分析及探讨
泉州湾表层沉积物粒度特征分析
分组域数据业务的停复机优化