李金生
【摘 要】为了提升终端与网络交互问题分析及定位的效率,提出了基于终端侧感知异常事件智能动态采集,并结合网络侧信令进行联合溯源定位问题的方法。通过在终端上安装异常事件采集APP,自动采集终端侧关键参数,在关键参数偏离正常范围时触发感知异常事件并动态扩展参数采集范围,从而为问题定位提供更多有效的终端侧网络环境信息,并结合网络侧信令,从端到端角度提升问题分析定位的效率。
【关键词】异常事件 终端与网络交互 问题定位
1 引言
随着智能手机普及程度的不断提升,越来越多的人热衷于利用手机上网进行社交以及购物等,这些新型的用户行为对网络的传输速率及数据传输的稳定性要求越来越高。与此同时,运营商网络容量和资源利用方式面临的压力剧增[1],终端方面也每天都有各种影响感知的异常事件出现,比如信号强度弱、应用异常退出等。由于涉及的业务链长,终端与网络交互存在的问题定位难度变大。
为了提升终端与网络交互问题分析及定位的效率,本文提出了基于终端侧智能动态采集感知异常事件,并结合网络侧信令进行联合溯源定位的方法。
2 目前针对终端与网络交互问题的解决
方案
对于如何及时发现客户在使用网络业务过程中出现的终端与网络交互问题并进行解决,主要存在如下3种方法:
(1)客户投诉记录挖掘[2]:通过采集人工客服收到的投诉工单,并按照投诉的时间、地点、投诉内容、终端类型等维度进行深入的挖掘分析,找出与终端相关的具备共性的投诉案例并进行拨测验证。
该方法优点是能准确界定问题所在,缺点是通过客户投诉记录来挖掘终端问题无法先于用户发现,具有滞后性。
(2)人工遍历测试[3]:使用疑似存在问题的智能终端实体,按照预设的测试用例,在现网进行大量的测试,最后汇总其中测试不通过的用例及终端,进行二次确认和排障。
终端拨测验证法能主动地先于客户投诉发现终端存在的问题,但消耗资源极高,对于目前现网庞大的终端数量,几乎不可能进行完备的测试。
(3)基于网络侧信令进行聚类挖掘[4]:此方法难以实现对终端侧与网络侧异常事件的精准定位与分析,网络侧无法采集与分析还没有到达网络的数据,例如由于终端侧原因产生的业务失败、终端本身的性能下降等。
3 基于异常事件机制的分析定位方法
异常事件是指客户在使用智能移动终端的过程中,信号覆盖、语音业务、数据业务、终端性能、APP等方面的相关参数偏离正常范围,导致用户使用感知下降,甚至无法正常使用业务的情况[5]。
本文提出一种基于异常事件动态采集的终端与网络交互问题分析定位方法:对于安装有终端异常事件统计APP的智能手机用户,当用户终端发生异常事件时,APP会动态智能扩展采集范围,从该异常事件的核心定义参数扩展到终端侧环境数据,包括用户维度数据(用户标识号、APP标识号和系统版本号等);时间维度数据(异常事件采集时间点、间隔等);空间维度数据(异常事件发生的小区号等)。然后,终端侧采集APP将异常事件核心定义参数与环境参数发送回后台系统。最后,通过异常事件环境构建,联合异常事件前后一段时间与邻近地区的参数,对发现问题的情景进行复现和回放,协助问题的分析定位。处理机制的主要工作流程如图1所示:
图1 异常事件采集及分析流程
下文將对异常事件采集及分析的关键步骤进行分析阐述。
3.1 采集终端关键参数,触发异常事件
首先在终端上安装异常事件统计APP,运行该APP后,可以从信号覆盖、数据业务、终端性能和终端应用4个维度对手机终端的关键指标参数进行日常监控,自动提取手机终端异常事件核心参数[6],并与正常值进行对比,从而判断是否发生异常事件。
3.2 智能动态扩展参数采集范围
(1)采集机制
当终端异常事件统计APP采集到核心参数异常(即发生异常事件)时,触发智能动态参数采集:基于时间轴,动态调整采集频率与采集内容,智能扩展终端侧及网络侧参数采集范围,自动采集异常事件发生时刻前后一段时间内、异常事件发生地点邻近小区等的环境参数,如小区号、经纬度、采集时刻等,并将数据传送至系统后台,重构终端异常事件发生环境及情景[7],进行异常事件分析。参数采集动态扩展原理如图2所示。
(2)动态采集算法
使用基于时间序列的预测[8]进行关键指标的动态采集。通过对时间序列的关键指标进行分析,掌握关键指标随时间变化的规律,从而动态决策外延指标的采集范畴。
由于终端客户感知与终端所处的无线网络环境息息相关,因此选取信号强度作为指标动态采集的关键参考指标,并对信号强度的时间序列使用加权移动平均法进行预测。算法包含如下4个步骤:
1)以一定的时间间隔采集用户所处网络的信号强度时间序列:S1, S2, …, SN;
2)以N为移动的时间段,使用简单移动平均数的计算方法得出预测值Mt,如公式(1)所示:
(1)
3)考虑各期数据的重要性,对近期数据给予较大的权值,远期数据给予较小的权值,将预测值改良为加权移动平均数Mtw,如公式(2)所示:
(2)
4)根据信号强度的预测值Mtw,动态决策信号类、数据类、应用类、终端类四大类共50多个具体指标的采集,以达到在满足异常事件溯源分析的前提下,节省采集APP待机时资源消耗的目的。
3.3 异常事件环境构建与情景复现
通过终端异常事件统计APP采集到了终端异常事件扩展数据,包括基于时间轴前后一段时间的终端、网络与业务参数指标,如终端本身(CPU内存利用率、界面交互等)、终端与网络交互(小区、信号强度、制式、速率、语音数据掉线率等)[9]、终端与业务平台(平台连通性、时延等)等方面的指标。然后根据这些指标,对发现问题的情景进行复现和回放[10],协助问题的分析定位。endprint
(1)根据终端异常事件统计APP采集的参数,结合网络侧信令参数,展示、构建异常事件发生时间前后的空间场景与全时间流程,网络侧辅助参数包括HLR(Home Location Register,归属位置寄存器)用户签约数据、话音及数据网络留存的控制面和媒体面信令等数据。终端侧与网络侧信令的关联示例如图3所示:
图3 终端侧与网络侧信令的关联示例
(2)结合终端侧参数与网络侧信令数据,形成完备分析工具,判断检测结果,得出初步分析结论。如图3所示,终端进入弱信号覆盖区域,从网络信令上看,终端一直在TD-SCDMA和GSM网络之间不停选择,但信号强度均达不到稳定在一种网络下,此时获取到的网络制式、LAC、CI均会有错位,终端侧APP的判断“2G弱覆盖”符合预期。
3.4 异常事件聚类分析与定位
在3.3节的基础上,根据几个场景分类,分析异常事件发生时的各项指标,具体流程如下:
(1)导出异常事件,从终端、小区等维度进行聚类分析,对于在终端维度的异常事件,从网络制式、用户维度进行聚类分析。
(2)根据场景分类,确定各场景流程环节中的重点指标参数并进行分析,如上网场景中的PDP(Packet Data Protocol,包数据协议)激活成功率,终端异常场景中的终端配置等,辅助问题定位分析。
(3)结合网络侧信令,确认最终问题,将问题派单分发给下一级运营商或者厂商。
3.5 方案优点
本方案具备如下3个方面的优点:
(1)分析挖掘效率高:通过对现网用户的无线覆盖、网络互操作、终端行为、应用行为等进行深度数据挖掘,可高效快速地定位网络指标异常和用户网络行为异常的终端。
(2)准实时性:实时采集用户网络日志,实现感知异常事件发现时延控制在5分钟以内。
(3)分析成本低:无须使用终端进行拨测,充分利用了现网的用户作为庞大的虚拟测试群体,因而能节省人力成本和测试实体机的购买成本。
4 结束语
本文提出了一种基于终端侧感知异常事件智能动态采集,对终端与网络交互问题进行分析定位的方法。通过在终端上安装异常事件采集APP,自动采集终端关键参数,在异常事件发生后自动触发動态扩展参数采集范围,并结合网络侧信令对终端及网络交互环境进行溯源定位,提升用户感知异常发现及定位的效率。
参考文献:
[1] 楼旭明,孙中原,赵合. 4G时代流量爆发性增长的实证分析[J]. 价值工程, 2016,35(13): 49-51.
[2] 唐盛涛. 基于数据挖掘的运营商客户投诉分析方法研究[J]. 互联网天地, 2016(3): 53-55.
[3] 郭宝. TD主流商务终端的路测与优化[J]. 通信世界, 2012(14): 23.
[4] 陈平,宋玉蓉,蒋国平. 基于多维聚类挖掘的异常检测方法研究[J]. 计算机技术与发展, 2012,22(7): 136-139.
[5] 赵旺飞,戴罕琦. 基于互联网模式的4G网络感知提升技术研究[J]. 电信快报, 2016(3): 18-21.
[6] 黄斐一,孙立军,孔繁盛. 基于移动互联网手机应用的无线网络性能采集方案[J]. 广东通信技术, 2014(4): 2-6.
[7] 莫建林. 基于虚拟终端上下文环境感知的多终端重构系统和方法: 中国, 103248653 A[P]. 2013-08-14.
[8] 李健,孙广中,许胤龙. 基于时间序列的预测模型应用与异常检测[J]. 计算机辅助工程, 2006,15(2): 49-51.
[9] 王凯,姚东升. 无线通信网络信号质量监测系统: 中国, 1905588 A[P]. 2007-01-31.
[10] 杨理想. 移动通信网络用户感知智能分析系统:投诉回放和故障重现模块的研究与开发[D]. 重庆: 重庆邮电大学, 2013. ★endprint