移动网络投诉热点区域智能识别方法与应用

2021-09-24 02:45孟现锋梁松柏
河南科学 2021年8期
关键词:热点边界聚类

孟现锋, 梁松柏, 徐 刚

(1.中国联通郑州市分公司,郑州 450000; 2.中国联通河南省分公司,郑州 450000)

用户对无线网络感知越来越敏感,导致移网用户投诉量居高不下. 与此同时,如何快速识别移网投诉热点区域,将有限的投资及设备资源投入到真正的投诉热点区域,有效改善用户感知,则是运营商十分关心的一个问题[1]. 传统方法是通过对某一个投诉位置的投诉数量累加,随后进行投诉量排名,将投诉量靠前的场景名称确定为投诉热点. 而该方法的主要缺点,一是无法有效去除噪声点,形成独立成簇的投诉热点区域;二是无法精细化地识别投诉热点区域的边框,投诉热点区域通常为没有明确边界范围的模糊区域;三是无法对网络的规划、建设、调整以及优化提供有力的数据支撑. 各行业的热点区域挖掘目前常用的方法是聚类算法[2-15]. 其中,DBSCAN算法(密度聚类)相较于其他聚类算法,对噪声不敏感,无须设定类别数量,可以任意形状成簇,适合投诉热点区域识别.

针对投诉热点区域网络问题的解决,对规划方法和手段要求更高. 而网络仿真软件无法评估每一个投诉热点区域的价值及建设优先级. 并且,传统方法更多依赖于经验判断,考虑维度较单一,在解决方案的精准性方面存在欠缺,不经慎重评估便建设一个站点,不仅无法针对性地解决实际需求,反而可能会带来重叠覆盖、越区覆盖、干扰等严重问题.

基于以上分析,本文结合DBSCAN 聚类和凸包算法,提出一种投诉热点区域智能识别方法. 首先通过DBSCAN算法预处理历史投诉数据,聚类生成投诉热点区域;然后,基于Graham扫描法求解投诉热点区域边界点,并勾画投诉热点区域边界;最后,基于投诉热点区域网络优化模型,进行网络问题分析定位,输出投诉热点解决方案.

1 总体实现思路

针对移动通信行业用户历史投诉数据集,投诉热点区域智能识别与网络评估流程如图1所示. 首先,采用DBSCAN算法去除噪声点,快速地筛选出投诉热点区域的簇集合;然后,基于凸包算法中的Graham扫描法求解投诉热点区域边界点,并勾画投诉热点区域边界;最后,基于投诉热点区域网络优化模型,评估投诉热点区域内的网络指标,输出问题解决方案.

图1 总体流程Fig.1 Overall process

为有效解决投诉热点网络问题,同时保证资源的精准投放,在分析梳理影响网络性能要素的基础上,筛选出网络运营、市场支撑、用户感知三个维度的九项指标,建立投诉热点区域网络优化模型. 具体结构如图2所示.

图2 投诉热点区域网络优化模型Fig.2 The network optimization model of complaint hot spot area

模型数据源包含价值微网格数据、基站工参数据、MR 数据、路测数据、友商竞对数据、市场签报数据、集团客户数据、口碑场景数据、投诉数据等九种数据. 数据定义见表1.

表1 指标定义Tab.1 Index definitions

2 基于DBSCAN算法投诉热点区域聚类

2.1 DBSCAN算法介绍

DBSCAN算法的基本思想就是计算某个eps半径范围内采样点的数量是否大于设定值min_samples. 其中eps和min_samples,分别限定算法的区域半径和最少样本点数量[16-19].

如图3 所示,最小集合数量min_samples=4,表征一个簇内至少包含4 个样本点. 其中A、B、C 在半径eps 内均互相可达,可生成一个簇. 无法聚类成簇的点被作为噪声点,比如图3 中的N点.

图3 DBSCAN算法示意Fig.3 Schematic diagram of DBSCAN algorithm

2.2 投诉数据描述

本文所分析数据源为Z市某运营商半年来的移动通信投诉数据. 数据样例部分数据如表2所示. 数据包含日期、受理号码、经度、纬度等数据.

表2 数据样例Tab.2 Data samples

取Z 市季度投诉数据地理化,从图4 看到,投诉数据地理化无明显簇状分布特点,需去噪处理.

图4 投诉数据地理化分布Fig.4 Geographic distribution of complaint data

2.3 投诉热点区域聚类过程

针对Z 市半年历史投诉数据分析,结合投诉历史数据人工统计经验,给出移动通信网络投诉热点区域定义:半年内,200 m 范围内出现10 例及以上网络质量投诉. 即算法参数eps 设定为200,最小样本点min_samples设定为10,聚类结果如图5所示,聚类产生12个投诉热点区域.

3 基于凸包算法求解投诉热点区域边界

3.1 凸包算法介绍

凸包概念:对于数据点集合(P1,P2,P3,…,Pn),求解一个最小凸多边形P,P能够完全包含数据点(图6)[20].

图6 投诉热点区域边界求解示意Fig.6 Solution of complaint hot area boundary

3.2 Graham扫描法确定投诉热点区域边界

步骤一:将移动通信网络历史投诉数据集中的点投射到直角坐标系,Y轴中最小点,即图6中的P0点,必定为凸包的一个顶点,并以此作为坐标的原点,如图6中的投诉点P0.

步骤二:以投诉点P0作为顶角,X轴作为一条边,其他顶点与P0连接生成第三边,夹角设为a.

步骤三:集合中的每个数据点与投诉点P0连线夹角a,通过夹角a大小的比较,排序各个数据点. 很容易得知投诉点P1和投诉点P8必为凸包上的点.

步骤四:将凸包上的点入栈,如投诉点P1入栈,并将投诉点P0与栈顶元素连接,例如P0P1. 依次判断投诉点Pn在投诉点P0与栈顶连线L的左边还是右边. 如果投诉点Pn在左边或在同一直线上时,将它与栈顶元素相连,比如投诉点P2将与投诉P1连接.

步骤五:将新连接线段的坐标与前一线段坐标进行叉积运算,如果叉积结果为负,则该投诉数据点一定是凸包上的顶点,将其入栈,否则出栈.

步骤六:判断栈顶数据点,如果栈顶数据点是角度a最大的数据点,则数据点即为凸包上的顶点,凸包形成,算法执行完毕. 否则继续执行步骤四.

基于Graham扫描法处理投诉热点区域数据,求解投诉热点区域边界,投诉热点区域边界如图7所示.

图7 投诉热点区域边界Fig.7 Boundary of complaint hotspot area

4 投诉热点区域网络优化方案

4.1 投诉热点区域网络优化模型

投诉热点区域边界确定后,基于投诉热点区域网络优化模型,评估投诉热点区域内的网络指标,输出问题解决方案.

以MR数据判断面覆盖,路测数据判断线覆盖,投诉数据判断点覆盖. 同时,结合周围无线环境、现网资源、站址资源,点线面联合分析,实现网络问题的精准定位,随后匹配网络问题解决方案库,得出最优解决方案,方案库如图8所示.

图8 网络问题解决方案库Fig.8 Network problem solution library

投诉热点区域网络问题分析定位后,实行“先维优,后规建”的原则,网优类问题通过优化手段解决,维护类问题通过维护手段解决,建设类问题输出规划建设方案. 方案确定后,将指标量化,进行加权评分,计算出投诉热点区域解决方案的评估总分,进行价值排序,输出解决方案优先级详表,指导投诉热点区域网络问题解决,见图9. 各项指标评分方法及分值如表3所示.

图9 方案得分计算流程Fig.9 Program score calculation process

4.2 实例验证

针对Z 市某运营商半年来的移动通信网络质量投诉数据,求解确定了12 个投诉热点区域. 随后,基于投诉热点区域网络优化模型进行问题定位,并输出解决方案,确定价值排名. 详细的规建维优方案如表4所示.

表4 问题定位与解决方案Tab.4 Problem locations and solutions

投诉热点2定位原因为该区域主服务小区方位角不合理,基于MR数据求取最佳方位角140°,但工参数据库中方位角为100°,调整前后指标如表5所示. 从表5可见,该区域网络性能提升的同时,投诉问题有相应改善.

表5 投诉热点2优化方案执行前后指标对比Tab.5 Comparison of indicators before and after the implementation of complaint hotspot 2 optimization scheme

5 结论

相比较于人工筛选,基于DBSCAN聚类和凸包算法的投诉热点区域智能识别方法能够快速准确识别出投诉热点区域. 针对Z市某运营商半年来的移动通信网络质量投诉数据,求解确定了12个投诉热点区域,并基于投诉热点区域优化模型,实现了投诉原因定位,输出一点一策方案. 并针对其中一个投诉热点区域,提取优化方案执行前后的网络后台指标以及投诉数据,该区域网络性能提升的同时,投诉问题有相应改善.

猜你喜欢
热点边界聚类
热点
守住你的边界
拓展阅读的边界
探索太阳系的边界
意大利边界穿越之家
热点
结合热点做演讲
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法