盛莉莉 谷俊江
中国联合网络通信有限公司江苏省分公司
随着移动互联网业务的普及,人们对无线移动网络质量的要求越来越高。尤其是视频、游戏业务的发展使得用户对于数据业务的流量要求越来越高。无线小区的业务流量也成为网络后期规划扩容的依据。但是从KPI指标体现的业务流量是否反映了该小区下用户的实际流量需求?最常见的,容量的瓶颈会导致用户的实际业务需求无法满足,同样,由于干扰,覆盖等问题也会导致用户在使用业务时由于速率过低放弃继续使用数据业务的情况。这就是用户的实际流量需求被压抑的情况。因此,现网中由于各种因素的干扰,KPI指标所反映的业务流量和实际用户需求流量是存在差异的。如果用现网的指标作为流量预测的根据,将会导致预测不准,使得网络规划跟不上用户需求的发展,最终导致用户感知和满意度的下降,因此,需要有手段对网络中的流量压抑进行识别,并将还原后的流量指标作为网络扩容规划的依据。同时也需要对流量受压抑的根因进行判断,以便做出快速有效的调整措施,及时改善用户感知。
本方案通过标杆小区的确定,找到指标正常、感知正常、不存在流量压抑情况的小区,探索其流量和指标之间的特性并建立模型,将其他小区的指标输入模型之后判断是否存在流量压抑,整个流程分为分类、拟合、异常识别、压抑预估、根因判断5个步骤,实现方法如图1所示:
图1 流量压抑识别流程
PRB(PHYSICAL RESOURCEBLOCK)利用率是反映无线网业务量最为直观的指标,正常情况下该指标会随着用户数和业务量的增加而增加。因此,小区的PRB利用率和小区的流量一定存在直接的关系,但是由于实际网络环境的复杂性、用户行为的差异以及无线环境的差异,两者之间的关系也一定存在差异,比如,在存在干扰的情况下会存在PRB利用率虚高的情况,少量的小包业务也会影响PRB的调度。因此,需要通过多个维度对小区进行分类,以确定不同类型下标杆小区的PRB利用率和流量之间的不同关系。分类的维度可以包括:社会场景、业务类型、用户规模、无线环境、频段特征等。利用以上维度作为特征值,采用k-means聚类算法,可以获得无线小区的分类。
分类完成之后首先进行标杆小区的确定,标杆小区即不存在容量瓶颈的小区。
拟合,是为了获得PRB利用率和流量之间的关系。对于每一类标杆小区的数据集,计算该场景下PRB利用率和流量之间的关系模型即流量预估模型,为增加鲁棒性,此处采用线性模型。
任何原因的流量压抑均会导致用户的感知恶化,但是由于KQI指标比较主观,相应的指标需要从信令中汇总计算获得,处理复杂度较大。并且KQI性能恶化不一定是单个因素造成,可能是多个因素组合导致。因此,本文首先对通过FPGrowth算法学习无线性能指标恶化与用户感知异常事件的关系,并形成网优性能指标与感知异常的关联规则库(KK关联规则库),并通过设置置信度门限甄别出感知异常小区。
(1)输入正负样本
正样本包括正常小区及其无线性能指标,负样本包括异常小区及其无线性能指标。正负样本提取需要部署用户级定界组件,针对定界后的结果进行规则学习。
(2)获得关联规则
通过FPGrowth算法,学习无线性能指标与感知的关系规则库,即当小区哪些无线性能指标恶化时会导致感知恶化以及该规则在过往历史中的置信度。
数据处理:对数据进行一致性检查、缺失值的处理、数据关联、异常值处理等;
机器学习:对数据进行数值离散化处理、规则挖掘并进行模型检验及优化;
建立规则文档:将挖掘出来的规则生成文档。即哪些因素会导致该KQI差,并包含其对应的置信度(即该组合导致KQI劣化的概率)。
(3)感知异常小区识别
通过设置置信度门限,有效甄别出由于无线原因导致的感知异常小区。
对于前面获取的感知异常小区再根据拟合步骤中得到小区的流量预估模型计算得到理论的流量值。流量理论值减去实际值的差即为流量压抑预估值,当流量压抑预估值大于设定的门限时,认为该小区存在流量压抑的情况。具体步骤如下:
(1)匹配分组:按找对应的场景、频段、业务类型,人数规模等维度匹配对应分组,并获得相应的线性回归标杆函数f(x);
(2)估算小区应有流量:将目标小区的用户平均数据代入其对应分组的线性回归标杆函数f(x),估算小区应有的总流量。(当估算PRB利用率小于当前利用率时,按照当前利用率计算);
(3)计算小区压抑流量:小区应有流量减去其现有流量得出受压抑流量,即受压抑流量= f(x)–目标小区当前流量(当数值小于零时,填为零);
(4)与设定门限值对比,判定是否存在流量压抑。
流量压抑识别后,需要对造成流量压抑的无线侧根因进行定位。本方案采用根因矩阵识别算法进行根因识别。本方案对覆盖、质量、容量、切换、干扰指标进行分级,根据设定绝对门限和质差门限,分为指标良好,指标较差、指标差按三个等级。
STEP 1:覆盖、质量根因识别
如表1所示。覆盖差定义为RSRP>-105的采样点比例满足绝对门限。
表1 覆盖问题判断示意图
覆盖较差定位为RSRP>-105的采样点比例满足质差门限。
覆盖好定义为RSRP>-105的采样点比例不满足绝对门限,也不满足质差门限。
质量差定义为CQI≥7的比例满足绝对门限。
质量较差定义为CQI≥7的比例满足质差门限。
质量好定义为CQI≥7的比例不满足绝对门限,也不满足质差门限。
STEP 2:干扰根因识别
如表2所示。基于无线、质量根因识别的结果,再结合干扰的情况进行根因识别。干扰严重定义为干扰噪声平均值满足绝对门限。
有干扰较差定义为干扰噪声平均值满足质差门限。
无干扰定义为干扰噪声平均值低于质差门限。
表2 干扰问题判断示意图
STEP 3:切换根因识别
切换差定义为切换相关指标中有一项满足绝对门限。
切换较差高定义为切换相关指标均不满足绝对门限,但有一项切换指标满足质差门限。
切换好定义为切换相关指标中没有一项满足绝对门限,同时也没有一项满足质差门限。
STEP 4:容量根因识别
如表3所示。负荷很高定义为容量相关指标中有一项满足绝对门限。
表3 质差门限、绝对门限定义
负荷较高定义为容量相关指标均不满足绝对门限,但有一项容量满足质差门限。
负荷正常定义为容量相关指标中没有一项满足绝对门限,同时也没有一项满足质差门限。
根因类别 质差门限 绝对门限175 ≥250最大RRC连接用户数 容量31(800M) ≥90干扰噪声平均值 干扰 ≤-95dBm ≤-90dBm X2接口切换成功率 切换 98% 95%eNodeB内切换成功率 切换 98% 95%
本文涉及的功能已经在江苏联通上线并应用。从数据评估上看,苏州流量压抑较为严重,且根因分析判断大部分为覆盖引起,这与现网实际情况比较一致。现网对于干扰引起的流量压抑问题进行了整改,效果较为明显。图2是针对苏州的流量压抑小区SZ_KS_HW_仕泰隆拉远电信鸡鸣塘_FL_B_1的分析处理结果,根据根因判断,该小区由于干扰问题导致流量压抑,从表4的KPI指标中可以明显看出该小区存在干扰。图3显示,采取优化措施解决干扰问题后,日均流量显著提升。
图2 系统分析界面
表4 受压抑小区指标
经实际验证,基于机器学习算法和KQI/KPI指标关联可以有效识别网络中的流量压抑情况,对于识别网络中的伪低负荷小区,还原用户实际流量需求,激发网络流量,改善用户感知有积极作用,也能为网络扩容和规划发展提供更精准的决策数据。
图3 调整前后日均流量对比