基于Prophet时序算法的无线网络突变小区识别方法研究

2021-03-13 10:19杨飞虎许国平刘贤松张硕伟郑敏之施亚洲中国联通网络AI中心上海00050中国联合网络通信集团有限公司北京000上海联通无线网运营中心上海00050
邮电设计技术 2021年2期
关键词:门限预测值时序

杨飞虎,许国平,刘贤松,张硕伟,郑敏之,施亚洲(.中国联通网络AI中心,上海 00050;.中国联合网络通信集团有限公司,北京 000;.上海联通无线网运营中心,上海 00050)

1 概述

随着5G 和物联网的引入[1],移动网络越来越复杂多变,但人们对无线网络的质量要求越来越高,这对运营商的无线网络优化提出了新的挑战[2]。KPI 指标直接反映了无线网络的性能和质量,传统的小区KPI突变检测方法是先采集PM 和配置等数据,网络优化工程师再根据专业知识和经验,对各个KPI 指标分别设置阈值,观察KPI 指标是否连续若干个小时超出阈值,来判断KPI 指标是否存在异常[3]。但是网络制式多样化,用户行为不可控,总会有部分属于正常性突变或者偶发性波动的KPI 指标作为异常被识别出来,这种方法存在资源投入大、阈值不准确、优化不及时等问题。

2 传统无线网络KPI突变小区检测方法

小区KPI突变检测是无线网络优化的一个底层核心技术,是改善网络覆盖质量的重要手段,因此小区KPI 突变检测在无线网络优化工作中具有重要的指导意义[4]。传统的小区KPI突变检测流程如图1所示。

图1 传统的小区KPI突变检测流程图

传统的小区KPI突变检测是对全网各项指标进行日常性监控,并对有问题的小区进行预处理和派单。在监控KPI 指标时,除了满足质差小区定义及突变小区定义外,还需要同时满足监控时间条件,如不满足监控时间条件则继续监控指标。通常在各项指标日常监控中,监控时间段为:09:00—24:00(15 h),并且质差或突变条件触发后要同时满足“6 h及以上或连续4 h”,才能触发告警派单。如果人为设定规则过于苛刻,监控系统预处理与派单有严重的滞后性,网络运维人员不能及时处理网络质量或性能问题[5];如果规则过于宽松,可能出现因为非无线原因、正常潮汐、特殊事件等造成的正常性突变或者偶发性波动被当作KPI指标异常处理的情况。

随着整个移动网络系统中数据规模的指数式增加,传统的基于“人为设置单一规则”的自动化小区KPI 突变检测显得力不从心[6]。现阶段的网络运维优化迫切需要一种能够从海量运行数据中依据人工智能方法自动地获取和更新更加可靠的规则,以实现对无线网络质量提供强有力的保障[7-8]。

3 Prophet时序算法介绍

Prophet 算法是2017 年Facebook 发布的开源时序预测框架,它主要研究时序数据特征和时序变化规律,并对未来走势进行预测[9-10]。该算法不仅能够弥补传统时序模型对时序数据过于局限、缺失值需要填充、模型取法灵活性等不足,而且相较于传统的时序模型,在模型准确率以及使用者之间的互动方面具有更好的效果[11]。Prophet 算法是一个可分解的时间序列模型,它对时序数据各个特征进行分析,例如对时序数据的长期趋势性、季节周期性、节假日效应等特征分析。Prophet 算法通过将这几项特征拟合,累加起来得到时间序列的预测值。Prophet模型的构成如下:

式中:

g(t)——趋势项,用来拟合时间序列的趋势性变化

s(t)——周期性变化,一般来说是以周或者年为单位

h(t)——节假日因素造成的影响,数据中是否存在节假日

εt——误差项,通常表示突发事件的影响

3.1 趋势项

在Prophet 算法中,趋势增长类似于种族增长。Facebook 采用了2 种增长函数,一个是基于逻辑回归函数,另一个是基于分段线性函数。

基于分段线性函数的趋势:

式中:

k——增长率

δ——增长率的变化量(适应率)

m——偏移量参数

γ——让函数连续

基于逻辑回归函数的非线性趋势:

其中,C(t),k(t),m(t)是随着时间t变化的函数,a(t)=(a1(t),...,aS(t))T,δ=(δ1,...,δS)T,γ=(γ1,...,γS)T。

3.2 季节周期项

时间序列通常随着天、周、月、年等周期性的变化而呈现周期性的变化,在数学分析中,区间内的周期性函数是可以通过正弦和余弦函数来表示。在Proph⁃et算法中,使用傅里叶级数来模拟时间序列的周期性。傅里叶级数的形式如下:

式中:

P——时间序列的周期,如P=365.25 表示以年为周期,P=7表示以周为周期

Prophet的周期函数如下:

其中,

参数向量β初始化为β~Normal(0,σ2)。

4 基于Prophet时序算法的突变小区检测方法

通过Prophet 训练模型的时序分解方法,将KPI 指标分解为3项:趋势项、周期项和误差项,针对趋势、周期特征分量,建立Prophet 模型进行预测。流程如图2所示。

图2 基于Prophet时序算法的小区KPI突变检测流程

a)将实际KPI 指标值与各分量的预测值相减获得随机序列,随机序列的标准差和各分量的预测值合成得到KPI指标的动态门限。

b)在绝对门限和动态门限之间设置相对门限,来设定异常KPI指标等级。

c)通过判断KPI 数值是否超过相对门限,来判定该KPI指标是不是发生异常。

4.1 Prophet预测

Prophet 算法在预测过程中,能够通过调整转折点平台参数自动探测到转折点。对历史KPI指标发生异常的数据进行调整,减少对KPI指标历史规律的影响,这样可以使预测结果更加灵活、平滑。

a)首先采用Prophet 模型训练的时序数据分解方法,将历史KPI 指标数据St分解成趋势项trendt、周期项(dailyt,weeklyt)和误差项ε。

b)将分解出的趋势 trendt和周期项(dailyt,weeklyt),采用Prophet 模型预测获得第t+3 天趋势预测值 trendt+3和周期预测值(dailyt+3,weeklyt+3)。

c)将上述趋势预测值trendt+3、周期预测值(dailyt+3,weeklyt+3)和误差项ε集成得到第t+3 天小区KPI 指标的预测值St+3,St+3=trendt+3+dailyt+3+weeklyt+3+ε。

4.2 动态门限

根据中心极限定理,如果一个事物受到多种因素的影响,不管每个因素本身是什么分布,它们叠加后结果的平均值呈现正态分布。因此实际值与预测值的差值即随机序列呈现正态分布。正态分布的标准反映了组内个体间的离散程度。如一个较大的标准差,表示大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

a)将历史KPI指标数据St与趋势预测值trendt、周期预测值(dailyt,weeklyt)相减得到随机序列Rt,Rt呈现正态分布,Rt=St-trendt-dailyt-weeklyt。

b)随机序列Rt的标准差反映了实际KPI 指标与KPI 指标预测的离散程度,计算随机序列Rt的标准差。

c)将第t+3 天小区KPI 指标的预测值St+3与随机序列Rt的标准差σ进行集成得到第t+3天小区KPI指标的动态门限d_threst+3,d_threst+3=St+3+σ。

4.3 相对门限和绝对门限

a)公司对各个KPI 指标的健康度阈值有明确的要求,如4G 接通率不能低于90%,4G 掉话率不能高于5%等等。根据KPI指标的健康度阈值,设置绝对门限a_thres。

b)落在动态门限和绝对门限之间的数据不一定很差。通过设置相对门限r_thres,来控制派单量以及KPI 指标异常程度。相对门限设置10 个等级,等级越大,相对门限越大,落在相对门限和绝对门限之间的概率越小,KPI 指标越接近于绝对门限,KPI 指标异常越严重;等级越小,相对门限越小,落在相对门限和绝对门限之间的概率越大,派单量也会越多。设相对门限等级为β。

5 实验分析

5.1 原始数据

本文所采用的数据集来自某省网优某小区过去连续28 天的KPI 指标,数据集中包含日期、4G 接通率等信息。在对原始数据分析的过程中,发现数据中存在格式的不一致性、空缺值和无用信息等噪声数据,这些噪声数据将会不利于模型的训练,需要对原始数据进行预处理。

5.2 数据预测处理

数据格式。原始数据集中包含很多KPI 指标,本文实验只是使用4G 接通率,因此需要对其他KPI指标进行过滤。在保证原始数据完整性和准确性的同时,对原始数据格式进行转换,以满足算法模型对数据的要求。

空缺值处理。原始数据中存在空缺值,如4G接通率在某一天的某个时刻没有数值。本文采用上下均值替代法,即用空缺值时刻的上个时刻数据和下个时刻数据的均值来填补缺失的KPI指标数据。经过一系列对原始数据的分析与处理,得到适合模型训练的标准、连续的数据集。

5.3 参数说明

Prophet 本质上是一种可分解的加法回归模型,即按时序特征可将时序数据分解为非周期性变化的趋势项、天或周的季节周期项和节假日效应等。因此,Prophet 模型可以灵活地对各时序特征的参数进行设置,这些参数值的大小分别表示各个特征对模型预测结果的贡献度。通过分析模型的训练结果,可以调节各特征的参数,以便进一步提升预测精确度。本文使用的Prophet算法的部分参数说明如表1所示。

5.4 实验结果

5.4.1 Prophet算法预测结果与分析

如图3 所示,黑点表示某小区4G 接通率的真实数据,蓝线表示预测值。从预测结果可以看出,模型对历史数据有较好的拟合,自动调整历史4G接通率数据中的异常点,减小异常点对拟合曲线的影响,预测结果较好地拟合了大部分历史数据的规律,并对未来3天的数据进行预测,可以发现模型对KPI 指标历史规律的预测比较准确。而且相较于传统小区KPI突变检测方法,能够对未来3天的KPI指标趋势进行预测。

表1 模型的参数

图3 4G接通率KPI指标预测值

5.4.2 动态门限结果分析

如图4 所示,浅蓝色部分表示某小区4G 接通率预测结果的动态门限。动态门限包含了大部分的真实值,在动态门限内的数值都属于正常KPI指标,而超过动态门限的数值则属于异常KPI指标。相较于传统小区KPI 突变检测方法,动态门限更容易发现不符合历史规律的KPI数值,值得运维人员重点关注。

5.4.3 相对门限与绝对门限结果分析

如图5 所示,较深蓝色部分表示某小区4G 接通率预测结果的相对门限,深蓝色部分表示预测结果的绝对门限。相对门限将动态门限和绝对门限之间的数据进一步筛选,选取1 级相对门限,异常KPI 数据减少了20%。因此,相对门限对异常KPI 数据有进一步的筛选作用,帮助运维人员关注KPI 数据异常程度更高的时刻。

图4 动态门限

图5 相对门限与绝对门限

5.4.4 不同等级相对门限分析

如图6 和图7 所示,超过等级1 相对门限的KPI 数值有8 个,而超过等级3 相对门限的KPI 数值只有5个。因此,不同等级的相对门限,可以人为控制KPI指标异常数量,减少预警次数。

图6 等级1相对门限

图7 等级3相对门限

如表2 所示,某小区4G 接通率从2020 年6 月3 日9 点开始发生异常,从11 点到14 点连续低于相对门限但未低于绝对门限,直到17 点4G 接通率突然恶化,直接低于绝对门限,降到74%。可以发现模型对KPI 指标突然恶化有明显的预警作用,如果运维人员能够在2020年6月3日9点到14点找到4G接通率KPI指标异常原因,那么17 点就不会发生4G 接通率突然恶化,也不会造成用户投诉。

表2 2020年6月3日4G接通率实际值与3个门限

5.5 应用效果

目前该方法已经在某省联通无线网运营中心进行试点使用,根据“区域”模块可选择全网小区、重点场景、网格、区县分公司等指定区域,通过时间和相对门限等级选择,可以自动对比绝对门限筛选出不同KPI 的TOP 小区,便于后台指标监控人员实时掌握不同区域的KPI突变情况(见图8)。

图8 无线网络突变小区智能识别应用

通过点击任意KPI指标表盘中的“超过动态门限”区域,可显示出超过动态门限的TOP 小区具体分析结果及指标变化趋势图,随时掌握TOP 小区指标突变时刻及历史趋势。

6 结束语

本文构建了一种基于Prophet 时序算法的无线网络突变小区识别方法,对突变小区KPI指标进行识别,实验结果表明,该方法将KPI指标历史数据拟合,可发现历史KPI指标的分布规律,通过动态门限、相对门限和绝对门限精确地识别突变KPI 指标,使运维人员及时掌握网络性能,降低误报和错报异常,提升网络优化效率和质量。目前,该方法是对4G 网络KPI指标进行突变检测,将来还可以应用到对5G 网络KPI指标突变检测。后续工作将考虑多维度KPI 指标关联和KPI突变根因定位等,探索更加准确、适应范围更广的预测模型。

猜你喜欢
门限预测值时序
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
基于规则的HEV逻辑门限控制策略
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
AI讲座:ML的分类方法
你不能把整个春天都搬到冬天来
基于方向加权多级门限DP-TBD的目标轨迹检测算法
自体荧光内镜对消化道肿瘤诊断临床应用分析
随机失效门限下指数退化轨道模型的分析与应用