熊建胜 孙洋洋 郑 圣 尤 耀 季成健
中国联合网络通信集团有限公司江苏省分公司
近年来,移动通信网络快速发展,多制式网络共存,各类新业务不断涌现,设备连接海量化,移动数据流量爆发式增长,随之而来的是基站数量和能耗的快速增长,节能降耗、提升网络能效已经成为通信网络发展的必然要求。
传统基站节能方案主要基于人工经验,确定各关键指标阈值及节能时段,低于阈值时启动节能,或者基于历史业务数据的统计分析,得到每天业务的闲时和忙时时段,再对闲时时段(如00:00-06:00)进行节能操作。面对通信网络复杂化、业务场景多样化的发展趋势,难以在保障用户业务性能、不引起用户投诉的前提下实现最大化节能,而人工智能技术(AI)在通信领域的应用为这个问题带来了新的解决方案。
目前已有不少学者提出基于AI的节能方案,很多方案采用时间序列预测的方法,基于历史数据预测关键业务指标在未来一段时间的走势,并与设置好的阈值对比,当关键指标低于阈值时,则对小区进行相关的节能操作;另外也有方案是基于智能场景识别,利用AI聚类算法识别出话务流量潮汐现象明显的场景,对其实施节能操作。
上述AI算法方案均没有综合利用多个业务指标,本文引入基站小区价值度的概念,利用多个关键业务指标对每个基站小区每小时的价值度进行综合评估预测,使得基站能够在节能的同时,实现重点用户的差异化保障。本文利用多个机器学习算法模型融合的算法方案对现网大量数据进行分析,建立业务模型,实现参数训练及业务预测。基于价值度预测结果,识别未来一段时间内基站小区业务负载低、用户数少的低价值时段,为节能策略提供更科学的支持。
为更好的评估基站小区是否可节能,引入基站小区价值度的概念,多角度考虑多个关键指标,摒弃以往节能中只考虑单个指标的情况。共选择6个关键指标用于计算小区价值度,包括上下行流量、上下行PRB利用率四个网络业务指标,以及VIP用户数、4/5G用户数两个用户指标。用户指标根据网络类型进行调整。下面以4G网络为例进行说明。
对国内某省会城市一个月内所有基站的逐小时数据进行统计分析,并去除缺失值、异常值等,数据量超过三百万。
关键指标有6个,分别为上行流量、下行流量、上行PRB利用率、下行PRB利用率、4G用户数、VIP用户数。根据统计分析可知,各个关键指标的数据分布均近似于指数分布,故可以用指数分布对各个关键指标进行拟合,得到每个指标的指数概率密度函数。
由概率密度函数积分可得到各个关键指标的累积概率分布函数,累积概率分布函数F(X)定义如下:其中,X是一个随机变量,x是任意实数。表示随机变量X取值小于等于x时的概率。
根据6个指标的累积概率分布函数,当各个指标的概率值小于0.2时,相应指标的取值均很小,基站小区基本处于空闲状态,业务负载低,用户数很少,可认为该状态下的小区为低价值小区。
由此引出本文中小区价值度的定义:6个关键指标的累积概率分布函数值的加权平均值。实际应用中计算基站小区价值度时,根据大量历史数据拟合得到的指数分布函数,将当前小区各关键指标数值代入函数中计算对应的累积概率分布函数值,再取平均值,公式为:公式中,m为关键指标个数,F(x)为关键指标取值为x时的累积概率分布函数值。
可以看到,小区价值度取值范围为[0,1],当小区价值度低于0.2时,认为该小区为低价值小区。各个指标的权重可根据需要进行调整,如更关注小区的业务负载,只有当业务负载很低时才认为是低价值小区,则可增大价值度中网络业务指标的权重。
为了实现基站小区精准节能,设计了基于机器学习的基站小区节能算法方案,如图1所示。
图1 算法方案流程
步骤一:采集基站小区的性能数据、话单数据、小区感知数据、MR数据等,并进行解析入库;
步骤二:对采集的数据进行数据清洗、特征构建、特征选择等操作,使其满足机器学习算法训练和预测的要求;
步骤三:基于处理后的历史数据计算基站小区价值度,作为场景聚类和时序模型的输入;
步骤四:基于30天的基站小区历史价值度数据,利用时间序列模型对未来一段时间内的基站小区价值度进行预测;
步骤五:基于基站小区历史价值度数据,采用时间序列形状聚类k-shape算法进行聚类,识别相似场景,并基于场景聚类结果进一步分场景训练分类模型进行小区价值度预测,以提升分类模型准确率;
步骤六:将分类模型和时序模型结果进行融合,对基站小区每一时次价值度预测结果取两者最大值,以提升基站小区价值度预测查准率;
步骤七:模型融合结果经过策略过滤后,生成可节能的基站小区清单;
步骤八:对基站小区节能效果进行监控,包括投诉、感知以及用户相关反馈信息,以辅助优化模型,调整模型参数、低价值小区阈值等,实现整个算法方案的闭环。
2.2.1 数据准备
从Hadoop平台上定时获取模型所需数据,包括设备层、网络层、业务层、用户感知四类数据,如表1所示。
表1 模型数据说明
类型 字段 获取频次业务层 上下行流量、4G用户数、5G用户数、VIP用户数等 每小时用户感知 上下行TCP建立成功率、RRC掉线率、上下行RTT总时延等 每小时
2.2.2 数据处理
涉及多模型,对于不同的模型采用不同的数据处理方法。
聚类模型基于时间序列进行形状聚类,故聚类模型与时间序列模型数据处理方法一致。
时间序列模型基于一个月的基站小区历史价值度数据进行预测。对大量基站小区历史价值度数据进行统计分析表明,该时间序列数据具有明显的周期性,因此数据处理主要针对异常值去除和缺失值填充,以提升时间序列模型拟合效果。异常值去除采用箱线图法,当某一数值超过下四分位值减去1.5倍四分位距,或者上四分位值加上1.5倍四分位距时,即认为该数值为异常值,予以去除。时间序列模型要求时间序列中不能存在缺失值,故需对去除的异常值及原始存在的缺失值进行填充,由于该时间序列存在明显周期性,故首先利用历史数据一周内同一时次的平均值进行缺失值填充,然后利用双线性插值算法进行第二次缺失值填充,保证数据的完整性。
图2为商业中心某小区的5天价值度时序图示例,时序存在明显的周期性,凌晨价值度低,上午11点和下午15点前后价值度高。
图2 商业中心小区价值度时序
分类模型中数据处理主要包括数据标注、特征选择及特征构造。
利用方差法、相关系数、假设检验等方法筛选模型特征,共筛选出以下几类特征:(1)价值度相关特征,包括过去24、48、72小时的各个关键指标数值;(2)时间特征,包括小时、天、节假日等;(3)统计特征,如根据基站小区ID、小时、节假日进行分组后,对标签求均值作为特征;(4)基站小区属性特征,包括小区ID、小区所属城市、地区等。
对特征数据进行缺失值处理后,将其划分为训练集和测试集。
2.2.3 数据建模
时间序列模型采用三次指数平滑算法(Holt-Winters)和统计分析相结合的方案。
三次指数平滑算法可以预测有趋势且有周期性的时间序列,由于基站小区价值度周期性变化明显,故利用Holt-Winters模型预测时,引入历史数据的影响,对一个月的历史数据根据一周内同一天同一小时分组后取均值,与模型预测结果进行加权,以减小单一的Holt-Winters模型的预测偏差,权重可根据实际数据进行适当调整。
为将基站小区根据不同的业务场景进行区分,采用k-shape算法进行聚类分析,依据时间序列数据的形状相似性,将形状相似的时间序列聚为一个类别,由此可得到多个业务场景。
为提高分类模型的准确率,分类模型在聚类模型基础上进行训练,对于聚类出的场景,分别进行分类模型的建模,分类模型均采用LightGBM算法,LightGBM算法相对于其他boosting算法,如GBDT和XGBoost算法,训练速度更快,且准确率依然很好,对于大量的高维度基站小区数据,采用LightGBM算法进行处理能够更好地适用于生产环境。
为将分类模型预测结果与时序模型预测结果融合,需要对分类模型预测结果进行转换,转换公式为:V=1–Pred,该式中,Pred为分类模型预测概率值,V为价值度预测值。当预测概率值很大时,即有很大的概率该小区该时次为低价值,利用上述公式可以将概率转换为价值度。若对价值度低于0.2的基站小区进行节能,即可认为是对分类模型结果中有80%的概率为低价值的小区进行节能,此种转换可以保证节能的准确性。
为进一步提升节能算法的准确性,对时间序列模型和分类模型的价值度预测结果进行融合,对基站小区每一时次价值度预测结果取两者最大值,将其作为最终的模型预测结果。
完整的数据建模流程如下:
2.2.4 模型验证
基于全量样本集划分出的五百万数据量测试集,对模型效果进行验证,模型AUC值为0.96。为在实际应用中测试模型准确性,2021年春节期间对江苏全省价值度预测结果进行效果评估表明,模型查准率95%以上,对分类错误的样本进行分析表明,绝大部分样本的价值度均较低,与正负样本划分的价值度阈值0.2相近,由此可保证节能的效果。
2020年江苏省试点节能期间,对南京和苏州基站小区节能前后两个月的投诉工单数据进行分析,结果表明,节能前10月份投诉总量为2637,节能后11月份投诉总量为2383,未发现由于节能引起投诉总量的明显变化。因节能时段为0-6点,根据投诉手机号查找其晚常驻基站小区,并与参与节能的基站小区进行比对,结果表明,未发现由于基站小区节能引起的投诉。
上述节能算法方案在江苏全省4G基站小区进行了推广应用,节能策略较保守,根据业务部门需求,从算法提供的低价值基站小区清单中筛选部分参与节能的小区,将节能时段限制为凌晨0点至6点,在保证用户感知和邻区覆盖的情况下,对一个月的节能小区数据进行统计表明,AI算法日均可节省电量超过1万度,涉及节能的小区近4万个,持续应用,预计年度省电超过400万度。
基于AI技术,引入基站小区价值度概念,提出利用时间序列和分类算法相结合预测小区价值度的方案,基于价值度预测结果可进行相关节能操作。小区价值度的引入使得节能时可综合考虑各个关键指标的作用,此外,也使得我们可以利用基站历史数据对小区以及整个基站的价值度进行分析,对于高价值的基站,可以提供更好的保障服务。