郭华,张东林,徐维华,张航,陈超
(中国移动通信集团吉林有限公司,吉林 长春 130033)
随着4G/5G 网络的不断深入建设,无线网络运维成本急剧上升,将人工智能技术与无线网络运维相结合成为了重要的解决途径。目前业界在该方面的研究仍然处于探索阶段,文献[1] 探讨了人工智能技术在异常数据诊断、指标趋势预测、小区扩容等方面的应用,文献[2] 给出了机器学习在无线网络规划中的应用,文献[3] 梳理了人工智能当前在通信领域的研究和应用进展,并给出了网络智能化解决方案,文献[4] 探讨了多元线性回归模型在5G 功耗建模中的应用,文献[5-7] 分别从流量预测、用户感知速率预测、认知无线网络优化等高阶应用方面进行了研究,文献[8] 和[9] 给出了人工智能技术在网络运维中遇到的困难,文献[10] 和[11] 则进行了人工智能在5G 网络中的应用探讨。近年来,虽然在光无线网络自治、资源分配、移动性管理等方面进行了研究[12-13],但是当前基于机器学习的网络参数自优化的研究与应用仍然较少。
无线小区负载均衡[14]优化是指在特定的无线环境下,通过无线参数调整等手段对同站内具有一定覆盖重叠度的小区实现流量均衡分担,是近年通信网络感知优化的重点方向。现有的负载均衡优化只能根据人工经验逐个比对同扇区内的负载不均小区对之间的相互关系,以制定参数调整方案,往往需要大量反复的手动核查,准确率、效率均无法有效提升。以吉林省通化、白山、辽源、长春这四地市为例,每周2 000 个负载不均小区中需要反复关联、核查、计算的十大类参数共计约35.7 万条,数据量巨大,人工优化已经很难胜任。鉴于此,本文介绍了基于XGBoost(eXtreme Gradient Boosting,极限梯度提升树)[15]集成学习方法和DNN(Deep Neutral Network,深度神经网络)[16]的无线小区负载均衡参数自优化原理以及实验实现。利用机器学习的自学习机制,实时自动化输出负载不均衡小区的主要均衡参数,从而实现负载均衡的自优化,使得工作效率显著提高。
本文提出一种基于机器学习的负载均衡自优化方案,利用XGBoost 算法以及DNN 网络对负载均衡小区参数配置进行建模学习,然后自动输出负载不均小区优化方案。整体流程方案如图1 所示:
图1 整体流程方案
主要流程如下:
(1)基于均衡小区的切换事件建模:采用XGBoost算法,以现网均衡小区的无线网络特征数据作为输入、均衡小区的切换事件配置作为学习目标,对XGBoost 模型进行训练,这里切换事件配置主要包括A3/A4/A5 三类。
(2)负载不均小区切换事件预测:基于上述训练模型,将待优化的不均衡小区的无线网络特征数据作为输入,输出不均衡小区对的切换事件配置,即对不均衡小区按A3/A4/A5 进行分类,由此确定了切换事件。
(3)基于均衡小区的切换事件门限建模:在确定切换事件的基础之上,采用全连接网络,以均衡小区的无线网络特征、切换事件配置作为输入,以各小区对应的切换事件门限作为学习目标,对神经网络进行训练,此步骤属于多任务回归问题。
(4)不均衡小区切换门限预测:以待优化的不均衡小区无线网络特征以及切换事件作为输入,输出不均衡小区切换事件对应的门限配置。
本文首先介绍如何对均衡小区的无线网络数据进行特征选择,然后分别针对负载均衡小区切换事件、负载均衡小区切换事件门限的建模过程以及预测进行详细描述。
无线小区的负载均衡参数配置需要考虑众多网络因素,如两个负载小区的用户数、流量、PRB 利用率、频率、接通成功率、切换成功率、掉线率、MR、覆盖距离等指标,以及两个负载小区对间的共性因素,如两个小区的方位角覆盖偏差、小区对间切换次数、小区对切换成功率、同扇区小区数目、最近邻距离等。
通过对吉林省通化、辽源、白山三地市负载均衡小区网络数据进行整理,按负载均衡小区定义关系,匹配小区对后得到网络特征共计73 个,采用卡方检验法对特征进行选择[17],挑选对负载均衡影响最大的topN特征。卡方值计算公式如下:
其中,A为变量的观测值;E为理论计算值。应用到特征选择,对于特征X与分类Y的卡方值,有:
其中,count(X)、count(Y)、count()、count() 分别表示包含特征X的频次、包含分类目标Y的频次以及不包含特征X的频次、不包含分类目标Y的频次。
这里取打分值在前90%的特征为最终的特征选择结果,最终得到60 个主要特征,卡方得分值为1万~30 万,具体分布如图2 所示:
图2 特征得分分布
部分特征得分如表1 所示,基于特征选择结果进行后续的建模。
表1 部分特征得分表
小区负载均衡主要依靠调整小区对间互操作参数实现,其中最重要的为切换调整,主要包括负载不均小区间的切换事件调整以及对应的切换门限调整。具体参数如表2 所示:
表2 切换事件-对应门限
(1)切换事件:取值包括A3/A4/A5 三类。
(2)切换门限:在确定切换事件的前提下,有各自对应的门限参数。
本节采用XGBoost 实现切换事件的预测,属于分类问题。XGBoost 为GBDT[18]梯度提升树的一种高效实现,不同之处在于XGBoost 在目标函数、树节点分裂方式、特征离散化等细节进行了诸多改进,无论执行速度还是准确率都有显著提高。一般形式如下,假设第t次迭代需要训练的模型ft(x),则有:
表3 XGBoost参数配置
以吉林省通化市2021 年8 月份3 609 对负载均衡小区数据作为样本数据。将样本数据按8:2 比例划分为训练集、测试集,对训练集数据依次按[0.1,0.325,0.55,0.775,1] 比例划分,并进行交叉验证。训练集、测试集准确率学习曲线对比如图3 所示,当样本数量达到1 500 以后,模型性能达到稳定。
图3 训练集、测试集学习曲线
进一步用训练数据集对XGBoost 模型进行训练,然后用测试集验证结果。A3/A4/A5 预测结果混淆矩阵如表4 所示,整体预测准确率为97.37%。
表4 测试集混淆矩阵
利用XGBoost 库的predict_proba 函数分别输出A3/A4/A5 事件预测概率,并绘制对应的ROC 曲线如图4 所示,横坐标表示假阳率,纵坐标表示真阳率,可见ROC曲线呈现出靠近左上角趋势。用sckit-learn[19]的sklearn.metics.auc 函数分别计算图4 中A3/A4/A5 ROC 曲线面积(即AUC 值)分别为98.16%、97.02%、97.02%,可见模型较为稳定,具有较强的泛化能力。
图4 A3/A4/A5分类ROC曲线
对XGBoost 模型中的树结构进行绘制,为一个7 层的树结构模型,具体如图5 所示。
图5 XGBoost结构图
本节主要介绍采用全连接神经网络实现负载均衡切换门限预测,属于回归问题。定义一个具有2 个隐藏层的DNN 网络,可以拟合任何精度的平滑映射。
(1)输入层:包含同扇区下小区对间的方位角60 个特征以及A3/A4/A5 某个切换事件之一,共计61 个节点。
(2)隐藏层:共计2 层,第一层20 个节点,第二层5 个节点,用以处理中间输入。设输入层节点为x1~xn,输入xi到隐藏1 层链接权重为,则有:其中,f为隐藏层激活函数,采用RELU 作为激活函数[9]。两个隐藏层之间添加一个BatchNormalization[20]层,并设置Dropout=0.5[21],用以控制过拟合。
(3)输出层:针对不同的事件门限预测,不设置激活函数,输出节点数与A3/A4/A5 事件对应的参数门限数分别一一对应,门限参数详见表1。由此得到对应的网络结构图整体如图6 所示:
图6 网络结构图
以吉林省通化、白山、辽源三地市2021 年8 月份8 536对负载均衡小区数据作为样本数据,对样本数据集分别按A3/A4/A5 切换事件进行划分,得到基于A3 切换的小区对4 092 个、基于A4 切换的小区对2 070 个、基于A5切换的小区对2 374 个。
按训练样本、测试样本8:2 比例进行数据集划分,损失函数采用平均绝对误差MAE,分别以A3/A4/A5 切换事件对应的切换门限,包括A2 门限值、CIO 值、A4 门限值、A5 门限值为学习目标,最终得到对应门限平均损失函数曲线如图7 所示。当迭代次数达到100 次以后,训练、测试数据集损失曲线逐步趋于稳定,A3/A4/A5 对应的参数误差波动在2~4。
图7 A3/A4/A5门限训练-测试误差分布图
以A4 切换事件为例,A4 事件相关联的三个门限值:CIO 值、A2 门限值、A4 门限值的预测平均绝对误差以及在现网中的取值范围如表5 所示。可以发现,相对于各类门限的现网取值范围,预测误差的波动在可接受范围之内,可以用于实际的优化工作中。
表5 预测误差与现网取值范围
进一步采用拟合优度R2得分对模型进行预测能力综合评估,拟合优度计算方法如式(6) 所示,R2≤1,当R2越接近1,代表预测值与实际值越接近,预测效果就越好。
各切换事件对应参数的拟合优度值依次如表6 所示,R2值全部在0.6 以上,CIO 拟合优度在0.6~0.7,切换门限拟合优度全部在0.7~0.8,可见模型的拟合效果较好。
表6 各参数拟合优度值
本文分别给出了负载均衡小区的均衡事件、门限的自优化方法,包括网络特征选择、基于XGBoost 和深度学习网络的负载均衡优化原理以及实验结果。通过该方法可以在较高的准确率下,实现对无线网络负载均衡切换参数的建模学习。目前人工智能技术在此方向的应用仍然较少,本文进一步拓宽了AI 赋能无线网络优化的研究思路与方向。后续将进一步融合其他方法以增强模型的表达能力,如加入知识图谱用以描述小区间关系、加入强化学习用以实现奖惩策略等,并扩展应用到无线网络优化的其他领域,如邻区切换自优化、小区选择自优化、功率设置自优化等。