王磊
(中国移动通信集团设计院有限公司,北京 100080)
当前,LTE网络中各设备厂家通用配置参数和私有无线参数总和已超过8000余个,这些复杂参数仅依靠人工经验很难进行精细化配置。首先,各设备厂家近万项无线参数,需要从中分析和梳理出日常LTE网络重点关注和优化的参数;同时,在全网LTE基站数已达到100多万情况下,这些重点参数需要在复杂多变的场景下做到最优配置;此外,还需要研究一种通过计算机算法能够自动化的学习现网已有的海量参数配置经验的方法,从而使得优化经验得到快速复制和推广。
上述需求,归结为LTE网络参数的精细化设置的问题,在LTE时代,中国移动已具备多维度数据的集中分析基础,集团层面和各省内都已逐步建立了多维度大数据共享平台,可以通过关联挖据现有数据中有价值的信息,自动化的学习和固化分场景的参数设置的优秀经验,并推广到各地。
个性化推荐系统和相关算法在今天互联网的产品和应用中已被广泛采用,包括今天经常使用的相关搜索、话题推荐、电子商务的各种产品推荐等等。一般认为,推荐系统这个研究领域源于协同过滤算法的提出。
举一个通俗的例子:比如某天很无聊,想下载一部电影看看。但当你打开某个下载网站,面对数不胜数的电影,你会手足无措,不知道该看哪一部。此时,就遇到了信息过载的问题,需要一个人或者工具来帮助你做筛选,给出一些建议供你选择。
不过,总不能时时刻刻都去麻烦“专家”给你推荐,这时需要的是一个自动化的工具,它可以通过分析你的历史兴趣和行为特征,从庞大的电影库中找到几部符合你兴趣特征的电影供你选择。这个工具就是个性化推荐系统。
推荐系统的发展过程中,各种各样的推荐算法层出不穷。这些方法的归类有很多不同的方式。比如,可以按照数据分成协同过滤、内容过滤、社会化过滤,也可以按照算法分成基于邻域的算法、 基于图的算法、 基于矩阵分解或者概率模型的算法。
从上面介绍的给人推荐电影的个性化推荐系统中,我们得到启发,如果现网已经具备了海量的网优经验数据,就可以根据不同的网络场景特征数据,进行LTE小区粒度的特征抽取和多维度分析,从而使计算机自动化的学习和挖掘出现网优秀的参数配置经验,建立起LTE小区级特征数据与参数配置经验的模型。
进一步扩展,基于成熟的协同过滤算法,就可以实现针对不同场景特征的小区,个性化的自动推荐LTE网络配置参数,从而大大提升网络优化尤其是参数优化的工作效率。
LTE网优参数智能优化系统的流程架构主要分为:特征选取、数据预处理、聚类分析、网络质量分析、特征匹配与参数推荐这5个环节,如图1所示。
2.3.1 LTE无线小区的特征建模
要实现面向LTE网优参数的自动化推荐和设置系统,首先环节就是进行LTE无线小区粒度的特征建模。而以往那种人工的、标签化的无线场景分类方式则较为粗放,难以量化(如机场、医院、学校、写字楼等传统标签方式)。
因此,需要从多个维度考虑,选取可量化的特征属性进行LTE无线场景的精细分类,包括但不限于:LTE小区结构特征(如站高、海拔、站间距、下倾角、天线属性); LTE小区业务量特征(如控制面/用户面/语音/数据业务量特征、时间序列特征); 用户分布特征(如距离、方位分布特征); 用户移动性特征(如切换特征); 邻小区的站址结构特征(如邻区站高、 站间距、下倾角、相关性角度); 地形地貌特征(如主覆盖区域内的建筑高度、密度分布); 互操作配置策略特征(如本系统、异系统切换/重选策略)等等。
图1 LTE网优参数智能优化流程架构
2.3.2 多数据关联提取与数据预处理
进行无线小区的特征建模所用到的数据,包括现网海量的参数配置数据、MR测量数据、工参结构数据、邻区配置数据、性能指标数据、3D地图数据等多维度数据源。
从数据源提取数据后,首先要进行数据清洗,因为我们拿到的数据可能包含了缺失值(北向输出缺失),也可能包含噪音值(如错误工参),也可能因为人工录入错误导致有异常点存在,对我们的模型构建和算法运算出有效信息造成了一定的困扰,所以我们需要通过一些方法,尽量提高数据的质量。数据清洗一般包括如下步骤:分析数据、缺失值处理、异常值处理、去重处理等。
2.3.3 基于聚类算法的小区特征分簇分类
在完成数据预处理环节后,引入了无监督机器学习聚类算法进行小区特征分簇分类:如基于可变权重的K-Means算法、BIRCH算法、DBSCAN算法等:能够让计算机程序自动完成小区特征的定量分簇分类。
每个小区均可以看作是一个具有P维属性的数据对象(即用多维空间的一个向量点来表示),在地里维度上,特定区域内的所有N个小区,组成了N×P矩阵(N个对象×P个属性),如公式(1):
基于可变权重的距离度量进行聚类算法相似度计算,如公式(2):
小区无线特征的聚类运算过程可视化,可将不同类别小区用不同颜色表示,如图2所示。
2.3.4 无线参数配置与网络质量相关性分析
此步骤中,使用在上一环节各场景特征聚类划分结果后的簇内小区,进行网络质量评价,挖掘现网各个场景下的局部参数最优配置,进行IT平台固化,固化后的簇内局部参数配置经验,用于后续按照协同过滤算法进行参数经验值的自动化推荐。
2.3.5 基于协同过滤算法的小区特征匹配与LTE参数自动化推荐
在当前成熟的个性化推荐系统中,基于邻域的协同过滤算法,仍然是最为流行的推荐算法,其中KNN即是典型的邻域算法(K-Nearest Neighbor algorithm,K最近邻算法),通过计算样本个体间的距离或者相似度寻找与每个输入样本个体最相近的K个个体(即:找到特征最相似LTE无线小区的过程),算法的时间复杂度跟样本的个数直接相关,需要与每个个体完成一次两两比较的过程。
在计算K近邻的过程中,距离和相似度度量是KNN的基础算法,因为KNN的个体相似度或邻近的距离都会选择距离度量和相似度度量中的某种方法进行计算,本文所述工具在此处也重复使用了前面章节描述的可变权重距离度量进行相似度计算。
在本文介绍的LTE参数自动化推荐系统的实践过程中,就使用了小区粒度的KNN算法(LTE cell-based kNN)找到参数最优经验库中的特征最相似LTE无线小区,从而实现参数取值的自动推荐输出。
2.3.6 LTE参数实时推荐系统的改进方法
目前主流的推荐系统,当分析的对象数量(如电子商务领域的用户和商品,以及本文所描述的LTE无线小区)达到一定数目时,推荐算法都面临严重的可扩展性问题,推荐的实效性变得较差,如何在算法和架构上提高推荐速度是很多公司不得不思考的问题。目前,在算法上主要通过引入聚类技术和改进实时协同过滤算法提高推荐速度。
在算法上,一般可采用EM(Expectation-Maximization)、K-Means、模糊聚类等聚类技术提高推荐速度,因为使用聚类技术可以大大缩小待匹配对象的最近邻居搜索范围,从而提高推荐的实时性。
在本文介绍的LTE参数自动化推荐系统中,即采用了基于可变权重的K-Means算法,作为前置环节,通过将LTE无线小区进行场景特征的聚类分簇,先将小区级特征聚类为典型场景,在每个场景内部进行参数设置评估,固化优秀参数配置经验。从而在参数推荐环节, 也就减少了算法计算量,基本实现了参数取值的实时推荐功能。
LTE参数智能推荐和优化工具在某省内选择67个高掉线TOP小区,使用场景参数自动推荐工具输出参数修改建议,累计修改254项参数。
计算机自动输出参数修改情况,如表1所示。
图2 小区无线特征的聚类运算过程可视化
表1 自动化算法推荐参数取值情况
按照计算机自动输出的参数经验推荐值,进行调整后无线接通率从99.45%提升至99.65%,提升了0.21个分点,无线掉线率从0.5%下降至0.37%,改善了0.13个百分点,切换成功率从98.85%提升到了98.91%,提升了0.06个百分点,可以看到,基于机器学习和挖掘的参数经验取值自动推荐方法,对于该地区TOP小区具有明显改善作用。
通过算法验证结果证明,使用基于机器学习技术的LTE网优参数自动化设置与推荐系统,程序自动计算输出的参数经验取值,已基本能接近人工优化的效果。
本文所述的工具建立了一套基于无线小区特征分析的参数配置取值自动化分析和推荐系统。
通过本工具建立的现网优秀参数配置经验库模型,以及个性化推荐系统,可使一线优化人员充分借鉴已充分优化地区的LTE参数配置经验,以减少优化人员工作量和技术水平要求,可快速辅助各地市网优人员将新入网小区的参数配置质量达到人工参数优化经验的水平。
[1] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.
[2] Francesco Ricci. 推荐系统:技术、评估及高效算法[M]. 李艳民, 等, 译. 北京: 机械工业出版社, 2015.
[3] Dietmar Jannach. 推荐系统[M]. 蒋凡, 译. 北京: 人民邮电出版社, 2013.
[4] 项亮. 推荐系统实践[M]. 北京: 人民邮电出版社, 2012.