徐晶,王西点,沈骜,王磊
(中国移动通信集团设计院有限公司,北京 100080)
对于现代移动通信网络的建设和优化来说,有效地区分场景是能够更精确制定规划建设方案、更准确确定网络优化策略、实现精细化管理和资源有效利用的重要基础。目前场景划分的方法主要有两种,一种是人为划分场景,一种是智能划分场景。第一种划分场景方法是根据覆盖等特点人为进行划分,分为室内覆盖场景、室外覆盖场景、室外移动覆盖场景三大类,进而根据具体地区话务特点划分小类场景。一般来说规划建设方案期间基站的场景已基本设定,如某基站属繁华街区、写字楼、大型酒店、普通城区等,主要依赖于网络规划工程师个人经验的定性判断,场景粒度较粗。第二种方法是根据小区综合指标进行智能分析,从多维度属性定量分析,进而识别小区场景。由此划分的小区场景与所在地理位置基本没有联系,比如之前设定为高校场景的小区和设定为山区场景的小区可能同属于一个场景,因为由各项指标分析,它们的网络特点相近,可以作为同一类网络进行优化和利用资源。智能分析的方法是建立模型,由模型对小区进行划分。首先需确定将小区聚合为多少场景类别,然后通过迭代计算小区之间各项指标的差异度距离,进而确定小区应与其他哪些小区分属同一类场景。模型的精确度决定着划分场景是否准确,因此模型的评估与优化是智能划分小区场景的关键。
目前,移动通信网络的场景划分主要基于按覆盖和业务等特点根据经验人为配置。这种场景的划分方法是一种粗粒度的定性的划分,并不能作为精细化调整优化的准确依据,也无法指导网络规划建设和扩容调整。在不同的无线网络特征场景下,网络优化策略会不尽相同,往往会采用不同的优化模型。然而,在用这种方法划分的情况下,同属于一类场景的小区其网络特征会存在不同程度的差异。也就是说,这种粗粒度的定性划分并不能精确的识别小区网络特征。
智能识别小区场景的方法能够综合考虑多项业务指标间的关联,并且可以从多维度定量地分析小区的网络特征。虽然现阶段这种方法并没有在各省移动运营商中广泛应用,但随着网络规模的扩大和多种网络制式组网的日趋复杂,会有越来越多运营商选择运用海量数据来智能划分场景。这种划分方法是否可以准确的给出具有相同网络特征的场景分类,很大程度上取决于智能分析模型的准确度。虽然此种划分方法在精细化划分场景方面有着显著优势,但目前仍存在一些问题。首先,在划分小区场景时无法提前给出应聚合为多少类场景。场景类数过多或过少都会导致类别冗余度高,场景网络特征不明显。其次,在考虑各项指标时,不区分指标的重要度,不能有效的聚合小区场景。另外,聚合出小区场景类别后,没有具体指明每一类小区场景的网络特征。
由此,要实现精细化划分小区场景,需要综合考虑多项网络指标,然而人工分析无法全面衡量多项指标,只能依靠智能模型划分场景。因此,提升场景智能划分方法的准确度是非常必要的。
网络规划优化中将智能划分场景的方法应用到实际工作中,一是需要提高场景划分准确度,二是要能够有高效的手段判断出小区场景类的网络特征。
本文提出了一种能够有效提升场景智能划分准确度的方法,并且能够评估划分出的场景具有的实际网络特征。第一,通过区分各项指标的重要度得到指标权重,在计算小区间差异度距离并对小区进行聚合分类处理时引入指标的权重。第二,通过二分聚类来确定小区集合应被聚合成多少类场景。第三,得到场景类别后利用概率的平方差来评估场景的网络特征。
2.1.1 指标均方差加权
在综合考虑各项指标的基础上,对指标进一步分析,从而得到指标的权重。不同指标在表明小区网络特征时,其波动的活跃度不同。比如覆盖率是表明小区场景的一个重要指标,那么覆盖率的权重值会高于其他指标。为了确定哪些指标在表明场景网络特征上更为重要,对各项指标采取求均方差的方法进行处理。因为均方差是衡量样本波动大小的量,均方差越大,说明该指标在不同小区中取值变化越大,也就越为重要。
设指标集A={ai|i=1,2,…,n},n为指标数量。设指标ai的取值集合为Vi={vij|j=1,2,…,m},m表示指标ai取值情况有m种。每个小区可以表示为一个n维向量,每一维度代表一个指标的值。
指标ai的均方差表示为公式(1):
其中μi是ai的平均值。
在计算出各指标的均方差后,对各指标的均方差进行归一化,进而得到相应的指标权重。通过加权可以更准确反映场景类内小区的相似度,得到更佳的场景分类。
2.1.2 二分聚类确定场景类别
由于在分析全网或某一地市小区集合时,无法确定小区应该分属于多少个场景类别。本文提出了二分聚类的方法解决场景类别数量初始值设置的问题。
首先,设置初始类别个数k=2,选择两个中心点对小区集合进行聚类处理。对得到的两个场景类别进行评估,如果评估结果是分类需要保留,则对两个子小区场景类的小区集合分别继续进行二分聚类处理,直到子场景类的二分聚类分裂结果不再需要保留为止。
在判断子场景二分聚类处理是否需要保留时,采用的方法是最短描述长度(MDL)原理。该方法得到两个信息,一个信息是新的两个场景类别中心与各自类中每个小区之间关系所需的信息,记为S1,一个信息是两个场景二分聚类分裂之前原场景中心与所有小区之间关系所需的信息,记为S2。如果S1>S2,则说明本次二分聚类不需要保留,此方法举例如图1。现在需对小区集合进行场景划分。
第一次二分聚类得到场景包括小区集合A、小区集合B,评估后可知第一次的场景分裂需要保留。
图1 二分聚类判断场景类别的举例
第二次分别对集合A、集合B进行二分聚类处理,并对分裂进行评估。评估结果集合A的场景分裂需要保留,集合B分裂后其所需信息量大于分裂前,因此停止对集合B的处理,并将集合B作为一类场景。
第三次对集合A分裂得到的子集合AA、AB进行二分聚类处理及评估。评估结果集合AA的分类需保留,集合AB分裂需终止,将AB作为一类场景。
第四次对集合AA分裂得到的子集合AAA、AAB进行二分聚类处理及评估。评估结果集合AAA、AAB的分裂需终止,并作为最终场景类。
因此小区集合最终被最大程度聚合为四类场景,分别是B、AB、AAA、AAB。
2.1.3 概率方差确定场景的网络特征
本文通过量化的方法归纳并呈现场景类别的网络特征。主要方法是计算各项指标的概率并进行比较,根据概率的比较结果得出网络特征。场景Cl中的某个小区因为已考虑小区所在的场景类,所以在评估该小区指标ai取值为vij的概率时,相对于概率P[ai=vij]来说P[ai=vij|Cl]的概率应该更大。各项指标的概率情况会有不同, P[ai=vij|Cl]较P[ai=vij]越大,则说明此类场景中该项指标的特征越明显。为了更好的显示各项指标概率的情况,用平方的差来计算P[ai=vij|C1]和P[ai=vij]的相差程度,设相差程度为U,则指标ai的概率相差程度定义见公式(2):
通过计算概率相差度可以量化的呈现各类场景的指标特征,综合概率相差度最高和最低的指标,可以得到较为准确的场景网络特征。
以上几种技术从3方面分别改进了智能划分话务小区场景的方法。为了能够使3种技术系统地结合,本文设计了实施流程见图2。
技术的实施首先对选定的小区集进行指标加权,可以充分考虑各项指标的重要度。然后通过二分聚类来确定小区集合应被聚合成多少类场景。在得到场景类别后,用常规聚类分析方法对小区集进行处理,得到各类小区集合。最后利用概率的平方差来量化地呈现场景的网络特征,从而指导制定优化方案。
图2 实施流程图
本文结合智能划分场景方法的不足之处,提出了指标均方差加权、二分聚类确定场景类别、概率方差确定场景特性3种技术加以改善。优势在于能够分重要级别考虑场景划分的依据,能够明确全网小区场景可分几类,能够细分出场景的特征,有针对性的采取优化措施。但由于该方法目前在现网中应用较少,在小区数据处理操作上积累的经验方法较少,因此后续更多需要围绕现网数据开展大量的验证和实践工作,并进一步提升话务场景划分的效率和准确率,更好的指导现网优化工作。
[1]李军,刘匡虎.一种现代移动通信网络话务场景划分方法[J],移动通信, 2012(9).
[2]韩斌杰, 杜新颜, 张建斌.GSM原理及其网络优化[M].北京:机械工业出版社,2010.
[3]岳士宏,王正友.二分网格聚类方法及有效性[J].计算机研究与发展,2005,42(9):1505-1510.
[4]Jiawei Han, Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社, 2007.
[5]谢邦昌.数据挖掘Clementine应用实务[M].北京:机械工业出版社,2008.