权笑,戴鹏程,辛潮,岳军
(中国移动通信集团设计院有限公司,北京 100080)
高价值区域识别与分析利用设计院研发、中国移动自主核心能力清单中的自主类产品——基于多数据源的综合网络质量精细化智能分析平台,通过海量数据处理、多维关联和深入分析,结合当地网络发展情况和特点,构建以流量、业务、用户、终端和竞对覆盖等为基础的价值评估体系。同时,利用地理信息系统和程序化操作,可以自动聚合输出当地LTE网络高价值区域,实现了价值理论与网络规划优化相结合,解决了高价值场景识别和规划优化工作中的痛点和难点问题,为提高规划优化投资效率提供了理论指导和技术支撑。
高价值评估体系是进行高价值区域识别的基础,目的是对小区逐一进行价值评分,确定高价值小区清单。
评估体系的建立步骤如下:
(1)确定输入输出;高价值评估的输入是各类数据,包括S1-U数据、MR数据、工参数据、经分数据;高价值评估的输出是所有小区价值评分清单。
(2)评估维度选取及权重:价值维度从可能带来的经济价值和社会价值两个方面综合考虑: 经济价值:从投资回报角度,能够直接或间接体现通信消费,权重较高;社会价值:从社会影响角度,能够体现重要性、广泛性、竞争性和影响力等,权重相对降低。
根据输入数据类型,可以将评估体系归纳总结为流量、业务、用户、终端和竞对覆盖五大维度,如图1所示。
价值维度的权重可以通过定性分析进行排定,如表1所示。
各维度指标需要从指标类型设计、指标权重设计、评分方法设计和门限阈值设定4个方面进行,如图2所示。
图1 价值维度与评估维度
图2 评估指标设计思路
指标种类设计思路:体现总量+体现高端占比+低相关性;
指标权重设计思路:直接与收益相关的权重最高;
评分方法设计思路:既要突出高价值小区的分数和排名,又要兼顾整体分数不能差距太大。同时,也要避免超高小区价值得分对整体得分的影响;
门限阈值设定原则:符合各类规范要求或一般理解,同时考虑当地网络发展实际需求和具体目标。
指标种类、权重、评分方法和门限阈值与当地经济发展情况和网络发展目标紧密相关,不能以一概全、僵化标准,而是利用辩证利用高价值评估的方法论对具体情况进行具体分析、具体操作。
确定维度、指标、权重、评分方法之后,就可以对全网所有小区进行价值分数评定,输出所有小区价值分数清单。之后,通过指标结果、评分结果的合理性对评估体系进行修正,主要从以下两个方面进行操作。
2.2.1 指标降维
降低维度是利用主成分分析法对所有指标结果进行分析,得出指标间所含公共信息的程度,针对公共部分进行操作,最终降低指标维度、简化指标操作复杂度。
PCA (Principal Component Analysis,主成分分析)是一种常用的数据分析方法,通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量,常用于高维数据的降维。具体步骤包括:(1)指标维度矩阵化;(2)去平均;(3)计算协方差矩阵;(4)计算协方差矩阵的特征值和特征向量;(5)将特征值从大到小排列,取前N个特征向量;(6)将数据转换到上述N个特征向量构建的新空间中(假设N维数据可以满足可信度门限)。
相关性分析主要运用于指标维度间整体所含公共信息不明显,而局部指标维度间公共信息很高的情况。对相关性高于90%的指标进行精简,实现局部降维,降低复杂度。例如,上下行流量之间的相关性超过90%,所以两个指标只需选取其一即可表征该维度的内容。
表1 维度权重定性分析
主成分分析方法降维科学严谨,但降维后已不再是原有指标,而是由原有指标组成的综合指标,不便于描述含义,适用于整体指标间所含公共信息较多的情况;相关性分析降维简单易行,降维后仍是原有指标的子集,适用于局部指标间所含公共信息较多的情况。
实际工作中,两种方法需要具体情况灵活使用。
2.2.2 高价值评估门限
设定高价值评估分数门限一般有两种思路,一是数值分析法,二是固定比例法。数值分析法可以通过穷举所有小区价值分数,排序后分析PDF变化率较高值对应的分数,一般存在多个较大值,还需辅助分数对应的高价值小区数量总和选择;固定比例法,一般由使用方按照当地实际情况和工作需要划定,直接取价值分数Top N的小区作为高价值小区。数值分析法,方法科学结果可信;固定比例法,简单直接贴近实际。实际工作中,一般加两种思路结合使用,效果最佳。
将高价值小区聚合为高价值区域,可以使关注目标从离散的站点转变为整体区域,从宏观角度量化呈现区域价值情况,形成重点保障与优化区域,同时也为提高规划、设计、优化和运维等环节的投资效率提供了理论指导和技术支撑。
高价值区域识别与聚合重点:
(1)高价值区域识别:寻找高价值小区周围满足距离门限范围内的高价值小区,不断迭代最终将每个高价值站点标注唯一的区域编号。
(2)高价值区域汇聚:将筛选过的高价值区域内的小区,在凸包算法的基础上通过修正Graham扫描法自动聚合生成高价值区域图层。
某城市通过高价值区域识别与聚合后,共输出了19个高价值区域,区域内指标如表2所示。19个高价值区域面积共计47.51 km2、占整个城市0.75%;区域内所有小区数量占比4.73%,价值得分占比7.66%,流量占比高达12.02%。较小的高价值区域、较少的小区得到了较高的价值得分、贡献了很高的流量,充分说明了高价值区域识别的准确性和合理性。
高价值区域内高价值小区各维度贡献非常突出,高价值区域内平均数量占比41.28%的高价值小区得到区域整体价值得分的53.78%、贡献了区域内67.63%的流量。
另外,在识别出的19个高价值区域中,不仅包含了普遍理解的高价值区域,如核心CBD、5A风景区等场景,还包括了一些传统意义中的冷门场景,如城郊城中村、工业产业园等,如图3所示,充分体现了用数据“说话”的客观性和准确性。
图3 某城市高价值区域识别结果
高价值场景是中国移动“五高一地”重点关注的场景类型,但目前缺乏有效的识别手段。本次高价值区域识别与分析,利用了信令数据、MR数据、工参数据、经分数据等多维数据源,充分挖掘了数据价值,建立了价值评估体系,从经济价值和社会价值两个层面对网络发展情况进行多维度评估和分析,实现了高价值区域的聚合与自动生成,开展了区域价值分析,解决了高价值场景识别和规划优化工作中的痛点和难点问题,为提高规划优化投资效率提供了理论指导和技术支撑。
表2 高价值区域合理性分析
参考文献
[1] 戴鹏程,等. 流量业务用户感知的评估方法分析. 中国移动通信集团设计院第19届新技术论坛论文集.
[2] 张守国, 张建国, 李曙海, 等. LTE无线网络优化实践[D]. 北京:人民邮电出版社,
[3] 沈风华. 关于通信工程技术在国民经济中的应用价值分析[J].通讯世界,2016,7:36-37.
[4] 李永耀. 国民经济中通信工程技术的应用价值研究[J]. 数字通信世界, 2017(6).