罗伟华 许盛宏
【摘 要】基站的位置是移动网络的核心资源数据,但目前存在大量台账数据是不准确的,严重影响了日常网络优化、规划等工作。从基站小区获取到的MR数据出发,提出一种基于MR大数据的基站小区定位方法,采用大数据算法构建模型,实现台账坐标经纬度的预测,目前已经在现网部署试点应用,辅助校正错误的基站工参信息,取得了较好的预期效果,提升了日常网络优化、规划的工作效率,为基站网络覆盖质量提升提供了有力支撑。
【关键词】MR;基站;大数据;定位
doi:10.3969/j.issn.1006-1010.2020.10.013 中图分类号:TN91
文献标志码:A 文章编号:1006-1010(2020)10-0073-04
引用格式:罗伟华,许盛宏. 基于MR大數据的基站小区定位方案[J]. 移动通信, 2020,44(10): 73-76.
0 引言
随着定位技术在生活中的应用日益广泛,各种日常应用对定位技术的精确度要求也已逐步提高[1]。运营商也同样如此,台账包括经纬度坐标等核心工参数据,是基站扇区的核心资源,是网络优化、规划、建设的基础分析数据,也是用户定位算法等方面应用必不可少的数据,因此确保基站台账数据的准确性非常重要。但是,由于工程建设、网络优化、网络规划等多方对网络设备进行调整和优化,可能存在台账工参数据和现网设备实际配置不一致的问题,据初步统计,目前全省基站扇区经纬度偏差大于500 m的占比约为10%,这些错误台账已经严重影响了平时工作中网络的优化。
为了核对准确的台账数据,传统方式需要到现场使用专用GPS(Global Positioning System)定位设备进行勘察后修正台账数据,耗费人力物力且效率低下,为了解决这个痛点,本文提出一种基于大数据的基站定位方案,通过大数据算法模型和携带经纬度的AGPS-MR(Assisted Global Positioning System-Measurement Report)数据,去除复杂的无线环境导致的误差干扰[2],实现基站小区坐标的预测。
1 运营商基站坐标预测
1.1 使用数据说明
(1)本方法上线测试时所使用的数据是运营商现网上所有基站小区其历史一周内采集到的全量MR(Measurement Report)数据,数据量约为百TB级别。
(2)AGPS(Assisted Global Positioning System)即辅助GPS(AGPS)定位技术,目前结合了GPS定位和蜂窝基站定位的优势,借助蜂窝网络的数据传输功能,可以快速精准地定位,在手机终端中被广泛使用。AGPS定位技术比传统GPS定位技术更有参考价值[3],该特征表示了UE(User Equipment)所在的位置。
(3)TA(Timing Advance)用于表征UE与基站天线的距离,可以用于估算用户到基站小区天线的位置距离,而根据计算,在4G LTE网络环境中1个TA表征的距离约为78 m[4]。
1.2 总体实现流程
台账经纬度预测功能实现总体流程如图1所示:
(1)该方法首先获取运营商现网上所有基站小区其历史一周内采集到的全量MR数据。
(2)按基站小区分组,每组数据均为以该基站小区为主接入小区的MR。
(3)提取MR的AGPS和TA的信息,经纬度坐标转换为平面坐标。
(4)然后对同TA的点分组,用聚类的方式使一个TA值只保留一个点。该点仅携带AGPS信息和TA信息。
(5)再对这些保留的点按规则——以MR经纬度为圆心,分别以TA×78 m、(TA+1)×78 m为半径画圆,得到一个圆环,并在圆环处划分栅格,该栅格大小为10 m×10 m。构造栅格来计算一方面是因为如果直接算交点坐标,那么可能出现的情况是交点均落在一个较小区域内且分布比较分散,另一方面是因为比起直接计算交点的浮点数值类型的坐标,计算栅格的效率会更高。
(6)通过计算可以得到各个圆环中栅格的重叠次数,最终要找到栅格重叠次数最高的栅格集合,并从中选取到该集合中其他栅格距离之和最短的栅格。
(7)取该栅格的中心经纬度为估算的基站小区位置。原因是不用栅格方法计算得到的最终交点坐标可能位于栅格化后内部的任一处,而取栅格中心点能获得最小的误差。这里稍微牺牲了准确度,但大大提升了计算速度。
(8)重复(2)~(7)步骤,预测现网中各个基站小区的经纬度。
1.3 数据提取
MR数据是用户在执行业务过程中上报给网络的测量信息[5],能够准确反映网络的覆盖情况,提取海量MR数据中的重要特征来预测基站的坐标经纬度,为LTE工程规划提供重要支撑。本模型首先从运营商现网数据中读取全省过去一周的历史MR数据,提取其中含有AGPS数据的MR,并去掉没有上报TA的MR,按基站小区号分组汇聚数据。
1.4 数据处理与计算
在本模型中,TA是衡量用户设备到基站天线距离的重要标识,如果根据TA算的和实际距离不一致则会严重影响算法的准确度。但是由于无线环境复杂,比如信号经过多次反射到达天线、基站使用了小区合并[6]等情况,结果不准确的TA值会直接影响结果的正确率,所以必须保证要尽量多地去除异常TA值。本文的模型计算时充分考虑了无线环境产生的误差,对数据进行如下处理。
(1)DBSCAN算法聚类过程
按基站小区分组采集到多条MR后,实际情况中这些数据包含多个不同的TA值。然而TA会因无线环境复杂等多种情况产生不同的误差,例如处于相同位置的UE其TA可能都会有较大的差异。本方法把同基站小区内的相同TA的数据单独取出来,采用DBSCAN聚类算法,找到其中一个点作为具有准确TA的MR点,保留该MR点的AGPS和TA值。结合DBSCAN的实现思想[7],在此处本方法使用DBSCAN算法的伪代码思想如下:
1)设置DBSCAN重要参数:Eps=200 m,MinPts=10,Eps指定一个点附近区域的半径范围大小,MinPts表示在该点Eps的范围大小内至少要有的点的数量,如果一个点满足MinPts的条件,那么该点可以归类为准确TA的候选点,否则归类为边缘点。
2)在同组(同基站小区同TA值的MR)点中随机选取一点为中心点,计算该点与同组其他点的距离,若满足MinPts的条件,则把该点归类为候选点,并将满足条件的其他点加入到集合中去,并以集合中的点作为新的中心,判断其余点是否同样满足MinPts的条件,直至完成归类。重复上述步骤,直到该集合没有新的点加入,该集合则为聚类完成的一个簇。
3)判断是否还有未归类的点,如果有则重复第2)步,否则算法结束。
4)获取聚类后点最多的一个簇,在簇内的候选点中查找到其他簇内点距离之和最短的点,取该点的TA值和AGPS为一个有效数据。
5)重复上述步骤,直到遍历完该基站小区包含的MR中所有出现过的TA值为止。
本文算法利用DBSCAN算法找出分布最密集的类,将其中的中心点作为有效数据,此处采用极大似然的估计方式,只要该小区所搜集到的大部分用户的数据准确,那么对应地,密集分布的群体内具有高准确度的中心点,其TA是能够准确反映该点到基站的位置的[9]。所以,利用聚类的方法,在其分布最多最密集的地方只保留一个中心点作为准确点,从而在最大程度上去除了误差点的干扰。
(2)按TA值外扩栅格预测基站小区位置
该步骤对应的示意图如图2所示。从1.2节(1)中获取该小区内所有的有效数据(一个TA值一个有效数据),对每个有效数据进行如下处理:
1)以每个有效数据(图2中的TA=1,TA=2……这些点,图中用红色小圆环表示)的AGPS经纬度为圆心位置,分别以TA×78 m和(TA+1)×78 m为半径做圆,从而得到一个TA点对应一个圆环(图中用不同颜色表示不同TA值对应的圆环)。
2)圆环中间栅格化处理,以10 m×10 m为一个栅格大小,并记录这些栅格被多少个圆环重叠过,即记录它们的重叠次数,推断基站小区位置只出现在这些栅格上,如图中的栅格{a, b, c, d}。
3)取重叠次数最多的栅格中心点为预测基站小区的位置,如果重叠次数最多的栅格有多个,则把距其它栅格距离和最小的那个栅格中心点作为基站小区的位置。如图2中栅格{a, b, c}重叠次数均为3,而栅格d的重叠次数为2,由此可以去除d,而在栅格{a, b, c}中,a距离另外两个栅格的距离最短,则取栅格a的中心点位置为预测的基站小区位置。
4)对其他基站小区都进行上述步骤处理,从而预测出所有基站小区的位置。
特别地,在实际情况中,也有可能出现如图2中TA=1、TA=2这些误差点,表示其TA在无线传播过程中出现误差,无法用于衡量到达基站小区的位置。但在查找重叠次数最多的栅格这一步骤中,可以达到去除误差点影响的目的。
2 结束语
本方案实现了一种基于大数据的基站小区定位方法,可实现对室内、室外小区的定位。通过对MR数据的挖掘分析,采用其自身携带的AGPS和TA信息,构建基于大数据的定位方案模型。本方法具体实现过程主要有:
(1)首先获取该基站小区采集到的用户终端上传测量报告(MRO)数据,提取AGPS和TA的信息。
(2)获取对应基站小区下的MR,对同TA的点分组,用聚类的方式使一个TA只保留一个点。再对这些保留的点分别以AGPS为圆心、距离圆心TA×78 m至(TA+1)×78 m的距离处划分栅格。
(3)得到重復度最高的栅格作为栅格集合。在该集合内,选取到其余栅格距离之和最小的栅格,其中心经纬度即为预估的基站小区位置。
基站工参信息维护人员,通过对比工参信息中各个基站小区的位置与本方法预测出的基站小区的位置,修改校正错误的工参信息,目前初步取得了较好的预期效果。
然而,该算法目前所能够进行坐标勘误的前提,还是需要较为理想的测试环境的,且目前只能预测MR对应的主服务小区的经纬度位置,还不能够解决一些例如室分外引、天线到RRU馈线过长导致TA过大等情况,算法还需要结合现网各种场景进行不断改进、不断优化。
总之,基站台账的准确性是移动网络规划与优化的基础,只有作为基站台账位置这些基础信息准确了,才能给未来网络优化、规划的工作打下良好的基础,才能给现场运维工作人员提供更好的支撑,减轻工作难度与压力。后续将会继续结合MR数据的各种特征,不断突破原有算法的限制,为运营商的网络规划、智慧网优和优化布局提供全方位智能化的分析方法。
参考文献:
[1] 史刘强,付江涛. 基于UWB定位系统设计[J]. 电子设计工程, 2019(15): 161-165.
[2] 耿珂,黄智刚,苏雨,等. 基于地面基站的定位系统构建和方案[J]. 北京航空航天大学学报, 2019,45(10): 2051-2057.
[3] 左超,耿庆鹏,刘旭峰. 基于大数据的电信业务发展策略研究[J]. 邮电设计技术, 2013(10): 1-4.
[4] nanjinghangda. LTE TA理解[EB/OL]. (2014-03-21)[2019-09-30]. https://blog.csdn.net/nenema/article/details/22162623.
[5] ZHANG K, YANG P. WCDMA ratio network optimization approach based on measurement report[C]//Iet International Conference on Communication Technology & Application. IET, 2012.
[6] 管文明,廖梦石. LTE小区合并技术及其在现网的应用实践[J]. 电信技术, 2015,7(11): 85-88.
[7] 王桂芝. 基于密度聚类分析的相关算法研究[J]. 电脑知识与技术, 2013(30): 6714-6716.
[8] scikit-learn. Clustering[EB/OL]. [2019-09-30]. https://scikit-learn.org/stable/modules/clustering.html#dbscan.
[9] 肖伟雄. 移动通信网络覆盖优化分析方法与系统实现[D]. 长沙: 中南大学, 2010.
[10] 邹北骥,肖伟雄. 一种基于时间提前量TA的GSM网络覆盖优化方法[J]. 计算机工程与科学, 2011,33(1): 7-11.