王智博
(中通服网优技术有限公司,上海,200050)
CDMA网络中用户通话记录的GIS分析概述
王智博
(中通服网优技术有限公司,上海,200050)
CDMA无线网络中,主流厂商的无线设备都会生成用户的通话记录数据,如阿尔卡特朗讯公司的PCMD(Per Call Measure Data) 和摩托罗拉公司的CDL(Call Detail Log)等。相比传统无线网络优化手段(DT、CQT)和性能统计指标(KPI)而言,用户通话记录能提供无线环境信息以及用户和终端属性,通过对其的分析和运用,已经在无线网络运维和优化工作中发挥了举足轻重的作用,并且还有相当深度的潜力有待挖掘。除了常规的统计学分析方法之外,在实际应用中基于GIS的分析方法越来越受到重视。本文概括总结了用户通话记录应用中的GIS定位分析、GIS空间分析和GIS栅格分析等方法,并对这些方法的业务应用场景做了归纳和总结。
用户通话记录;PCMD CDL;时态GIS
用户通话记录数据是海量的通话状态详细记录,每个通话(语音、短信、数据)都会产生一条记录。不同厂商设备用户通话记录的字段数、字段属性、字典表等会有不同,但经过提取、翻译、计算等处理后可以筛选出一些公有属性,这也为统一地分析和应用用户通话记录数据提供了可能。
用户通话纪录中的呼叫起始和呼叫结束位置经纬度是非常重要的分析依据,通过确定用户的地理位置,结合基站的位置经纬度,可以实现通话纪录、用户、基站小区的定位分析;可以实现基于地理位置的空间分析;可以实现栅格分析;本文分别总结了上述分析方法的基本原理与应用,最后提出了基于时态GIS的分析方法及其应用潜力。
所有的GIS分析方法和应用的基础是通话纪录数据的定位,作为GIS分析的必备条件,定位的算法和精度影响着GIS分析的准确性。
1.1 定位基础
常见的用户通话纪录定位分为起始位置定位和终止位置定位。 每条通话纪录中都包含勇于定位的信息,再结合基站小区的基础信息即可实现位置定位。下面以阿尔卡特朗讯公司的PCMD(Per Call Measure Data)中起始位置定位为例进行说明。
在定位计算时需要知道本次通话的主小区ID、第一个PSMM消息中的参考小区ID和第一个PSMM消息中的非参考小区ID,并且知道通话点距离这些小区之间的往返延时(Round Trip Delay, RTD),再结合所有上述小区对应的基站ID和基站所在的经纬度以及该基站的类别(室外站/室内站)
如果需要精确计算,还需要知道基站的高度、下倾角等信息。
其中, 往返延时的单位是1/8chip,可以换算成距离。相关解释如下:
在无线通信网络中,电磁波在真空中的传输速度与光速相同为3*10^8 m/s, 在空气中很接近真空速度,一般情况下也以光速计算;CDMA网络中,前向信道和反向信道的码片速率均为1.228 8Mbit/s; 因此每个码片代表的距离为3*10^8/1。2288*10^6=244。140625m。粗略计算时可取每CHIP为244米。
因此移动终端距基站小区的直线距离约为:RTD/8/2*244(单位米)。
1.2 定位算法
关于CDMA网络中通话纪录的定位算法,最常见是AFLT(Advanced Forward link trilateration,高级前向链路三角定位)算法。
为提高定位的准确度和定位精度,张国华等在AFLT算法的
基础上增加了定位补偿因子并引入了工程参数的修正,其中补偿因子主要是弥补实际无线环境中的非直线传播、反射折射的影响而引入的针对不同场景而实际测量得出的定位计算系数,如山区和密集市区的定位因子相差30%以上;而工程参数主要是通过小区的方向角来辅助计算只有一个或两个基站时的经纬度位置。
肖恒辉等设计了一种改进的Fang算法,用以计算有三个或以上基站时的经纬度位置。充分发挥全部基站的信息,共同提高了定位精度。
在为每条通话纪录进行起始位置和终止定位进行定位之后,即可以得到很多应用。
2.1 用户位置定位
可以针对VIP用户,进行位置监控和跟踪。以获取用户的通话位置。 按照时间顺序绘制一段时间内的用户位置即可形成用户的运动轨迹。
在刘阳等的文章中,利用用户的位置信息,对VIP客户实施重点服务保障应用,通过对用户的通话习惯/业务类型、活动区域、通话质量的实时监控,可以很好地了解客户的业务使用情况,从而根据用户的使用习惯为用户定制一些差异化服务项目,在提高运营商业务收入的同时,也树立了运营商的服务品牌效应。
谭钧元等提出一种基于用户位置定位的生活熵进行用户分类的算法,生活熵取值从0到80,数值越小表明用户的位置变化越有规律。按照其统计结果,约53%的用户生活熵在10以内,而仅有5%的用户生活熵大于30。
2.2 用户移动速度
以通话终止位置与通话起始位置之间的距离除以通话纪录中的通话时长,即可得出该通话期间用户的移动速度。从而可以在海量通话纪录数据中筛选特定的纪录进行进一步的分析。
如可以设定高铁速度的阀值为大约150公里/小时,来过滤出在高铁上发生的通话纪录,从而根据这些通话纪录的CFC值,EC/IO等来判定和分析高铁基站的通话质量。从而为高铁基站的优化提供辅助依据。
在GIS空间分析的时候,一般需要根据小区的方向角把小区覆盖范围图层绘制出来作为基础底图。小区覆盖范围在计算时一般情况下不考虑障碍物、楼宇高度等的影响,采用Delaunay三角网算法生成泰森多边形(Voronoi diagram),其中室外小区的模拟信号覆盖范围是不规则多边形,室内站的模拟覆盖范围是一个半径为50米的圆圈。
3.1 缓冲分析
缓冲区分析是指以点、线、面实体为基础,自动建立其周围一定宽度范围内的缓冲区多边形图层,然后建立该图层与目标图层的叠加,进行分析而得到所需结果。它是用来解决邻近度问题的空间分析工具之一。
在重点区域实时监控应用中,根据全网中热点事件的事件和位置,事先设定需要监控点和监控路径,再根据监控等级设定监控的缓冲区距离,通过实时用户通话纪录采集时候的位置过滤,实时筛选出缓冲区内的用户通话纪录,再通过运算成监控指标进行实时呈现。
3.2 专题图分析
专题地图是按照分析主题的要求突出、完整地显示一种或几种特定要素而使地图内容、用途成为专题化的地图,一般由底图要素和专题要素组成。常见专题地图类型如唯一值、区间专题、柱状、饼状等。
如根据一天内所有小区的掉话率数据,按照话务量大小划分成5个区间制作掉话率专题图。
栅格数据的空间分析就是在每一个栅格单元的基础上进行。如果单元过大则分析结果精确度降低,如果单元过小则会产生大量的数据,而且计算速度降低。根据无线网络分析的要求,一般设定100×100米的栅格为分析单元。把用户通话纪录定位到栅格内,再通过栅格内各通话纪录的其他业务属性的平均值、求和等运算计算出该栅格的名义色阶进而进行后续的业务分析。本文主要介绍栅格密度分析的相关应用。
4.1 栅格分析的基础
针对分析区域,以分析区中心点为基础原点,向四个象限扩展,以100×100米为界绘制分析区基础栅格。以中心点向外扩展可以尽量避免计算误差的影响,使得分析区所有的栅格大小一致。按照方位对每个栅格进行唯一编码,作为后续用户通话纪录与栅格关联的标识。
在计算出通话纪录的位置经纬度后,与分析区中心点坐标进行距离计算,进而求得该通话纪录所在的栅格坐标。在业务统计(如EC/IO、话务密度、导频污染、通话质量(FFER)、干扰分布等)时,可以以通话纪录栅格标识分组统计。
4.2 栅格密度分析
本文以导频污染为例,说明如何利用GIS栅格对用户通话纪录进行分析。
导频污染通常指当移动台的激活集中有四个或者更多导频信号,这些导频信号强度都很大并且没有一个信号的强度足够大成为真正的主导频。在这些区域,由于其它不在移动台激活集中的强导频信号的突然出现导致移动台在切换当中经常容易引起掉话。因此,强导频信号成为潜在的干扰源。
在用户通话纪录中,选择LAST PSMM中非空小区数量在4个以及以上的,并且信号强度EC/IO在-9db~-14db之间,再按照用户通话纪录所在的栅格标识进行分组统计,按照导频污染纪录的条数按照10-100,100-1000,>1000进行栅格渲染。
GIS作为一种呈现和分析手段越来越受到重视,也展现出传统数理统计方法不能比拟的功能和作用。
定位分析、空间分析以及栅格分析都是对某一时间点的业务数据进行的静态分析方法。未能关联和考虑业务数据变化的历史,更无法预测未来的趋势。而时态GIS能提供完善的时序分析功能,高效地回答与时间相关的各类问题,在时间与空间两方面全面处理地理信息系统,是近年来GIS研究领域的热点,随着时态GIS在算法和性能方面的深入研究发展,相信会在通话纪录分析方面有更广阔的应用空间。
[1] Lucent Technologies.Per Call Measurement Data and Related FeaturesOptional Feature DescriptionRelease 30.0,Issue 13,May 2009.
[2] 沈海涛.CDL在CDMA网络优化中的应用研究[D].上海:上海交通大学,2007:8-9.
[3] Behcet Sarikaya.Geographic Location in the Internet [M].2002:32-34
[4] 张国华,袁亘,罗彩艳.基于CDL的精确定位和网络优化探讨[J].电信科学,2011,6:113-119.
[5] 肖恒辉,林惜斌,李炯城.基于通话记录的无线定位方法及其应用[J].电信科学,2010,7:88-93.
[6] 刘阳,吴章成,辛炜博.通话纪录在网络运营中的应用探讨[J].中国新通信,2011,13(18):78-93.
[7]谭钧元,宋国杰,谢昆青.一种有效的基于生活熵的移动用户分类算法[J].计算机研究与发展,2009,46(增刊):433-438.
[8] 刘少华,罗小龙,何幼斌.基于Delauany三角网的泰森多边形生成算法研究[J].长江大学学报(自科版)理工卷, 2007,4(1):100-103.
[9] 宋捷,曾伟,许强.CDMA网络的导频污染问题[J].移动通信,2004,2:86-87
GIS Analysis Summary on CDMA Network Call Detailed Log
Wang Zhibo
(China Telecommunication Service Bytemobile Corporation,Shanghai,200050)
Call Detailed Log in CDMA network can provide wireless info,user info and terminal info,.This paper summarythe GIS analysis methods (locating analysis,spatial analysis,and raster analysis) and their application environments.
The user call records;PCMD CDL;temporal GIS
王智博(1981-)男,汉,上海人,工程师,硕士,主要从事软件开发,项目管理等工作;