刘 莺,胡剑炜
(1.湖南农业大学理学院信科系,湖南 长沙 410128;2.湘潭大学数学与计算科学学院智能计算与信息处理教育部重点实验室,湖南 湘潭 411105;3.中国移动通信集团湖南有限公司,湖南 长沙 410015)
目前,在移动通信领域,一方面4G用户快速增长,另一方面4G手机上网用户满意度相对偏低.即使网络KPI指标显示网络质量良好,依然有大量用户抱怨和投诉业务体验.通过LTE信令监测系统的大数据分析可知,部分问题因被整体指标淹没而未能及时发现,其中包括:(1)LTE信令监测系统基础数据的准确性欠佳,影响发现问题的准确率;(2)传统网管数据无法从业务、用户的角度全面精准地分析出质差网元,需要利用信令数据深入挖掘;(3)信令分析聚焦于提升整网的KPI和KQI指标,对视频业务、高铁网络质量等具体业务的分析不足.[1-2]在LTE用户数和流量迅猛增长的情况下,LTE端到端质量指标和用户感知面临巨大挑战,急需开展LTE端到端质量指标和用户感知优化工作,完善LTE端到端的应用,解决各类隐性问题,从而提升用户对网络质量的满意度.
利用LTE信令监测系统的大数据分析,以XDR数据的问题整治为基础,以提升端到端业务感知为目的,进一步完善感知类问题定界方法,开展端到端质量分析及优化工作.
(1)提升XDR数据质量.针对LTE信令监测系统的信令数据,从字段核查、网管指标对比、路测比对和网元环比这4个方面提升数据的完整性、规范性和准确性.[3]
(2)完善感知问题定界方法.完善低速率质差小区、频繁乒乓TAU问题和质差互联网网元等的定界方法,提高问题定界和定位的准确性.
(3)聚焦具体用户/业务感知.实现LTE信令监测系统软采和硬采数据关联分析,拓展信令数据在视频网络业务、高铁网络业务等端到端业务感知质量提升中的支撑能力.
针对LTE信令监测系统中XDR数据质量存在的问题,从基础数据和指标应用层面,通过对比通信协议、逻辑性、网管指标和路测拨测来进行核查整治,确保基础数据的完整性、规范性和准确性,从而提升LTE信令数据质量,使XDR字段满足规范化要求.
2.1.1 完整性核查 从用户信息回填、位置信息回填、时间信息回填和上层应用需求这4个方面进行数据完整性核查.
(1)用户信息回填.核查MSISDN,IMEI和IMSI等用户字段信息回填率和取值合法性,对低回填率和不符合逻辑的用户字段信息进行整改.
(2)位置信息回填.核查CITY,TAC和CELL ID等位置字段信息回填率和取值合法性,通过对比拨测数据和XDR数据来核查资源位置信息回填的准确性.
(3)时间信息回填.核查业务流程起始时间回填率和取值合法性,通过拨测来核查XDR数据记录时间差异和文件生成时间差异.
(4)上层应用需求.根据上层应用对底层数据的需求,梳理字段的满足情况,提出新的字段需求.新增VIDEO_DATA_RATE视频清晰度、STREAMING_FILESIZE流媒体文件大小、STREAMING_DURATION流媒体文件时长等字段需求.
2.1.2 规范性核查 主要考察字段取值超出正常范围、字段格式不符合规范、相对时间错误和关键ID不一致等异常情况.从字段取值合法性、拨测字段准确性和字段之间关联性这3个方面开展规范性核查.
(1)字段取值合法性.从接入数据流量变化情况、用户数据信息等方面验证XDR字段的规范性.
(2)拨测字段准确性.利用拨测数据在微观上验证XDR记录的完整性和准确性.
(3)字段之间关联性.从业务模型、数据特征、XDR生成规则和业务流程这4个维度核查字段之间的关联性.
2.1.3 准确性核查 主要从业务面指标、信令面指标和路测指标这3个方面开展准确性核查.
(1)业务面指标.对比无线网管指标,如流量、DNS查询、TCP建立、RRC建立和X2切换等,对偏差大于5%的指标进行整改.
(2)信令面指标.对比核心网网管指标,如附着、默认承载建立和TAU等,对偏差大于5%的指标进行整改.
(3)路测指标.利用自动路测对比XDR事件全面性、时间/小区一致性、流量全面性和占用小区顺序情况等.
2.2.1 综合业务无线低速率质差小区 对现网用户行为数据进行大数据分析,修改并完善无线低速率质差小区的判别方法,有利于定界由无线侧问题造成的无线低速率小区,从而提升判别的准确性.从XDR数据的角度定义无线低速率小区需要考虑以下方面的问题:(1)排除SP,SGW和终端的影响;(2)无线侧问题引起低速率必然会同时影响视频、浏览和应用下载等相关业务;(3)大部分无线低速率质差小区的无线网管指标和MR指标较差.判别无线低速率质差小区的思路是:(1)明确综合下载速率定义.包括主流文件类型的会话包为多大和综合下载速率需要选择多大的会话包等.(2)排除非无线问题影响.排除质差SP、终端和核心网等的影响.(3)指标监控门限判别.根据小区下载速率分布情况确定下载速率监控的大致范围,根据处理门限预测全网指标以确定合适的处理门限.(4)过滤偶发原因.根据连续出现天数排除偶然原因,根据流量对问题小区进行优先级排序.(5)关联网管指标和MR指标.对关联网管指标和MR指标进行准确性验证,对指标无异常的疑似无线低速率小区进行复检和再确定.
排除非无线原因后,在LTE信令监测系统上,综合业务无线低速率质差小区最终定界为数据包大于100 kB、综合下载速率低于1 300 kbps、流量大于100 MB、用户数大于100、连续5 d的统计中有3 d下载速率低于门限值的小区.
2.2.2 频繁乒乓TAU问题 LTE采用硬切换,即使小区下载速率高,但在TAC边界频繁出现TAU时,用户感知会明显降低.基于无线网管的统计指标体现的是小区级TAU.如果用户在短时间内频繁出现TAC A—TAC B—TAC A,无线网管指标无法体现,那么TAU通常会被确定为正常.传统优化中只能通过路测来发现此类问题,而基于XDR的信令面数据可以从用户级粒度来分析TAU.针对TAC A—TAC B—TAC A等,TAU采用无需进行路测的特定算法进行定位分析,节省了测试成本.基于信令数据的频繁乒乓TAU的判定流程如图1所示.
图1 频繁乒乓TAU的判定流程Fig. 1 Identification Process of Frequent Ping-Pong TAU
利用大数据分析可以实现TAC插花/边界判定和TAC/LAC一致性判定、TAC边界合理性判定.具体过程为:(1)基于用户识别频繁乒乓TAU的小区;(2)跨TAC的TAU次数与TAU总数的比值大于80%,可认定出现问题;(3)对比站点30 m内的TAC和LAC,实现TAC/LAC一致性判定;(4)通过共覆盖判别来考察与最近一圈基站TAC是否一致,实现TAC插花/边界的判定;(5)基于切换、TAU指标评估参数设置的合理性,实现TAC边界合理性判定.
2.2.3 质差互联网网元 传统分析方法是根据拨测结果,统计主要的网站指标并检查SP服务器的负荷.该方法的缺点是拨测耗时耗力,工作量大,且因没有针对业务和速率的监控,只能查找面的问题,对点的问题无能为力.
利用XDR数据,通过3种方式定位服务器端质量问题:(1)服务器协议码.通过信令统计数据获取质差内容源的TCP失败率、TCP重传率和HTTP误码率,若它们大于5%则定位为服务器质量问题.(2)业务速率.对于长期有互联网质量监控的热点内容源,在IP网络质量基本不变的情况下,若速率下降超过20%,则定位为服务器质量问题.(3)服务器维度.对于具备服务器侧质量统计能力的资源,在IP网络质量基本不变的情况下,若速率下降超过20%,则定位为服务器质量问题.质差定界流程如图2所示.
图2 质差定界流程Fig. 2 Qualitative Difference Demarcation Process
以高铁通信网络质量分析及优化为例.依托LTE信令监测系统,通过大数据分析将用户、小区、路线、方向、时间和场景这6个维度汇聚成一个整体,根据高铁用户身份识别、场景质量透视、指标监控和异常事件定位分析来快速和准确地评估高铁网络质量,提升用户业务感知.六维一体分析法如图3所示.
图3 六维一体分析法Fig. 3 Integrated Six-Dimension Analysis
2.3.1 高铁用户识别 获取高铁专网基础数据,包括高铁沿线专网小区覆盖信息、小区方向序列、方位角、经纬度、TAC和ECI等.获取用户位置定点数据,包括小区序列、方位角、跟踪区和MR等.以信令作为分析数据源,从实时信令监测数据中匹配数据矩阵,并利用自学习算法对矩阵数据进行修正.基于数据矩阵、用户移动速度和首末距离等,综合分析用户占用小区类型、运行距离、移动速率和占用小区时间等多项因素,形成以移动速率为主体判别条件的用户身份识别算法,准确识别高铁专网用户.
首先,根据MME时间段关联HTTP数据和时间占比情况,将一条HTTP数据拆分成多条记录.然后,将1 h内获取的数据分别按照用户和时间分组排序,以2 min为一组进行多边形的用户位置定位.根据2 min的用户定位的经纬度,计算用户在20 min内的移动速度和用户占用小区等情况.最后,利用信令面S1_MME数据,以小时为单位,按照以下规则识别高铁用户:(1)识别用户占用高铁专网的首末小区;(2)用户20 min之内的移动速度大于100 km/h;(3)占用3个以上的高铁专网小区;(4)用户占用高铁首末小区距离大于10 km;(5)用户60%的会话次数占用了高铁专网.
2.3.2 高铁用户脱网/公网用户入侵判别 在高铁用户识别的基础上进一步获取高铁用户从高铁专网脱离占用公网小区进行业务、公网用户占用高铁专网小区进行业务的信息,实现高铁用户脱网或公网用户入侵的判别.从海量用户中识别出高铁用户和非高铁用户,判断高铁用户是否脱网以区分高铁脱网用户和非脱网用户,判断非高铁用户是否入侵以区分公网入侵用户和公网非入侵用户.
高铁脱网识别规则:(1)判断用户是否为高铁用户;(2)识别高铁用户的运行方向;(3)同TA list的TAU尝试;(4)UE存在专网小区到公网(排除月台小区)的TA更新;(5)用户在高铁专网小区重新发起Attach请求,且3 min前有信令;(6)用户在高铁专网小区掉线.
低速入侵专网识别规则:(1)用户移动速度小于60 km/h;(2)用户占用非站台附近的高铁专网小区;(3)用户占用的高铁专网小区数不大于3;(4)占用某一高铁专网小区业务的时间超过5 min.
2.3.3 建立高铁专网质量评估体系 通过大数据分析将用户、小区、路线、方向、时间、场景这6个维度汇聚成一个整体,利用高铁用户定位、身份识别和乘车方向识别等算法判断用户脱网或入侵,实现脱网或入侵高风险区域、路线、方向的判断,构建高铁专网覆盖质量评估体系.[4]
目前专网站间距小于10 km,高铁运行时速为250 km/h,考虑进出站等减速情况,假定平均时速为210 km/h,则列车通过一专网小区覆盖范围需要的时间约为3 min,因此计算高铁穿越某专网小区的用户数的时间应限制在3 min以内.根据3 min内的统计和方向识别判断用户乘车、会车的特殊场景,实现网络峰值用户数、峰值业务量和峰值时段的判断,构建高铁专网容量评估体系.
进一步实现网络接入性能、传输性能、稳定性能和移动性能的判断,构建基于多维度关键算法的高铁专网质量评估体系,从用户、小区、场景、路线、方向和时间等方面监控网络质量和评估用户感知.
在LTE端到端优化工作中,紧密围绕用户感知提升,依托LTE信令监测系统,可实现提升XDR数据质量和用户感知、完善定界方法的目的.现以某省2017年上半年的数据为例进行说明.
(1)累计发现121个LTE信令监测系统数据异常问题,解决了104个,解决率达85.9%.重点解决了X2口数据不完整,MSISDN和CELLID等字段回填率低于90%等问题.XDR数据完整率由72.4%提升至99.8%,合规率由78.2%提升至92.1%,准确率由80.6%提升至91.5%,数据质量取得较大提升.
(2)深入挖掘并解决1 884个无线低速率质差小区,565个乒乓TAU问题,101个互联网质差网元.采用新规则对低速率质差小区进行判定并分析原因发现,覆盖类问题突出,占比高达41%,其次是容量、参数和干扰问题.对低速率质差小区进行优化后,平均下载速率由627.26 kbps提升至2 193.37 kbps,HTTP业务成功率由72.48%提升至96.26%.对频繁TAU算法进行优化后,分析问题的准确性由45%提升至95%,且只需5 min即可完成全省网络分析.此外,结合XDR数据和工参信息,从网络维度分析TAU,可以发现插花站点、孤岛站点等一系列网络问题.通过参数和RF调整来减少重叠覆盖后,乒乓TAU次数由51 906次下降至23 782次.
(3)对视频业务卡顿与调度、高铁高脱网与高入侵风险点等展开深入分析,统计全省4G网络用户感知类指标.网络优化后,网页浏览页面的响应成功率由88.74%提升至95.7%,显示成功率由87.73%提升至92.2%,下载速率由913 kbps提升至1 039 kbps;视频播放成功率由90.6%提升至92.1%,下载速率由2 020 kbps提升至2 340 kbps;累计发现16个高脱网或高入侵风险点.
基于用户感知的端到端业务质量保障是一项长期性的工作.[5]利用LTE信令监测系统的信令数据提升XDR数据质量,通过完善感知问题定界方法来提高问题定界和定位的准确性,以高铁通信网络质量分析及优化为切入点,建立基于用户感知的网络质量评估体系,为优化端到端业务质量提供了可行的实施方案.
[1] 黄琪飞,李 贝,胡海波,等.基于用户感知的端到端网络优化方法研究[J].电信技术,2016(9):9-12.
[2] 程晓军,苗守野,景洪水,等.基于用户感知的移动网络优化体系及关键技术[J].邮电设计技术,2011(11):54-58.
[3] 慕明君,晁 昆.基于端到端的用户感知方法研究[J].无线通信,2015(8):52-55.
[4] 李富强,谢 鹰,刘文鹏.高速铁路移动网络覆盖方案的研究[J].邮电设计技术,2014(8):20-24.
[5] 刘 通.移动互联网端到端客户感知评估与问题分析思路探讨[J].移动通信,2016(11):64-72.