刘杨
(中国移动通信集团湖北有限公司网优中心,湖北武汉,430023)
LTE网络质量与性能,对用户的业务体验和客户满意度,具有重要影响。目前LTE低速率质差问题需要通过路测分析来定位,ATU测试周期过长,存在时效性不足和测试无法遍历全网所有小区的问题,另外由于无线环境的不确定性和不定期LTE新站的入网影响原有LTE网络结构都可能导致LTE小区低速率的情况经常出现。
目前的低速率网络优化工作是一个重大的挑战,主要体现在三个方面:(1)后台评估低速率手段匮乏;(2)基于用户业务投诉发现问题小区方式太被动;(3)传统“点”状CQT遍历测试和“线”状路测无法全面评估全网所有小区的速率业务质量。
网络运行状况由KPI指标来反映,小区速率究竟如何?如何去甄别和监控这些KPI指标是由于低速率引起?基于这些问题,为实现对LTE低速率小区实现快速探测,移动运营商成立了专门的LTE低速率攻关团队,通过大数据栅格和网管指标LTE小区下载速率进行关联分析,实现低速率实时探测,降低LTE低速率质差判定成本,提升问题的定位与判定效率。
为深入解决LTE低速率的问题,本文采取的方法是,基于软硬采大数据栅格100*100及OMC指标定位低速率小区及低速率区域,通过MR、地理化呈现精确定位分析,结合形成智能分析工具,针对低速率小区及低速率区域,给出解决方案,如图1所示。
图1 LTE低速率问题发现与定位示意图
根据信令软采以及MR指纹定位获取栅格总采样点、弱覆盖采样点、平均RSRP等覆盖数据并进行地理化呈现,如图2所示。
图2 LTE低速率栅格定位示意图
在LTE低速率栅格定位过程中,需要进行栅格数据入库以及数据清洗等,具体操作包括:
首先,栅格数据入库。软硬采的栅格数据存在较多的冗余信息,需要先对数据进行清洗,清洗时,仅保留如下关键字段:id(栅格编号)、eutrancell_name_1、rsrp_sample_count_1、speedavg、download_speed、upload_speed。
其次,进行大数据处理。大数据处理过程为:(1)将清洗后的栅格数据按照ID进行汇聚,可以得到该ID栅格6个服务小区的采样点的集合A={rsrp_sample_count_1,rsrp_sample_count_2,……,rsrp_sample_count_6} ;(2)进行栅格主服务小区的判定,按照采样点进行判断,并依次判断从rsrp_sample_count_1到rsrp_sample_count_6的定位;(3)判断栅格速率是否低于5mbps,以及自忙时数据为是否为中包或大包业务。
最后,输出低速率栅格。通过栅格数据处理原则,以栅格ID进行汇聚处理,给出低速率栅格及栅格对应的6个服务小区排序。通过这样的定位与分析,可定位导致LTE低速率质差问题的原因,如表1所示。
表1 导致LTE低速率质差问题的原因分析
OMC的平均速率采集,主要是通过IP Throughput速率统计衡量用户感知速率,该项指标通过计算单位时间内小区吞吐量来评估小区速率,结合网管常规关联因子评估小区级用户感知速率。
在采集IP Throughput速率时,最后一个下行数据单元的传输总的吞吐量需要从总的下行数据传输吞吐量减除,因为当数据缓存为空时,ENB所传输的下行数据单元受分组数据的大小影响,即传输速率不取决于ENB的调度,排除最后一个下行数据单元的传输吞吐量将更准确地反映小区的下行平均速率。
图3 OMC平均速率采集示意图
IP Throughput是基于单个QCI和单个UE的,测算与业务类型(traffic patterns)和大小不相关的Uu口的IP吞吐量。主要统计有可能导致需要分成多个TTI进行传输的突发数据的情况,是评价无线侧在用户有足够业务需求时网络能够提供的速率能力。要识别用户有足够业务需求就是要识别出大包的业务需求,大包是指期望能够在每个TTI中占满所有的RB。因为大包需要分成多个TTI传输数据,这种情况下除了尾包TTI,其他包占用的TTI都是满PRB使用的,因此尾包的传输数据和传输时间不做统计,可以更准确的反映用户感知速率。同理,对于小包业务,通常占用网络资源很小,不可能达到满PRB调度,不能有效反应网络所能提供的速率能力,所以不做统计。
现网中,我省主要有两类机型:华为和中兴。正对这两类机型,结合上述分析,开发了相应的指标体系。
对华为机型,主要采集的指标为:网元名称、本地小区标识、OMC小区名、基站名+本地小区标识、小区、小区PDCP层所发送的下行数据的总吞吐量(单位:比特)、小区PDCP层所接收到的上行数据的总吞吐量(单位:比特)、使UE缓存为空的最后一个TTI所传的上行PDCP吞吐量(单位:比特)、使缓存为空的最后一个TTI所传的下行PDCP吞吐量(单位:比特)、扣除使UE缓存为空的最后一个TTI之后的上行数传时长(单位:毫秒)、扣除使下行缓存为空的最后一个TTI之后的数传时长(单位:毫秒)、上行速率(单位:kbps)、下行速率(单位 :kbps)等。
对于中兴机型,主要采集的指标为:eNodeB、eNodeB名称、产品、小区下行IP Throughput数据量高(单位:兆比特)、小区下行IP Throughput数据量低(单位:千比特)、小区下行IP Throughput数据传输时间(单位:毫秒)、平均速率、小区上行IP Throughput数据量高(单位:兆比特)、小区上行IP Throughput数据量低(单位:千比特)、小区上行IP Throughput数据传输时间(单位:毫秒)、上行平均速率(单位 :kbps)等。
图5 LTE低速率问题定位与解决流程示意图
结合方案在实际工作中的应用情况,本文提出的基于大数据与OMC结合的低速率探测方案,具有如下创新点:
图4 LTE速率的栅格四象限示意图
首先,本方案可以精准定位问题区域。结合大数据100*100栅格与OMC网管小区指标进行匹配,将栅格主服务小区与小区速率结合与分析,利用四象限法找出栅格低速率区域且低速率小区,按照栅格速率低于5mbps、自忙时数据为中包和大包业务,以横轴为速率小区方向,以纵轴为栅格速率方向,建立四象限,如图4所示。
其次,依托本文提出的方案,可以有效建立标准化流程。以集中派单为手段,充分调动地市分公司参与,结合省公司专家团队力量,针对低速率问题,进行集中整治,如图5所示。
第三,实践应用效果良好。
【案例1】近端弱覆盖导致低速率:(D)某国税局-HLH该站点为美化方柱,且该方向天馈覆盖在楼面平台,被楼面阻挡,导致站下信号覆盖差同时质差,现场测试下载速率仅为4-5Mbps。网优人员前往现成发现,天馈系统遮挡严重。采用本文所述的方法,实施天面整改,将该小区天馈搬迁至东北面边缘,解决了天面平台的遮挡问题,所有指标立竿见影改良。
【案例2】高负荷导致低速率:硚口解放大道717号某超市-HLH-3小区现场测试速率波动较大,平均速率较低;后台查看该小区下行PRB利用率较高,高峰期达到过90%。网优人员前往现成排查,发现该站点位于某高校内,属于高校站点,但仅仅配置了F1站点,基于此,制定了两套可选方案:扩容为F2频点,或新增D频段。后来,采用新增D频段,问题解决。
【案例3】高负荷/干扰导致低速率:张湾村学生公寓-HLH该站点为美化方柱,现场测试该小区的下载速率为10-40mbps之间,存在波动,提取自忙时数据下行PRB利用率达到88%,同时该小区存在干扰,初步怀疑为干扰器干扰。网优人员前往现场测试,发现D频段负荷较低,同时现场还存在干扰。基于此,开启了基于PRB利用率的负荷均衡方法,进行了F/D的负载均衡。同时,对现场进行了干扰排查,解决了干扰,消除了潜在的隐患。
本文提出的基于大数据与OMC结合的低速率探测方案,已在现网中进行了充分实践。根据大数据栅格及OMC指标探测低速率方法,对全省低速率探测小区进行派单整治,累计解决1312个小区的低速率问题。低速率小区指标接通、掉线、上下行速率改善,全网上下行低速率占比从0.62%改善到0.41%,调整后低速率占比减少约0.21PP。使用大数据与OMC结合的低速率探测方法分析武汉区域0.5人天(4小时)可完成大数据的解析和分析工作,而传统测试与分析至少需要70人天(560小时)完成武汉区域测试,效率提升140倍左右。同时,基于大数据与OMC结合的低速率探测方法,无需新增资源、设备,网络分析及问题派单均无耗费。传统测试分析模式均存在大量车辆、人工费用,为公司节约了可观的费用。