王君君 魏志刚 虞辉
中国移动通信集团江苏有限公司
随着运营商不限量业务的发展,以及网上业务的手机端集中化,用户对业务感知越来越敏感,对无线网络容量的要求也越来越高。因此,网络运维和优化就需要基于明确的标准或算法来准确衡量无线网络容量,以便及时指导扩容,提升用户感知。
目前,不同运营商采用的高负荷衡量标准各有不同,指标维度差异、门限差异、权重差异等是根据各自无线网络业务分布特点进行评估,但往往基于小时甚至更长时间维度。比如,我们当前采用基于小区自忙时的高负荷评估标准,根据自忙时每ERAB流量将业务类型分为大包、中包和小包,对不同的包类型设置不同的指标门限,综合PRB利用率、流量、用户数三个维度,分别进行上行和下行的小区负荷判断,上下行之间是“或”关系,维度之间是“与”关系,如表1所示,该扩容标准反映的是小时级别高负荷。
表1 小时高负荷标准
但用户业务在小时内的发生并非均匀,存在一定波动性,小时级的平均指标难以发现短时间的高负荷问题,例如,在日常投诉处理中,有些短时高负荷导致的投诉问题难以及时定位,所以,我们需细化时间粒度,对短时高负荷考虑如何及时定位解决。为了与网管指标时间粒度契合,本文选择15分钟作为短时粒度展开扩容标准优化研究。
以15分钟作为短时进行研究,若沿用现有小时级标准,即流量、利用率、用户数门限均与小时级相同,则高负荷小区明显减少,主要原因是小时级利用率和用户数均为4个15分钟取平均值,而流量为4个15分钟求和,15分钟判断流量维度较难达到门限,所以,15分钟高负荷标准的流量维度不合理,需要重新研究门限。
以南京市为例,对15分钟粒度的小区数据进行汇聚分析,依据流量及利用率拐点关系,对流量门限进行修订,同时,结合当前高负荷利用率门限标准,分析得到15分钟级流量门限,即下行流量门限:大包2GB、中包1.1GB、小包0.8GB,上行流量门限:大、中、小包均0.15GB,分别如图1和图2所示。
图1 15分钟上行利用率和上行流量关系
图2 15分钟下行利用率和下行流量关系
由此,得出15分钟粒度高负荷标准如表2所示。
表2 15分钟高负荷标准
分场景看,由小时粒度修改为15分钟粒度后,采用新标准统计,如图3所示,高负荷小区增加比例较为明显的场景包括交通枢纽、地铁、城市道路场景,可见,小区覆盖下用户流动性高,有大量用户移动的场景,易出现15分钟短时高负荷。
图3 15分钟与小时高负荷小区数对比
短时高负荷在时间粒度缩短之后,高负荷小区规模整体扩大,以南京市为例,如表3所示,平均每天15分钟级高负荷小区数比小时级要多250个左右,连续3天的15分钟级高负荷小区数比连续3天的小时级也要多100多个。在扩容资源有限的情况下,需考虑如何进行资源精准投放。所以,从横向时间规律性和纵向发生频度两个角度出发,对短时高负荷标准的应用进行探索。
表3 小时和15分钟高负荷连续多天出现对比
部分短时高负荷并非偶然发生,而是在天级时间维度上存在规律性,例如地铁早晚高峰时段、办公楼午休时段等,会在固定的15分钟时间段业务骤增,导致容量不足。针对该类短时高负荷,我们定义为“横向规律性短时高负荷”,即连续3天的同一15分钟或相邻15分钟内均出现高负荷,如图4所示。
部分短时高负荷在天级时间维度上无规律性,但是每天发生频次很高,例如工业园区、集宿区等,工人不定时休息,一天会出现多个业务集中的15分钟短时高负荷,导致容量不足。针对该类短时高负荷,我们定义为“纵向高频次短时高负荷”,即每天15分钟高负荷频次不低于3且连续3天的高频高负荷,如图5所示。
图4 横向规律性15分钟高负荷示意图
图5 纵向高频次15分钟高负荷示意图
对横向规律性和纵向高频次15分钟短时高负荷小区,进行网管分析,并选取地铁、商业中心等进行现场测试,以验证分析其对用户感知的影响。
2.3.1 体验速率
对南京雨花、建邺两区下行2M以上体验速率满足度分析,如图6所示,横向规律性15分钟高负荷小区平均67.76%,纵向高频次15分钟高负荷小区平均66.96%,均远低于非问题小区的82%,可见,存在较明显的感知恶化。
图6 DL 2M以上体验速率满足度对比
2.3.2 测试速率
(1)ATU测试:如表4所示,从上传和下载速率来看,小区闲时平均上传速率5.5Mpbs,平均下载速率46.4Mbps,而15分钟问题时段平均上传速率2.5Mpbs,平均下载速率16.2Mbps,分别下降53.8%和65%。从最小速率来看,小区闲时最低下载速率区间为5Mbps~9Mbps,而15分钟问题时段内最低下载速率区间仅为1Mbps~2Mbps,且持续1-2分钟以上;小区闲时最低上传速率区间为0.6Mbps~4.8Mbps,而分钟问题时段内最低上传速率区间为0.2Mbps~1Mbps,且持续2分钟左右。
表4 ATU测试结果
(2)APP测试:测速软件与ATU测试结果基本一致,如表5所示,与闲时相比,15分钟规律性问题时段平均下载速率下降82%,平均上传速率下降89%。
表5 APP测试结果
综上,横向规律性和纵向高频次15分钟高负荷,均对用户感知有较大影响。
网络优化中,为有效权衡资源投入和用户感知提升,针对15分钟短时高负荷,进一步结合小区用户价值、业务类型、用户感知维度,建立价值分级自动化机制,提升扩容资源的投放效能。
价值评估维度包括用户价值、业务类型和用户感知,如表6所示,其中,用户价值表征“影响的价值”,高负荷小区的高端用户越多,损失越大,采用小区平均ARPU(每用户平均收入)值来衡量;业务类型表征“影响的业务”,在线游戏、即时通信、高清视频等业务对感知更敏感,小区内这些业务越多,用户满意度越低,采用小区游戏和视频流量占比来衡量;用户感知表征“影响的程度”,感知越差,用户越难容忍,采用HTTP综合速率衡量。
表6 价值分级打分
对横向规律性和纵向高频次15分钟高负荷小区,基于价值维度进行量化打分,得分区间为60-100分,得分越高表明扩容价值或者紧迫性越高。对短时高负荷通过“优软硬建”整治,资源优先通过载波动态调度及静态挖潜解决。
对接采集信令、经分、性能、网管等多维度数据,实现横向规律性和纵向高频次15分钟短时高负荷自动统计,并实现负荷价值分级评估,指导日常扩容。
本文从短时高负荷的有效识别和感知提升出发,通过建立横向规律性和纵向高频次两种15分钟高负荷模型,并结合价值分级机制,明确扩容优先级,在解决感知问题的同时,提升资源的使用效能,且综合多维数据源实现平台自动化,有效融入到日常网络优化中,提高生产效率。