朱伟 艾怀丽 张桂荣 赵志扬 张晶 梅明涛
中国移动通信集团江苏有限公司
随着移动推行“四轮驱动”融合发展战略,4G发展一直保持行业领先,2016年4G用户数和4G渗透率达到新高,2017年的目标是4G用户突破6.3亿,VoLTE用户突破1.5亿。VoLTE语音逐步成为用户通话的最基本选择。高质量的语音、更快速的接通给用户带来更好的体验的同时,对网络质量的要求也越来越高。差的VoLTE语音感知往往会引起用户投诉,一线的优化压力日趋增长。
图1 移动用户数及4G用户占比图
针对江苏多个重点城市VIP投诉详单抽样分析,语音质量类问题是影响用户感知的主要问题,占VoLTE投诉的70%+;其中4G弱覆盖、干扰等仍是影响用户感知的主要因素。
目前每天南京的VoLTE高清语音质量通话次数大约35万,未来五年随着VoLTE业务的建设和深入发展,VoLTE高清语音将成为主流,预计增长20倍到700+万通话/天,若VoLTE语音质量问题占投诉的70%,一旦等用户规模成倍增长,而VoLTE语音质量问题无法得到有效解决和闭环,等比20倍的投诉量增加将是灾难性的。
图2 VoLTE问题占比图
而目前结合现网优化经验,传统的KPI指标在网络性能较差的情况下能够反映网络问题,但是在网络质量提升到一定水平后根据KPI指标就很难真实的反映用户体验好坏,往往会出现传统KPI指标非常好的情况下用户体验并不好;更进一步的KQI指标有一定改善,但是从VIP投诉分析来看,还是存在MOS值满足要求,用户体验不好的情况。因此,针对传统KPI指标无法及时发现VoLTE语音质差并及时解决和闭环这个难题,需要一种新的方式能够识别VoLTE语音质量导致的客户感知差的问题,并能够推动促进问题高效解决。
传统的网管指标最小粒度是5min粒度,没有反映用户听不清的指标,且无法表征真实的用户感知,本课题提出的VoLTE语音感知研究,基于反映用户听不清的吞字指标,对话音流进行切片,以5s为粒度进行分析,对比传统网管的5min粒度指标,解决了问题点因过粗的统计而湮没在样本中的问题。
从用户体验入手,将VoLTE语音质差小区识别出来,排除终端、用户故障的干扰,并关联已有的无线侧其他系统定位的问题,实现自动派单,提供给网优部门处理。本研究课题通过三大步实现精准的质差小区定位。
图3 VoLTE语音质差小区原理图
在3GPP LTE中,VoLTE业务编码有AMR-NB窄带和AMR-WB宽带两种编码,两种编码速率具有不同的话音质量,所以又分别称为VoLTE标清语音(或VoLTE 12.2kbps)和VoLTE高清语音(或VoLTE 23.85kbps)。
AMR-NB和AMR-WB这2种编码具有如下特点:
每20ms产生一个语音包,包括了RTP/UDP/RLC-Security压缩头;每160ms生成一个SID语音静默包。帧长20ms;普通人讲话的语速为每分钟120至180个汉字左右(新闻联播播音员的语速280到300字)。因此,普通人大概1个字占16~25个语音包。
用户语音质量体验差总结起来有三种感受:
吞字:感觉对方说话吐字不清,或者漏字。
断续:感觉对方说话时断时续,有明显停顿感。
单通:完全无法听到对方说话。
通过海量数据的分析,发现丢包是影响语音质差的关键因素。但是,是否语音质差,不完全取决于整体的丢包数量和丢包率,而取决于在具体时段的丢包数量。
经过对海量样本以机器学习算法研究,一般情况下的表现如下:
吞字:连续20个包,丢12个包。
断续:连续50个包,丢30个包
单通:丢包率大于80%。
其中断续、单通是比吞字更加严重的情况,吞字是否发生能够在一定程度上表征用户语音质量体验。下图是吞字发生在语音频谱上的典型体现:
图4 吞字语音频谱图
吞字表征语音质差相比IPMOS的优势:
前期我们用IPMOS来评估语音质量,但是其实通过统计指标加权综合评分,并不能够完全表征用户语音质量感受,通过对从南京市抽取的2348份通话记录进行对比如下所示,并不是所有IPMOS好的场景都不发生吞字。
图5 产生吞字的IPMOS值分布图
基于用户、终端、小区等因素排查
(1)终端因素排查
故障终端按照小区维度动态监控,通过语音质差小区信息关联其小时维度ToP质差用户终端型号,一旦出现终端型号集中,应判断为终端问题。
经过大数据样本统计分析,正常情况下终端故障不会大面积集中出现。如下图7所示,取南京全网1天数据,最差的终端故障率仅为2.9%,日常VoLTE语言质差并没有因终端原因引起的。
图6 快速定界手段图
图7 TOP终端故障率图
(2)用户因素排查
为了避免在异常情况下由于某些特定用户导致的问题出现,质差小区信息中关联该小区下的故障通话次数、故障通话用户数,一旦出现故障通话用户数远小于故障通话次数,则判断为用户因素,因某些异常用户导致了大量的故障通话。
经过大数据样本统计分析,正常情况下Top质差用户不足以影响Top质差小区的识别。
图8 TOP质差用户排除图
(3)切换因素识别
通过大数据识别,将一天内数以千万计的通话情况、语音质量、切换情况关联。
图9 切换关联原理图
如下所示,识别出在切换情况中出现的语音异常的场景,识别出切换导致的语音质差问题。
图10 切换中识别出的语音异常的场景图
基于大数据的Kmeans聚类算法将质差用户按照小区位置进行聚类,识别出Top质差小区。
图11 质差用户Top小区图
通过统计分析,大概30%的小区在业务体验差的情况下,会在传统的无线监控指标上有体现。因此,通过关联传统的容量不足、覆盖、干扰等无线指标,从多个维度反映该5s质差Top小区的原因,避免了传统派单中仅针对单一指标进行优化而导致的资源浪费问题,并能大大提升一线优化问题的处理效率。
由于传统网优手段的限制,若无法用传统的网络监控KPI指标识别的问题,处理难度大。通过人工拉网排查成本高效率低。
因此,针对70%语音质差识别的无法用传统保障措施发现的故障小区,需要采用新的方法来解决——这就是基于软采数据的大数据OTT定位信息,如下图所示,基于高铁小区进行专项试点显示,通过这个方法能够精准的识别出现语音质差的具体位置,以及无线相关的具体信息,能够有的放矢地指导网优人员做精准专项优化。
图12 基于大数据OTT定位信息的栅格化辅助定位图
实际数据显示,基于语音质差故障栅格化呈现的方式,精准地完成了语音质差小区的优化。
图13 质差用户Top小区处理效果图
本文针对传统的无线网络质量保障无法提升用户体验的不足,提出了基于5s切片技术的基于大数据的VoLTE语音感知系统。从表征用户体验吞字入手,自动实现问题定界,依次分析终端、用户、切换因素,将VoLTE语音质差小区精准识别出来。并关联已有的无线侧其他系统定位的问题,依托OTT定位栅格化信息,实现自动派单,提供给一线现场网优处理。目前该系统已在南京上线,质差小区具有很高的准确性,能够较精准地完成语音质差小区的优化。该课题对于一线优化生产将带来很大帮助,具有全国推广的意义。