移动用户业务感知时延类KQI优化

2019-06-10 01:01李钟瑞戴明珠
软件导刊 2019年2期
关键词:用户体验移动互联网

李钟瑞 戴明珠

摘 要:在移动互联网业务迅猛发展的背景下,通信设备的KPI无法反映用户真实业务感知的问题日益凸显,运营商逐渐从传统KPI向感知时延类KQI转变,以期为移动互联网用户提供更好的用户体验。为实现对移动互联网业务用户进行全面、及时、准确的感知评估,分析用户业务感知时延类KQI流程,对包括DRX相关参数、智能预调度参数等7个方面的参数配置进行优化,完成对主流网站时延类KQI指标的测试,结果证明该优化方案能够有效提升移动用户业务感知时延类KQI。

关键词:移动互联网;用户体验;时延类KQI;业务感知

DOI:10. 11907/rjdk. 181659

中图分类号:TP393文献标识码:A文章编号:1672-7800(2019)002-0169-05

Abstract: Under the background of the rapid development of mobile Internet services, the problem that the KPIs of communication equipment fails to reflect the users real business perception has become increasingly prominent.Telecommunication operators have Suifted their focus gradually from traditional KPIs to perceived KQIs,and try to provide a better user experience for mobile Internet users. The processes of user service-aware time delay KQI and segmentation delays are analyzed in order to achieve a comprehensive,timely and accurate perception assessment of mobile Internet business users.Optimized configurations of seven parameters which include DRX related parameters and intelligent pre-schedule related parameters was done,and the test that getting time delay KQI indicators from mainstream websites was completed.It was proved that the proposed optimization scheme can effectively improve the service-aware time delay KQI of mobile users.

Key Words: mobile internet; user experience;time delay KQI;service-awareness

0 引言

隨着移动通信网络的发展,各运营商围绕移动数据业务的争夺愈发激烈,用户对于真实网络环境下的用户体验要求近乎苛刻,网络质量与用户体验成为运营商在4G时代决胜的关键。然而,传统单纯以绩效指标(KPI)为参照的考核标准,已不能完全体现真实的网络性能,且无法准确、及时地根据实际用户体验进行LTE网络优化[1-5]。因此,各运营商拟定了关键服务质量指标(KQI),建立了面向业务及市场价值的网络分析体系[6-9]。以KQI为基础的网络环境监测与分析方法在网络环境优化中同样扮演着重要角色,其能够从端到端的视角审视影响网络建立时长、业务使用质量、网络流畅度及服务响应时间等关键服务质量指标(KQI)的因素,并梳理与这些影响因素相关的关键绩效指标[10-13]。由于传统面向KPI与客户投诉等以问题为导向的网络优化方法存在人工操作效率低、质量问题定位周期长等缺点,所以由KPI指标测评方式转变为以面向用户感知时延类KQI测评方法为主导的测评方式是十分必要的,各大运营商急需一套移动用户业务感知时延类KQI优化方案,以实现先于用户发现问题并对问题进行优化[14-17]。

从“面向网络”的KPI评价向“面向用户感知”的KQI评价转变,通过“主动化”、“精细化”的运营方式,使客户得到良好体验,是运营商推进业务发展并确保市场竞争力的关键因素之一。本文对移动互联网主流业务以及影响用户业务感知质量的相关因素等进行研究与分析,提出一种用户感知网页时延KQI优化方法,并对优化前后的网页时延测试结果进行对比分析,以期为将来进一步优化移动用户业务感知KQI提供借鉴。

1 业务感知时延类KQI介绍

1.1 用户使用智能手机(或电脑)浏览网页过程

一般而言,用户使用智能手机或电脑设备浏览网页过程主要包含以下几个步骤[18]:①用户开机;②终端与基站建立业务信道(RRC连接)和无线承载(E-RAB);③用户输入网址,点击确认;④若终端不知道该网页IP地址,则对DNS服务器进行DNS查询,否则直接提取终端内该网址对应的IP 地址;⑤终端发送GET/POST 消息给对应SP,SP作出应答;⑥用户请求访问的内容显示在终端屏幕上;⑦前向/反向数据传送完毕后,关闭TCP连接。

1.2 浏览类时延占比分析

纵向分阶段分析给出影响网页浏览时延的主要阶段以及各纵向阶段时延占比,一次完整的网页打开流程包含以下7个阶段:①无线接入(无线空口连接+EPS承载建立);②DNS查询;③TCP 3次握手;④SP响应(下发GET的ACK以及第1个数据包);⑤SP下发首个GET的后续数据包;⑥SP陆续下发其它GET的响应数据包;⑦TCP 4次握手。

打开网页时,页面首包时延各段占比情况如图1所示,从图中可以看出,无线接入时延与SP响应时延在4种主要时延中占比超过81%。

2 业务感知类分段时延

通过分阶段进行时延统计并锁定异常时延阶段,可为后续网页时延分析指明方向[19-20]。

2.1 网页首包时延

网页首包时延是指统计手机发送的第一个DNS查询请求消息到手機收到SP下发的第一个TCP数据包之间的时延,其计算公式如下:

网页首包时延=手机抓包抓取的DNS查询时延+TCP握手时延+GET首包时延+SP处理时延(终端侧)

其中,手机抓包抓取的DNS查询时延=无线接入时延+DNS正常查询时延, GET首包时延为SP响应时延。

为便于理解,从网页打开流程上看,首先为无线接入过程,然后为DNS 查询过程,但实际情况是,在空闲状态时,首先进行DNS查询请求,再进行无线接入,接入成功后才将DNS查询请求发送出去,所以手机抓包抓取的DNS查询时延包含无线接入时延。

2.2 网页打开时延

只要某网页的第1个GET消息获得响应且本次GET 获取的数据包完全下发给终端,则认为该网页已经打开。一般而言访问网页产生的第1个GET消息用来获取网页的HTML框架文件,网页打开时延计算公式如下:

网页打开时延=网页首包时延+主页下载时延

需要注意的是,当终端处于激活状态并进行网页浏览时,是在已有的无线承载上发送业务包,所以此时的无线接入时延为0;当终端处于空闲状态时,任何上层业务请求都会触发建立RRC连接以及无线E-RAB承载,此时无线接入时延必然大于0。

2.3 网页完整打开时延

一个网页由很多元素组成,只有把所有元素都下载到终端并加以显示,网页才算完整打开。考虑到不同客户端与服务器端的连接策略不同,网页完整打开时延不仅受网络质量影响,还与用户行为有关,而且不同SP的网页大小不同,所以该指标不建议作为时延感知的考核指标,而仅作参考用途。该指标定义为归属某个网页的所有GET消息中,最后一个GET响应消息距离触发第1个GET的Service Request消息间的时延。

2.4 DNS查询时延

DNS 查询时延是UE浏览器客户端向DNS服务器查询目的域名IP地址过程中引入的时延。由于客户端在获取一次DNS查询结果后,会将该结果缓存,直到查询结果的老化时间结束,才会再次发起DNS查询,这意味着DNS查询不是每次网页浏览业务必须经历的业务环节。

2.5 TCP握手时延

在获取服务器IP地址后,客户端即发起对应IP的TCP链接建立请求,与服务器侧交互,建立TCP链接,此时产生的时间即为TCP握手时延。

2.6 GET首包时延

GET首包时延也被称为SP响应时延,是指从客户端发起GET请求消息,到客户端接收到应用层响应第一个数据包时产生的时间间隔。

2.7 SP处理时延(终端侧)

SP处理时延(终端侧)是指从客户端收到GET请求报文TCP的ACK,到接收完服务器下发首个业务包的时延。该时延指标主要反映服务器的业务响应性能。

2.8 主页下载时延

主页下载时延是指客户端收到服务器针对首个GET消息下发的首个业务包,到收到服务器下发的针对首个GET消息最后一个业务包的时延。该时延指标取决于首页大小及传输通道性能。

3 用户感知网页时延分析手段

对某片区域进行网页浏览业务时延KQI测试主要有3种方法,分别为手机浏览器APP+抓包、skyruler网页浏览测试、专业业务感知网管评估。根据不同的现场环境,可以结合实际情况选择不同方式进行感知测试。

3.1 手机浏览器APP+抓包

手机浏览器加抓包的方式最为原始,效率最低,但最容易实现。需要在手机上安装主流的浏览器(例如QQ浏览器等),然后手动访问某测试网站,同时安装手机抓包APP 及防火墙APP一起配合测试。防火墙APP的作用是避免在抓包时产生过多非网页测试的杂包,从而给后续抓包数据分析造成不便。而且,由于本方法无法抓取无线侧LOG,所以无法评估无线环境对业务感知的影响。

3.2 专业业务感知网管评估

国内三大运营商已经建立了较为成熟的专业业务感知网管系统,包括话务网管、电子运维、数据网管、传输网管等。运营商可通过专业业务感知网管采集DPI并部署APP,完成对KQI指标数据的采集。

3.3 skyruler网页浏览测试

该方法不用安装专业的抓包APP应用,skyruler可以同时实现无线侧LOG抓取与网络抓包,比以上两种方式更加高效便捷,但采用这种方式需要购买license。

4 用户感知相关参数优化

4.1 DRX相关参数调整

对于LTE而言,进入DRX(非连续接收)状态的UE(用户体验)对业务响应可能会有一定延迟,苏醒态的UE一直在监听PDCCH信道,进入休眠态后则不再监听,要等从休眠态重新进入苏醒态后再继续接收。如果控制信道中信息传送时UE恰好处于休眠态,则会对信息接收产生影响,即产生延迟。但是LTE一般都是数据业务,且业务是连续性的,一旦有控制信息传送过来,UE则会退出DRX周期,而且在业务进行期间不再受到DRX影响。

UE进入DRX状态一般是在网络不活动或系统未开展业务时,用户基本上不会感觉到网络质量的波动。为了验证DRX相关参数对首包时延的影响,对DRX相关参数进行调整,主要包括DRX短不连续循环周期定期器长度、在DRX循环周期中UE苏醒时间长度与DRX非激活定时器等,具体配置参数调整如表1所示。

4.2 TCP乱序重排功能打开

TCP乱序重排功能开关指示了eNodeB是否允许使用TCP重排序功能,在该开关被打开时,来自核心网乱序的TCP业务会在eNodeB侧被重新排序,并按照TCP序号顺序被发送到空口中;在该开关关闭时,eNode按照从核心网的接收顺序将业务数据发送到空口中。打开该开关有利于减少TCP业务的传输时延和抖动,而且会对下行TCP报文进行乱序纠正,但同时也对CPU的利用率造成一定影响。

4.3 TCP ACK分裂开关打开

TCP ACK分裂开关打开后,在TCP传输的慢启动阶段,TCP ACK数量增多,相应可以加快TCP发送窗口的扩展。对于TCP层采用隔段确认方式的场景,通过TCP ACK分裂进行逐段确认,可以有效加快TCP慢启动过程发送窗口的速度,使每一轮RTT周期可发送的数据量增长率更高,从而降低了网站主页主框架文件的下发轮次。也即是说,通过ACK分裂加速了服务器的下行发包速度,从而使网页打开时延与网页完整打开时延得到不同程度的降低。

4.4 PDCP丢弃定时器调整

PDCP从高层接收到一个PDU,即会启动一个定时器,当超时后没有收到底层(RLC)指示时,则会丢弃此SDU,该定时器时间即为PDCP SDU的丢弃定时器时长。

PDCP层丢弃定时器的主要目标是通过RLC的最大32次重发机制,保证数据包能够到达目的地。PDCP在10ms后即被丢弃,触发上层应用层重发机制,可能造成业务时延变得更长,因此需要保证绝大多数数据包通过RLC层重发都可得到正常发送。如果底层重发后仍有部分包丢失,则应调整为使用上层应用层快速重发,此时需要调小discard time。

对于“PDCP反传时是否发送状态报告”这一参数,用于决定在PDCP重建时,是否给对端发送状态报告。启用PDCP发送状态报告,会在切换或PDCP重建过程中,使目标小区了解源侧小区PDCP层SDU丢失的位置SN值,并使目标小区获取PDCP SDU的失序状态,了解失序个数与SN值。同时也会让目标侧获取未收到SDU包的位置,使目标小区更快地了解已成功传输的PDCP SDU,避免无限次重复发包,从而降低业务时延、提升速率。具体的PDCP丢弃定时器参数调整情况如表2所示。

4.5 上行混合调度算法修改

混合调度模式将在预调度持续时间内,定时、主动地向UE发送上行资源,UE利用该资源发送上行数据。UE发送上行资源的原有流程为:UE发送SR请求,基站检测到SR后,产生虚拟的BSR进行启动与调度,UE利用预调度资源发送ping包的上行数据与BSR。由于基站是周期性地对UE分配上行资源,而减少了UE发送SR的流程,从而缩短了ping包的时延。

在商用模式下开启上行混合调度,由于系统总用户量较大,大量的上行资源预授权会导致基站的反向干扰加强,影响基站反向解调性能。

4.6 SRI轻负载门限

在UE打开网页过程中,UE可能因为基站小区用户接入过多,造成SRI资源负载过大,因而导致用户数据接入时延变长,使UE网页打开过程变慢。通过分析网络优化过程发现,可以通过调整PUCCH资源分配算法中的“SRI轻负载门限”参数,增大基站小区判决SRI资源负载状态的接入用户数门限值,从而降低HTTP页面打开时延。与之对应的可同时将“SRI周期自适应开关”参数修改为“NOQCIADAPTIVE”,即基站仅根据小区SRI资源负载状态,自适应地调整用户SRI周期。经多次与多小区测试验证,该措施能有效降低部分网站的HTTP首包时延,但需注意其门限值需根据基站带宽进行合理设置,避免因该值设置过大,造成基站对小区SRI资源负载状态的判决混淆。

SR机制的基本作用是可以更有效、充分地管理基站上行資源,以更合理地为用户分配上行资源。如果UE没有上行数据需要传输,eNodeB为了防止资源浪费,则不用为该UE分配上行资源。因此,为获得eNodeB分配的上行资源,UE需上报eNodeB,告知其存在上行数据需要传输,eNodeB收到请求后,根据此时上行信道质量及SRI资源负载状态分配上行资源给UE。UE在接收到eNodeB发送的资源分配通知后,开始进行数据传送,直到eNodeB完整收到数据包。

在整个回环过程中,引入SRI轻负载门限以及SRI周期自适应开关算法机制,可以通过扩大基站小区判决SRI资源负载状态的接入用户数门限值,使eNodeB能够给UE分配更充足的资源。同时eNodeB可根据SRI资源负载状态,自适应地调整用户周期,以减少整个过程的回环时间。SRI轻负载门限参数调整具体如表3所示。

4.7 智能预调度开关

在用户需要进行资源调度时,在智能预调度打开的情况下,不管用户是否激活DRX,终端都将进入智能预调度模式。智能预调度相比于普通预调度方式,在降低上行Ping时延与提高网页打开速度方面有更好的用户体验。通过多次测试验证,该方案能有效降低部分网站的HTTP首包时延,对UE待机时长也有一定提升。智能预调度和普通预调度在DRX与非DRX模式时的组合控制关系如表4所示。

网管中打开智能预调度方法为:

打开智能预调度的意义为:

(1)对上行ping时延的影响。打开DRX,可以减小上行ping时延;关闭DRX,则导致上行ping时延增加。

(2)对异常掉话终端的影响。打开智能预调度后,即使终端进入DRX模式,基站在下行调度后,如果有剩余预调度资源,终端的RLC状态报告可以不用申请上行调度请求,而直接通过预调度上报给基站,从而避免了异常终端在DRX下不发送SR,导致基站收不到RLC状态报告而掉话的问题。

根据其它区域通过智能预调度提升KQI的评估效果及经验总结,对部分预调度参数进行优化调整,打开预调度和智能预调度开关,增加每个用户的预调度数据量,缩短终端调度周期间隔,减小时延。智能预调度相关参数调整具体如表5所示。

5 用户感知优化实例

使用用户感知相关参数优化中介绍的各参数“默认值”与“建议修改值”,分别对百度、淘宝等主流网站的KQI值进行外场测试,使用的网络为普洱市电信网,选择同一定点对目标网站进行参数修改前后的对比测试。

本次测试对象为百度、搜狐、淘宝、腾讯、网易、新浪共6个主流网站,外场测试结果如表6所示。表6中对参数修改前后各网站的时延测试结果进行了对比,从表中可以看出,使用改进后参数获得的首包时延、页面打开时延、DNS解析时延等6项测试指标均得到不同程度降低。

参数修改前后的总时延对比情况如图2所示,可以明显观察到,使用修改后的参数对6个目标网站进行测试,得到的总时延值均明显小于参数修改前获得的总时延值。

6 结语

通过以上研究与测试表明,使用本文提出的优化方案改进用户感知相关参数,能够有效优化移动用户业务感知时延类KQI。无线网络参数调整对网络的影响是多方面的,除对上述时延类指标的影响外,同样需要关注其对吞吐率、接入性、保持性等KPI指标的影响情况,评估效果后再进行参数修改,以实现对全网KQI指标的优化。

参考文献:

[1] 祝娜. 基于UE的数据业务优化模型及应用[J]. 通信技术,2013(7):99-102.

[2] 苑婷婷. LTE系统语音业务质量评估与性能优化[D]. 北京:北京理工大学,2015.

[3] 耿迎春. 4G网络面临的问题及优化方式之研究[J]. 通信设计与应用,2016(2):2-3.

[4] 罗军舟,吴文甲,杨明. 移动互联网:终端、网络与服务[J]. 计算机学报,2011,34(11):2029-2051.

[5] 戴鹏程,沈亮,万仁辉,等. 流量业务用户感知的评估方法分析[J]. 电信工程技术与标准,2014(3):11-15.

[6] 陈森, 陈超, 张小勇,等.  基于大数据分析的移动互联网用户感知评估系统[J].  电信科学, 2015, 31(4):148-155.

[7] 董良松. 基于A+ABIS的KQI网络优化分析[J]. 科技展望,2016,26(22):14.

[8] 曹恒. WCDMA无线网与传输网互联方案优化研究[J]. 邮电设计技术,2012(7):61-66.

[9] 张小林,廖章君,曹磊,等. 基于移动互联网的端到端移动用户感知评估研究[J]. 现代电信科技,2012(11):73-76.

[10] 吴涛,董振亮,董励. 基于KQI和KPI指标映射的模糊计算方法[J]. 吉林大学学报,2015(1):95-100.

[11] 刘冰. 基于用户感知的网络优化项目质量管理研究[D]. 北京:北京邮电大学,2012.

[12] 陈德金,郑成林,吴智恺. LTE移动用户感知模型研究[J]. 电信技术,2015(3):14-16.

[13] 操宜洁. 移动通信集团客户价值评估模型的研究[D]. 上海:上海交通大学,2011.

[14] 马啸威,曹维华,李文云. 移动互联网业务感知质量优化方法及系统[J]. 广东通信技术,2017(2):40-45.

[15] 戴明珠. 云南电信移动互联网业务感知提升研究[D]. 南京:南京邮电大学,2015.

[16] 杨琨琨. 互联网业务质量评估模型研究[J]. 电信技术,2014(2):100-104.

[17] ISMAIL M,ZHUANG W.A distributed multi-service resource allocation algorithm in heterogeneous wireless access medium[J]. IEEE Journal on Selected Areas in Communications,2012,30(2):425-432.

[18] 李鹤. 移动互联网业务使用行为影响因素研究[D]. 北京:北京邮电大学,2010.

[19] 龙青良,张磊. 基于用户感知的LTE网络优化关键问题研究[J]. 邮电设计技术, 2014(10):14-20.

[20] 叶青,安瑞虹. 基于移动互联网的业务质量和用户感知评测方法研究[J]. 邮电设计技术,2014(9):40-44.

(責任编辑:黄 健)

猜你喜欢
用户体验移动互联网
微美学
浅谈用户体验在产品设计中的运用
唯品会的品牌塑造研究
大数据环境下基于移动客户端的传统媒体转型思路
基于移动互联网的心理健康教育初探