罗 锐,黄鹂声,张振宇,薛 红,欧阳千玮,谈澄秋
(1.成都师范学院 计算机科学学院,成都 611130;2.电子科技大学 计算机科学与工程学院,成都 611731;3.西南交通大学 信息编码与传输重点实验室,成都 611756;4.重庆邮电大学 国际学院,重庆 400065;5.中国移动通信集团四川有限公司,成都 610095)
5G高速率、低时延的特性为移动网络视频业务带来了全新的视觉体验,视频业务已经成为5G网络主流应用.据爱立信移动市场报告数据[1],到2025年,移动视频流量在移动数据总流量中的占比将从2019年的略高于60%增长到近75%;另一方面,在5G时代,通信市场竞争日趋激烈,由于无线网络质量的影响,用户网络视频业务在体验过程中经常出现视频启动时间太长、黑屏和卡顿时间过长等问题,直接导致用户满意度下降、投诉量增加,甚至离网等后果.为此,运营商需要精确评估和掌握用户在使用网络视频业务过程中的体验质量,以便提前发现质量问题,进一步开展客户关怀、网络维护优化工作.因此,做好5G网络视频业务质量评估,及时发现网络视频业务运行过程中的问题,成为通信运营商亟待解决的课题,研究一套准确率高、易推广的5G网络环境下的网络视频质量分析方法成为迫切需求.
目前通信运营商采用的网络视频质量分析方法主要包括视频信令检测法、探针拨测法、直接深度包检测(deep packet inspection,DPI)解析法和呼叫/事务/会话数据记录(extend data recording,XDR)大数据法四类.视频信令检测法是运营商通过部署的统一DPI系统,提取视频播放过程中交互的视频播放时长、卡顿等信令数据,计算视频播放质量[2-5].视频信令检测法的优势是实施简单、准确率高,但若视频内容源服务商采用加密协议来传输视频数据,或修改了信令流程,都会导致运营商无法进行网络视频质量分析.探针拨测法是在网络中布放视频质量监测终端,视频质量监测终端对各主要网络视频模拟用户行为进行自动拨测、分析,从而获取视频质量分析结果[6-7].探针拨测法实施简单,也是运营商应用较多的视频质量分析方法,但探针拨测法获得的视频质量分析结果无法代表真实用户使用视频业务时的真实视频感知质量.直接DPI解析法是在运营商网络链路上部署DPI设备,对视频播放的流量进行捕获、抽取、解析,获取视频质量相关数据指标,在此基础上,分析、计算网络视频质量评价值,文献[8-18]都是直接DPI解析法,区别在于提取的视频数据指标不同,计算视频质量的方法不同.由于直接DPI解析法需要在网络链路上部署专门的DPI设备,在运营商已经部署统一DPI系统对网络流量进行全量采集、解析处理[19-20]的情况下,直接DPI解析法再单独部署专门的DPI设备,显然浪费投资.XDR是由呼叫数据记录(call data recording,CDR)演变而来的概念,CDR是传统通信网中对通话过程中网络关键信息的记录,XDR是CDR概念的扩展,泛指对通信网络中数据流量的关键信息记录,即流量日志,XDR以用户会话为单位,一个会话形成一条XDR记录,也称为一条XDR话单.为了对通信网络上承载的流量进行业务质量分析,各通信运营商都按技术规范部署了统一DPI系统,将通信网络上的流量数据复制一份到DPI设备,对通信网络上承载的所有流量进行解析、处理、保存,相应生成XDR大数据.XDR大数据法是利用运营商现有XDR大数据加工生成视频质量分析结果.文献[21-22]提出在运营商XDR大数据基础上,通过数据挖掘,实现包含视频业务在内的各种互联网业务质量的分析,该方法由于充分利用了运营商现有数据资源,降低了实施成本,但运营商XDR数据量大,数据粒度细,往往一次视频业务过程就对应数十条XDR话单,直接应用原始XDR话单进行数据挖掘需要耗费大量存储和计算资源,部署实施技术的可行性和经济性存在问题.为此,文献[23]提出,先从XDR大数据中提取出与视频质量相关性高的少量视频质量特征信息,将大规模、低价值的XDR话单数据转化为高价值、小规模的视频质量特征信息,在此基础上,应用机器学习算法实现视频质量的分析评价,以降低部署实施成本、提高视频质量分析的准确性,取得更为精确的视频质量分析评价结果,但文献[23]的视频质量分析方法只是针对一般的数据传输信道,未针对5G网络无线信道的特点进行优化.本文将在文献[23]基础上,针对5G无线信道的时变衰落特性和网络视频播放的缓冲机制,在视频质量特征信息指标加工过程中引入下行丢包率集中度指标,反映5G信道变化对视频播放质量的影响,以在充分利用运营商统一DPI系统、节约成本的同时,进一步提高视频质量分析评价的准确性.
在5G网络中,影响网络视频质量的主要是无线信道质量.在无线网络中,终端接收到的无线信号传播特性如图1所示,它包含了快变和慢变分量,变化较慢的慢衰落很大程度上可以通过功率控制加以均衡,而快衰落则不容易通过功率控制予以均衡,导致无线信道上的数据传输出现误码,进而产生丢包,同时,由于5G信道容量更大,同样的无线信道快衰落在5G网络中将会导致更多的丢包,无线信道衰落对网络视频业务质量的影响也更大.
图1 无线信号传播特性Fig.1 Wireless signal propagation characteristic
在网络视频播放方面,为了节约网站流量,节省视频内容源服务器资源,几乎所有的视频点播网站都采用视频数据分片传输方式,如图2所示,网站将一次视频播放的整个视频文件分为若干个视频分片文件,在视频播放过程中,根据当前播放进度和最大缓冲距离,算出一个允许缓冲位置,在这个允许缓冲位置之内的视频分片文件都通过5G网络依次在播放之前先下载到播放视频的终端中.
图2 视频数据下载播放过程Fig.2 Video data downloading and playing procedure
在网络视频播放的过程中,由于视频缓冲的存在,无线信道衰落导致的丢包率增加虽然会影响衰落期间视频分片文件的传输、下载,但并不一定会导致视频播放出现卡顿,只要终端的视频缓冲中有视频数据供播放,就不会出现视频播放卡顿,因此,5G无线信道衰落导致的丢包率增加并不一定引起用户视频播放质量的下降,除非无线信道衰落导致连续一段时间丢包率的增加,使得终端视频缓冲中无视频数据可供播放.
为了对5G网络上承载的流量进行分析,运营商部署的DPI设备对5G所有流量数据进行解析、处理后,对流量数据中的关键信息进行记录,生成XDR大数据.根据《中国移动5G上网日志留存系统技术规范v1.0.0》(中国电信和中国联通技术规范类似),用于视频质量分析的部分XDR话单数据记录格式见表1.
表1 部分XDR数据格式Tab.1 Format of some XDR data
基于XDR大数据的5G视频质量分析全过程如图3所示,虚线左边为视频质量分析模型的训练部分,虚线右边为视频质量分析模型的应用部分.在模型训练部分,在XDR大数据中选取部分视频播放记录作为训练对象,在XDR大数据中提取与这些视频播放记录对应的XDR话单,并对这些XDR话单作加工变换,针对每一次视频播放记录生成一组对应的特征信息指标,作为训练数据集的特征指标;同时,提取这些视频播放记录的视频播放质量信息,作为训练数据集的标签数据,将训练数据集的特征指标和标签数据输入机器学习模型,通过模型训练获得视频质量分析模型.在模型应用部分,针对每条视频播放记录提取对应的XDR话单数据,通过同样的加工变换,得到与该视频播放记录相对应的一组特征信息指标,输入视频质量分析模型,即可计算得到该条视频播放记录的视频质量分析结果;然后,将该分析结果提交网络维护和客户管理人员,指导网络维护和客服人员有针对性地开展工作.5G视频质量分析的关键是针对每次视频播放记录,在表1所示XDR话单数据格式基础上,通过加工变换,生成一组特征信息指标,用于视频质量分析模型的训练或视频质量分析结果的计算.
图3 5G视频质量分析全过程Fig.3 5G video quality analysis procedure
在网络视频业务播放过程中,视频数据将从内容源服务器传输到用户终端.无线信道的衰落导致5G信道呈现时变特性,因而在同一次视频播放过程中的不同时间段,视频数据可能具有不同的传输质量,进而可能呈现出不同的视频播放质量,因此,在视频质量分析中,需要对视频播放的完整时间过程进行分时段的切片,针对每个切片分别计算特征信息指标,在此基础上,再将所有切片的特征信息指标进行汇聚,从而获得反映视频播放全过程质量的一组特征信息指标.在XDR话单数据基础上,加工生成的与视频质量强相关的特征信息指标见表2.
表2 视频质量特征信息指标Tab.2 Information characteristic indicators of video quality
在与视频播放对应的5G网络视频数据传输中,一次视频业务播放过程可能对应于5G网络中多次的数据传输.相应地,在XDR大数据中,一次视频播放可能对应XDR大数据中多条XDR话单,这些XDR话单在时间上存在相互重叠,构成一个XDR话单群.由于在视频数据传输过程中的同一时刻可能存在多条XDR话单,这些XDR话单都与该时刻的视频质量有关,因此,决定该时刻视频质量的特征信息指标应基于该时刻的多条XDR话单进行计算.采用文献[23]的切片数据加工方法,从XDR大数据中加工、提取出反映一次视频播放质量的特征信息指标包括以下步骤:
1)将与一次视频播放相对应的多条XDR话单聚合为一个话单群,再将聚合的XDR话单群按时间切片;
2)在每个切片时间窗内加工生成新的、与视频播放质量强相关的特征信息指标;
3)在切片特征信息指标基础上,汇聚生成对应一次视频播放过程的一组特征信息指标.
3.1.1 XDR话单群的聚合
如图4所示,将运营商XDR大数据中对应同一次视频播放的多条视频XDR话单进行聚合,形成XDR话单群,其中:每一条线段表示一条XDR话单记录,线段的2个端点分别代表该XDR话单的起止时间.一个XDR话单群应满足以下条件:话单群中任意一条XDR话单,均能在本群中找到至少一条起止时间与之部分或全部重合的XDR话单;不同XDR话单群之间存在明显的时间间隔.
图4 XDR话单聚合Fig.4 XDR data records aggregation
假设话单群为x,x={c1,c2,…,ci,…,cn},其中ci表示第i条话单,其话单开始时间为si,结束时间为fi,则对于话单群中任意话单ci,在该话单群中都存在话单cj,有
话单群x的开始时间为stx,则stx=min{si|ci∈x};结束时间为ftx,则ftx=max{fi|ci∈x}.对于不同的2个话单群x和y,若stx<sty,则有sty-ftx>T,其中T为话单群之间最小时间间隔.
3.1.2 XDR话单群的切片
将同一个XDR话单群的总持续时长(最大结束时间与最小开始时间的差值)平均切分为多个固定时长的时间窗口,形成时间窗口记录列表,然后对同一XDR话单群中的所有话单按照该时间窗口进行数据切片,为话单群的每个时间窗口生成一条唯一的时间窗口记录,在该时间窗口记录中的各个特征信息指标来自于与该时间窗口部分或全部重合的多条XDR话单的同一切片统计结果.
话单群x的总持续时间为dtx,则dtx=ftx-stx,若将话单群x的总持续时间dtx平均切分为n个时间窗口,则第i个时间窗口wndi的开始时间wnd_sti满足
第i个时间窗口wndi的结束时间wnd_fti满足
第i个时间窗口wndi的持续时间
在切片时间窗口内,在XDR话单数据基础上加工生成新的特征信息指标,以下行数据包数量DL_PACKET指标为例进行说明.定义DL_PACKETi,k为XDR话单群中第i条XDR话单记录ci的DL_PACKET指标DL_PACKETi在第k个时间窗口wndk的分量值,则第k个时间窗口wndk的DL_PACKET指标WND_DL_PACKETk为该话单群中所有XDR话单在第k个时间窗口wndk的分量值之和,即
假设第i条XDR话单记录ci的DL_PACKET指标变量关于时间为均匀分布,且第i条XDR话单记录ci与第k个时间窗口wndk重叠的时间为Toverlap,第i条XDR话单的起始时间为si,终止时间为fi,则
其中的Toverlap计算式为:
类似地,可以计算第k个时间窗口切片内下行数据包的丢包数WND_DL_LOSTk.在此基础上可以计算第k个时间窗口切片内的平均下行丢包率类
似地,可以计算第k个时间窗口切片内的平均上行丢包率WND_UL_PLRk和平均下行速率WND_AVG_DL_BPSk.
3.3.1 下行丢包率集中度
在5G网络视频播放的过程中,无线信道衰落导致的丢包率增加显然会降低衰落期间视频分片文件的下载速度,但由于视频缓冲的存在,并不一定会导致视频播放出现卡顿,丢包率的增加是否会导致视频播放出现卡顿,还取决于丢包率增加的时间分布,只有连续出现丢包率增加导致缓存中的视频数据耗尽,无法满足视频播放需求时才会出现卡顿.显然,信道衰落在时间轴上的分布时间越长,就越可能导致视频卡顿出现.因此,在分析视频质量的特征信息指标中,除了丢包率等反映信道传输整体质量的指标外,还需要引入反映视频数据传输过程中丢包率集中程度的指标.
在气象、水文的研究中,通常采用集中度刻画降水、降雪、河流径流量等在时间分布上的集中性[24-26].本文针对视频播放过程中下行视频数据的传输,引入下行丢包率集中度对视频数据传输过程中丢包率增加的连续性进行刻画.在计算下行丢包率集中度的过程中,先将XDR话单群各个时间切片的丢包率转化为一个丢包率矢量,再将所有时间切片的丢包率矢量进行合成,合成后矢量的模与所有时间切片丢包率总和的比值定义为下行丢包率集中度.各个时间切片丢包率矢量的模为其丢包率.将所有时间切片序列从0°开始按顺序均匀分布在一个圆周上,丢包率矢量的方向为该时间切片在圆周上与0°之间的夹角.视频质量分析中,下行丢包率集中度DL_PLR_CD的具体计算式为
下行丢包率集中度DL_PLR_CD体现了视频播放过程中视频数据传输丢包在播放期间各个时间切片中的集中程度,取值在0~1之间,其值越接近于1,表示网络视频数据传输过程中的丢包发生越集中,相应导致视频播放卡顿的可能性也就越大.在下行丢包率集中度DL_PLR_CD基础上,相应可汇聚计算特征信息指标中的快推质量标记和传输质量评分.
3.3.2 特征信息指标汇聚加工
在得到XDR话单群中所有时间窗口切片的平均下行丢包率WND_DL_PLRk、平均上行丢包率WND_UL_PLRk和平均下行速率WND_AVG_DL_BPSk的基础上,分别取均值,计算一次视频播放过程的对应指标:平均下行丢包率DL_PLR、平均上行丢包率UL_PLR和平均下行速率AVG_DL_BPS.每个XDR话单群的推测码率MR为:
快推质量标记为
传输质量评分为
为评估5G衰落信道下的视频质量,在上午8:00至9:00期间,随机选取1万条播放时长大于5 min的视频播放记录,共有5万条视频播放记录及其对应的XDR话单作为训练数据集.后续采用类似方法每天选取1万条视频播放记录及其对应的XDR话单作为测试数据集.
在视频质量分析模型训练时,训练数据集中不但要有每个视频播放记录样本的特征数据,还需要将每个样本的视频播放真实质量信息作为标签数据.获取网络视频播放质量真实信息的方法分为两大类:主观质量评分方法和客观质量评分方法[27-29].主观质量评分方法[30]要求测试用户数量不能太少,且必须严格按照规范安排测试环境,因此,主观质量评分方法操作步骤繁琐,测试程序复杂,也无法实现实时地对网络视频质量进行评分;客观质量评分方法[31]通过IT系统提取网络视频播放过程中的网络参数,利用算法自动计算网络视频质量评分结果,不需要安排测试用户观看视频、反馈评价结果,可以实现实时地对网络视频质量进行评分,因而研究中通常更多采用客观质量评分方法.本文训练数据集和测试数据集采用客观质量评分方法获取网络视频播放的真实质量信息.在用户的5G网络视频播放过程中由于通信运营商主要负责视频数据的传输,及主要关注由于5G网络传输导致的视频播放卡顿,因此,本文以视频播放过程中的卡顿情况作为网络视频客观质量评分的依据,具体以整个视频播放过程中卡顿的时长占整个视频播放时长的百分比乘以100作为百分制的网络视频质量真实评分.本文通过运营商的统一DPI系统提取5G网络视频播放过程中的播放起止时间和卡顿起止时间信息,从而获得网络视频播放质量的真实评分.
评估视频质量的性能指标通常有平均绝对误差(mean absolute error,mae)、均方差(mean squared error,mse)和平均偏差误差(mean deviation error,mde),分别定义如下:
其中:Yi为视频质量真实评分;为视频质量预测评分;N为样本总量.
运营商视频质量分析主要用于评估和掌握用户在使用5G网络视频业务过程中的体验质量,以便提前发现质量问题,进一步开展客户关怀、网络维护优化工作.如果视频质量预测评分与视频真实质量评分差异不大,则视为预测正确,可将其应用于运营商的生产经营;反之,则视为预测不正确.在实际工作中,视频质量预测评分和视频质量真实评分差距在10分以内,视为预测正确,可用于生产经营;否则,为预测错误.相应地,采用准确率作为评估视频质量分析结果准确性的指标,其计算式为
准确率accuracy表示在总样本量中预测正确的号码总量占总号码量的百分比,反映了视频质量分析结果的可用度.
在相同的训练数据集上,采用Kaggle竞赛中广泛使用的xgboost(extreme gradient boosting)算法,分别基于本文提出的视频质量特征信息指标加工方法和文献[23]方法训练视频质量分析模型,并在10万条视频播放记录及其对应的XDR话单构成的测试数据集上测试.图5~7分别利用mae,mse和mde 3个性能指标对2种方法下的视频质量分析结果进行比较,可以看到,本文提出的方法较文献[23]方法都有明显的提升.
图5 5G视频质量分析评价绝对误差对比Fig.5 Comparison of 5G video quality analysis of mae between two methods
图6 5G视频质量分析均方差对比Fig.6 Comparison of 5G video quality analysis of mse between two methods
本文方法与文献[23]方法在测试数据集上的视频质量分析准确率比较如图8所示.从图8可以看出:本文方法的准确率约为87%,而文献[23]方法的准确率约为84%,说明在5G网络视频播放过程中,本文根据5G无线信道的衰落特性和网络视频播放的缓冲机制,在视频质量特征信息指标加工过程中,引入下行丢包率集中度指标,在此基础上加工生成视频质量特征信息指标,并使用该指标通过训练生成视频质量分析评价模型,有效提升了视频质量分析评价模型的准确率.
图7 5G视频质量分析平均偏差误差对比Fig.7 Comparison of 5G video quality analysis of mde between two methods
图8 5G视频质量分析准确率对比Fig.8 Comparison of 5G video quality analysis accuracy between two methods
针对5G网络环境下的网络视频质量分析,本文在运营商统一DPI系统的XDR大数据基础上,针对每一次网络视频播放,聚合相应XDR话单并进行切片,形成切片特征信息指标,在此基础上,将切片记录的特征信息指标汇聚成视频播放全过程的视频特征信息指标;在视频质量特征信息指标汇聚过程中,针对5G信道的时变衰落特性和视频数据传输的缓冲机制特点,引入下行丢包率集中度指标,以反映5G信道变化对视频播放质量的影响,在此基础上通过训练生成视频质量分析评价模型.仿真实验结果表明:与现有的视频质量特征信息指标加工方法相比,本文所提方法生成的视频质量分析评价模型的准确率更高.