成 刚(上海诺基亚贝尔股份有限公司,上海200127)
Wi-Fi下的视频传输质量的提升近年来一直是技术研究和关注的重点。统计数据显示2013年的视频传输流量占终端用户数据流量的60%,预计2018年视频传输的流量占终端用户数据流量的75%[1]。室内Wi-Fi网络中的视频应用已经是Internet上数据传输最重要的流量来源。
视频流从Wi-Fi的AP转发到各个终端时,既可以是单播也可以是组播。在IEEE 802.11的Wi-Fi网络中,终端每收到一个单播数据包就会返回一个确认数据包。当数据包丢失或被破坏时,AP能重新发送相同的数据报文。同一个无线网络中,如果终端数量较少并且速率较低,用单播方式传播视频是有效的方式。但一旦终端数量增加并且有较高速率要求时,播放视频占用的网络总带宽就会迅速增加,影响网络中其他数据业务的带宽需求。
通过组播方式来传输视频可以有效节省带宽。当Wi-Fi AP在使用组播地址传输视频流的时候,加入组播组的多个Wi-Fi终端能同时接收视频的数据包。但是传统的802.11的MAC层不支持组播数据包的确认,即终端不会对每一个组播包发送响应确认消息,否则每个终端发送的响应数据包将产生大量的额外开销,从而降低整体的数据传输性能。但缺少对组播数据包的确认和重传机制的MAC层传输是不可靠的。在Wi-Fi环境中,由于不稳定的无线环境和信道干扰,视频组播传输的可靠性比单播方式差,从而导致视频传输质量的下降[3]。
另外802.11的组播传输方式也不支持单播方式具有的Wi-Fi速率自适应和自我调整性能,即AP在组播传输的情况下选择的速率是该AP关联下的所有申请视频组播传输的终端中的最低能支持的速率。这种机制虽然能保证视频数据的传输能覆盖所有申请视频流的终端,但是它降低了整个网络数据传输的吞吐量,使性能较好的终端不能获得高质量的视频,即组播方式缺乏对Wi-Fi网络中异构终端的有效支持。单播和组进行视频传输的特点见表1。
表1 单播和组进行视频传输的特点
IEEE 802.11e[21]定义了新的操作方式和参数设置来增强MAC层的QoS(Quality of Service)的支持,即混合式协调功能(HCF——Hybrid Coordination Function)。其中增强的分布式协调访问(EDCA)是对原来的DCF的增强,它定义了4种访问类型(AC——Acces Categories)来区分数据流的优先级,当语音、视频、尽力而为的数据报文和背景数据流转发到MAC层的时候,它们就会根据优先级进入相应的AC队列中等待发送。
但如果有多个视频流进行传输,802.11e就没有办法进一步再区分它们之间的优先级。另外802.11e也没有针对组播视频传输的可靠性机制进行改善。
对于上述的单播、组播以及802.11e视频处理的特点和局限,为了提高Wi-Fi网络中视频传输的质量,传统的解决方案是在网络的各个层次中处理各自相关的数据,例如传输层和MAC层研究的重点是数据流的队列优先级,组播传输的重传和纠错机制等,并没有涉及到承载的视频流本身的编码和传输的特点,也没有跟人的主观体验有直接的对应关系。这种数据流的QoS的处理机制已经非常成熟,但对于视频质量提高已经没有更多改进的空间。例如,如果要在同一个无线网络中支持异构终端不同清晰等级的视频播放质量,目前不能通过已有的QoS处理机制来实现。
近年来QoE(Quality of Experience)是业界关注的重点[4-5]。它把用户的体验作为视频传输性能提升的目标。它背后的思路是期望网络设备并不仅仅是传输的物理层或路由选择的通道,需涉及被传输的应用层内容,然后根据用户对内容质量的需求调整传输的带宽。所以QoE研究的是跨网络层方案的视频传输[13],也就是网络中的上下各层(应用层、MAC层和物理层)互相配合,利用被传输的视频流的特点来提高质量,而不仅仅把视频传输当成内容无关的数据报文和比特流来转发。
本文根据近年来QoE的研究,从系统设计的角度归纳出无线网络中进行跨层视频传输的总体框架(见图1)。这个框架中包含应用层、802.11 MAC层以及物理层进行视频流传输的从上至下的过程,同时物理层收集视频流的链路状态,并从下至上反馈到MAC层和应用层进行重传控制、缓冲区管理以及视频分层的控制等。利用视频QoE的度量(Metrics)参数来评估整个视频传输过程的性能,本文使用的参数是实时缓冲区大小的使用情况以及可持续播放视频的时间。
这个跨层的架构中充分利用了H.264/MPEG-4视频分级的特点,即相同的视频流在编码时先分成基准层和增强层后进行传输,然后Wi-Fi AP设置了不同的传输速率根据不同的优先级转发基准层和增强层的数据流。建议的方式是基准层赋予较低的MCS(Modulation and coding scheme),这样确保网络中较低处理能力的终端至少能播放基本的视频流,赋予较高处理能力的终端较高的MCS,使其能接收和播放较高清晰度的视频流。
参考文献[14]和[15]是利用视频的分层结构的特点在AP上传输不同的组播数据流的例子。参考文献[14]讨论了传输基本视频清晰度质量的内容(基准层)以及增强型清晰度(增强层)的方案,利用FMS(Flexible multicast service)模式来增强省电模式下的组播数据报文的处理,让接收终端可以根据处理能力选择高清晰度视频或者电能消耗较少的基本质量的视频。结果表明这个方案能有效地满足用户对于视频质量和资源消耗权衡的需求。
参考文献[15]利用了相同的视频编码分层的结构,把基本质量的视频流和增强的视频流分别放入802.11aa定义的新增加的2个队列来区分优先级。另外文献中利用组播冲突防护(Multicast Collision Prevention)来减少组播冲突,并增加接收方的反馈机制来支持数据包重传机制。
参考文献[16]根据信道统计、源速率以及视频播放的缓冲状态来调整应用层的播放速率,在物理层上根据丢包率来进行QoS和QoE匹配,文中指出这样的跨层架构能避免视频播放缓冲的清空,及时调整缓冲大小来提高视频播放的效果。
本文把这些QoE的研究归纳到系统设计的结构框架中,分别介绍各个层次的作用和设计要求,通过基于QoE的度量参数来建立应用层、MAC层和物理层之间互相配合的关系,来整体提高视频传输的用户体验的质量。
图1 基于Qo E的跨层视频传输框架
传统度量视频传输QoS的方式跟数据报文一样,即关注视频流中的丢包率、时延和时延抖动。实际上这样的度量并不能体现用户对视频质量的真实体验,这些统计数据的实时变化并没有跟主观上的视频质量有完全直接的一对一的匹配关系。从终端播放视频的质量来分析,实时缓冲(Buffer Utilization)的使用情况以及可持续播放的时间(Play Time)直接影响用户的体验,本文借鉴了参考文献[25]的视频QoE的计算方式作为本跨层架构的核心度量。根据图1的跨层视频传输的架构,下面是针对可分层视频播放质量的度量方式(Metrics)。
H.264/MPEG-4视频流在编码的时候分成基准层和增强层后进行传输,基准层和增强层的视频对应不同的编码码率(Rate)。根据无线环境中不同终端处理视频的不同能力,在物理层针对不同层的视频流利用不同的MCS来进行传输,这样基准层和增强层就有不同的实时吞吐量的测量数据。
下面公式中的i代表了不同的视频层的编号,i=1是基准层,i>1是各个增强层。平均吞吐量(AvgThroughput)是各个视频层传输的吞吐量之和的平均值(Mbit/s)。平均码率(AvgRate)是各个视频层的码率之和的平均值(Mbit/s)。
如式(3)[25],当平均吞吐量大于平均视频码率时,终端能及时播放视频流,这种情况下缓冲利用率定义为零。当平均吞吐量小于视频平均码率的时候,终端播放视频可能出现卡顿或延迟,缓冲利用率的数值随之增加。通过式(3)的缓冲利用率可以度量在视频传输过程中无线网络环境对视频质量的影响。
参考式(4)[25],当平均无线吞吐量大于平均视频码率的时候,终端可以持续播放视频。当平均吞吐量小于平均视频码率的时候,缓冲区不能连续提供视频播放的数据流,使终端在播放过程中可能出现卡顿或延迟。式(4)中的BuffTime指的是初始化时缺省设置的缓冲区能播放视频的持续时间。
图2是式(3)和式(4)的图例,随着横坐标时间的增加,缓冲利用率变大(左图),播放时间缩短(右图),说明了无线吞吐量低于视频码率,并且差距随时间在变大,这样视频播放的质量就会随之下降,相应的视频画面会出现卡顿或者延迟的现象。
图2 视频质量的度量参数
通过式(3)和(4),系统可以在业务运行的时候实时测量和观察视频质量,物理层和MAC层把收集到的数据反馈到应用层进行缓冲调整和视频分层,这是客观QoE的处理方式。另外常用的手段是通过外部测量客观评估网络中的视频质量,例如PSNR、VQM等。
QoS是普遍应用的数据报文传输质量的评估,也有研究人员通过实验来分析QoS和QoE之间的关联。参考文献[6]是从QoS的角度出发研究网络中视频流的QoE,文章首先分析了单个QoS参数对视频流QoE的影响,得出视频流QoE与丢包、抖动相关而与延迟无关的实验结论,然后在此基础上进一步对不同编码的视频流的用户体验进行了实验建模,利用回归方程提供一种QoS参数和用户体验之间的映射关系。
上述跨层架构的实现是跟H.264/MPEG-4视频分级(Scalable Video Coding)的特点紧密相关的。JVT(Joint Video Team)组织在2007年通过了基于H.264/MPEG-4 AVC架构的可分级编码标准[22]。视频被编码成基准层和1个或多个增强层。基准层提供了解码后的基本视频质量,而增强层提供了更高清晰度的增强视频质量。在本文中如果视频编码有n个层的分级,定义i代表不同的视频层的编号,则i=1是基准层,i>1是各个增强层。
视频流的基准层和增强层分级是在网络中的视频编码服务器上完成并通过有线网络传输到室内的Wi-Fi网关或AP。在跨层架构中(见图1),AP的应用层支持的功能包括QoE度量值的收集和计算、动态缓冲区大小管理以及视频分层控制。
应用层首先在初始化阶段设置缺省缓冲区的大小,系统中可支持的最小和最大的缓冲区长度,然后根据底层收集的性能数据来计算实时的缓冲利用率和可持续播放的时间参考值。基于这样的QoE度量数据,应用层调整缓冲区的长度和等待队列的数量来接收外部网络中服务器传输过来的分层视频流。如果无线网络环境干扰严重,视频传输的吞吐量大幅度下降,缓冲利用率变大,可持续播放时间缩短,则应用层就只转发基准层或减少增强层的数量,让系统能自适应降低无线吞吐量,确保传输有效的视频流给终端。如果无线网络环境较好,则系统根据度量值来增加增强层的数量的转发,提高无线吞吐量,让终端播放较高质量的视频。
跨层结构中的MAC层首先要支持多个视频优先级队列,即把应用层转发过来的视频基准层和增强层放在不同优先级的队列中进行转发。然后MAC层根据无线网络中的终端数量,判断是通过组播还是单播来传输视频。如果是组播,则MAC层负责提高组播方式下的视频传输的可靠性和纠错机制。此外MAC层还要负责把物理层收集到的QoE度量的数据转发给应用层。
多个视频优先级队列的机制可以基于IEEE 802.11aa标准中的定义来实现。在IEEE 802.11e的4种访问类型的基础上,IEEE 802.11aa对于语音和视频的队列进行拓展来进一步区分优先级[10]。视频的发送队列分为基本队列和备选队列,可以根据优先级调度不同的视频流。
采用组播来传输视频,它的传输速率是在AP关联下的多个终端传输的最低能支持的速率。基准层和增强层在传统视频的传输过程中具有相同优先级的丢包和时延抖动,用户终端的解码软件既不能有效保证基准层的播放质量,又不能区分增强层的视频体现效果。在基于802.11aa拓展的视频队列(基本队列和备选队列)中,MAC层的解决方案是在AP侧把基准层和增强层放在视频传输的不同优先级队列中,基准层的视频流有较高的优先级,增强层有较低的优先级。在MAC层建立转发视频流的规则,确保终端首先播放基本质量的视频;如果当前无线网络的吞吐量较高,终端能够接收并选择播放视频的增强层。在不改变终端硬件和软件的情况下,让AP能够提高异构终端的视频播放的用户体验。
MAC层把不同优先级的视频数据流转发给物理层,高优先级的视频流对应的是基准层,低优先级的视频流对应的是增强层。物理层完成相应的MCS的适配,给高优先级的基准层分配较低的MCS,这样确保每个终端都能收到相应的基本质量的视频流;给低优先级的视频的增强层分配较高的MCS,在较好的无线网络环境情况下,处理能力较高的终端能播放更高分辨率质量的视频。参考文献[23]和[24]是对应用层的视频码率映射到物理层不同速率的研究。本文讨论的框架设计是把应用层缓冲区中的视频分层、MAC层的队列优先级以及物理层的速率作为整体的设计方案。
物理层的实时无线吞吐量是作为视频QoE的度量指标被上传到MAC层以及应用层进行计算和分析,然后应用层调整缓冲区大小以及控制视频分层的数量,从而动态调整系统视频传输的吞吐量和质量。
本文介绍了Wi-Fi无线网络中组播和单播传输视频的特点和局限,以及已有的802.11e的优先级队列的机制,然后着重分析和归纳了基于QoE的跨网络层的视频传输的总体架构,视频QoE的度量指标和作用,应用层、MAC层以及物理层互相配合来总体提高视频传输的质量。
视频流特定的分层的编码方式是支持跨层架构的解决方案的基础,而QoE度量参数是跨层结构中提高性能的关键指标和依据,这样确保了各层始终是依据用户体验来传输视频数据。应用层支持动态调整的缓冲区机制和分层数量转发的控制;然后视频流的基准层和增强层映射到MAC层的不同优先级队列,MAC层根据无线网络吞吐量和连接终端的数量决定是否需要把组播转换成单播进行转发;物理层适配相关的MCS转发视频数据给各个终端。物理层上的实时吞吐量数据上传给MAC层以及应用层进行缓冲区管理和流量控制的闭环处理。
基于QoE的跨层视频传输的总体架构中除了增强MAC层中的重传和确认机制是专门针对组播可靠性的提高,其他阐述的方案和QoE的度量同时适用于组播和单播方式。应用层的视频分级和缓冲管理、MAC层的优先级队列、物理层的速率适配等,都能有利于单播视频传输的质量以及终端播放的用户体验。
在分析MAC层的时候,本文阐述的技术的出发点是基于目前已有的802.11规范标准的改进,把AP作为框架设计的核心,这样能兼容用户已购买的终端硬件,而没有把终端上的软件的升级作为技术研究和方案来推荐。
基于QoE的跨层架构方案是最近几年视频传输研究的重点。本文没有罗列所有相关的论文和技术,而是从工程设计实现的角度关注系统的层次结构和框架,建立基于分层视频基础和QoE度量的完整的跨层方案。作为将来的改进方向,该方案可以继续研究其他有利于提高用户体验的QoE度量参数,组播重传机制的性能改进,降低跨层结构实现的复杂度,多AP网络基于QoE的视频传输等。