黄浩铭 郑滢 王博 王兴辰
北方工业大学 北京 100144
随着越来越多的人习惯于通过移动视频获取和共享信息,移动视频流量已经占据了移动网络流量的一大部分。然而,通过无线网络传输高质量的流媒体视频仍极具挑战性。在5G时代,数据风暴正在加剧,相比4G的价格,5G移动视频的数据成本不可忽略。提升移动视频QoE的一个流行技术是码率自适应(ABR)[1]技术。ABR的基本思想是,在播放过程中用户应该主动调整视频码率,使之与实时网络条件相适应,从而减少因为视频码率与网络条件之间的不匹配造成的播放卡顿。因此,更智能的ABR算法需要考虑比特率调整中的流量约束,在用户指定的可承受流量范围内提高移动视频QoE。为解决上述问题,本文考虑了一种基于数据流量的码率自适应算法。为此,我们首先分析不同码率切换和流量消耗对移动视频QoE的影响,给出流量感知的QoE预测模型;其次,提出一种基于数据流量的码率自适应策略;该策略以可承受交通为约束;最后,通过仿真实验将本文算法与经典ABR算法进行比较,验证了本文算法的有效性。
根据用户指定的流量限制与剩余视频长度,可以计算出下载剩余视频的平均码率R。 我们计算第j个视频片段在t时刻的QoE得分如下:
其中,α,β,μ是控制不同QoE因素重要性的权重值。S(j)反映了码率切换的影响,为平均视频码率,I(t)是一个0-1变量,表示下一个视频块的下载是否会使流量超出指定值,超出则取0。我们将以最大化QoEMem(j, t)为选择下一个视频码率的目标。
现有的ABR算法忽视了移动数据流量的成本,本文提出一种混合自适应码率选择算法,可以根据当前的网络和流量使用情况来优化QoEMem(j, t)。
为了使ABR算法尽可能地贴合移动视频用户的需求,自适应的目标函数如下:
其中,T为用户指定的流量限制,traffic截至目前下载视频所用的总流量。
本文通过增强学习模型来进行码率的选择,并利用“Actor-Critic”技术[2]来训练模型。在基于数据流量的ABR系统中,当前网络状态、视频源、视频播放器、数据流量限制将作为增强学习模型的环境;由深度学习网络组成码率自适应选择的代理,其能够随时间积累慢慢优化,从而做出最优的行为;环境信息将作为状态st(t)传递给代理,使代理做出码率选择决策。我们以QoEMem(j, t)作为增强学习模型的激励函数。当前码率选择作用在当前环境后(即改变码率),将会产生新的状态st(t+1),在新状态下获得的QoE指标被输入到激励函数,作为模型参数更新的依据。
仿真结果表明,在600秒的视频播放过程中,本文方法的码率切换次数最小。由于本文方法可以根据网络条件和流量约束更快速地调整视频码率,对环境变化更敏感。此外,我们将码率分为五个等级,并计算了各ABR方法下载视频块时不同码率的占比。本文方法主要有三个码率等级其中占比较高,具有良好的稳定性。而其他ABR方法则涵盖了五个等级。
为了在给定的数据流量范围内,提供更优的观看体验,本文首先定义了QoE模型,特别考虑了流量消耗对QoE的影响。其次,提出了一种基于数据流量的码率自适应算法,并采用增强学习求解。最后,通过仿真实验验证了本文算法的敏锐性和稳定性。