张世行,罗雅文,张敏,孙奇福,阳小龙
(北京科技大学计算机与通信工程学院,北京 100083)
随着移动互联网的迅速发展和移动智能设备的普及,移动用户可以随时随地享受到高质量的视频服务。根据思科公司预测,到2022 年,全球移动数据流量每月将达到77.49 EB,其中视频流量占比超过82%[1],移动视频流量的迅速增长给移动网络服务质量和用户业务体验带来了巨大挑战。首先,与文本等其他类型的数据相比,高质量的视频传输需要占用更大的带宽。例如,高清视频需要10 Mbit/s,4K 超高清视频(3 840 dpi×2 160 dpi)需要60 Mbit/s,而8K 超高清视频(7 680 dpi×4 320 dpi)需要的带宽高达240 Mbit/s;其次,与电视节目等传统视频不同,移动视频传输依赖于移动设备和无线网络,这导致移动用户更容易遇到低速率和高时延等问题。因此,如何通过无线网络进行有效的内容分发[2],同时保证移动视频用户的体验质量(quality of experience,QoE)[3],已经成为众多学者关注的焦点。
面对具有高时变性的移动网络环境,移动内容分发网络(mobile content distribution network,MCDN)[4]在传统内容分发网络(content distribution network,CDN)的基础上将缓存节点部署至无线网络中,优化无线网络和移动设备的内容分发,从而缓解移动环境下的请求延迟问题。预取技术是在用户请求视频内容之前,由靠近用户的节点服务器主动从源服务器获取视频并将其存储在缓存中,当用户需要时便可就近获得视频内容,从而减少从源服务器获取数据产生的时延。然而,移动环境下的预取性能会受到诸多因素的影响,如用户行为的随机性、内容预测的准确性和网络资源的时变性等。MCDN 预取策略的设计需要充分考虑上述因素,以取得最佳的预取效果,保证用户QoE。同时,随着移动用户需求的个性化和多样化日益明显,传统CDN 对多样性业务支持能力不足等问题已难以保证移动环境下的用户体验,加强MCDN 对多样性业务的智能化服务能力成为MCDN 预取技术的关键。无线多媒体大数据包含了丰富的用户行为、内容特征和网络动态等有价值的信息,为诊断系统瓶颈、设计新颖的体系结构并优化整体性能提供了机会。例如,可以从历史记录中挖掘用户的移动访问模式,如个人的地理位置和社交关系等,据此进行内容预取或通过社交网络进行内容传播。在各种人工智能应用的推动之下,机器学习等技术成为缓解日益增长的无线视频流量压力的有效手段。这些智能化技术在MCDN系统设计、部署和优化中的应用,将使MCDN对多样性业务的智能化服务能力得到大幅提升。
目前,预取技术在诸多领域均有应用,有许多关于这些不同领域的预取技术综述[5-7]。例如,参考文献[5]针对Web 访问延迟问题对Web 网页内容预取方法进行了总结。参考文献[6]综述了移动网络环境下的Web 预取技术。参考文献[7]对P2P 视频点播系统中的各种预取技术进行了比较分析。
随着互联网的发展,用户可以享受到高质量的视频服务,然而网络拥塞和服务器过载已经成为视频内容传输面临的主要问题,CDN 的出现为上述问题的解决提供了有力支持。CDN 是一种构建在互联网基础之上的overlay 服务网络,它通过部署分布式服务器,将内容分发到用户附近的缓存服务器上,把用户访问分散到网络边缘。如果缓存服务器预先缓存了请求的内容,则由缓存服务器将内容传递给用户。由于缓存的内容不必再从原始服务器传输到缓存服务器,这将有效减轻流量负担和网络拥塞,实现内容快速分发。以前的内容分发技术都假设客户端需求是静态的,然而,在高度易变的移动环境中,客户端需求和位置是实时变化的,需要更加灵活的内容分发策略。因此,面对日益增长的移动内容服务需求,国内外第三方网络内容服务商(如爱奇艺、YouTube等)与移动网络运营商联手构建了高效的移动内容分发网络,也称为MCDN。与CDN 不同的是,MCDN 部署在无线网络(如蜂窝网络、Wi-Fi)范围内,为移动设备提供高质量的动态数据和丰富的视频内容传输服务。
MCDN 中的网络基础设施包括两个部分:有线网络基础设施和无线网络基础设施。前者是负责CDN 有线环境的基础设施,它提供连接源服务器与代理服务器以及代理服务器与网络设备(如路由器、基站、接入点)之间的通信链路。后者负责在移动CDN 的无线环境中实现静态和移动用户之间的信息传输。因此,用户终端与服务器之间的通信被3 种通信流所替代:用户终端与无线网络边缘之间的通信流、无线网络边缘与代理服务器之间的通信流和代理服务器与源服务器之间的通信流。考虑到代理服务器应靠近无线网络边缘,同时又伴随着基站数量不断增加,MCDN 需要在其基础设施中部署更多的代理服务器,以便充分覆盖移动无线基础设施,同时代理服务器间相互协作。典型的MCDN 架构如图1 所示。
图1 典型的MCDN 架构
2.2.1 基本原理
除了MCDN 的服务器部署问题之外,确定合适的内容分发策略也很重要,缓存和预取是其中的两种关键技术。缓存[8-11]通常由用户请求驱动,当有用户请求视频内容时,若代理服务器中没有该内容,则由代理服务器从内容源服务器获取该请求内容,在发给用户的同时将该内容保存在缓存中,为未来相同的请求提供服务。本质上是一种被动内容推送方式,在互联网流量不断增长的趋势下,这种被动的内容分发方式将难以满足用户的需求。首先,当用户第一次请求视频内容时,仍需从源服务器获取,增加了视频获取时延。其次,若部分节点处的用户请求较少,被动缓存将导致服务器节点仅缓存有限的请求内容,使存储空间未能得到充分利用。
预取技术本质上是一种主动内容拉取,其核心思想是由节点服务器提前从源服务器处获取用户还未请求过的视频内容,以期加速用户对于内容的获取。预取技术要求系统具有预测和推断未来事件的能力,包括对用户移动位置的预测以及用户将要请求内容的推断等。预取技术的引入,使得服务器节点可以先验地缓存部分内容,解决了被动缓存的滞后问题;此外,即使在用户请求较少的区域,服务器节点也可以主动缓存用户可能需要的内容,避免节点处大量缓存空间闲置,使有限的网络资源得到充分利用。预取流程如图2 所示,首先,系统中的每个用户都被赋予独一无二的UID(user identification,用户身份证明),管理器根据用户的历史位置信息和请求信息确定预取位置、时间及内容,并将这些信息告知用户将要到达的基站判断是否需要进行预取操作。若该基站已缓存该内容,则不需进行预取;若尚未缓存,则可进行预取操作。当收到视频请求时,若缓存命中或预取命中,则用户可直接从基站处获取信息从而缩短响应时间,若缓存或预取均未命中,则仍需从源服务器获取该内容。
图2 预取流程
2.2.2 性能评估指标
预取的目的在于如何提升网络资源利用效率,同时保证用户QoE。因此,本节将从网络资源利用率和用户QoE 保证两个角度阐述如何评价预取方法的性能,如图3 所示。
图3 预取技术性能评估指标
基于网络的评估指标主要有带宽成本、负载公平、能量开销和存储空间使用率。带宽成本定义为预取技术消耗的多余带宽与不采用预取技术消耗的带宽之比。由于用户请求的视频内容具有多样性,为了提高预取效率需要进行频繁的预取操作,这将会消耗大量额外的带宽,高效的预取策略应减少不必要的带宽消耗。负载公平用来衡量网络中节点之间资源和数据的分配是否公平,它还有助于识别重载节点。保证网络中的负载公平不仅能够平衡网络节点间的传输速度和带宽增益,还可以提高资源利用率。低功耗是内容分发的主要目标之一,而传输和读写数据是能量消耗的主要原因。因为内容存储在更接近用户的地方,采用预取技术便可以显著减少传输能量。然而,在读取或写入预取内容时也要消耗能量,并且,活跃内容的数量越多,读写数据越频繁,能量消耗也就越多。因此,需要对预取产生的能量开销和取得的收益进行权衡。存储空间使用率定义为预取内容占全部存储空间的比率。该指标越高,便能在有限的存储空间中预取更多视频数据,从而满足更多用户的需要,因此,应尽量提高该指标的值,保证存储空间得到充分利用。
基于用户QoE 的评估指标主要有预取命中率、预取准确率、预取命中距离和响应时延。用户请求的视频内容可以在预取位置找到即命中,否则为未命中。预取命中率定义为可以服务的请求数与请求总数之间的比率,命中率越高,越有助于减少时延,用户体验也就越好。预取准确率定义为预取内容中被用户访问的内容数量与所有预取内容之比。提高预取准确率有助于减少网络资源的浪费,因此,这也是评估预取性能的一个重要指标。代理服务器之间的协作有助于缓解网络拥塞,这使用户可以从附近节点处获取视频内容,由此便衍生出预取命中距离的概念。预取命中距离可表示为响应用户请求的节点到该用户所经过的节点数,更短的命中距离意味着更少的请求时延。响应时延是指从用户发出请求到视频开始播放的时间间隔,减少响应时延对保证用户QoE 尤其重要。
根据预取时关注对象的不同,本节将从用户、内容和网络3 个角度对近年的移动视频预取技术的研究成果进行综述,把移动视频预取技术分为基于用户移动行为感知的视频预取技术、基于内容属性感知的视频预取技术和基于网络资源感知的视频预取技术。
随着移动通信技术的飞速发展,越来越多的人选择在私家车、公共汽车或火车上通过移动设备享受视频服务,而移动过程中的网络状况是不稳定的,这将影响到用户的视频观看体验[12]。参考文献[13]中的实际测量表明,移动视频传输受到用户移动行为的严重影响。因此,基于用户移动行为感知的视频预取技术研究具有重要意义,用户移动行为的高度可预测性[14]也为移动环境下的视频预取提供了机会。
用户移动行为模式与用户历史轨迹密切相关,通过对用户的历史位置信息进行收集和处理并由此建立用户移动模型,对用户移动行为的研究具有重要意义。参考文献[15]构建个体用户移动模型来捕捉用户行为,并利用用户移动性进行预取。运营商预测某个时间段某个内容将在某个地点有很高的需求,同时还预测哪些用户可能会在这个时间段出现在该地点,随后,运营商将这些数据预取至这些用户的设备中。该方案同时与D2D(device to device)通信[16]相结合,使这些用户能够将已获取的数据传送给周围的其他用户。结果证明了用户移动性的利用有助于减轻热门位置的网络拥塞,降低运营商服务成本。但该方案仅考虑了个体用户的移动性,而个体用户较强的随机性给移动模型的构建带来了困难,并且每个用户都处于社交网络之中,因此,充分利用群体用户的社交特性有助于避免个体移动随机性带来的影响。参考文献[17]利用群体移动模型预测流行内容的传播,据此进行移动视频的预取。与传统方案相比,该方案可以显著提高预取命中率,与基于流行度的预取技术相比命中率提高了近20%,与随机预取技术相比提高了近30%。但该方案忽略了用户的个性化需求,需要一种既能满足用户个性化需求又能充分利用群体用户相似性特征的移动视频预取方案,这可作为未来的研究方向。
利用用户移动行为信息进行移动位置的准确预测是提高预取命中率的关键。移动位置预测通常涉及一个离散时间系统,需要设计以时间序列为输入的移动位置预测算法。传统的机器学习预测方法,如指数平滑法和基于马尔可夫模型的算法,由于其高效、简单和低计算成本的优势,在预测问题中得到了广泛应用。然而,它们的局限性也很明显,指数平滑方法只适用于稳定的输入,基于马尔可夫模型的预测只能检索序列的短期相关性[18]。已有研究证明,深度学习方法,如RNN(recurrent neural network)[19]、 LSTM(long short-term memory)[20]网络和GRU(gated recurrent unit)[21]网络等,在预测方面可以达到很好的效果[22]。其中,由于LSTM 具有记忆能力,可以学习观测值之间的时间依赖关系,因此,能够在挖掘用户移动行为规律方面取得很好的效果。参考文献[23]提出了一种针对移动通勤用户的短视频推荐和预取方案,使用LSTM 作为移动位置预测算法来预测用户将要到达的下一个基站,提高了预测精度。该方案能够有效地推荐短视频和预测用户轨迹,在合适的参数设置下可以得到较高的性能,当设置为30 个节点3 层时,召回率可达100%。
参考文献[24]指出,用户倾向于观看社交媒体上朋友和家人共享的视频,即用户容易受到在线社交网络(online social network,OSN)的影响,因此,一些研究者进一步考虑了OSN 中的移动视频预取方案。由于社交网络能够提供丰富的用户信息,如浏览历史和社交关系,已有许多研究者利用这些信息进行用户与视频之间的相关性分析[25-27],例如,在他们的社交网络中,关系密切的用户很可能有相似的兴趣爱好,观看相似的视频。参考文献[28]中提出了一种聚类潜在偏差模型,通过大量的数据分析研究了社会关系对访问行为的影响,然后使用k-means 算法将用户划分为不同的组,推导出每个视频的单击分数,并在此基础上提出了一种自适应预取算法。该方案的平均预测精度为84.5%,可在较低的蜂窝数据成本和能源消耗情况下,显著降低访问时延。然而,用户的社交网络关系到隐私问题,未来的预取方案应对用户隐私加以保护。现有的方案利用社交信息和浏览历史来推荐视频,却很少解决用户是否会观看某个视频的预测问题,如果视频没有被观看,预取无用的视频显然是浪费资源的。参考文献[29]提出了一种基于社交和内容感知的预测方法,探讨了用户活跃度、用户的社交关系、视频相似度、用户兴趣、视频流行度5 个因素在视频预取时对预测准确性的影响,从而预测一个视频是否会被用户观看,以便在线社交网络中有效地传输视频内容。
综合上述分析,基于用户移动行为感知的移动视频预取技术研究及其优缺点见表1。
表1 面向有限网络资源的视频预取技术的优缺点
有效预取的一个关键问题是:确定哪些视频内容是值得预取的。每个区域中节点服务器的数量和存储能力都是有限的,并且需要为大量的本地用户服务。预取过多用户访问不到的内容反而会给网络带来负担,如冗余数据占据存储空间、频繁删除消耗能量及带宽资源等。因此,视频内容的准确预测是预取技术的关键。基于内容属性感知的视频预取技术研究集中在内容流行度和用户对内容的偏好程度两个方面。
根据Zipf 分布,少数流行内容被大部分的用户请求[30],因此,预取流行的视频内容可以获得优异的性能。然而,视频流行度不是固定不变的,随着时间的推移,网络中新出现的视频可能发展为流行视频,过去流行的视频也将不再流行[31]。过去和未来的流行度之间的高度相关性表明历史信息可以反映视频未来的流行趋势[32-33],因此,视频流行度是可预测的,理想的流行度预测算法必须快速,并提供准确的预测,以确保正确的预取决策的执行[34]。基于内容流行度的时间相关性,参考文献[35]通过构建时间序列预测模型来预测内容的受欢迎程度,并以此作为预取的依据,该方案在上下文敏感的内容上表现优异,然而,在与上下文无关的内容上表现较差,只适用于与时间高度相关的内容。参考文献[17]中提出了基于人群移动的流行度预测方案,该方案将每个时间段的预取问题表述为背包(back-packing)问题,其目的是最大化流行度与内容大小比。参考文献[36]中提出了一种基于张量学习的AP(access point)辅助视频预取方案,首先将视频流行特征表示为矩阵分解问题,然后用关联矩阵来预测下一时间段视频的受欢迎程度。该方案使预取命中率和准确率得到有效提升。与基于奇异值分解的预取策略相比,命中率提升10%,准确率提升15%;与基于历史的策略相比,命中率提升40%,准确度提升20%。然而,由于AP 与视频关系是随时间变化的,因此需要在每个时间段都进行矩阵分解,这带来了巨大的计算成本。一般情况下,上述方法在AP 端预取需求内容,由于实现和维护成本较高,可能会带来可扩展性差的问题;此外,在AP 端频繁替换预取内容很容易耗尽AP 资源,从而影响预取性能。参考文献[37]提出了一种云端CDN 数据分析体系结构,采用基于k-means 算法的非监督式学习机制来预测视频流行度,可达到99.8%的准确率。该架构也可以应用于许多其他的方向,比如异常检测和数据挖掘等。参考文献[38]提出了基于学习的流行度预测方案,同时指出预取与缓存结合的方案性能最优,但未给出具体的仿真结果。
虽然视频内容流行度是设计预取策略时的一个重要参考依据,但它始终面向所有用户,由于不同的用户有不同的偏好,人们往往会选择自己最感兴趣的而非最流行的内容进行观看。因此,若能通过挖掘用户偏好,对具有不同兴趣的用户提供个性化的预取,必将会给用户带来较好的视频观看体验。参考文献[39]提出通过用户宣布他们在不久的将来观看哪些视频,从而实现有针对性的预取,所提方案的命中率与LRU(least recent used)策略相比提高了54%。但这种方案可用性较差,因为用户对视频的观看通常是随机的,很少提前告知要观看的内容。为了应对用户观看行为的随机性,参考文献[40]提出在视频时间轴中插入书签和预取状态的预取方案,通过调整用户界面,引导用户观看已预取过的内容,从而降低访问时延。但该方案很难满足用户按照自己的喜好观看视频的需求。
与用户偏好密切相关的一个问题是推荐问题,推荐系统是当前解决推荐问题的非常活跃的研究课题,已被视频网站广泛采用。它根据特定用户历史观看记录和与其他视频的关系来评估量化该用户对某视频的兴趣度,将具有最高“评分”的项目推荐给用户。目前常用的推荐算法有协同过滤推荐[41]、基于内容的推荐算法[42]和混合推荐算法[43]等。参考文献[44]设计了一种基于流量模式和客户端行为的预取系统,使用协同过滤算法,根据用户相似度为用户预测视频,但是,预取性能与内容特征是密切相关的,当内容更加个性化时,使用该方案实现预测就变得更加困难。同时,传统的推荐系统面临数据稀疏和冷启动等问题。深度学习方法采用多源异构数据作为输入,并通过端到端模型自动训练预测模型,从而缓解传统推荐系统的问题,提高推荐系统的性能。参考文献[23]提出了一种基于深度学习的数据推荐和预取方案,利用深度学习的方法设计了一个短视频推荐模型,并用该模型来学习用户的偏好,该方案能够快速且高效地获得用户的兴趣,并将首选的短视频内容推送到用户最可能连接的基站。
以上讨论了单视点视频的预取,随着移动视频技术的不断发展,多视点视频的访问需求也日益增多。与传统的单视点视频相比,多视点视频将占用更多的存储空间和带宽资源,这无疑给移动视频的预取带来了更大的挑战。参考文献[45]研究了5G 网络中多视点视频的主动缓存问题,将多视点视频的主动缓存系统建模为一个结合视图选择和局部内存分配的Markov 决策过程,提出了一种基于深度强化学习的主动缓存策略。当视图数增加时,该方案与随机视图选择方案相比具有更加稳定的性能。然而,该方案未能考虑移动环境下有限的带宽资源对系统性能的影响,未来可以结合网络可用性对多视点视频的预取做进一步的研究。
综合上述分析,基于内容属性感知的移动视频预取技术研究及其优缺点见表2。
表2 基于内容属性感知的移动视频预取技术的优缺点
在用户移动过程中,无线链路状态的不断变化严重影响视频服务质量,研究者提出在波动的网络条件下通过自适应传输方式动态调整视频质量。自适应传输可以实现在不同的片段之间切换视频分辨率,客户端通过对自身历史网络性能的感知进行分辨率的调整[46]。为了更好地适应不同的终端性能或网络性能,将自适应传输与预取技术融合将有利于应对无线链路波动带来的问题。参考文献[47]提出在网络中部署一个服务控制器来监控流量特性,并向用户终端发送关于视频质量的建议,但这项工作未涉及预取。在上述研究工作的基础上,参考文献[48]提出了在无线接入点部署预取代理,它能够监控骨干网和无线信道的流量情况,这些信息用于决定下一段的预取质量,然而,它一次只预取一个段,这很难保证视频的不间断播放。参考文献[49]同样提出了一种基于代理的预取方案,不同的是,它可以每次预取一段,也可以预取n段,但要预取的段数都是固定的,这种固定的预取策略在网络波动较快的环境中并不能很好地执行。针对上述问题,参考文献[50]提出了一个可以动态调整预取段数的自适应段预取方案,但该方案未在时变的移动网络条件下测试。参考文献[51]提出了一种基于上下文感知的自适应视频预取方案,该方案能够根据用户和网络上下文实时动态地调整预取策略。随着人工智能技术的发展,学者们将机器学习等思想引入预取方案中。为确保当前带宽条件下热点内容的最高质量,参考文献[52]提出了一种基于热点感知的视频传输系统来实现视频预取,通过构建一个经验学习的级联神经网络模型,解决了网络波动情况下的热点内容预取时机的研究难题。与普通块比特率相比,该方案使热点块的平均比特率提高了14.31%,显著提升了用户QoE。参考文献[53]提出了一种基于学习的智能预取方案来改进自适应视频流的传输,通过面向QoE 的深层神经网络模型做出预取决策。与仅缓存、全预取和缓存与预取结合等方案相比,所提方案比最优的缓存与预取结合的方案在平均比特率方面提升41.1%,从而保证最佳的预取性能。
尽管无线服务供应商竭力升级基础设施并增加频谱来应对网络上的负载特性,但随着移动网络对视频流服务需求的不断增长,无线链路容量仍远远不能满足移动网络日益增长的业务需求。流量需求与链路容量之间的矛盾导致视频流服务质量较差,间歇性的中断和长时间的缓冲时延现象频繁发生。目前的解决方案是利用非高峰时段的可用带宽来预取视频内容。参考文献[54]的研究表明,移动网络上的流量在一天中并不是均匀分布的,可用带宽在2:00—5:00 增加,在6:00—20:30 减少,从20:30 开始逐渐增加,针对这种现象,文中提出了一种时移预取方案,它在网络连接的非高峰时期进行预取操作,有效缓解高峰时段的带宽压力。该算法可以使高峰时段的用户流量减少34%,然而,采用上述方案的弊端在于难以保证预取内容的时效性。
由于存储空间的限制,必须考虑预取内容的更新替换问题。目前,已经有一些成熟的缓存替换策略来处理这一问题,比如LRU 和LFU(least frequently used)[55],但LRU 需要进行从头到尾的大规模遍历,LFU 虽克服了LRU 的缺点,但容易导致旧数据的积累。为更好地权衡预取和缓存替换策略之间的关系,并优化缓存替换效果,参考文献[56]在考虑网络和存储资源的基础上,通过建立预取和缓存的效用函数,构造统一的缓存替换策略。并将其总结为一个移动感知预取和缓存替换优化问题,利用一组背包约束条件,将优化问题转化为整数线性规划问题,提出了一种高效的动态规划算法,该策略可以有效地度量缓存和预取视频的价值,提高存储单元的使用率和缓存命中率,与LRU、LFU 算法相比,缓存命中率可分别提升15.72%和23.24%,但动态规划算法对计算空间需求非常高。近年来,云计算技术凭借其良好的可扩展性及强大的计算和处理能力,也致力于为互联网用户提供更好的视频流服务[57-58]。参考文献[59]基于云计算技术提出了一个两阶段的更新方案来处理短期内容传输和长期缓存更新的混合时间最优化问题,该方案提高了存储空间利用率且明显降低了长期功耗。
综合上述分析,基于网络资源感知的视频预取技术研究及其优缺点见表3。
表3 基于网络资源感知的视频预取技术的优缺点
以上从3 个角度介绍了移动视频预取技术的研究现状,包括基于用户移动行为感知的预取、基于内容属性感知的预取和基于网络资源感知的预取。下面将对3 种技术进行优缺点分析和总结。
基于用户移动行为感知的预取技术通过对用户的历史位置信息进行收集和处理,从而实现移动位置的准确预测,以提高节点的服务质量。同时,考虑到用户易受社交网络的影响,根据用户之间的社交关系来预测用户的访问行为,更有助于提高预取命中率。该技术充分考虑到用户移动行为对移动视频预取的影响,满足了用户在移动环境下的视频观看需求,但用户移动本身的随机性给移动行为的准确预测增加了困难,同时,用户信息的获取也对用户隐私产生威胁。基于内容属性感知的预取将部分流行度高的内容或用户偏好的内容预取到边缘节点上,从而提高用户的访问质量,该方法给用户访问提供了更精确的服务,但同时数据挖掘技术的引入又给节点带来了大量的运算开销。基于网络资源感知的预取能够根据网络条件制定不同的预取策略,能够显著提高网络资源的利用率,但网络资源自适应的预取策略往往以牺牲视频质量为代价,难以满足用户对高质量视频的观看需求。
以上均是从用户、内容和网络3 种不同角度进行的独立分析,然而,实际应用场景相对复杂,仅仅考虑其中的某一个因素很难达到良好的预取效果,将不同的属性相结合的预取方式可以在很大程度上提高预取性能。例如,基于用户移动行为和基于内容偏好相结合的预取方式,先通过用户历史轨迹信息预测移动位置,随后根据用户偏好信息将用户最感兴趣的内容预取至该节点,该方案可以在提高移动环境下的预取命中率的同时满足用户的个性化观看需求;基于内容属性和基于网络资源感知的预取方式,先根据用户需求确定预取内容,随后根据网络条件动态调整预取视频的数量和大小,该方案可在提高网络资源利用率的同时保证用户QoE。综上所述,根据不同的应用场景制定合适的预取策略有助于预取性能得到更好的提升。
尽管预取技术已经为减少访问时延、提升用户QoE 做出巨大贡献,但仍有问题值得探讨。本节将从用户、内容和网络(网络能耗优化、异构网络协同预取)这3 个角度分别阐述目前预取技术存在的问题,并指出未来的研究方向。
(1)基于用户隐私保护的预取
为了更好地了解用户,预取需要收集大量的用户信息,得到的数据越丰富,预测结果越准确,预取性能也越好,然而,这将对用户隐私产生威胁。例如,预取通过对用户偏好的获取为每个用户提供更准确的个性化服务,而特有的偏好与社交关系等信息的结合,使得恶意用户能够通过网络信息识别出某个特定的用户,从而对其造成伤害。在制定预取策略时,很少有研究者考虑到用户的隐私保护问题。差分隐私[60]作为一种新兴的机制,在不影响整体数据特征的情况下,通过扰动已发布的数据来阻止输出的准确推断,成为解决隐私问题的一个有效解决方案。在未来的研究中,可以考虑在预取中引入差分隐私技术来保护用户隐私。
(2)基于内容预测误差修正的预取
内容的准确预测是保证预取命中率的关键,不准确的预测难以满足用户需求,也对网络资源造成浪费,然而许多因素会导致预测结果不理想,如用户行为的随机性、计算资源的有限性等。针对各种信息预测的不确定性问题,一种可能的解决方案是进行鲁棒优化[61]。为了设计能够处理不确定性的鲁棒算法,需要建立适当的预测误差模型[62],预测误差是指预测值与实际值的差。通过预测误差的修正可以提高预测算法准确率,从而大大提升预取性能。
(3)基于网络能耗优化的预取
预取技术可以显著降低网络时延,提高内容的可用性,但预取过程中的网络能耗是不可忽视的。一方面,为了减少下载时间将内容预取至靠近用户的位置,会导致存储成本的增加,预取至稍远的位置可以避免过多的存储,却增加了传输成本;另一方面,基于人工智能技术的预取机制可以帮助内容按需传输,然而智能算法复杂度的提升将会导致计算成本的增加。因此,有必要对预取性能的提升及其带来的网络能耗加以权衡。现有的研究往往只关注于提升预取性能而忽略网络能耗的问题。目前已有研究者对网络能耗模型的构建展开了大量研究,参考文献[63]中对近年来数据中心能耗模型的研究进行了总结,在未来的研究中可将能耗模型引入预取,以期在提升预取性能的同时实现网络能耗的优化。
(4)基于异构网络的协同预取
未来的移动通信网络将是基于宏基站与低功率小型基站实现信号覆盖的融合Wi-Fi、5G、LTE、UMTS 等多种接入技术的异构网络。为了使网络中的传输功率和能量最小化,利用多个基站协作预取视频内容是未来解决预取问题的一个重要研究方向。当用户发来请求时,若当前基站未预取该视频,则可从附近的其他基站进行传输,若其他基站也未预取,则通过回传链路传输,基站间的协作将大大降低中心网络的回传压力。然而,异构网络概念的提出,在显著提高频谱效率、增加系统容量的同时,也带来了一系列的问题,比如小区间的干扰变得更加严重,用户在小区间的频繁切换给移动性管理引入了额外的开销,基站之间负载不平衡问题变得更加突出等。移动网络环境的异构性导致了视频预取技术的复杂性,在未来的研究中需要考虑同时考虑干扰管理、移动性管理、负载均衡等各个方面。
本文从用户、内容和网络3 个角度对近年来移动视频预取领域的研究成果进行综述,并将预取技术总结为基于用户移动行为感知的预取、基于内容属性感知的预取和基于网络资源感知的预取。预取机制可以显著提升用户QoE,但仍然面临诸多问题。在未来的研究中,预取技术可以在用户隐私保护、内容预测误差修正、网络能耗优化和异构网络的协作预取等方向取得突破,使预取性能得到更好的提升。