移动边缘计算中的智能任务迁移技术:现状与展望

2022-09-27 06:12全浩宇张青苗赵军辉
无线电通信技术 2022年5期
关键词:时延边缘服务器

全浩宇,张青苗,赵军辉

(华东交通大学 信息工程学院,江西 南昌330013)

0 引言

近几年来,随着移动互联网技术的发展和5G网络的普及,互联网中来自移动端的流量呈现出爆炸式的增长,并逐渐占据了互联网的主导地位,而移动设备也成为了人们日常娱乐、社交的主要载体,在日常生活中扮演着重要的角色。据统计,截止2021年12月,我国网民使用手机上网比例达99.7%,远超使用台式机、笔记本电脑和平板电脑上网的比例[1]。然而随着人们需求的不断提升,移动设备的计算、存储能力已经无法满足现有的计算密集型和时延敏感型任务,例如智慧城市、自动驾驶等。此外,电池技术也没有取得令人满意的突破,这也是当下移动通信行业发展的瓶颈之一[2]。为了应对日益增长的业务需求,研究人员开始将云计算的计算模式引入移动通信领域,移动云计算(Mobile Cloud Computing,MCC)应运而生[3]。

MCC是指通过移动网络,将云计算中心的计算、存储资源分配给移动设备的计算方式,是移动通信和云计算相结合的一类应用。MCC的优势在于:移动设备可以通过连接云服务器,访问远程云计算中心强大的计算、存储资源,并将某些待处理的任务迁移至云服务器上运行。这样做的好处是可以大幅降低移动设备自身的计算、存储和能源开销,只需要负责数据的传输和结果的接收。这样不仅可以很好地弥补移动设备在计算、存储能力和电池容量等方面的天然弱势,还可以让移动设备运行更多的计算密集型应用[4-5]。然而,MCC的计算模式需要将任务所需的数据通过无线网络传输到远程云服务器上,这一方面会造成较高的服务时延;另一方面,从网络拓扑的角度来看,如此庞大的数据流也会给核心网带来较大的负载,从而影响网络整体的性能[6],并降低用户隐私数据的安全性。

为了解决上述问题,研究人员提出了首个将计算、存储资源靠近移动设备的概念Cloudlet[7]。Cloudlet的原理是将具有强大计算、存储能力的服务器放置在移动网络的各个关键节点,从而为周边的移动设备提供高效的计算和存储服务。相较于限制性较大的Cloudlet,思科于2012年提出的雾计算概念更加广为人知,甚至被视为物联网和大数据应用的关键技术[8-9]。雾计算的典型架构是由云层、雾层和设备层构成的3层体系。其中雾层可以根据实时需求拓展为多层,而雾节点可以是小型基站、WiFi接入点甚至用户终端。通过雾计算,可以有效降低移动用户使用云计算时的数据传输时延,并应用在更为广泛的场景中。

由于Cloudlet和雾计算模式的计算、存储资源都不是天然集成在移动网络架构中的,因此在网络拓扑比较复杂的情况下,用户的服务质量(Quality of Service,QoS)仍难以保证。为了解决移动用户的云计算需求问题,2014年移动边缘计算(Mobile Edge Computing,MEC)应运而生[10]。相较于传统的网络架构和模式,MEC能有效改善传统网络架构和模式下时延高、效率低、网络负载大等诸多问题。也正是这些优势,使得 MEC 被认为是未来5G的关键技术[11-14]。

本文对近年来有关MEC技术的文献进行了广泛调研,从不同角度分析了MEC与传统云计算技术的差异,重点叙述了MEC中的任务迁移技术,并对其研究现状进行了分类与总结。最后,对未来MEC与人工智能技术相融合做出了展望。

1 MEC概述

MEC是一种新型的计算范式,更是新一代智慧城市、智慧交通中的重要部分[15-17],其应用场景如图1所示。移动设备通过拓展来自边缘服务器的计算、存储资源,能显著优化用户的日常体验,并提升设备续航。

图1 移动边缘计算应用场景

当前MEC的优势主要集中在以下几个方面:

① 低时延:MEC通过将计算和存储能力“下沉”到网络边缘,拉近了与用户之间的距离,如图2所示。用户请求由部署在本地的MEC服务器直接处理并响应用户,从而有效降低通信时延。MEC的低时延特性在自动驾驶[18]等时延敏感型应用中表现尤为明显。

图2 移动边缘计算网络结构

② 大容量:通过部署在移动网络边缘的MEC服务器对流量数据进行就近卸载,可以有效降低传输网的带宽负载,并减少发生链路拥塞和故障的可能性,从而改善系统容量。

③ 低功率:对于设备而言,能量消耗主要包括任务计算耗能和数据传输耗能两部分。据不完全统计,我国仅云计算中心所消耗的电能就已超过匈牙利和希腊两国的用电量总和[19]。由于边缘服务器自身具有一定的计算和存储资源,因此能够在本地进行部分任务的计算,从而有效降低数据传输能耗。另一方面,随着资源缓存技术的发展,存储资源相较于传输资源的成本逐渐降低。MEC是一种以存储换取带宽的方式,通过内容的本地存储可以极大减少远程传输的必要性,从而降低设备的数据传输能耗。

④ 重隐私:当用户使用社交网络和自动驾驶等隐私服务时,用户的地理位置等隐私数据通常会被上传至云服务器进行处理,这会增加用户隐私数据泄露的风险。MEC通过使用近用户端的边缘服务器对数据进行直接处理,能有效缩短数据流通路径,降低隐私数据泄露风险[20]。

MCC与MEC技术对比如表1所示。尽管MEC技术理论上能有效提高用户体验,但是在实际应用中还是会面临诸多问题。例如移动设备的高动态性就对MEC的任务迁移与调度提出了很高的要求,同时用户分布的不均匀特性也对边缘服务器的资源分配带来了巨大挑战[21]。因此,一个好的任务处理方案就显得非常重要[22]。

表1 移动云计算与移动边缘计算技术对比

2 MEC中的任务迁移技术

2.1 任务迁移流程

在资源受限的移动设备上运行计算密集型任务会消耗大量的能量,而且运行效率往往也难以满足应用的时延等需求,这对安全性要求极高的应用,如自动驾驶,是难以接受的。为了解决此类问题,研究人员们提出了任务迁移概念。MEC通过将移动设备的任务迁移到附近的边缘服务器上执行,可以有效降低移动设备的电量开销,同时借助边缘服务器强大的计算能力,可以显著提升任务的处理速度,以达到缩短服务时延的目的[23]。

移动边缘计算的任务迁移主要包括环境感知、任务划分、迁移决策、数据传输、任务执行、结果返回六大步骤[24],其中环境感知、任务划分和迁移决策是整个迁移流程中最为核心的步骤。具体的任务迁移流程[25]如图3所示。

图3 移动边缘计算的迁移流程

2.1.1 环境感知

环境感知发生在任务迁移的准备阶段,用于为后续的迁移方案提供参考信息。当任务需要进行迁移时,首先需要对本地运行环境和外部运行环境进行感知,主要包括移动设备自身以及所有MEC边缘服务器的计算、存储和通信资源,这些信息将对后面的迁移流程起到决定性的作用。

2.1.2 任务划分

任务划分所解决的是在什么时间,对什么任务进行迁移的问题,根据其关注的指标,主要可以分为以下几类:

按需求划分需求划分主要是按照任务的计算需求将任务划分成时延敏感型任务和时延不敏感型任务。其中时延敏感型任务通常要求较低的服务时延,因此在资源充足的情况下将优先在本地计算;而时延不敏感型任务则倾向于在满足最大时延要求的情况下迁移到云上进行计算。

按粒度划分已有的粒度划分主要分为细粒度和粗粒度划分[26]。细粒度划分的对象主要是方法、类、对象、线程级的,而粗粒度划分一般都是应用、虚拟机级的。其中细粒度划分虽然可以最大程度优化系统的资源分配情况,但是存在随着划分任务数量的增加,解算法复杂度呈现出指数增长。因此在实际应用中,通常是将任务采用粗粒度划分的方式,以虚拟机的形式部署在边缘服务器上。

2.1.3 迁移决策

迁移决策是任务迁移流程最核心的环节,主要功能是解决任务是否迁移、往何处迁移、通过何种方式迁移等问题。具体来讲,这个环节会根据任务对环境的感知和任务划分,通过合适的决策算法,选择出最优的迁移目标与迁移路线。此环节在整个任务迁移流程中起着至关重要的作用,也是行业内的研究热点。

2.2 任务迁移过程中的重要指标

移动设备的任务迁移和调度是MEC的一个重要内容,可以使移动设备在有限的续航时间内体验更好的服务。通过向移动设备提供部署在网络边缘的计算、存储资源,能在保证服务时延的同时,加快计算速度,节约设备能源,提高用户的QoS。任务迁移的核心调度是通过迁移方案来控制的,主要取决于以下几个指标[27-28]。

2.2.1 服务时延

在对移动设备任务进行迁移的过程中,迁移方案首要的准则就是需要保证迁移后的服务时延在用户期望时延阈值内。由于大多数应用中任务处理后回传的结果数据量很小,因此服务时延主要由任务数据传输时延和任务处理时延决定。对于这些时间,可以表示为:

(1)

式中,C为迁移任务的计算规模,fm为所选择MEC边缘服务器的计算能力,Ds为运行任务所需的数据大小,Ru为移动设备和边缘服务器之间上传链路的传输速率。

若任务的回传数据量较大,如视频资源请求等,则需考虑回传时延,此时服务时延表示为:

(2)

式中,Dr为运行任务结果的数据大小,Rd为移动设备和边缘服务器之间下载链路的传输速率。

2.2.2 能源开销

任务在进行边缘计算的过程中,不仅会带来相应的服务时延,也会给移动设备自身和边缘服务器带来一定的电量消耗。对于移动设备而言,任务迁移过程中主要的能源消耗为传输任务所需的能耗,可以表示为:

(3)

式中,Pu为移动设备发送信号的功率,只存在于任务迁移的数据上传阶段。Pc为移动设备固有的电路功率,存在于整个任务迁移的过程中[29]。而对于边缘服务器而言,任务迁移过程中主要的能源开销为CPU计算任务所带来的计算能耗,一般表示为:

(4)

式中,κ为CPU的有效电容常数,一般取10-27。

2.2.3 系统负载

移动设备在进行任务迁移的同时不仅要考虑任务的时延阈值,也需要考虑MEC系统的任务负载情况。所选中的迁移方案要能在满足用户QoS的同时,尽可能地实现MEC系统处于负载均衡状态,以此来保障整个MEC系统的稳定性,并提高MEC系统的可靠性和容量。目前,运营商通常是将边缘服务器划分成虚拟机(Virtual Manufacturing,VM)的形式来实现多任务资源分配和处理的,对于每一个需要迁移到边缘服务器上的应用,服务器都会为其生成一个对应的VM用于处理该任务[30]。边缘服务器的总负载可以直接根据其部署VM占据的资源总和来计算。

假设边缘服务器PMj上部署的虚拟机数量为n,虚拟机VMi占用的计算资源为ci,则该边缘服务器PMj上的总资源占用Oj可以表示为:

(5)

式中,ri用于判断虚拟机VMi是否处于运行状态,可以表示为:

(6)

假设边缘服务器PMj的总资源量为Tj,则有边缘服务器PMj的使用率为:

(7)

(8)

而MEC的总体负载情况μ通常使用边缘服务器的负载均方差来表示:

(9)

2.3 任务迁移技术研究现状

实际研究中,任务是否能进行迁移是由MEC系统为迁移所付出的开销相较于任务迁移前后的用户QoS提升是否能被接受所决定的。具体来说,对于时延不敏感任务,例如文件资源请求等任务,任务迁移所带来用户的QoS提升不足以弥补迁移过程中系统的开销,所以此时迁移方案应倾向于保持当前状态。而对于时延敏感任务,例如自动驾驶相关的计算,通过任务迁移降低时延带来的好处,远高于迁移过程中的开销,因此迁移方案倾向于迁移该任务。

综上所述,常见的任务迁移方案按照其优化指标通常可以分为两类[31]:最小化时延和最小化开销,这两类的区别如表2所示。

表2 任务迁移方案的两类优化准则

2.3.1 最小化开销

文献[32]解决了兼顾任务计算和文件传输能量消耗的优化问题,为了最小化卸载系统的能量消耗,并考虑5G异构网络的特性[33],作者提出了一种高效节能的任务迁移(EECO)方案。文献[34]提出了一种多任务场景下的迁移决策方案,作者通过将任务建模成一个具有约束的马尔可夫问题,并将时间划分成均匀的时间片,旨在满足任务时延需求的同时最小化系统的开销。文献[35]则考虑多蜂窝小区的场景,提出赋予小型蜂窝基站增强云能力的场景,并在满足最大时延要求的基础上,提出了一种基于凸优化的分布式迭代算法来对通信资源和计算资源进行联合优化。实验结果表明,这种方案联合优化的结果显著高于对通信资源或者计算资源单独优化的结果。文献[36]则重点关注联合优化所有任务的卸载决策和计算、通信资源的分配,旨在使所有用户的能量成本、计算成本和时延的加权总和最小。作者先将问题表述为一个非凸二次约束的二次规划问题,并由此提出了一种由半定松弛、交替优化和顺序优化组成的高效三步算法。结果证明,此方法总是能计算一个局部最优解,并在合适的参数设置下给出接近最优的性能。

2.3.2 最小化时延

文献[37]提出采用马尔可夫决策过程来处理计算任务调度的方案,通过分析每个任务的平均时延和设备功耗,对功率约束条件下的时延进行建模,并提出了一种高效的一维搜索算法来寻找最优的任务调度策略。实验结果表明,所提出的方案在任务平均时延方面相较于贪婪算法等方案都有着更好的表现。文献[38]提出一种基于在线Lyapunov优化的动态任务迁移算法,实现了在任何时间节点,都无需计算通信资源和任务计算请求的统计信息,就能求得确定性优化问题的最优解。文献[39]针对移动边缘云计算中多个移动设备用户的任务迁移决策问题,提出一种博弈论方法,并推导出了计算收敛时间上界的公式。仿真结果表明,该方案具有较好的卸载性能,而且随着系统内用户数量的增加,算法也具有更好的适应性。

3 未来挑战与展望

MEC作为未来移动通信系统中重要的功能,吸引了国内外大量研究人员的关注。但目前的MEC仍然是一项不完善的技术,有着较多的问题需要解决,其中的挑战主要来自以下几点:

① 与传统边缘计算相比,MEC中用户的分布具有高动态的特性,这就要求MEC系统在任务迁移的实时决策上有较好的性能表现[40];

② 在实际应用场景中,用户的分布往往随着时间,在不同位置呈现出错峰聚集的特性,这就对边缘服务器部署提出了较高要求;

③ 不同的任务在到来时间、时延阈值以及对不同类型资源的要求上具有较大差异,这就对边缘服务器的资源分配方案提出了巨大的挑战。

随着近些年人工智能领域的崛起,行业内已经有越来越多的研究人员开始尝试将人工智能技术与MEC技术结合,希望通过人工智能来解决MEC所面临的问题。文献[27]提出使用非支配排序遗传算法,通过合理构建MEC的系统资源模型,并根据多目标决策准则,来实现在保证任务执行时间的同时,对边缘服务器进行负载均衡优化。

文献[41]提出了一种基于多智能体算法MADDPG的任务卸载方案,通过建立边缘系统主导下的联合任务时延约束和多维资源管理模型,实现了以任务执行总时间最小为目标的多任务多目标的联合优化。文献[42]中通过量化远程通信开销与VM迁移开销,构建了VM迁移开销模型,并利用DQN算法实现了VM迁移决策模型的训练。

对于单用户的MEC系统而言,用户在迁移前后都能独占MEC服务器的全部计算资源,因此不用考虑来自其他用户的通信、计算、存储资源竞争,可以很方便地得到迁移决策。但随着车联网和物联网的发展,越来越多的设备将接入MEC系统,这就对MEC系统提出了非常高的要求。MEC系统需要灵活利用有限的通信、计算、存储资源来满足多用户场景下的多任务并行处理。本文就融合了人工智能算法DDPG的MEC动态任务迁移机制做了简单仿真,具体仿真参数如表3所示。图4为融合了人工智能算法的MEC系统性能表现,其中图4(a)为训练过程中系统容量相较于基线的表现,图4(b)为训练过程中任务服务时延相较于基线的表现。各项实验结果表明,融合了人工智能技术的MEC系统能有效降低任务的服务时延并提升系统容量,相信这也是未来MEC研究领域的一个重要方向。

表3 仿真参数

(a) 系统容量表现

4 结束语

随着移动互联网领域的迅猛发展,越来越多的计算密集型应用出现在了人们的日常生活中。受限于移动设备资源的匮乏,MEC技术便成为了解决当下困境的突破口。然而,复杂的移动场景又为MEC系统提出了各种新挑战。本文对MEC技术的研究进行了全面综述,首先回顾了MEC概念提出之前,行业内的其他移动云计算技术;然后分析了传统移动云计算技术在当前环境中存在的不足,并由此引出了MEC的概念。介绍了MEC在当前环境下的优势与MEC任务迁移的相关技术与指标;最后对最新的研究做了总结,并进一步对MEC与人工智能相融合的发展方向做出了展望和仿真。

猜你喜欢
时延边缘服务器
计算机网络总时延公式的探讨
服务器组功能的使用
理解Horizon 连接服务器、安全服务器的配置
PowerTCP Server Tool
《舍不得星星》特辑:摘颗星星给你呀
基于GCC-nearest时延估计的室内声源定位
基于移动站的转发式地面站设备时延标校方法
一张图看懂边缘计算
计算机网络安全服务器入侵与防御
在边缘寻找自我