莫梓嘉,高志鹏,苗东
北京邮电大学,网络与交换技术国家重点实验室,北京 100876
在过去的十几年中,以云计算模型为核心的集中处理模式将计算能力、存储能力和网络管理集中化。随着物联网时代的到来,物联终端设备数量爆发式增长,根据IDC(International Data Corporation)预测,到2025年,全球物联网设备数将达到416 亿台,产生79.4ZB 的数据量,同时这些物联网设备产生的数据量将以28.7%的复合年增长率(CAGR)增长。
万物互联时代的到来带来了时延、能耗、性能、存储、安全等方面的新需求,为了满足以上需求,面向边缘终端设备的进行海量数据处理与分析的边缘计算模型应运而生。边缘计算是在网络边缘执行计算的一种新型计算模型[1],是部署在边缘设备与云中心之间的一种新的计算范式,处理来自云的下行数据和物联设备的上行数据。
从集中式的云计算模式到分布式的边缘计算模式,更多的是从数据流转和数据处理能力的角度考虑模式的转变,然而随着物联设备数量的快速增长,要求终端设备运行智能计算并提供智能服务成为主要需求。2010年后,由于深度学习的兴起,人工智能技术再次受到学术界和产业界的关注。人工智能是一项使用机器实现、代替人类实现认知、识别、分析、决策等功能的技术, 其本质是对人类意识与思维信息过程的模拟[2]。当前人工智能技术主要分为四类:模式识别、机器学习、数据挖掘、智能算法,并成功应用于图像识别、语言识别、专家系统、智慧医疗、智能交通等领域。然而,由于人工智能方法包含大量的计算,当前人工智能大部分计算任务部署在云计算中心等大规模计算资源集中的平台上,这极大地限制了人工智能带给人们的便利[3]。
物联网时代的到来使得现有的集中式云计算服务向设备端下放计算资源,让更多的数据处理任务就近完成。同样地,对于人工智能技术而言,智能算法大多是需要强大计算能力作为支撑的计算密集型算法,然而当下的技术发展趋势更加偏向于灵活但是资源受限的终端设备。因此,将智能算法下沉到边缘设备端进行部署,结合边缘数据的计算本地性与智能算法的强计算能力,同时解决资源受限问题和实时处理问题,催生出一个新的技术——边缘智能。
边缘智能是将人工智能引入边缘场景的新技术,具体来讲,边缘智能是一种融合网络、计算、存储、应用核心能力,使边缘设备执行智能算法,提供智能服务并满足时延率低、能耗量小、精确度高和安全可靠的关键需求的新兴技术。它为边缘计算设备提供了一个融合了数据联接与管理、数据计算与分析、数据存储与收发、业务智能决策与开展的开放式平台,同时利用智能算法为边缘计算节点提供任务迁移和任务卸载等智能服务,并进一步满足了实时业务、数据优化、应用智能以及安全隐私等方面的行业需求,创造了一种边缘计算与人工智能技术相互协同的新模式。边缘智能使得用户服务更加贴近数据侧,这是在当下物联网时代以数据为驱动的特定场景下提出的一种更加高效,更加便捷的计算方式。
边缘智能被提出至今仅有5年时间,尚处于探索阶段,但其发展前景被业界广泛看好,引起了高度关注。为了更清晰地确定边缘智能的发展过程,本文以边缘计算元年2015年[4]作为统计的开始,在谷歌学术上以“edge intelligence”为关键词进行搜索每年的文章数量,结果如图1 所示。从2015年至今,边缘智能相关的论文数量在逐年地小幅度上升,2018-2019年论文数量较之前显著上升,但是整体的论文数量至今未破万篇,这代表在学术界该领域的研究进展还处在初级的技术积累阶段。尽管在工业界,以边缘智能为核心思想的业务在不断地发展壮大,但学术界对边缘智能这一领域的研究依然缺少标准化、一体化的研究思路,这大大阻碍了边缘智能的进一步发展。
图1 Edge intelligence 论文发表数量及趋势Fig.1 Number of published papers and trends
图2 边缘智能的发展历程及典型事件Fig.2 The development process and typical events of edge intelligence
图2 列举了边缘智能在工业界发展中的典型事件,边缘智能第一次出现在公众的视野中是在欧洲电信标准协会(ETSI)2015年9月发布的《移动边缘计算:一项通向5G 的关键技术》中,该报告提出了在移动边缘节点嵌入人工智能的相关技术的思路;2017年5月微软在Build 大会上提出了智能云和智能边缘的概念;2018年3月,阿里云发布了Link Edge,通过云边一体的设计理念将阿里云的能力下沉到边缘端,致力于用云端的能力解决边缘端的问题;2018年8月,由阿里集团联合多个物联网产业链伙伴组成的ICA(IoT Connectivity Alliance)联盟发布了《边缘智能白皮书》;2018年11月边缘计算产业联盟(ECC)在北京主办了以“边缘智能、边云协同”为主题的边缘计算产业峰会。我们可以看到在短短的几年时间内,边缘智能就获得了学术界和产业界的一直青睐,相信随着不断地技术积累,未来还将有更多的技术被应用在边缘智 能领域。
本文将边缘智能计算模型发展的过程分为四个阶段:
技术储备阶段:在边缘计算提出伊始,“边缘+云”的模式开始在学术界被提出,此时边缘节点之间与云中心相互独立,在这个阶段云端计算中心承担着几乎全部的工作任务,也并未向边缘节点下沉计算资源,全网统一的算力面和数据面还未形成。
单一智能阶段:物联网时代的到来,兴起了一批以数据为驱动的技术,同时“边缘+云”的工作模式也渐渐地被应用到了更多的场景下。人工智能在视频分析、语音识别等多项业务中表现突出,因此在这一阶段,根据不同的业务需求,在边缘节点上部署有针对性的单一化智能服务,以推动智能向本地化发展。该阶段尚未整合多种智能算法,且对边缘设备侧的实时响应能力要求不高。
模型优化阶段:由于传统的深度学习框架过于庞大,很难直接部署在边缘计算平台上,因此在这一阶段,研究专注于以神经网络为代表的深度学习模型的压缩、优化、分割的问题,最终实现轻量化的人工智能模型,并将轻量级的人工智能引擎引入边缘计算平台,使其具备在本地进行小规模模型训练和推理的能力。同时,云端被要求实现一系列的边缘节点调度和任务卸载策略,在这些基础的策略算法搭建完成之后,人工智能技术的潜能才能被彻底激活。
协同计算阶段:经过上述三个阶段的演进与发展,本阶段将形成以终端物联设备、边缘节点与云计算中心为计算框架,人工智能技术为驱动导向的协同计算模式。该模式将提供资源丰富、响应灵活的个性化智能服务。本阶段主要在数据、算法、任务三个维度中体现边云协同:数据协同打破“数据孤岛”,算法协同破解数据隐私保护难题,任务协同为应用场景提供多种类、一致性的智能服务[5]。
从边缘智能的发展趋势中不难看出,边缘智能正逐渐从单一的智能化阶段走向协同计算阶段,计算模式的更新迭代一方面可以推动相关技术的发展和进步,另一方面,多方协同的计算模式必然会带来很多的挑战与矛盾。在协同计算的模式下,衡量边缘智能技术主要依赖四个特性:实时性(时延低)、精确性(准确率高)、能耗性(能量消耗低)和安全性(安全和隐私保护)。根据边缘智能的四个特性,本文总结出边缘智能发展的三个主要矛盾,并阐述由矛盾带来的挑战。
边缘智能中的时延包括计算时延和通信时延,前者取决于边缘节点的能力和计算模型的规模,后者受影响于传输的数据量及网络带宽。由于深度学习的发展,当前的智能模型多采用深度神经网络算法,大规模的神经网络模型使计算结果准确率提升的同时,也提高了边缘节点的运算时间,如何在保证计算结果精确度的情况下满足边缘智能计算实时性的需求,是边缘智能研究中的重要挑战。
以分散方式训练智能模型时,计算和通信过程都消耗大量能源。但是对于大多数终端设备而言,它们都是能量受限的。能源效率主要受目标训练模型的大小和边缘设备资源规模的影响,一般来讲,计算结果精确度要求越高,模型规模越大,所消耗的边缘节点能量越大。边缘智能的一个重要挑战则是如何平衡计算模型精确度与边缘节点的能量消耗。
在用户数据安全方面,由于边缘节点靠近产生数据的用户终端设备,因此使用边缘节点来存储数据可以在一定程度上避免数据泄露,达到用户隐私保护的目的。但是人工智能算法作为以数据为驱动的算法,往往需要海量数据作为支撑加以实现[6]。不充分的数据使得智能算法无法进行完善的训练,降低算法的准确率,从而最终影响服务质量。因此,边缘智能场景中如何在不影响服务质量的情况下,保护数据隐私安全亟待研究。
随着边缘智能研究的逐渐深入,各界研究人员直面挑战,解决问题,推动相关技术的发展。针对上节分析的边缘智能中的矛盾与挑战,本节总结了当前学术界的四个主要研究方向,包括模型优化、任务资源分配、边缘联邦智能、云边端协同。其中,模型优化和任务资源分配主要解决了计算精确性与实时性、能量消耗之间的矛盾,不同点在于前者是从边缘赋能智能的角度上出发,后者则是智能赋能边缘的重要方向。边缘联邦智能主要目的在于解决服务质量与隐私保护之间的问题,云边端协同则在协同架构角度上综合性地解决了上述提出的三大矛盾与挑战。
当边缘计算设备嵌入人工智能技术时,相较于云端高性能的计算能力,边缘侧的计算设备计算能力有限,同时,移动设备在面对海量数据的输入时其存储能力也相对有限,而深度神经网络是数据驱动的技术,因此大规模的数据和模型训练过程是无法避免的。面对这样的窘境,如何开发、优化、压缩、分割神经网络模型就成为了边缘智能领域中最为重要的研究方向之一。目前为止,学术界及产业界提出的多样的模型压缩方式以及模型分割技术,比如:模型剪枝、模型量化、低秩因子分解、知识蒸馏、紧凑型网络设计以及模型分割等。根据优化思路的差异,如图3所示,我们将现有的模型优化策略分为三类,结构性优化策略、非结构性优化策略以及协同性优化策略。
图3 网络模型优化策略分类Fig.3 The classification of network optimization strategies
对于结构性优化策略来讲,在保证一定准确率的情况下,致力于将深度神经网络中冗余的或对整个模型影响较小的信息进行剔除或压缩,从而达到减少计算和存储开销的目的,这类优化策略主要关注的是网络模型本身,基于固定的网络模型来进行模型优化。
剪枝[7-10]是模型结构性优化中使用最多的方法,通常是寻找一种有效的评判手段,来考量参数对于模型的重要性,在保证模型的准确性的基础下,将不重要的参数剔除来进行参数量的缩减,模型剪枝算法在云中心执行,并将剪枝后的模型分配到边缘计算节点。模型量化[11-12]也是近年来模型优化研究的热点。量化神经网络中8 位整型表示32 位的浮点型数,通过牺牲精度来降低每一个参数所需要占用的空间。当参数规模很大时,模型量化可以很好地压缩存储空间,使其更加适配于存储敏感的边缘节点。这对于边缘智能来说,无疑是很有效的方式,也是近年来使用较多的一种方式。深度神经网络旨在挖掘并去除网络中参数和特征的冗余信息,从而达到减少网络参数。这恰恰与边缘智能中的边缘节点对于模型的需求相同。研究者发现对于参数矩阵它们往往具有低秩的性质,存在大量冗余,因此可以使用SVD 等方法将权值矩阵分解成多个小矩阵的乘积,使用这种方式可以有效的降低参数间的冗余信息,达到模型压缩的目的。Tai C[13]等人在2016年提出从零开始训练低秩卷积网络模型的方法,也是基于低秩近似的思想完成的。目前,低秩分解的方式虽然已经发展较为成熟,但是在实际场景下的应用并不多,其中一个重要原因是越来越多的网络已经开始使用1x1 的卷积核,对这种小的卷积核用低秩分解的方式无法对网络加速和压缩。
与结构性优化策略完全不同的是,在非结构性优化策略中,不关注模型本身的结构,而是将深度神经网络模型视作黑盒,只关注系统的输入输出情况。在这种优化策略中,致力于重新构造网络模型,在保证与原复杂模型功能实现相同的情况下,设计更轻量化、更适于应用在边缘侧的网络。前三类方法并没有改变整个网络模型的结构,而是针对模型中的冗余信息进行压缩,而本节中的两种方法则彻底地改变了整个模型,使用另外的模型替代现有模型已达到同样的目的,这是两种截然不同的设计思路,但对于边缘节点来讲,只要最终达到了模型参数压缩和存储压缩,使用不同的方式可以起到同样的作用。
知识蒸馏方法采用的是迁移学习的方式,通过采用预先训练好的复杂模型的输出作为监督信号去训练另外一个简单的网络。利用知识迁移来压缩模型最早由Caruana 等人[14]提出,他们训练了带有伪数据标记的强分类器的压缩模型,并复制了原始网络的输出,后来Hinton[15]等人引入了知识蒸馏的框架,提出了“学生-教师网络”这一概念,其中教师网络一般是一个泛化能力较强的深层网络模型,它的性能良好,可以用来监督轻量化的网络模型,即“学生网络”,通过“惩罚“教师和学生之间输出的损失值,使学生输出逐渐逼近教师模型的输出。基于知识蒸馏的方法能令复杂度很高的深度神经网络模型显著降低计算成本,但同时这类方法的局限性也很强,只能应用于具有softmax 损失函数的分类任务中。紧凑网络设计的方式是在模型构建的初始阶段就选择小而冗余度低的网络,比如将原本的3x3 卷积核替换为1x1 的卷积核,或者减少卷积核的输入通道数量,这样在保证结果的准确率的情况下,大大的压缩了存储空间,目前紧凑型的设计中最有名的是MobileNets 系列以及Inception 系列,他们都很好的应用到了移动端的深度学习开发当中。
最后一类优化策略则是基于“边云”协同模式下的一种个性化设计策略,与前两类策略不同,协同性优化策略根据边缘节点的计算资源、存储能力的差异以及不同场景对于计算时延和精确度的要求,设计提供了不同的模型退出和切分点,使模型得到了精简和优化。典型例子是Li En 等人[16]提出的Edgent 协同按需推理框架,能够实现在设备和边缘之间自适应的划分深度神经网络模型,实现按需低延迟边缘智能服务。
在边缘计算模式中,云计算中心的计算任务将部分迁移到多个网络边缘,通过在云数据中心与边缘服务器之间进行动态任务卸载和资源调度,减轻云计算中心的计算压力,减少网络主干带宽的使用,并提升服务响应能力和数据隐私保护能力。当使用人工智能技术与边缘计算结合后,任务卸载的研究同样适用于边缘智能,以用来优化AI 模型中产生的计算时延、能耗和精确性等多种性能。
任务资源分配的主要目的是减少服务的响应延迟,降低能耗,节约网络流量和提高服务质量等。当终端节点不具有处理能力时,可以将计算卸载到边缘服务器或云数据中心,以提高系统的整体性能。云边协同场景下的任务卸载,将任务智能地卸载到云端或边缘节点上,在远程云中进行大规模数据训练得到源神经网络,在边缘节点加载预训练的神经网络并自定义预测模型、训练模型和进行任务卸载。He Li 等人[17]提出在视频图片信息处理场景下,在深度学习的中间层加入边缘服务器处理低层数据,缩减数据之后传给云中心,减少网络流量,并且缩减后数据不具有语义,以此来保障安全性。并提出了在线和离线调度算法,调节边缘服务器所在层数,最大化边缘服务器可调节的任务数量。
在边缘智能场景中,如何在不影响服务质量的情况下,保护数据隐私安全正在逐渐成为人工智能的下一个挑战,边缘计算由于其将数据储存在边缘设备端的架构优势,在一定程度上增强了数据的安全与隐私保护。然而,数据在不同边缘节点相互独立存储、维护、管理,容易形成数据孤岛。联邦学习的产生为边缘智能打破数据屏障和进一步发展提供了新的思路。
图4 云边端协同架构示例Fig.4 The example of Cloud-Edge-Device collaborative architecture
联邦学习本质上是一种加密的分布式机器学习技术,各个参与方可在不批露底层数据和底层数据的加密形态的前提下共建模型,在保护本地数据的前提下让多个数据拥有方联合建立共有的模型,从而实现了以保护隐私和数据安全为前提的互利共赢。对于边缘智能领域而言,联邦学习具有天然优势。首先,联邦学习架构与边缘计算架构类似,都是计算资源与服务的下沉与分散化,通过协同终端设备与边缘服务器,使得联邦学习可以与边缘计算进行很好的结合;其次,针对边缘设备的智能化需求,联邦学习通过多客户端协同优化模型,参与优化的边缘设备服务模型可以在迭代训练中不停完善,从而持续提高边缘设备智能化程度;最后,在联邦学习框架下边缘设备数据不对外泄露,可以有效地保障智能设备内隐私数据安全,在智能安全的前提下解决边缘智能中的数据孤岛问题。总而言之,边缘智能和联邦学习的有机结合——“边缘联邦智能”将为学术界和工业界进一步展开研究提供新的机遇。
随着边缘智能相关技术的发展,如何把云中心、边缘计算以及物联设备进行连接和计算力的协同,发挥云中心规模化、边缘计算本地化与终端感知快速决策等方面的优势,并平衡精确性、实时、能耗和隐私安全是一个关键问题。图4 给出了云边端协同架构的模型示例,“云-边-端”协同架构是以云为中心,向边缘节点、物联终端逐层分散延伸的网络架构,这其中涉及到云边协同、边边协同和边端协同三种协同方式。
(1)云边协同:云计算与边缘计算的协同方式是目前研究者和产业界探索最多的一种协同模式,云计算强大的存储和计算能力能够确保大规模、长周期的智能处理与分析,边缘计算的实时性则更好地支撑了局部、短周期的实时智能决策与执行。云边协同的场景下,云根据边缘上传的数据或模型来分析、存储,并将训练好的模型下发至边缘端,边缘进行终端数据的采集并实时更新云下发的数据或模型。这种协同方式支持数据在边缘和云之间进行可控有序流动,完成自主学习闭环。
(2)边边协同:在边缘智能场景中,单个的边缘节点计算和存储能力有限,且数据来源受限,需要多个边缘节点协同训练。每个边缘节点作为计算节点承担模型训练或数据分析任务,边缘节点拥有整个或部分模型,训练集来源于云端下发的数据或者由边缘自身产生的数据生成。训练后的模型参数更新到中心节点或者其他节点中得到完整模型。早在2012年,Jeffrey Dean[18]就提出了大规模分布式训练思想,并证明具有训练大型模型能力的系统能够显著地提升深度神经网络的训练效果。在边缘智能场景下,该分布式训练的意义仍然存在。与传统分布式训练不同的是,在边边协同的场景下,边缘节点存在资源差异性、动态变化性和通信差异性。不同边缘节点之间的存储计算能力、承担计算任务、通信带宽质量差异较大,同一边缘节点在不同时刻的计算能力也有所不同,这种协同方式支持边缘节点的任务和资源合理分配,使得效率最大化。
(3)边端协同:边端协同中的“端”指物端设备,边端协同更注重智能调度和安全接入,本身与应用场景高度相关。在边端协同场景下,物端设备实时地收集数据并上传至边缘服务器,边缘服务器采集多源的实时数据后进行计算与分析,向终端发出指令,指导终端向用户提供各种不同的服务。由于物端设备与用户关系紧密,因此,边端协同被认为是实现智能化服务的重要一环[6]。
针对目前边缘智能的典型场景,本文介绍三个应用案例。
道路交通设施监测管理以及路口流量(人流/车流)监控是智慧交通中最主要的两大应用场景。传统的云端管理平台无法保障对于交通的精确化、实时化管理。因此杨志华[19]等人提出了基于边缘智能的PLC-IoT(Power Line Communication)全联接平台设计。如图5 所示,该平台共分为四层:其中终端设备层包括道路上的各种交通控制设备,这些设备负责下达指令和设备感知;第二层为边缘智能层,终端设备层通过电力载波PLC 与边缘智能层进行实时通信;第三层为网络层,其负责边缘智能层与云应用服务层的网络连接。边缘节点收集来自本交叉口的信号灯,倒计时牌等终端设备的数据,运行智能算法对各个设备进行状态检测与维护、智能分析等操作。同时需要将分析结果上传云端,以实现大范围的交通设备管理服务。云端收集不同交叉路的汇总数据,综合分析给出交通优化策略。该平台的提出实现了智能交通信息的实时响应,大大提高了交通运行效率。
图5 基于云边端协同的道路交通监测系统架构图Fig.5 Architecture diagram of traffic monitoring system
近年来,在智能安防领域由于现有的摄像头无论在数量还是安置位置上都很难满足抓拍到符合条件的人脸图像的要求,且受到人面部特征(发型、胡须)以及佩戴的各种饰品的因素影响,人脸识别和追踪的精确度很难保障。为此商汤科技[20]推出了SenseDLC 嵌入式人像识别SDK 软件。该项技术的实质是边云协同下的人工智能技术。如图6 所示,商汤科技在云端依靠GPU 集群通过亿级别的人脸训练过程完成了模型的建立,随后将训练后的深度学习模型集成到边缘侧的摄像头中,使得该摄像头可以实现人脸结合人体的综合检测,同时它提取了23项影响人面部特征的因素进行建模,使得原先模型识别和追踪精确度较低的问题得到大幅度改善。值得注意的是,上述功能均在边缘侧的摄像头中得到实现,这一改变,大大降低了传输过程中的时延以及云中心的视频处理压力,使得云中心可以更好地对分布在不同区域的智能摄像头进行监控和数据分析。该技术由于支持各类主流的神经网络芯片平台,因此可以很好地应用于小区、校园、商场等人员流动密集区域。
图6 SenseDLC 嵌入式人像识别SDK 软件在小区门禁场景下的应用Fig.6 Application of SenseDLC embedded portrait recognition SDK software in community access control
智慧家庭是边缘智能技术的典型应用场景之一,其旨在对各类家庭终端设备进行实时监控和智能分析以达到提高用户舒适度的目的,家庭中的终端设备包括用于采集室内状况的各类传感器以及记录用水用电的各类监测器,传统的智能家庭系统难以满足用户对于低延时、个性化、隐私保护等的服务需求,为此周莎[21]提出了基于情境感知的智能家居节能系统,实现了边缘数据情境化管理以及数据趋势等功能。如图7 所示,该系统主要分为终端设备、智能网关和云中心三层。首先基于收集到的海量家庭数据信息在云端对各功能模块的深度学习模型进行预训练,接着将模型下沉至家庭中的边缘智能网关节点,这些节点将会采集不同终端传送的本地化数据,以此进一步在预训练模型中加入个性化特征。同时,智能网关将使用流行的机器学习预测算法GBDT、XGBoost、LightGBM 等进一步保障模型对于室内温度、湿度、用电、用水等数据的预测精确度,最后结合用户设置的各类舒适度参数,为用户提供自动化的控制、预警等服务。
将人工智能技术引入边缘计算环境从而产生的边缘智能作为一种新兴技术,从2015年首次提出至今经过近几年的研究发展和技术储备,已经得到了来自国内外政府、学术界和工业界的广泛重视。虽然仍处于初期发展阶段,但得益于边缘计算和人工智能相关技术的快速发展,边缘智能正在由技术储备期走向快速发展期,并在许多场景下发挥 作用。
图7 基于情境感知的智能家居系统架构图Fig.7 Architecture diagram of smart home system
本文从边缘智能发展动态分析出发,总结了边缘智能在时延、精确度、能耗和安全隐私之间的三个主要矛盾,并由此提出了边缘智能面临的挑战,针对这三个主要矛盾与挑战归纳了当前学术界和产业界相关学者研究的四个方向,并列举了边缘智能场景下的应用范例。在可以预见的将来,随着技术的逐渐成熟以及新的应用场景出现,边缘智能技术将得到更大的发展。
本文相信,在进一步完成技术储备后,边缘智能将会在未来进入高速发展阶段,在工业互联网、物联网和智慧城市等智能化产业建设领域取得更大的成就,为产业升级和学术发展提供助力。在面向万物互联的场景下,为了满足更低时延、更低能耗、更高可靠、更智能服务等需求,人工智能和边缘计算技术在向一种全局协同的组合形态进阶,边缘智能是人工智能向边缘侧分布式拓展的新触角。
利益冲突声明
所有作者声明不存在利益冲突关系。