彭晓晖 徐志伟
摘要:针对物端计算系统面临的“昆虫纲悖论”和“数据过于集中”2大生态问题,从计算系统的角度,讨论分析了其在系统架构、应用层协议、资源管理、开发与运行时、计算负载调度5个方面面临的挑战。提出了物端控域计算机设计愿景,即将物端计算系统划分为具有相同或兼容管理策略的控域,并将每个域看作一台分布式计算机,为其设计物端信息总线架构原型。
关键词:边缘计算;物端计算;物端控域计算机;体系架构;应用层协议
Abstract: To address the two ecosystem problems of things system: “Paradox of Classis Insecta” and “Centralized Data”, five challenges of things system in perspective of computing system are discussed in this paper. These challenges include system architecture, application protocol, resource management, application development and runtime environment, and computing payload scheduling. Then, the design vision of the physical-zone-of-control computer is put forward, which divides things system into multiple zones of control with same or compatible management policy. The physical information bus architecture prototype which regards every zone as the distributed computer is finally proposed.
Key words: edge computing; things computing; physical zone of control computer; system architecture; application protocol
1 物端系統的背景
1.1 万物互联与物端计算系统
信息技术正在进入人机物三元计算的万物互联新时代,计算设备正在被赋予了各种具体的形态并融入到物理环境中[1],我们称这样的设备为物端设备,例如温湿度传感器、摄像头等。物端设备正以指数级增长的方式连入互联网,形成物端计算系统,是边缘计算[2]的重要组成部分。物端系统不断地从物理世界感知多源异构的数据,传输到信息世界进行计算,信息世界数据处理的结果也通过其反馈到物理世界,物端系统是感知和控制数据的出入口,是未来人机物三元计算空间的咽喉要塞。物端计算系统天生位于网络的边缘,具有天然的近数据源优势。将计算迁移至物端系统可以大幅减少网络带宽消耗,缩短应用响应延迟和保护用户数据安全和隐私。
物端计算机的显著特征是需要与物理世界进行交互,不断地感知物理世界状态,并通过反馈控制改变物理世界状态。例如,空气净化器可以根据小于2.5 μm的细颗粒物(PM 2.5)传感器数据,调整净化器的净化强度,直至达到设定的目标。这是人机物三元空间中典型的感知-计算-控制循环,也是未来万物互联时代的基本计算模式之一。其中,控制环节可以是系统根据某种策略或算法自动执行,或由用户根据计算结果选择控制动作。
在现有的物联网架构中,由于物端计算机的软硬件平台还未完全准备好计算负载迁移至离环境和人更近的物端上,该循环的计算环节通常在云端进行,造成应用的响应延迟和不确定性。人机物三元计算环境中,大量的应用对实时性有较为苛刻的要求。我们在利用亚马逊的Alex语音控制打开卧室照明灯的实验中,每次开灯平均耗时3 s以上[3]。如图1所示,智能音箱采集的语音数据传输到位于美国的亚马逊云计算服务中心进行解析,识别出的开灯命令发送到位于新加坡的设备控制服务器,通过应用程序编程接口(API)打开位于本地的照明设备。由于数据通路过长,云计算模式显著增加了开灯操作的时延和不确定性。
1.2 物端计算系统的生态问题
物端计算系统面临的第一个生态问题是数据过于集中。随着联网的设备不断增加,其产生的数据也是呈指数级增长。据国际数据公司(IDC)预测,到2025年,全球数据年产量将达160 ZB,其中75%以上是产生于网络边缘和物端设备[4]。近年来人工智能和大数据的发展显示了用户数据在下一代信息系统中的重要作用,以至于被誉为信息时代的“新石油”。然而各大设备厂商均将物端设备感知到的用户数据收集到私有或公有的云计算中心存储和分析。边缘计算、雾计算和物端计算等新的计算模式均旨在将云计算中心的负载向下迁移,这种迁移目的之一也是为了解决数据过于集中的问题。万维网(Web)发明者Tim Breners-Lee在2018年提出了去中心化平台Solid,以解决数据过于集中带来的一系列问题。
物端计算系统面临的另外一大生态问题是昆虫纲悖论[1],即物端设备的种类像昆虫一样繁多,其本质描述的是系统的多样性和无序性。多样性体现在应用场景、芯片架构、硬件接口、操作系统、应用软件、编程模式、通信协议等多个方面。这造成了物端计算机应用开发、部署和运维十分困难,程序员通常需要熟练掌握从硬件选型、软件开发到通信协议选择的全栈知识,才能研发出高效、可靠的新产品。无序性表现在系统的架构、设计方法、编程模式等方面。由于缺乏统一的系统架构、设计和编程方法,物端应用变得十分碎片化,设备之间难以协同计算,从而对人机物三元空间人的行为做出适当的反应。
[8] BORMANN C, CASTELLANI A P, SHELBY Z. CoAP: An Application Protocol for Billions of Tiny Internet Nodes [J]. IEEE Internet Computing, 2012, 16(2): 62-67. DOI:10.1109/mic.2012.29
[9] XU Z, CHAO L, PENG X. T-REST: An Open-Enabled Architectural Style for the Internet of Things [J]. IEEE Internet of Things Journal.2019. DOI: 10.1109/JIOT.2018.2875912
[10] HUNKELER U, TRUONG H L, STANFORD-CLARK A. MQTT-S — A Publish/Subscribe Protocol for Wireless Sensor Networks[C]// 2008 3rd International Conference on Communication Systems Software and Middleware and Workshops (COMSWARE '08). India: IEEE, 2008. DOI: 10.1109/COMSWA.2008.4554519
[11] SHELLY Z, BORMANN C. 6LoWPAN: The Wireless Embedded Internet [M]. USA: Wiley, 2009
作者簡介
彭晓晖,日本东京大学博士毕业,中国科学院计算技术研究所副研究员、硕导;现主要从事物端计算系统的编程方法、应用协议与系统架构研究,研究方向为分布式系统、边缘计算等;主持和参与了数项国家、部委级研究课题;发表论文近20篇。
徐志伟,中国科学院计算技术研究所研究员、博士生导师、学术委员会主任,中国科学院大学教授,CCF会士,曾担任国家自然科学基金委信息科学部专家咨询委员会委员,《IEEE TC》《IEEE TSC》等多个国际著名期刊的编委等;主要研究领域为高性能计算机、分布式计算、网格计算与系统软件,近年来主要从事边缘计算、海云计算系统的研究,并提出了物端计算方向;曾获国家杰出青年科学基金、中国科学院科技进步一等奖、国家科学进步二等奖、中国科学院优秀青年科学家奖、中国科学院百人计划资助、中国科学院杰出科技成就团队奖等,2007年获中国计算机学会“王选奖”;发表论文100余篇、专著3部。