● 中国航天系统科学与工程研究院 李 臻 岑 格
● 山东厚德测控技术股份有限公司 宗绍国
● 军事科学院系统工程研究院 王成海
2017年2月,美国国防部高级研究计划局(DARPA)正式启动分散式计算项目(DCOMP),该项目是一项为期4年的计划,每2年为一个阶段,主要由美国雷声(Raytheon)公司等4家公司,同时联合美国东北大学等多所高校进行技术攻关。该项目旨在研发新算法和网络通信技术,合理应用作战前线分散部署的大量计算基础设施与装备,更好地完成预警探测、战术推演、指挥控制等多种计算任务。
分散式计算是指战场用户利用可编程的网络协议,通过任务感知、任务调度的方式使用本地环境内每台终端设备中可用的计算能力、信息与存储资源,无需集中连接即可实现设备间数据存储和计算能力无缝交换的计算方法。
分散式计算将数据分解成许多小的部分,分配给就近计算设备进行处理,可节约整体计算时间,大大提高计算效率。DARPA认为,分散式计算概念广泛适用于美国军方及其利益共同体的各种想定。为此,DCOMP项目明确了以下研究目标:一是开发利用物理上分散的计算算法和协议,大幅度提升应用程序和网络传输性能;二是基于边缘网络构造云平台;三是针对性地自动将计算移动到网络边缘;四是开发面向边缘网络的协议体系,以弥补现有因特网协议对边缘网络支撑的不足。
一是DARPA要求战场用户能够实时获得数据支持。当前技术条件下,具有重要计算需求的用户通常依赖于对大型、高度共享的数据中心的访问,他们将数据(如图像、视频或者网络日志文件)回传到该中心进行处理。然而,在网络吞吐量严重受限或用户应用需要近于实时响应的状况下,这种“回程”的延迟可能会引发严重的问题。在这种情况下,用户若能利用本地可用的计算能力,则能够大大提高应用的性能,同时降低任务风险。而分散式计算项目寻求开发可扩缩的、鲁棒的决策系统,使具有竞争性需求的用户能够基于任务感知,对计算资源进行安全的、集中式的任务分配,并可跨越大量异构计算平台实现,从而设计出能够在网络连接性高度变化和恶化的环境中运行的系统,使用户能够以最适合任务需求的方式接入,实现数据的快速处理。
二是DARPA要求网络协议能够实现网络可编程。分散式计算项目还寻求网络协议方面的创新。自因特网体系结构及其协议首次被提出以来,网络传输容量增长了多个数量级,用户的应用需求发生了巨变,然而指导互联网体系结构的“端到端”设计原则,导致应用层和传输层协议逻辑主要局限于作为数据源和接收器的端点,造成数据网络缺乏可编程计算能力。分散式计算技术已赋予网络可编程、安全高速的信息处理能力,这需要重新考虑如何利用位于路径上的端点之间的可编程执行环境来提高性能,例如,通过协议逻辑的动态修改,或者本地化的路径内分析,实现有效的诊断和纠正功能。包含分散式计算软件的可编程平台被称为组网式计算点(NCP),用来支持用户应用程序、网络协议堆栈或者兼顾两者的多种功能。
三是DARPA要求能够综合提高网络能力。DARPA认为,目前其战场数据处理过于依赖后方数据中心,在现有网络系统中,大部分网络设备仅作为数据传输节点,并不参与数据计算和存储交换等工作,相关工作仅由数据中心完成,在这种情况下,大量网络资源得不到充分利用。但在战场环境下,大量用户同时提交数据需求,数据中心处理要求和网络传输压力较平时大幅提升,加之新一代作战指挥强调高机动、轻量化、小规模,连排级分队快速机动行动将成为主要的作战形式,在恶劣战场对抗前沿环境存在网络信号和带宽不稳定的情况,可能造成信息传输延迟,极大地影响作战效能。对此,DARPA信息创新办公室(I2O)于2016年6月提出DCOMP,旨在克服当前互联网体系结构中的不足,使大量分散的计算平台能够赋网成云,实现数据到代码的策略性自动移动,使应用程序和网络传输性能实现数量级增长,以改变传统网络体系,研发能够在网络状态高度变化环境下有效运行的新型系统,将相关网络设备由数据传输节点变为可随时调用的计算和通信资源,提供高效智能的计算分析和协同共享能力,从而提升网络系统整体能力,满足用户需要。
DCOMP主要采用面向大数据处理的编码分布式计算技术、可编程网络协议栈技术,以及基于任务完成时间的边缘调度技术等核心技术,与传统网络系统相比,具有以下特点:
一是可灵活调用网络中分散的设备资源。大部分网络设备将具有数据处理和交换功能,形成可调用的计算和通信资源,系统可自动识别可用网络设备,根据需要动态分配数据传输、计算等任务至相关设备,以提高数据传输和处理效率。
二是具备自我感知和快速响应能力。战场网络环境中,人员和装备携带的网络设备在移动过程中能快速感应网络带宽、信号变化情况,通过相关协议进行自动适配,确保数据服务请求得到快速响应,而无需将数据回传到后方数据中心,就地处理数据,可降低数据处理的时延,提高作战系统的实时性能力。
三是能够智能调控网络数据流量。针对战场上大量数据请求给网络带来的巨大负载,分散式计算将开发可编程网络节点和协议栈,通过协议逻辑的动态修改、本地化路径内分析,自动对数据进行整合与精简,实现智能诊断与错误纠正,并按优先等级传输和处理数据,使网络传输更智能,从而确保数据传输的快速、安全性。
四是实现计算能力的倍增。分散式计算具备跨异构计算平台能力,可进行集中式任务分配,可合理应用网络组件、电台、智能电话、传感器、便携式云计算设备,配置可编程执行环境,实现作战前线计算能力的最大化。
DCOMP项目从技术内容角度包括3个技术域(TA),在技术域内及跨技术域之间将进行迭代开发、样机研究和试验。
TA1的阶段性目标是实现分散式任务感知计算算法。重点关注以下方面:一是在综合考虑组网式计算点的负载、计算能力、网络路径特性的情况下,提供最佳计算方案。二是及时处理数据,减少回传数据量。三是及时发现、监视后续数据动向。四是充分利用各种计算设备的计算能力、设备故障感知和恢复能力、任务优先级区分能力,实现分布式控制,满足健壮性和安全访问的要求。
TA2的阶段性目标是实现可编程节点和协议堆栈。重点关注以下方面:一是网络节点具备探测、测量和分析功能,实现有效的网络诊断。二是网络节点通信协议逻辑清晰,便于观察数据传输路径。三是根据传输带宽智能分配计算资源。四是网络节点安全与系统安全,确保数据传输与运算的稳定性。
TA3的阶段性目标是技术集成。将重点关注分散式任务感知算法与可编程节点和协议堆栈实现时的协同性,减少系统运行时的内部冲突。
当前DCOMP项目面临的问题与挑战主要集中于TA1和TA2。
TA1面临的主要问题与挑战包括:一是如何确定延迟、网络负载、功耗、网络节点健壮性等计算任务分配参数的标准;二是如何优化分散式计算方案;三是系统可涵盖的网络节点和用户数量;四是如何确定计算任务的优先等级;五是如何处理网络不稳定情况下的数据分发。
TA2面临的主要问题与挑战包括:一是如何根据系统和任务需要制定通信协议逻辑;二是如何在网络环境多变的情况下进行有效通信;三是如何最优化网络通信;四是如何避免数据重复传输带来的网络负担;五是如何确保网络节点与整体通信的安全。
对比DARPA分散式计算的需求发现,我军网络技术存在的问题主要包括以下三个方面:
一是灵活调用网络资源难,动态组网能力弱。未来联合作战要求指挥信息能够在态势感知、指挥决策、力量控制和支援保障等职能域之间按需流动,在需要的时间传送到需要的点位,这就要求网络资源与业务系统要高度动态耦合,能够实现动态灵活组网、按需进行资源调度。当前IP网,要么垂直建设、专网林立,要么不区分业务、过度使用资源,要么独自使用、共享不畅,这些情况都难以适应联合作战的要求,必须厘清用网需求、明确业务类别、统一规划设计、集中统筹资源、灵活分域保障,才能强化业务与网络的耦合,实现网系动态自动组网。
二是自动化管理弱,服务质量无保证。现有网管系统功能不强、配置复杂、基础数据不足,缺乏全网全局性综合管理手段,难以全面掌握网络运行态势,不能有效抑止用户过度占用或违规使用资源;服务质量保证策略只能通过人工静态设置、预先配置,不能动态调整,这主要是由于IP网络存在服务质量感知、资源调控能力弱的缺陷,急需提高自动化管理能力,简化网络配置复杂度,增强按需动态配置能力,缩短预先规划时间。
三是战术前沿缺乏智能化手段。战术侦察的智能化能力不足,跨媒体(影像情报、实时情报、视频情报)的战术目标识别跟踪、目标毁伤分析、轨迹分析等技术能力智能化水平不高,仍需要进行一定的人工分析工作,无法适应战术前沿进行快速、可靠侦察的需求,急需提升跨媒体的战术目标识别跟踪、目标毁伤分析、轨迹分析等技术能力。从大量实时的视频和图像情报中识别目标并分析其轨迹,对网络的计算能力和智能化水平都是巨大的挑战。
未来战术通信网络已成为国内外学术界和产业界研究的热点之一,呈现出异构融合、网络编程、动态感知、按需分配、灵活组网等诸多新特征。计算和存储将成为网络的重要功能,现有网络中的数据存在严重的冗余传输,造成网络资源的极大浪费,同时影响了用户体验。在网络中合理地集成存储、计算功能,利用存储换带宽正成为一种可行的设计思路。同时,未来网络将融合更多的智能要素,将通过多种测量分析手段,提供多种感知能力,包括网络感知能力、内容感知能力和情境感知能力等,网络与应用的双向感知、协调控制能力及自管理机制成为未来网络的重要功能。我军战术通信网应顺应趋势,在组网方式上向软件定义方向发展,支持面向作战任务的按需组网,能够根据资源状态和任务需求的变化动态调整网络拓扑,支持网络资源的按需分配;在资源组织运用方式上向虚拟化、网络化共享发展,通过资源感知和统一描述,构建包含网络、传输、计算、存储等在内的通信计算资源,以及兵力火力等战斗资源的虚拟资源池,支持资源的按需调度与动态分配,灵活支持各类作战应用需求。
近年来,战争形态快速转型、武器装备更新换代和使命任务不断拓展,以及战场网络环境的不断变化,对计算、网络和指挥等环境要素提出了全新要求。鉴于分散式计算技术的主要技术理念和重要特征符合未来战场网络的应用要求和发展趋势,经分析研判可以认为:分散式计算技术是一种结合感知、计算、存储、智能等技术的新型未来网络技术,可有效提升我军网络的快速反应能力、网络感知能力和计算能力。
我军未来网络建设可从以下几个方面借鉴DCOMP的研究。一是对于可动态变化和配置的网络协议的研发,在能够适应战术前沿弱连接、高动态、高毁伤环境的同时,应减少人工配置网络的时间,以加快战术系统的开设速度。二是对于网络内可编程计算节点的研发与推广,网络内计算节点的交互关系可以根据应用需求、网络状态等实时变化,以弥补传统应用模式固定不可变的缺点。三是使用计算融入通信的方式为战术前沿需要高智能化、大计算量、高通信带宽的跨媒体的战术目标识别跟踪、目标毁伤分析、轨迹分析等应用提供技术支持。
针对我军网络现状,密切关注DARPA的DCOMP等研究项目的最新进展,深入开展分散式计算理论方法的研究,吸收借鉴其技术架构、协议体系、调度算法、关键技术等最新研究成果,加快推进我军战术网络环境下对低时延作战应用的支持研究。
结合我军网络信息体系建设的需求,组织专家围绕网络设施问题、基础平台能力问题和战术前沿智能化问题开展专项研究,论证分散式计算技术对作战模式和信息传输处理方式的影响,进行高动态平台作战应用场景分析,为下一代战术信息通信装备发展提供支撑。
结合我军网络建设实际,通过安排预先研究项目,加大分散式任务感知计算算法、网络可编程节点和协议堆栈等关键技术研究的支持。一是在网络架构与协议方面,重点研究网络资源可全局调度、网络节点能力可编程开放等内容。二是在可编程网络和资源按需共享方面,重点研究作战任务的按需组网,网络拓扑动态调整,网络资源的去中心化存储等内容。三是安全方面,重点研究分散式计算中的安全保密、安全存储、鉴权认证等内容。