易 凯,张修社,韩春雷,张 扬
(中国电子科技集团公司第二十研究所,西安 710068)
随着深度学习、脑机交互、神经元计算等军事智能技术的广泛应用,已经产生了无人集群战术、作战云、算法战、分布式杀伤、多域战、“马赛克”战等智能化作战理论,战争形态正由机械化战争、信息化战争向智能化战争快速演变。相比机械化战争、信息化战争,智能化战争将呈现以“无人、无形、无声”为主的各类作战平台、智能化传感器、指挥系统以及导弹武器系统,能够深入各种恶劣环境侦察战场,面对瞬息万变的战场态势进行自主协同打击,其显著特征是作战环境复杂化、作战空间全域化、作战对象多样化、作战时间敏捷化,制胜关键要素从信息域向认知域转变、从争夺信息优势向获取认知优势转变[1]。因此,为满足智能化战争条件下基于战场大规模、大差异、不确定、高冲突信息的快速处理和及时响应的要求,解决人类智能无法在短时间内应对多目标、多对多的指挥控制计算和判断的问题,需要重点研究以作战要素协同为核心、人工智能计算为主要手段的分布式智能作战决策系统,突出决策优势,提高决策的科学性和可靠性,运用算法夺取战场的“制智权”。
分布式智能作战决策将以作战区域内的各类作战力量、平台、装备要素等多智能体为载体,依托自适应高速信息传输网络构建功能解聚的分布式作战集群,综合考虑作战的任务需求以及各方面获取的战场情报信息,结合大数据条件下先进智能算法,进行多源信息融合处理与态势认知,制定包含作战意图识别、威胁分布、火力规划与任务分配的决策方案,在分散和模糊作战部署和意图的同时,保持战场指挥员做出更快和更有效的决策,如图1所示。
图1 分布式智能作战决策示意图
20世纪70年代,决策支持系统的概念被提出来,决策支持系统是辅助决策者通过数据、模型和知识,以人机交互方式进行结构化和半结构化决策的计算机应用系统[2]。1980年Sprague 提出了决策支持系统三部件结构(对话部件、数据部件、模型部件)[3],明确了决策支持系统的基本组成,而后得到极大的发展。
20世纪80年代初期,Scher 和Thomas 等人提出分布式决策支持系统概念。该系统实现了分布决策、分布系统、分布支持的三位一体,从概念上可理解为由多个物理上分离的信息处理节点构成的网络,网络上的每个节点至少含有一个决策支持系统或具有若干辅助决策支持的功能[4]。Chuang 等人认为其是支持组织中决策网络节点的决策、通信、协同和合作的决策支持系统。
20世纪80年代末90年代初,决策支持系统开始与专家系统相结合,逐步发展为智能决策支持系统[5-6]。智能决策支持系统是在计算机的辅助下,综合运用现代决策理论和人工智能技术,结合管理决策科学、信息科学与运筹学等,依托人类知识库,通过逻辑推理来帮助解决现实问题[7]。
美国20世纪70年代就开始研究人工智能在国防军事领域中的应用,最早提出了作战指挥决策支持系统的概念。2009年以来,DARPA 启动了拒止环境协同作战项目(CODE)、“阿尔法”(Alpha AI)、指挥官虚拟参谋(CVS)和蜂群战术(SWARM-Tac)等与智能指挥决策相关的大量技术研究与工程实践项目,2017年美军提出了以决策中心战为基本理念的“马赛克战”新型作战概念[8-9],涵盖了上述的先期多项项目计划。
其中,拒止环境协同作战项目旨在研发先进的自主算法和监督控制技术,以减少所需的通信带宽和人工系统界面,实现无人机或尖端导弹在通信和GPS 信号均被干扰的对抗环境下,自主协同完成跟踪、识别和攻击[10]。“阿尔法”是美国辛辛那提大学和空军实验室合作研发的一款智能空战系统[11]。据称,阿尔法在空中格斗中快速协调战术计划比人类快了250 倍,可同时躲避数十枚导弹并对多目标进行攻击,还能协调队友、观察学习敌人战术,该技术是人工智能技术在作战决策控制领域应用的重大突破。
“马赛克战”是美军考虑到战场环境的诸多约束让战场网络无法满足“全连通”这一网络中心战的前提条件,以网络中心战向决策中心战转变作为基本理念,以传感器、网络、人工智能作为基础设施,而提出的作战概念。其核心内涵是将作战区域内的平台在功能层面和物理层面上分解为网络化的杀伤网,而非线性的、单一的杀伤链,通过快速组合、重组一支更加解聚型军事力量来提升敌方的决策复杂度或不确定性,如图2所示。该作战概念将高度依赖人工智能技术,重点研究内容包括基于自主系统实现分布式作战和任务指挥、基于人工智能实现快速的决策支持等。
图2 美军马赛克战示意图
随着人工智能技术的不断发展,国内也一直在数据融合处理、态势预测分析、火力规划与资源分配等领域开展智能作战决策应用研究,建立了一系列的辅助决策模型和决策支持系统,能够为指挥员提供一定计算支持与智能辅助决策,取得了一定的成果。
20世纪90年代,国内在作战决策方面的研究成果主要以专家系统、运筹优化、贝叶斯估计等较为成熟的智能技术为主,通过建立规则库,基于专业知识进行推理分析,用以解决特定领域的智能辅助决策系统。如军事科学院研发的“进攻一号”军事专家支持系统[12],通过应用人工智能和军事运筹技术,建立了一个4000 多条规则的军事知识库和一个定性与定量相结合的高效推理机制,为指挥员下定决心提供大量的咨询信息。
2010年以来,深度学习、大数据处理等理论方法和计算机运算能力的突破,助推新一轮人工智能军事应用研究热潮,图像、语音识别和推理、分析与判断能力有显著提升。如国防大学研发的“兵棋推演系统”,为复杂系统管理提供了更加符合其特性的决策辅助支持[13-14]。近年来,基于深度学习开展了一系列军事智能辅助决策技术的研究,通过对抗博弈进行学习训练,探索态势认知与威胁智能评估、作战方案智能推荐与优选、智能自主决策推理等一体化智能决策理论方法。总体上看,当前作战决策系统仍处在计算智能阶段。
强干扰、对抗的战场空间复杂环境,必然带来态势生成与演化的不确定性,以及通信设备受干扰或传输链路受损可能导致的分布式作战条件下信息不对称,且敌方目标行为存在多样性,需要考虑不确定、模糊、随机、偶发、对抗等诸多因素,在军事领域中的智能作战决策应用难度大,面临的挑战主要体现在以下3 个方面:
(1)数据样本稀缺。人工智能的学习需要以数据为支撑,且对数据量有很高的要求[15],如目前主流的深度学习是高度数据依赖型算法,其性能随数据量的增加而不断增强,可扩展性显著优于传统的算法。由于实战、作战演练无法获取海量可用数据样本,作战演练、仿真推演的装备和战术运用、敌我对抗态势等与实战有较大差距,样本数据单一、分布不均衡,作战决策所需的智能认知的样本数据和领域知识极其缺乏。
(2)不透明和难解释性。人工智能可以探索新的作战规则,但其推理、决策行为过程对于人来说是一个黑盒,如深度学习架构是在“端到端”模式下,通过标注大量数据来进行误差后向传输而优化参数的学习方法,高度的非线性赋予多层神经网络极强的模型表示能力,学习结果准确率高,然而神经网络特征或决策逻辑在语义层面难以理解,可解释性弱。
(3)可信性有待验证。机器学习对训练数据的加工、标注和数据集的构建主要依赖作战规则、专家经验等知识。由于指挥员作战决策是高度艺术化的思维活动,可能存在作战规则遍历不充分,对人的经验知识提炼、标注不规范等问题,导致学习结果偏离实际,且对结果的可信性缺少有效的评价标准与验证方法[16]。
针对军事领域智能作战决策应用面临的困难与挑战,我们仍需进一步探索人工智能技术在作战决策应用中的作用机理和实现途径,提出的主要思路如下:
(1)分析研究战场环境、敌我态势、作战样式等影响作战决策的各类因素,打造逼近真实的典型场景数字挛生战场,通过决策推演提供高质量的训练数据样本支持。
(2)从理论上探索强化学习、迁移学习、可解释性深度学习等人工智能底层算法的作用机理,通过数据特征可视化等手段,分析描述人工智能的推理和决策行为过程。
(3)进一步完善作战规则、交战准则和条令条例等知识体系,积累军事领域专家和作战指挥员人工决策经验知识,规范知识结构,建立机器所能理解和掌握的知识图谱。
(4)通过设计大量符合实战的对抗推演,建立相关准则进行量化分析,研究验证智能化技术可行性、综合评价智能决策结论可信度与智能决策水平高低的方法。
在多域协同作战条件下,为提升分布式智能作战决策水平,需重点解决传统以相对固化的模型与规则为基础的辅助决策带来的问题,研究突破态势理解认知、智能威胁评估、自主任务分配等核心关键技术。以下结合现有军事智能技术水平,提出分布式智能作战决策关键技术的一些研究思路和实现途径。
战场环境的复杂性带来态势生成与演化的不确定性,战场态势理解的正确性成为协同火力打击的前提和关键。在复杂战场空间大数据信息过载情况下,为了降低指挥员认知负荷[17],增强人的认知能力甚至替代主观认知,深层次理解、判断敌我双方作战部署、战术意图、行动企图等,形成多维度协同打击态势场,提出分布式处理条件下基于神经网络的态势理解认知方法,解决神经样本高效生成与评估问题,以获得更快、更全、更准和更深的智能态势理解能力。
研究军事领域专家与作战指挥员分析、推理和判断作战态势的思维模式,形成态势理解认知的知识库[18],分析战场态势要素与知识库之间的映射关系,建立认知经验模型;研究态势理解认知神经网络模型,利用神经网络深层复杂结构的非线性表达能力和逐层理解、自动分析提取的结构,拟合建立一个从战场态势要素到指挥员认知结果的非线性映射关系,对指挥员认知经验进行模拟;研究分布式处理条件下,多平台异构多粒度态势认知和综合态势推理技术,解决多源协同推理中信息属性和信息粒度差异大、冲突高,差异信息难以有效综合的问题。在上述总体研究内容的基础上,通过样本数据训练学习,最终得到态势理解认知的结果。研究思路如图3所示。
图3 态势推理认知研究思路示意图
敌方的饱和攻击战术使得协同作战态势呈现高动态、大数据等特性,这与有限武器资源的精准打击形成矛盾。为了将有限的火力资源用以攻击最具威胁的目标,需进行及时、准确的多目标威胁评估。现有的威胁评估算法模型多基于各领域专家的知识规则进行学习构建,不同模型只能匹配特定场景类型,在工程应用中泛化能力差,常会导致模型移植后性能急剧下降,有必要研究权重自学习的多平台多目标智能威胁评估技术。
研究目标多威胁特征自主认知模型,通过对作战场景图像信息的深度挖掘、战场原始态势数据的自主认知,实现对目标威胁特性的深度挖掘,自适应提取目标类型、作战意图、目标作战能力等影响威胁评估结果的关键属性信息;研究威胁评估深度神经网络学习模型,根据目标威胁评估结果执行后的实时综合拦截效能,以及实战和战场仿真推演生成的样本数据,进行网络模型的在线和离线学习训练,并可通过样本数据驱动、环境交互和奖惩反馈,实现威胁评估模型的自主成长与完善,为火力规划与任务分配优化提供决策依据。研究思路如图4所示。
图4 智能威胁评估研究思路示意图
不确定性对抗博弈体系下的战场态势时变性和目标行为的多样性,对跨平台多武器目标任务分配的合理性、正确性、协同性带来难题。为了支持指挥决策方案的快速准确生成,实现作战空间内各种作战力量与装备要素的实时反应、自主任务分配和协同行动,提出一种基于深度强化学习的自主任务分配技术,解决瞬时强对抗环境下能够提供的打击决策数据样本量少、传统机器学习方法难以有效应用的问题。
采用分层强化学习方法实现博弈对抗下的多域协同作战自主任务分配,将大规模博弈对抗问题在状态空间或动作空间根据时域特征进行人为分解和抽象[19],对博弈对抗集群作战下的可重构协同任务组自主分配问题进行求解。研究跨域集群作战单元的任务规划模型和基于深度强化学习的策略自主生成技术,探索各种不确定性因素对多任务自主分配的影响机理,结合专家经验知识,建立基于专家经验的任务分配策略模型,根据实时战场态势为协同任务组分配子任务,协同任务组根据当前状态和子任务,对所属平台和传感器、武器装备要素进行自主任务分配和打击决策,将传统的自成一体型多任务单元分解成可灵活组合的力量单元,通过力量单元组合或重组的多样性,给敌方施加更高评估分析复杂度的决策压制,支持跨域分布式杀伤网的实现。研究思路如图5所示。
图5 自主任务分配研究思路示意图
本文根据多域协同作战条件下智能作战决策研究现状,分析了分布式智能作战决策应用发展面临的制约性问题,主要体现在作战决策所需的智能认知样本数据和领域知识缺乏问题,推理、决策行为过程不透明和难解释问题,决策结果的可信性缺少有效的评价标准与验证方法问题。针对问题提出了应用发展的一些思路,包括通过打造近真实典型场景数字挛生战场提供训练数据样本支持,从理论上探索人工智能底层算法作用机理以描述决策行为过程,完善作战规则、交战准则和条令条例等知识体系和知识图谱,研究综合评价智能决策结论可信度与智能决策水平高低的方法。本文还研究了分布式智能决策关键技术,描述了分布式处理条件下的态势推理认知、基于神经网络的多目标智能威胁评估、面向博弈对抗体系的自主任务分配等关键技术研究思路和实现途径。
本文旨在明确提出分布式智能决策应用发展的总体思路和关键技术实现途径,为深入开展分布式智能决策技术应用技术研究和基于对抗博弈数字战场推演的模型算法设计验证,提供了较好的理论与方法支撑,对推进军事领域智能作战决策系统发展具有一定的理论意义和应用价值。