杜思良 韩家启 张永亮 韩 东
(1.中国电子科技集团公司第二十八研究所 南京 210007)(2.陆军工程大学 南京 210007)
作战任务规划是针对作战任务,综合分析我方作战资源、作战能力、作战环境和敌方对抗措施,对打击目标、毁伤要求、使用部队、作战地域、武器装备、打击时机、协同保障、行动路线、飞行航迹等作战要素及作战活动进行筹划设计的过程[1]。遵照习主席关于“对作战方案计划的设计必须越来越精确化。在信息时代、大数据时代,搞好作战筹划更需要精算、深算、细算”的重要指示,迫切要求陆军积极采用大数据、云计算、数据挖掘、机器学习等最新技术,加紧开展智能化作战任务规划技术研究和系统建设,使指挥员及参谋机关从繁琐的脑力劳动及手工作业中解放出来,提高计划组织的效率与科学性,推动陆军部队作战任务规划能力实现跨越式发展和“弯道超车”。
美军开发与装备的任务规划系统最为先进、最具代表性。经过四十多年的发展,目前已经建立了涵盖战略、战役和战术多个层级的任务规划系统,其陆军战术级任务规划系统,既有陆军通用型的任务规划系统,例如基于地形的任务规划站(TMPW)[2]、自动化纵深作战协调系统和电子战任务规划系统;又有兵种专用型的任务规划系统,例如野战炮兵使用的“阿法兹”高级野战炮兵战术数据系统、野战防空部队使用的防空反导计划与控制系统和陆军航空兵使用的航空任务规划系统。作战任务规划技术一直是国外人工智能领域以及运筹学界的研究热点,AlphaGo解决了不确定性的问题,“深绿”实现了“纸上谈兵”和实际战场的结合,其相关技术研究为作战任务规划系统建设奠定了基础。
相对国外先进任务规划系统而言,我国在这方面的发展程度相对薄弱,起步较晚,特别是战术级作战任务规划系统尚处在预研阶段。由于地面战场环境比空域和海域更加复杂多变,陆军的作战行动计划往往更需要随机应变、多方考虑,对任务规划技术提出了更高要求。
一是要实现陆战场态势高效研判预测。作战力量多元构成,打击手段日益丰富,战场空间不断拓展,网络链接日益紧密,要求任务规划中的敌我态势研判技术,可以快速自动分析我方作战能力、判断出敌兵力部署、分析出敌我双方力量对比、能够分析出作战地区对我方战斗行动的影响,以满足深刻感知战场全局、快速研判战场态势的需要。
二是要实现作战任务精确高效规划。陆军要树立“以快吃慢”基本制胜理念,作战筹划必须跟上作战行动节奏,尽可能缩短决策周期,确保先敌反应、先敌行动、先敌打击,赢得作战主动。因此,迫切需要深入研究作战部署方案自动生成、作战任务自动分配等技术,为提高陆军部队精确高效作战筹划能力提供保障。
三是要实现作战方案智能化推演评估。作战系统复杂性的不断增加与指挥人员决策能力的局限性形成的矛盾越来越突出,需要为各级各类决策人员提供大样本、多策略的仿真推演与评估能力,从而方便指挥人员从时间、空间、资源等视角全方位地分析对抗交战环境下敌我综合实力情况,科学预判作战胜负发展趋向。
图1 系统技术架构示意图
本技术研究应着眼构建智能化的作战任务规划系统,基于现代信息技术,以使命任务实现为目标,深度融合军事理论思想,全面分析作战要素信息,标准化指挥决策过程,合理协调多任务单元行动,有效控制任务执行进程,精确预演作战进程,科学评估作战效果,动态调整决策方案计划,全面排除资源冲突,多手段展现规划成果,有效支持作战行动组织、准备、实施、评估全过程,其总体技术架构如图1所示。
基础支撑环境层:基于大数据、深度强化学习、专家系统等技术构建智能规划业务的物理支撑平台、功能支撑平台,支撑陆军作战部队任务智能规划的业务与管理。
模型与数据服务层:基于任务规划数据化处理、多兵种分布式任务规划、作战任务规划管理、作战任务智能推演评估等技术,构建各类业务数据库、决策分析模型库、仿真推演模型库,并通过模型集成,为作战任务规划作业提供业务支撑。
作战任务规划业务层:基于协同任务规划环境支撑跨层级分布式协同任务规划作业。在作战任务智能规划系统支撑下,指挥员科学、快速地完成作战任务规划活动产品。
作战任务规划数据展示层:实现作战任务规划数据的图、文、表多模态展示,展示方式包括甘特图、任务矩阵、标绘图、作战文书、任务清单、思维导图等。
以陆军战术级作战任务智能规划系统为牵引,围绕系统构建、方案生成、推演评估等内容,研究突破陆军部队陆战场态势研判、作战任务自动分配、智能化仿真推演与评估等核心技术,是提升陆军部队作战任务规划能力的基础和关键。
态势研判及预测重点研究基于目标态势的情况分析判断技术,实现对战场态势的深度分析和对未来态势估计,解决目前态势分析大都停留在数据层且有态无势的问题。技术研究思路如图2所示。
图2 技术研究思路示意图
结合复杂适应性理论和复杂网络方法[3],构建基于复杂网络的多智能体模型[4],将复杂网络描述系统整体的长处与多智能体描述微观实体的长处相结合。利用复杂网络对作战系统进行建模,将作战节点之间的指挥、控制、协同、协作、侦察、打击等联系和关系为边所形成的复杂网络;运用图论的方法将复杂网络汇总关系的抽象和关系的度量通过加权邻接矩阵表示[5~6]。通过复杂网络点和边的分布规律和变化规律,来认识作战系统的结构、行为、演化等方面的特点和规律,分析作战重心[7]及协同关系,实现战场态势研判。
态势预测指基于对当前态势的理解对未来可能出现的态势情况进行预测[8]。通过多智能体建模技术构建作战实体模型,反应作战实体个性、能力是如何影响系统演化的;利用复杂网络技术构建作战实体交互关系模型,结合复杂网络技术的宏观层面网络分析,进而反应实体之间的交互关系及网络演化趋势。通过机器学习(离线学习与在线学习相结合)的方式得到大量的训练数据及模型参数。态势预测时利用训练数据与模型,结合复杂网络演化规律和多智能体行为规律,生成敌方行动决策,形成敌方态势预测,从而为指挥员任务规划提供精准敌方动向情报支撑[9~10]。
作战任务分配过程是统筹资源和匹配能力的过程,即根据作战任务的能力和时间需求,安排能力与之匹配的作战实体遂行相应作战任务,且任务分配需符合整体作战态势需求[11]。任务分配研究的关键在于通过将双方在关键性局部战场的力量对比关系、交战格局关系、火力接触关系和火力分配关系进行综合分析,得出双方的作战势能比值,在定量计算的基础上进行作战任务的智能分配。
1)基于层次任务网络(HTN)的作战任务分解技术
基于HTN的作战任务分解就是将复合任务按照某种规则逐层细化为子任务直至战术行动的过程。该技术通过引入基于军事规则的决策支持库构建基于HTN的作战任务生成框架。决策支持库主要由模型库、方法库、知识库、数据库知识获取等构成,以创新方式使用海量数据,通过感知、认知和决策支持的结合,建立真正能独立完成决策的辅助分析模型,结合作战任务智能规划的基本流程,以总体作战任务作为出发点,深入分析作战目标与作战任务的映射关系,建立基于目标匹配和任务模板库的任务分解知识库来支撑HTN方法在作战任务智能规划中的应用,实现在作战人员的有限参与下高度自主地分解作战任务,确定作战目标和行动方案。
2)基于作战效果的作战行动序列(COA)生成技术
在基于效果作战理论的指导下,对效果、COA等概念进行形式化描述;从预期要达到的最终效果出发,进行逆向推理,建立从期望态势到初始态势逐级效果之间定性的影响关系模型,并根据影响关系模型选择相应的作战行动,逆向生成初始COA;根据战场态势数据建立不确定条件下的计划识别方法,得到敌方计划及意图,结合初始COA确定对期望态势有重要影响的关键作战行动(集);根据关键作战行动(集)动态调整初始COA,建立基于影响网的COA动态推理模型,通过该模型的不确定性推理,最终生成基于效果的反应式COA。
3)任务冲突检测与消解技术
作战行动时间冲突检测,通过建立有向图,采用在有向图中寻找有向圈的方法,检测有冲突的作战行动子集。空间冲突分析,通过对作战单元的威力范围或空间使用需求进行几何建模,形成一系列空间对象单元,然后通过空间对象间的几何拓扑关系来实现空间交叉分析与冲突判断。物域冲突分析,首先通过作战单位的执行行动关联到作战对象,然后根据作战对象的属性和作战要求,按照杜派指数模型和战斗损耗方程进行资源需求量的加权计算,进而判断作战单位资源分配的合理性。
路径与航线自动规划技术主要着眼于无人作战的需要,实现部(分)队及无人车辆的路径自动规划、陆航/无人机的航线自动规划。
路径规划主要通过路网建模技术和路径规划技术实现道路/越野机动路线的优选。着眼道路/越野机动的约束条件和规划目标,主要采用道路网络拓扑技术、六角格网地形量化技术实现地理信息的路网建模。在此基础上,采用D*算法路径规划技术,实现最优路径规划智能决策,支撑部(分)队或无人车辆做出快速而合理的机动方案[12],以应对复杂战场态势。
航线规划主要通过建立立体栅格网规划无人机、直升机及编队航线,该技术能够从时间维和空间维精确确定飞行器的空间位置,能够对多种威胁进行空间量化处理,运用最优航迹规划算法,根据作战效能和危险性评估,计算并选择具有较高生存性和较好任务完成率的出航航线和返航航线,并且能够实现弹道/航线冲突判断与消解。航线规划支持静态规划和动态规划相结合,在实际飞行时,能够根据当时的局部地形和动态威胁,不断修正参考航线,动态计算飞行航迹,有效实现航线规划的全局最优性。
作战方案智能推演与评估技术,主要是基于离线学习与在线学习相结合的智能推演技术,基于机器学习的部队AI模型构建方法,以及整体评估与局部评估相结合的作战效能智能评估方法。
1)多级多类作战实体AI模型构建技术
作战实体是进行方案推演的基础要素,作战实体AI模型构建,是对其自适应感知、决策、行动过程的描述,可认为是在连续状态空间、离散动作空间上的多步强化学习过程,本质是解决其最优行动策略生成与优化问题[13]。该技术重点利用深度Q网络(DQN)、双层DQN、深度确定性策略梯度算法(DDPG)等值迭代与策略搜索相结合的强化学习技术,实现对多类作战实体的COA生成。对于作战实体群体AI模型的构建,可采用共享记忆认知库的Q值(奖赏评价值),所有同类作战实体共享共同的Q值,作战实体执行各自任务的过程中,可以将其它实体和作战环境看作是外部态势,通过通信和反馈实现自身决策模型的优化。
2)基于机器学习的作战方案智能推演引擎技术
智能推演引擎是驱动作战方案多分支平行仿真、大样本并行仿真实验的基础支撑平台,着眼提高仿真推演的智能化程度,应实现基于有限样本条件下离线学习与深度强化学习的在线学习相结合的智能推演机制。有限样本条件下的离线学习,主要利用我军、外军有限的训练和实战作战训练样本,运用深度逆向强化学习、迁移学习、小样本类人概念学习和对抗生成式网络技术[10],构建面向陆军诸兵种(专业)的多分辨率仿真指挥实体的AI模型与行动实体模型。面向智能蓝军的在线学习,主要运用利用蒙特卡洛树搜索算法,集成行动策略网与态势估值网,实现与智能蓝军对抗条件的策略优化与调整的过程。智能推演引擎体系结构示意图如图3所示。
3)作战方案的智能化评估技术
作战方案的智能评估包括关键性问题的分段或专项评估以及整个作战方案的综合评估。作战方案评估从可行性、风险度、作战效益等进行的评价和估量,采用静态评估与动态评估相结合、正向评估与逆向评估相结合、人工评估与系统评估相结合、整体评估与局部评估相结合、过程评估与结果评估相结合等多方式、多角度展开,找出方案的优点与缺点,发现方案存在的问题与不足,分析产生问题的原因,为方案的优化调整提供科学参考。评估方法主要依据专项评估与综合评估指标,结合目前成熟的指数法、最大熵法、模糊综合评判法等多层次、多角度地给出评估结论,从而衡量作战方案的优劣。
图3 基于机器学习的智能推演引擎体系结构图
当前以监督学习、深度强化学习、类脑计算、知识图谱为代表的智能技术群的快速发展[10],以及其在图像理解、机器翻译、语音识别、智能推荐领域的成功应用,为精确、高效地开展作战任务智能规划创造了成熟的技术条件。本文从基础理论上突破创新,研究基于人工智能、具有自学习能力的任务规划技术,提出了智能任务规划的关键技术及实现途径,为智能任务规划系统的建设打下了良好的基础,对提升陆军战术级作战任务智能规划水平具有十分重要的意义。