涂卫红, 张建廷
(海军研究院, 北京 102249)
在作战体系对抗仿真实验中,模拟的作战层次是带有一定战术逼真度的战役行动,通过交互式的离散事件模拟,探索面临不确定战场态势时决策者的行为、网络化兵力组织运用等方面的能力。为了实现作战体系对抗的建模与仿真,多智能体(Multi-Agent,MA)的建模技术得到了广泛的应用[1-3],该技术主要基于复杂适应理论发展起来的,在具体实现过程中从研究个体行为着手,将复杂系统划分为多个Agent,每个Agent具有各自的模型、数据、规则和接口等,通过对Agent的行为及它们之间的交互关系进行刻画,以自底向上的方式描述复杂系统的行为,进而获得系统宏观行为。在多智能体的作战体系仿真推演应用领域,尤其是面向网络中心战的应用[4],国外已经相继开发了OneSAF[5]、MANA[6]、SEAS[7]等系统,国内相关方向的研究和应用还处于起步阶段,多停留在理论研究层面,存在理论和实践脱节的问题[8]。
侦察预警系统的仿真,涉及众多平台武器系统,不仅包括岸、海、空、天的各型侦察兵力平台,还包括各种预警探测、情报侦察、指挥控制、通信、数据融合处理等组成的电子信息系统,这些系统之间关系复杂、相互作用明显、相互制约多、相互影响大,成为构建有效体系仿真实验环境的主要难题。为此,本文从侦察预警体系仿真的需求出发,采用基于多智能体的建模与仿真方法,建立有效的物理和行为模型,为作战仿真推演实现提供有效的方法支持。
侦察预警系统仿真的实现基础是对体系进行有效的描述,描述的过程就是建模过程。侦察预警装备实体是整个仿真的基本单元,通过建立各种侦察预警装备的仿真模型和作战环境、交互关系等模型,模拟作战环境下装备体系的能力和检验各个装备对作战的贡献率,通过仿真结果输出数据的统计和分析,最终得到体系的效能评估结果。侦察预警系统仿真的任务需求体现在以下三个方面。
1)过程模拟,既要模拟系统在物理域的变化规律,还要能够刻画信息域和认知域,反应作战系统整体和不同层次的OODA环[9]过程。
2)行为模拟,侦察预警系统表现复杂,体现在兵力个体或多个实体之间的交互或它们的交互所表现出来的宏观行为,反过来,全局行为又决定了个体进行决策、反应的环境,通过个体的简单行为,构建复杂全局行为能力,仿真环境需要模拟这种行为关系。
3)物理模拟,对仿真中所需的兵力平台模型、传感器模型、网络模型、信息流模型等进行仿真。
三者关系如图1所示。
基于MA的建模与仿真的方法实现侦察预警系统仿真,采用相互之间具有复杂交互行为的自治实体对系统进行描述和抽象,建模的重难点可以归结为两个方面:体系模型和行为决策模型构建。
体系模型及架构分析主要在Agent仿真方法指导下,对体系中的实体、关系、环境和交互关系进行分析,针对体系层次的能力要求,按照作战仿真的任务需求,基于效能评估指标和交互关系对体系中涉及的对象、作战过程、行为关系等要素进行抽象,研究需求的模型类型、组合方法、组成结构关系,形成面向体系仿真需求的元模型,进而利用元模型的实例化,构建仿真实现所需的物理模型基础。
决策行为模拟主要针对体系对抗仿真中作战实体的决策行为表示,是信息域和认知域进行有效联系的基础,只有将信息优势转换为决策优势才能反映信息化条件下体系对抗的特点,而作战实体的决策行为表示是所有作战仿真中需要解决的一个难点。为此必须在仿真中解决Agent的行为描述和行为组合方法,能够更加自然地表示和快速组合Agent行为。同时,作战体系对抗模拟中,实体数量规模庞大、实体行为复杂,Agent种类多、交互复杂,需要大规模的计算与仿真。因此,设计合理的Agent行为方案(Course of action,COA)[10]决策模型,提高仿真运行效率至关重要。
通过上述分析,侦察预警系统仿真环境的构建需要解决两个方面的问题。一是采用多智能体方法,研究多智能体的模型结构设计,包括作战实体单元的传感器模块、通信模块、行为模块等模型的组合方法、关联方法,构建合理的作战实体结构,保障系统中仿真单元具备目标性和自主行为能力;二是研究系统的决策行为模型,通过有限的状态变量和态势事件约束、匹配,依据Agent仿真中活动执行顺序进程,对侦察预警相关的信息处理、威胁判断、决策行动等作战复杂决策行为过程进行模拟实现。
智能体(Agent)模型在仿真中感知并选择性地接收环境信息(感应器),根据规则分析做出相应反应的行为(决策器),并根据反馈调整自己的行为和规则(执行器),基于Agent的仿真要素包括任务分配、行为协调及通信、交互机制[11]。体系中的模型组件应当包含物理域组件、信息域组件和认知域组件,根据Agent的基本组成结构:感受器、决策器和执行器,设计侦察预警Agent的物理域组件为感受器和执行器,信息域组件包含信息处理模块和通信模块,认知域模块主要包含决策器。
根据以上分析,结合侦察预警系统的特点,构建仿真系统中的Agent结构模型,如图2所示。
侦察预警Agent模型的各个模块的功能设计如下。
1)感受器模块。依据所搭载的传感器模块,对战场其他实体发出的可探测信号进行侦察,实时感知战场态势,并将信息发送到信息处理模块。
2)信息处理模块。将感受器传来的信息,例如目标的点迹、轨迹等信息进行融合处理后,得到情报数据,将情报数据输出到实体的决策器模块,或者发送信息到外部通信网络连接的其他实体节点。3)决策器模块。对战场态势信息(自身获取或外部传入)按照战术表,进行信息的接收、条件判断匹配和行为方案输出过程,产生Agent下一步的行动方案。若Agent是指挥节点,则输出方案为指控命令,若Agent是非指挥节点,则输出方案为战术动作。
4)执行器模块。执行器是Agent的行为输出模块,它接收决策器送来的决策信息,并输出相应的基本战术动作(如侦察、跟踪、机动)或协同动作(指挥命令、其他节点的行动方案)。
5)通信节点。与外部通信网络连接的通信终端模块,可以设置的网络类型有广播终端、点对点终端、移动自组网终端和TCP/IP终端。当节点间有通信链路,并处于同一通信模式下时,节点间经由通信网络进行信息传输。
在上述通用侦察预警Agent模型的基础上,根据仿真中不同的侦察平台,配置相应的模型参数和功能,例如,不同的传感器单元、机动能力、作战空间、通信节点、链路连接关系等,生成体系仿真的不同类型Agent实体,进而可以实现体系仿真运行。
作战体系的对抗性和动态性特征主要依赖于网络化组织中的各兵力Agent个体行为反应以及相互间的交互实现,各兵力Agent作为网络中的节点,以通信网络为基础,相互之间传输战场态势信息、指挥控制信息,并依赖于这些信息进行战术触发,例如,对特定目标、区域进行特定信号类型的侦察,侦察兵力对目标主动进行跟踪、定位等。为了在体系仿真中实现侦察预警行为的实施,建立Agent的行为决策模型,本文采用基于战术表的方法,实现Agent的自行为和交互。
在进行战术行为决策时,根据战术表驱动Agent的行为主要遵循“刺激——反应”模式,一般采用“IF<条件>THEN<行为>”的方法来表示,即在满足一定条件时,Agent做出相应的动作。侦察预警兵力Agent的个体行为是整个作战仿真系统演化的基础,Agent通常在受到一定外部条件“刺激”后,在一定的条件约束下完成相应的任务,它的行为要受到必要的限制,以达成对真实作战过程的模拟,这种限制行为的约束条件在本文中以通用战术表的形式体现。为了提高仿真的效率,采用两类战术表来表示整个仿真过程的战术行为,分别是作战指挥Agent战术表和平台Agent战术表。
作战指挥Agent战术表,主要用于搭载了作战指挥任务的Agent节点上,根据战场态势(敌情、我情和环境等)控制其他Agent执行战术任务,是整个战场态势的全局决策者和控制者。平台Agent战术表与作战指挥Agent战术表不同的是在输出行为控制条件过程中,其战术行为控制只对自身起作用。
战术表的主要处理流程分为三个阶段:1)输入触发条件;2)战术使用限制条件;3)输出行为控制条件。此外,对于同一战术表中,设计多个不同的应对战术,通过决策输出检查,对各个战术最后依据优先级顺序进行判定,选择优先级高的作为本次战术输出。战术表的实现流程如图3所示。
在仿真过程中,当有平台传感器获取目标信息(运动或轨迹)后,信息在网络中传输到指定的节点,该节点就会触发战术响应,输入触发的条件主要分为三类:
1)目标轨迹类型,分为太空、空中、陆地、水面和水下;
2)威胁分类,主要是目标的敌我属性,包括友方、敌方、中立和未知;
3)轨迹战术识别,目标的平台属性类型,例如战斗机、水面舰船等。
当输入信息满足战术触发条件后,就要判断战术使用的限制条件进行检查,主要有以下4类:
1)时间使用限制,包括开始、结束时间限制,想定设计阶段的限制;
2)信息不确定性限制,表示目标信息来源的误差,例如目标信息中的位置判定不确定区域、速度不确定值等;
3)目标运动限制,指目标的速度、相对航向在一定范围时,战术才有效;
4)使用位置限制,指目标与战术实施平台的相对距离、方位,或位于指定区域时,战术才能够执行。
对于平台Agent战术表,主要有:
1)跟踪探测类型,指目标体现出来的可以被探测的信号类型,例如通信、电磁、红外等,用于指定所使用的跟踪传感器;
2)平台当前状态,指战术触发时平台的状态,例如巡逻、行驶、被引导等;
3)战术行为控制,指平台对当前目标执行特定任务,例如报告轨迹,电子战攻击和激活传感器等;
4)机动行为控制,指平台向着目标进行自引导,实施规避,设定规避速度和距离控制等。
对于作战指挥Agent战术表,主要有:
1)跟踪探测类型,与平台Agent战术表一致;
2)战术行为控制,战术响应方式,控制被指挥平台对目标进行查证、定位、跟踪、搜索、监视等任务;
3)机动行为控制,根据目标平台运动介质,进行合理的规避距离、高度控制,以及执行任务过程中的盘旋、机动方式等进行控制;
4)探测能力要求,执行任务的平台应当至少满足一种探测能力,执行或的逻辑运算关系,同时,可以对平台的分类识别能力进行指定,这样可以实现对目标使用不同平台不同传感器同步查证的目的。
综上,战术表的本质是感知战场态势,然后将感知到的战场态势与规定的战术条件进行匹配,根据匹配结果做出决策的一种灵活的、自动的作战规则集合,战术表的作用流程如图4所示,其中的触发战术判断采用本节战术表设计方法和图3所示流程方法。
本文介绍的侦察预警系统模型,采用C++语言开发的多Agent侦察预警仿真模块,已经集成到某海上对抗仿真系统中,对文中所提出的多智能体模型和战术决策模型进行仿真验证。以海上红蓝双方对抗过程为例,Agent模型包括卫星、舰船、侦察预警飞机以及其上搭载的传感器及通信模块等,其中整个侦察预警战术响应按图4所示流程进行判断和战术触发。
通过红蓝双方编队及空中兵力的侦察预警活动推演,验证本文方法设计的多智能体系统的仿真有效性,想定中,红方按照由远及近、由粗到细对目标进行发现、查证和跟踪识别等战术响应。作战仿真中的红方对蓝方的自动侦察预警行动效果如图5所示,当红方发现目标后,按照设定的战术,自动触发相应作战实体的侦察预警行为。图6为整个仿真过程中卫星和舰载无人机发现目标随时间的次数分布。
仿真初始阶段,由发现距离远但精度低的侦察平台(卫星、预警机等)发现目标,然后将信息共享,触发战术响应,引导探测距离近但精度高的平台(战术侦察机、无人机等)进行抵近查证、跟踪和监视,图6的结果中0到40小时的目标发现主要由卫星等远距离侦察平台实施,而整个仿真的后续阶段侦察任务主要由探测精度高的近距离侦察平台负责,仿真中所设计的多智能体能够有效进行协同侦察和战术触发,并且正确触发各种敌情态势下的侦察预警战术,实现了对作战体系对抗推演和实兵演示验证等应用的支撑。
本文详细描述了采用多智能体的侦察预警系统的建模和仿真方法,主要面向作战对抗推演应用。研究了侦察预警实体单元的Agent建模方法,通过多模块组合设计方法,抽象出侦察预警的通用模型,其他不同的实体建模可以依据此模型进行定制和修改;提出基于战术表驱动的决策行为模型,实现了Agent的决策行为表示,通过有限的状态变量和态势事件约束、匹配,依据Agent仿真中活动执行顺序进程,对侦察预警相关的信息处理、威胁判断、决策行动等作战复杂决策行为过程进行了模拟实现,设计的战术表通用性强,计算简单,仿真运行效率高。但本文设计的智能体的行为决策属于容易实现的条件触发方法,具体应用中需要大量的作战条令、专家经验库等支撑,后期研究可以考虑引入人工智能等方法,增强Agent的智能化和逼真性。