郭永红, 刘瑞, 刘承, 李旭光
(中国兵器工业计算机应用技术研究所 车辆综合电子研发部, 北京 100089)
班组是派遣最为快捷、运用最为灵活、效果最为可控的作战单元,其兵力编配水平直接影响军事对抗的执行力和作战效果。从机械化、信息化到智能化,战争形态已经发展到新的阶段,随着“信火一体”[1]、“网电一体”[2]等新概念的产生,战争将进入“多域”和“秒杀”时代。班组作为战场末端单元,传统以预案模板匹配方式为主[3]的兵力编配方法难以实现临机动态性,无法在机会式窗口实现多角色敏捷转换、多任务灵活响应和自适应敏捷重构等新能力要求。特别是无人装备向战场的持续渗透和逐渐应用[4],有人/无人协同所带来的“数据爆炸”问题将直接超出人类认知极限,瞬时“数据致盲”风险加剧,使得传统以人为信息处理中枢的兵力编配模式也将不再适用。人工智能技术有望对由战场环境中急剧增长的认知客体数量、被海量数据淹没的认知空间和不完备的认知工具所造成的信息过载问题进行有效应对,但其本质是根据历史经验数据寻找拟合函数,军事领域数据收集难、兵力使用灵活度高、趋势走向不确定性强等特殊性,使得人工智能自身在实现战斗分组、任务分工、装备编配使用等临机决策和自适应规划方面存在一定的局限性和缺陷。军事智能化[5]和元宇宙[6]热潮下,以云计算、数字孪生、区块链、5G/6G等先进技术为支撑的军事元宇宙雏形已基本明晰[7],元宇宙强大的计算能力和精准的数字孪生特点将为智能算法模型收集利用数据并理解发现复杂行为和规律提供丰沃土壤。
在此背景下,本文创新性地提出基于军事元宇宙支撑和人机混合协同决策的班组兵力编配方式方法,通过研究在平行视角下利用混合智能方式实现临机兵力编配规划的潜在途径,以期为开展智能化、动态适变的班组级兵力规划系统研究和相关技术探索提供一种新的思维方式,并为利用军事元宇宙赋能班组级作战、人工智能技术的军事应用模式等研究提供发展思路。
人工智能是一种引领产生颠覆性变革的使能技术[8],并已在众多领域得到了实践和证明。但在现阶段,受限于人工智能机理、技术与应用场景条件,人将依然是回路中的主体性和决定性因素,主要原因分析如下。
采取“人在回路外”还是“人在回路中”的人机协作方式,本质上是智能化系统发展自主性还是合作性的路径选择问题。现阶段,复杂场景所具有的不确定性和开放性使得人工智能技术在应对时存在脆弱性特点[9],数据不完备[10]、认知不精细[11]、决策闭环慢[12]等问题使得智能化系统自主决策在军事领域的实现难度大、应用范围窄,因此应该更加强调发展机器与人的合作性。
一是人工智能技术原理先天不足。大数据与机器学习算法结合是当代人工智能的基本原理,其本质是通过概率学的理念方法从海量数据中寻找规律,因此它只能寻找到重复出现的模式并作为自身获取的知识[13]。在这种模式下,系统只能学习获取既往战斗行动取胜的经验知识,却无法精准预测下一场行动的发展方向,新的思想与方法很可能因与学习到的既有知识冲突而被当成错误信息排除,即一旦行动跳出学习范围,机器自主性强的系统就难以有效应对。
二是智能系统运用场景还很受限。现代人工智能的应用场景必须满足确定性信息、完备信息、静态、单任务和有限领域等5个条件[14],是完全信息博弈,军事智能系统概莫能外。例如,深入分析美国“Alpha AI”智能空战系统[15]完胜人类飞行员的案例,可发现“Alpha AI”执行任务单一,装备、环境与对手应对措施等信息清晰可见,交战规则清楚明确[16],参加模拟的人类飞行员只有1人,符合完全信息博弈的基本条件。但是,实际空战中系统需面对敌机、友机、地面等多方动态信息和编队对抗场景,是典型的不完全信息博弈,已超出系统运用场景,智能化系统无法“自主决策”。因此,美国并未将自主无人机作为未来空战装备发展方向,而是推出“忠诚僚机”项目,以“有人-无人”混合编队方式执行空中作战任务[17]。由此可见,智能化系统在作战使用场景中受到极大限制,不能脱离人类的引导与控制。
因此应该把研究重点放在智能化系统辅助人、补位人以及降低人为错误、提高决策效率等方面,其底层逻辑是,人始终是机器智能的服务对象和最终“评估判断”的仲裁者,在现阶段人工智能分析决策模型在数据完整度、精度和置信度等方面还无法支撑复杂应用[18]的背景下,将人的作用或智力引入机器智能系统中,是实现人工智能在复杂领域赋能的有效途径。相应地,应以“人+机器智能”的人机混合增强智能作为发展方向,探索人工智能在人装编配规划方向的应用原理和方法,通过人机互为补充的智通力聚,提升班组临机兵力编组配置水平,为有人/无人混编协同等提供基础支撑。所形成的人在回路的混合智能范式如图1所示。
这种范式中,人始终是智能系统的一部分,当系统的求解收敛困难或输出置信度低时,人主动有限介入调整或直接给出合理正确的问题求解,实现基于人机协作的反馈回路闭环。在手段上,一是“机对人”的增智,即智能技术对人脑在提升环境理解水平、增广认知范围、加深决策深度等方向进行赋能,通过降低人脑认知负担,提升指挥员决策的速度和正确性。二是“人对机”的增智,即通过人的适时干预,对现有人工智能应用系统在提升态势研判准确度、补齐知识盲点、创造性缺失等高级认知和决策方向能力进行加强。
在效果上,是将机器决策具有的精准性、快速性、重复性与人脑决策具有的高度思想性、创造性、主动性相结合,机脑辅助人脑、人脑利用机脑,通过人机能力融合和效能聚合,把人对模糊、不确定问题分析与响应的高级认知机制[19]与人工智能系统相耦合,提高班组指挥员的临机调整水平和规划决策的可靠性。
基于元宇宙全时、全天候、高逼真、高可信[20]概念下的基础体系能力支撑,提出3+2总体架构,即通过平台层、定义层、能力层三层,向下连接资源层接入物理硬件和原始数据,向上支撑应用层满足多样化能力需求与应用场景,如图2所示。该架构充分运用信息技术的渗透性实现功能要素与作战能力的粘合铰链,结合“软件定义+硬件可重构”的建设思想,通过人机协同决策,实现班组多角色、多任务场景下兵力编配的敏捷适变能力生成,支撑班组能力灵活重构和临机自适调整。
图2 智能化兵力编配系统总体架构图
1)资源层。资源层包括实现功能的全部末端软硬件组件以及末端采集或外部信息支援而来的基础数据资源。若以“便当”为类比,则可视上述软硬件组件为“食材”,数据资源为“调料”。
2)平台层。平台层为系统所涉及的基础硬件、通联网络、互联接口、人机交互、算法模型等提供基础支撑。包括涉及信息化基础设施、通用底层服务等组成的基础体系,以及涉及元宇宙引擎、人工智能、数据接入与处理、算法服务等技术领域的“智能+”、“数据+”、“服务+”等组成的“软”平台。基础体系提供基础软硬件支撑,类似“餐盘”,而“软”平台各组件紧密联结、协同工作,根据任务需求,实时计算生成辅助决策策略,“爱吃什么口味,就生成什么菜谱”。
3)定义层。定义层执行平台层输出的人员/装备、软件/硬件等编配策略,从人员组成、任务分工、目标分配、装备编配四个维度“定义”班组,并相应地形成功能需求列表。在此基础上,结合数据资源和基础服务所构建的软件应用,面向个性化任务需求,对功能要素、软件模块、算法模型等进行按需虚拟组合,完成“菜品烹制”。进一步,依托元宇宙的虚拟映射能力,指导对班组功能映射、人员分工、人装编配等进行按需重构,在物理世界“出锅盛盘”。
4)能力层。主要输出两类能力。一是通过“定义”出的个体编配赋能形成紧贴具体任务需求的智力、体力、感知力、生存力、控制力五个个体综合能力。二是在实现个体能力的基础上,通过定义层基于“智能+数据”的编配推荐和面向任务的“人、装、目标”映射,在班组层面形成凝聚力、默契度和互补性三种能力。进一步,以班组能力反哺个体能力,在提升战斗力的同时降低单一个体装备的质量和成本。
5)应用层。依托平台层输出的应用服务、数据和算法支撑等,结合定义层打造的多模态编配方案,对“有人-无人”模块化编组、网络化互联和智能化协同进行多样化、个性化赋能,结合系统可重构能力,满足不同场景下的应用需求。
综上,通过层次化架构设计,上层为下层提供需求,下层为上层提供支撑和能力输出,各层可独立进行按需扩展和剪裁,结合可重构设计,可实现灵活、低成本的班组兵力编配动态规划及面向任务的自适调整能力。
平台“搭台”的设计使得班组兵力编配系统可在数据、算法、功能方面纵向进阶,而定义“唱戏”的理念使得系统能够实现面向任务功能差异化细分的横向扩展。在作用方式上,本文第2节提出的“定义”理念,综合应用人机混合智能原理与方法,以条例、案例、历史经验等为基本约束,结合先进建模与仿真[21]、多智能体强化学习与平行推演、知识图谱等相关应用领域专业技术,充分利用元宇宙不受时空、地理限制等优势[22],平行推演迭代,逻辑推导预判相关情形,辅助推送优化结果,具体问题具体分析,“定义”出适时适用的班组人装编配、单装功能和系统组成。具体流程如图3所示。
图3 班组“定义”流程示意图
1)根据具体执行任务的目标和特点,以个体能力(体能、心理、技能水平、文化素质、性格特点、专长、短板等)、装备能力(功能、性能、使用条件、限制等)等数据为支撑,以条例、规则为约束,以历史经验、案例为辅助,结合人-人的凝聚力和默契度以及人-装的互补性等能力需求,通过平行推演,形成人员组成、任务分配、装备编配等辅助规划,经班组指挥员调整优化和确认后,形成兵力编配方案。
2)根据执行任务中所涉及的样式、环境和条件制约,通过大数据关联分析和人工智能推理,输出完成班组行动所需的功能列表和编配建议。
3)根据任务分配,完成任务向个体的匹配;根据功能需求,结合使用特点,完成所需功能向身上要素、身周要素和无人要素的映射。硬件上,依托模块化组合能力,实现个性化单装;软件上,关联选取所需的AI算法、业务服务和应用软件,向个体装备进行OTA推送,完成软件功能安装和部署。
本文第3节提到的兵力编配方案主要包括人员组成、装备编配、任务匹配、功能组合与映射等规划要素。考虑军事大数据平台使用条件、军事数据获取难度等现实困难,假定人员组成推荐已在战前通过基于大数据的人员选拔算法完成,装备编配推荐已通过某指挥系统的任务预案模板生成完成。在实验上,设计通过仿真推演的形式,验证辅助规划算法即决策模型在任务匹配、功能组合与映射等方面的决策有效性。
在任务想定方面,以单兵战斗组遂行斩首行动为典型,构建有人-无人协同作战场景下的仿真作战任务。红蓝双方兵力设置分别为:红方战斗组1个,包括突击手士兵2名,察打一体无人机1架;蓝方前线指挥所1个,包括轻型指挥车1辆,导弹操作手2名(各配备便携式防空导弹1发)、武装侦察车1辆。行动任务以红方击毁蓝方指挥车为胜利,以红方所有士兵、无人机被摧毁或时间耗尽为失败。
仿真环境采用墨子仿真推演平台,利用数据接口与决策模型进行交互,实现模型对仿真环境中智能体的驱动,以及接收仿真环境状态、行为结果等对模型的反馈。设计推演20 000轮,每轮以红蓝一方胜利或仿真时间耗尽为结束。软件实验环境示意如图4所示。
图4 软件实验环境示意图
各智能体动作空间设定为机动类、配装类和打击类。其中,机动类是指红蓝双方对航向、速度等的调整空间;配装类是指红方战斗组中士兵和无人机的功能配备调整空间,为简化模型,仅开放对火力打击功能的配备调整空间,设计士兵的火力装备为狙击枪或突击步枪,设计无人机的可选火力载荷为挂载式榴弹;打击类是指红蓝双方各智能体的攻击动作调整空间,即是或否的布尔值。动作空间和调整范围约束设计如表1所示,红蓝双方火力装备性能参数约束设计如表2所示。
表1 智能体动作空间与范围
分别设定红蓝双方各智能体的奖励机制,以击毁/击毙为满分,击中但未击毁/击毙时得分与战损值呈正比。具体为,红方击毁蓝方指挥车记100分、击毙蓝方导弹操作手记50分、击毁蓝方武装侦察车记50分;红方突击手士兵被击毙记-100分、无人机被击毁记-50分。蓝方击毙红方突击手士兵记100分、击毁无人机记50分;蓝方指挥车被击毁记-100分、导弹操作手被击毙记-50分、武装侦察车被击毁记-50分。
小学老师都有一颗长不大的心,只有这样才能和小学生亲近。小学生都是好动的。在课堂上,他们不会放弃一点点可以动的机会,那么老师就可以充分运用小学生的这一点心理,在动中教会他们知识。如在汉语拼音第6课教j、q、x的儿歌时,老师可以和学生一起做动作来加深印象:星期天(一起做7的手势),洗衣裳(做两手搓衣服的动作);洗衣机,嗡嗡响(加入手指转动的动作);妈妈洗衣,我帮忙(两手放在胸口,做“我”的动作)。除了动作,面部表情也蕴含了大量的情感信息,老师和学生一起运用表情和动作来增进课堂教学的情感交流,使拼音教学课堂充满生机!
依据本文4.2节的仿真环境和参数设置进行实验。迭代推演过程中,红方奖励值变化如图5所示。对其分析可知,起始阶段红方智能体行为呈现无规则,因而难以获取较高的奖励值。随着决策模型的学习推进,各智能体行为逐渐形成攫取高奖励值的趋势,并不断通过击伤、击毁等过程累计得分。当推演进行到7 500轮左右时,模型逐渐收敛,所获取的奖励值稳定于400分附近。
图5 红方奖励值变化
经过20 000轮迭代之后,将模型在墨子仿真系统中进行可视化测试推演,观察测试推演过程可发现红蓝双方主要行为如下:
1) 红方无人机在蓝方防空导弹攻击范围之外机动,并逐步接近蓝方指挥车;红方突击手利用数量优势,通过狙击步枪对蓝方导弹操作手进行打击。相应地,蓝方指挥车机动空间被不断压缩;在击毙蓝方所有导弹操作手之后,红方无人机对蓝方指挥车进行打击。
2) 蓝方指挥车在己方防空导弹和武装侦察车的防御范围内机动,蓝方武装侦察车搜寻并打击红方突击手。
综上,决策模型对红方智能体进行了任务匹配,并在此过程中同步给出红方突击手配备狙击步枪、红方无人机挂载榴弹进行行动的火力功能组合与映射建议。通过对仿真环境中红方各智能体的行为进行分析,上述编配建议符合人脑对无人机作战使用时采用的“先清缴防空、后空中突击”的思想行为模式,故而采纳上述方案建议。而后,算法模型驱动红方智能体在仿真环境中完成了任务,表明决策模型在班组作战场景下对任务匹配、功能组合与映射等决策过程表现出一定的有效性。
基于人机混合智能的班组兵力编配系统以基于元宇宙的平行推演为底座,建立基于知识工程的技术体系和不同层级的推理模型,支撑从单装到个体再到班组的多模态重构。
一是多模态单装。智能化的班组兵力编配系统将颗粒度细化到功能要素级,可采用“基础单装平台+功能要素模块+自适应软件加载”的形式,通过对功能要素的灵活配装和个性化动态集成,实现对单装功能的灵活拆分与模块化组合,通过算法驱动,对单装各功能进行重配置和个性化组合使用,支持实现类似“软件定义”的个性化实体装备。
三是多模态班组。基于表征建模、数据画像的实体能力抽象,充分利用虚拟空间平行推演,通过学习算法不断地利用日常数据优化迭代班组级编配方案,利用大数据技术优化实现可定制化编配和互补式应用模式,有效调动以凝聚力、默契度、互补性为代表的隐性战斗力生成,使班组内部的个体可以更为有效地互相衔接、取长补短和高效运转,实现对任务、事件等驱动下的快速响应和灵活适变。通过信息技术实现对班组拓扑、关系、分工等的按需变换,有效提高班组高效遂行多样化任务的适应能力。
但也要看到,作为军事博弈与人工智能的交叉领域,人机混合智能技术在班组级兵力编配决策领域的研究还处于起步阶段,下一步将在以下方向继续探索:
1) 本文仿真验证的决策模型虽然达到了预期效果,但由于其采用强化学习技术,存在可解释性差、专家系统集成困难等局限,后续将在强化学习与决策树等方法相结合的决策模型研究方面继续探索。
2) 为降低验证难度,目前实验仅采用“同意/调整”的有人介入模式,未对知识补充、决策引导等层次化人在环有限干预模式进行软件接口实现,也未对人员选拔推荐、装备编配预案等进行自动化关联,后续可进一步完善基于决策模型的软件应用。
3) 为简化计算过程,目前仅选取部分典型参数描述智能体动作空间,且仅验证了在单一场景、单一功能组合映射下决策模型的有效性,后续可进一步细化动作空间表征并提高模型泛化能力,使其适用于多任务偏序场景下的多类功能要素组合编配推荐。
4) 后续将进一步展开对班组凝聚力、默契度、互补性能力的生成机理和模型研究,并在士兵能力图谱建模、基于大数据的人员组合和匹配推荐模型方面进行算法探索。
新技术形成战斗力的过程,实质上是探寻有力释放其作战潜力的过程。在军事领域中,人工智能技术赋能下的智能优势,实质是信息优势与认知优势的高度统一,最终必将服务于决策优势。人机协同的混合增强智能是新一代人工智能的典型特征,本文基于人机混合智能原理,提出了一种面向班组层级的智能化兵力编配系统架构,给出了作用方式设计和预期能力分析,并通过仿真实验验证了其在班组作战场景下对任务匹配、功能组合与映射等决策过程的有效性,以期为多角色敏捷转换、多任务灵活响应和自适应敏捷重构能力等新要求背景下班组“只见五指、攥不成拳”的问题提供解决思路。相关研究和分析结果可为面向班组层级的智能化兵力编配策略、指挥决策系统研究和工程化构建提供理论支撑和技术基础。