面向联合作战评估的兵棋推演实验研究

2018-12-20 09:10:54刘海洋唐宇波胡晓峰刘戎翔崔文华

指挥与控制学报 2018年4期

刘海洋唐宇波胡晓峰刘戎翔崔文华

联合作战评估,按照评估对象层次的不同可分为作战方案评估、作战计划评估与作战问题评估等,而作战方案评估或作战计划评估在某种意义上可视为作战问题评估在不同粒度上的综合集成.针对作战问题评估,需要提取能够反映作战问题的综合评估指标并对其进行度量.在对联合作战进行评估时,传统的运筹分析方法已无法满足动态评估需求,脚本式的仿真模拟也不能有效地体现对抗过程,而人在回路的兵棋推演通过将人的决策引入到推演过程中,能够较好地反映联合作战动态对抗的特性.兵棋推演是联合作战在虚拟空间的一种实验活动[1],推演的过程、结果以及产生的数据可为联合作战评估提供基础支撑.

兵棋最早起源于19世纪普鲁士的莱斯维茨父子发明的宫廷战争游戏[2],随着计算机与信息技术的发展,早期的手工兵棋逐渐演化为现代的计算机兵棋.20世纪80年代后,计算机兵棋技术蓬勃发展,先后出现了多款军用和民用的兵棋系统,其中最为著名的当属美军的联合战区级兵棋系统(JTLS)和联合冲突战术兵棋系统(JCATS)[3].美军在联合出版物JP5-0中也明确规定采用兵棋推演对作战方案进行分析与评估.相比于美军,国内在兵棋推演方面的研究起步较晚,但通过借鉴国外成熟的兵棋推演技术并与我军实际相结合,我们在兵棋系统研发与运用方面也取得到了较快的发展.很多学者在兵棋推演的系统架构[4]、数据与规则[5−6]、推演机制[7−8]、态势表达[9]等多个方面进行了深入的研究.其中,国防大学兵棋团队研制的某大型战役兵棋系统,已在多次部队兵棋演习和教学推演中积累了大量的实际演习数据,能够为战区开展联合作战评估提供推演平台与数据支撑.

依托某大型战役兵棋系统,采用模拟实验的方式对作战条件与过程进行控制,能够较大程度地还原战场的真实状况,给出较为客观的综合评估指标度量结果.本文在对兵棋推演实验总体框架进行分析的基础上,考虑兵棋推演的特点与规律,根据评估需求有针对性地设计兵棋推演实验流程与步骤.在对兵棋推演实验数据进行分析时,从时间、空间等多个维度上对评估问题进行综合,采用工程化的手段快速生成有效的度量结果,以此来辅助指挥员和决策机关解决联合战役层次带有全局性的重难点评估问题.

1 实验总体框架

兵棋推演实验的基本过程主要包括3部分,分别是兵棋推演设计、兵棋推演运行和兵棋推演分析.兵棋推演设计重点是针对推演问题设计相应的解决方案,兵棋推演运行侧重于对推演过程的控制,兵棋推演分析则是从推演数据中获取综合分析结果.将分析结果反馈至推演运行,可作为调整推演运行与控制方式的依据,同时推演运行状态也是对推演设计的直接反映,通过从分析结果到推演设计的回溯基本上较好地保证了两者间的对应关系.兵棋推演实验总体框架如图1所示.

1.1 兵棋推演设计

兵棋推演设计是兵棋推演实验的基本环节和首要步骤,是在明确推演问题的基础上,对推演方法与步骤的预先制定.兵棋推演设计的科学性与合理性,直接关系到兵棋推演运行以及后续的综合分析,能够对综合评估指标的度量结果产生重大影响.其设计的步骤主要包括:

1)问题设计.涵盖了对推演问题的分析、设计与规划,提出针对推演问题的命题与假设,给出输入条件、输出要求以及可能的影响因素等等.

2)方案设计.在给定初始输入条件与输出要求的情况下,对推演实验所采用的方法、步骤与流程进行规划,同时对实验过程中可能出现的问题进行梳理,并给出相应的解决办法.

3)推演设计.在问题设计与方案设计的基础上,对兵棋推演运行进行具体的规划,包括对推演运行的控制变量、运行模式、推演步长、运行时长等参数进行合理设定,以确保兵棋推演实验能够高效运行.

1.2 兵棋推演运行

兵棋推演运行是对推演方案中实验流程与步骤的具体实现,也是在兵棋推演控制模型的调度下产生推演数据的过程.在推演运行过程中,兵棋系统在兵棋推演控制模型的调度下自动运行,通过多轮次的推演批量产生推演数据,为综合评估指标度量结果的获取提供数据支撑.

整个推演运行过程主要包括推演运行与控制和数据采集与存储两个模块,其中推演运行与控制模块处于支配地位.推演运行与控制模块由推演控制和推演执行两部分组成,推演控制主要是向兵棋系统发送各类控制指令同时接收兵棋系统实时发送的状态信息,负责实验启停、过程监控、逻辑判断以及任务指令下达等功能;推演执行主要是依托兵棋系统在推演控制的调度下开展推演活动,负责加载断点数据、系统按步长推进、执行任务指令等功能.数据采集与存储模块主要是将产生的带有时间戳的兵棋推演数据存入相应的数据库,为兵棋推演分析提供数据.

1.3 兵棋推演分析

兵棋推演分析主要是基于兵棋推演数据开展,大致可以分为3个层次,即统计分析、数据挖掘和综合分析.统计分析侧重于通过统计的方法和手段对战果、战损、战耗以及指控命令、战场情况报告等作出阶段性汇总分析.数据挖掘是在基础数据和统计数据的基础上,以数据挖掘的方法对隐藏在数据背后的规律和知识进行探索,通过数据来增强对推演不确定性与整体关联性的把握.综合分析通过引入人的知识与经验,对数据分析结果进行再分析与再判断,通过定性与定量相结合、机器与人相结合的手段对推演的结果进行综合权衡.从以机器为主的统计分析,到人为主导的数据挖掘,再到以人为主的综合分析,3种分析方法层层递进,既借助了机器的精确与效率,又融入了人的知识与经验,从而能够大大增强推演分析结果的科学性与合理性.

2 实验流程与步骤

依托某大型战役兵棋系统开展兵棋推演实验,主要是根据兵棋系统的断点重推机制,在兵棋推演断点数据的基础上进行复盘推演,并在推演过程中置入额外的探测任务,通过对探测任务测量到的态势变化情况进行分析挖掘,得出对综合评估指标的度量结果.兵棋系统在断点重推机制的设计上充分考虑了态势数据的前向累加与指令数据的后向兼容[11],即通过加载断点数据可以得到当前的态势信息以及所有后续推演的指令序列信息,而后续推演指令序列信息的选择性载入可使兵棋系统在无人参与的情况下进行复盘推演,从而保证了探测任务能够在近似实际推演的环境中执行.

2.1 实验流程

兵棋推演实验的流程如图2所示,其可以简单概括为“统一时间断点,顺序置入探针,逐轮开展推演”.实验过程中包含两种时间,即作战时间和物理时间,作战时间是按照推演逻辑进行组织,而物理时间对应的是实际的天文时间.在作战时间轴上,假设选定数据断点E1为统一的时间断点,则实验中的每轮推演都会以E1为共同的起点,得到的初始态势与后续的指令序列均保持不变,确保了不同的探测任务能够在相对一致的环境下进行.将探测任务顺序置入推演过程中,需要考虑实验需求、探测任务对作战态势的影响等因素,尽量减小探测任务对其他正常作战任务造成的影响.以区域制空权探测任务为例,对于战场中的n个空域,需要置入n个探测任务对其进行探测,若将n个探测任务同时置入推演过程中,则会使作战态势受探测任务影响的概率大大增加,从而使兵棋推演朝着不确定的方向演化.逐轮开展推演主要是考虑到兵棋系统重启的时间成本,在探测任务的有效探测周期内应确保作战推演的连续性,即使在实验周期内出现探测任务失效的情况(如担负探测任务的部队无法到达指定位置或已被消灭等),也要尽量避免不必要的兵棋系统重启.在该轮次的推演结束后,根据当前实验条件来判断是否进入下一轮的推演,在全部推演结束后再通过对推演数据的处理来筛选出探测任务失效的情况.

2.2 实验步骤

兵棋推演的过程本质上是一种受控的实验活动,而有效的控制是推演实验能否成功的关键所在.兵棋推演实验过程主要包括兵棋推演控制与兵棋推演执行两部分,兵棋推演控制端根据实验流程与实验方案对兵棋系统进行控制,兵棋推演执行端依托兵棋系统进行推演,接收推演控制端发送的控制命令,同时将系统状态信息反馈至推演控制端.兵棋推演实验控制过程如图3所示.

以兵棋推演控制过程为逻辑主线,兵棋推演实验步骤包括:

1)系统启动,加载模型与数据;

2)按照实验需求,对兵棋系统当前的初始态势进行调整,并向兵棋系统发送初始态势调整命令,兵棋系统接收执行后对当前态势进行微调;

3)向兵棋系统发送推演启动命令,兵棋系统接收执行后按时间步长推进,并保存兵棋推演数据;

4)接收兵棋系统实时发送的推演运行状态信息,对兵棋系统推进步长、当前作战时间、当前运行状态等参数进行监测;

5)接收兵棋系统实时发送的任务状态信息,对特定任务探针的当前执行情况进行监测;

6)对特定任务探针的执行情况进行判断,若满足任务下达条件,则向兵棋系统发送任务控制指令,兵棋系统接收并执行后,将任务执行状态实时反馈至推演控制端;反之,跳至步骤4),继续对兵棋运行状态与任务执行状态进行监测;

7)对是否满足实验结束条件进行判断,若满足实验结束条件,则向兵棋系统发送实验结束命令,兵棋系统接收并执行后退出系统运行,实验结束;反之,进入本轮推演结束条件判断;

8)对是否满足本轮推演结束条件进行判断,若满足本轮推演结束条件,则对推演方案进行调整,准备进行下一轮推演;反之,跳至步骤4),继续对兵棋运行状态与任务执行状态进行监测;

9)向兵棋系统发送重启命令,兵棋系统接收并执行,等兵棋系统重启结束后重新加载断点数据,准备进行下一轮推演;

10)推演控制向兵棋系统发送推演启动命令,重复进行步骤3),直至满足实验结束条件,最终退出兵棋推演实验.

3 实验数据获取策略

在探测实验完成后,需要对相关的实验数据进行抽取,以获得针对评估问题的综合评估指标度量结果.度量结果的获取是一个自底向上的综合过程,由实验数据得到的统计结果作为小区域评估结果,再由小区域评估结果综合成大区域的评估结果,通过对评估结果在时间轴上进行切片,能够得到不同空间和时间分布上的评估结果.在实验数据处理的过程中,由于兵棋推演规则本身的限制,探测任务无法做到在任意时刻和任意区域持续实施探测,所以对实验数据的获取需要考虑实验结果确定和实验结果不确定两种情况.

3.1 实验结果确定

在这种情况下,探测任务的探测结果能够明确地反映出评估结果,如在上述的制空权评估示例中,若执行探测任务的侦察机在特定时段特定空域内遭敌方地面或空中火力打击,则探测结果为我方在该时段该空域内没有制空权,反之我方获得制空权.

数据统计主要从兵棋推演数据库中的空空交战表和地空交战表中查询.假设评估结果的初始状态为S(0)ij,其中i=1,2,···,m,j=1,2,···,n表示目标网格的坐标编号为(i,j),则初始状态的评估结果矩阵可表示为:

经查询空空交战表后,对发生空空交战的网格记为AAij,此时评估结果状态为:

此时,评估结果矩阵可表示为:

经查询地空交战表后,对发生地空交战的网格记为SAij,则评估结果状态为:

此时,评估结果矩阵可表示为:

矩阵E2为考虑在实验结果确定的情况下,融合了空空交战与地空交战数据后的评估结果.其网格内的探测结果是明确的,即遭到打击的网格为没有制空权,顺利执行任务的网格为有制空权.从数据统计结果来看,部分网格内存在着探测任务遭到多次打击或正常推演的空中编队遭到打击的情况,为简化问题,此种情况同样被视为该网格没有制空权.

3.2 实验结果不确定

在这种情况下,探测任务得到的探测结果不能明确地反映评估结果.同样在上述示例中,利用探测任务对目标空域进行探测时,由于受到兵棋推演规则的限制,探测任务需要根据兵棋推演指令开展行动,包括从场站起飞、途径航迹点、到达目标空域等一系列飞行过程,当探测任务因遭敌方打击而失效时,需要对目标网格及时派出第2批甚至更多的探测任务,以满足特定时段内的持续探测需求.在这个过程中,实验结果不确定的情况可分为两种,一种是在特定时段内探测任务状态良好,且尚未到达目标网格;另一种是在特定时段内探测任务已经失效,且尚未到达目标网格.上述的两种情况探测任务均未到达目标网格,所以不管探测任务的状态是良好还是失效,其探测结果都不能准确反映对目标网格的评估结果.

假设在T时段内,探测任务DMij无法对目标网格进行探测,此时需将目标网格的评估结果状态置为S(3)ij=−1,则在T时段的评估结果矩阵为:

根据数据统计结果来看,在实验的大部分时段内不确定的目标网格数在网格总数中占比较小.根据人的经验来看,当目标网格满足包围规则时,即属于不确定状态的目标网格处于确定状态的网格的包围中时,目标网格的状态可根据周围网格的状态进行判定.例如在目标网格的周围都是有制空权的网格,则该目标网格可判定为已取得制空权.

判定是否满足包围规则的算法设计如算法1所示:

算法1:包围规则判定算法

输入:评估结果矩阵E3;

输出:评估结果矩阵E4.

在实验数据处理过程中,首先对评估结果矩阵赋初值,然后通过查询数据库对评估结果矩阵进行多轮迭代,最终形成针对评估问题的量化评估结果.针对特定时段的部分网格探测任务无法探测的情况,通过借鉴专家经验设计包围规则判定算法,对目标网格进行近似判定,对于不满足包围规则的网格,则做舍弃处理.运用上述的实验数据获取策略生成的评估结果,基本上较为客观地反映了当前的作战态势,且在很大程度上实现了工程化处理,避免了人为因素对评估结果的干扰.

4 实验案例

在联合作战过程中,制空权对夺取其他战场制权来说至关重要,是否夺取制空权通常是指挥员重点关注的核心问题之一[12].利用兵棋推演实验考察目标空域的制空权评估结果,首先需要对目标空域进行网格划分,在特定时间段内设置探测任务,使其在特定的时段能够覆盖到特定的空域,以该任务编队的任务执行情况来判断区域性制空权.在兵棋推演实验过程中,选取的时空对象应涵盖主要作战阶段和主要作战空域,对时间段的选取原则是能够覆盖主要的交战时段,可通过观察态势回放进行选定,如“X年X月X日6:00∼X年X月X日12:30”等;作战空域范围是以与作战时段对应的主要战场的经度、纬度和高程范围来进行约束,如纬度为北纬XX-XX◦,经度为东经XX-XX◦,高程为XX-XXm等.

依托某大型战役兵棋系统,以代号为“XX”的战役演习为基本想定,在其基础上考察特定时空条件下的制空权情况.将目标空域划分为10×10的网格,任务探针选择2架歼10并挂载侦察载荷执行空中侦察任务,重点考察作战时间为X年X月X日6:05∼7:05时段内的制空权情况.兵棋推演实验推演速率设定为10:1,即作战时间为60min,物理时间消耗约6min,单次系统重启时间约14min,则每轮实验耗时约20min,10×10实验网格所消耗的总有效时间约2000min.利用移动时间窗口考察区域内制空权情况,时间窗口大小为5min,时间窗口之间的间隔为1min,部分实验结果数据如表1所示.

受兵棋推演规则的限制,部分目标空域无法进行持续探测,这种情况下将探测结果置为−1,表示在该时段内该目标空域制空权评估结果为不确定.制空权评估的部分兵棋推演实验结果如图4所示,图中红格表示已夺得制空权,蓝格表示没有制空权,灰格表示探测结果不确定.

对兵棋推演实验结果数据进行统计分析,得到的制空权综合评估指标度量结果曲线如图5所示,其中横轴表示时间段,纵轴表示区域制空权百分比,test_result=1表示已夺取制空权,testresult=0表示未夺取制空权,test-result=-1表示评估结果不确定.

表1 兵棋推演实验部分结果数据表

依据图5中的统计曲线,同时结合图4所示的可视化评估结果可知:在实验初始的数分钟内,红方区域制空权占比可达57%,不确定的区域占比将近40%,在该阶段红方主动对蓝方发起攻击,此时红方具有先发优势,而不确定区域占比较大是因为部分任务探针尚未在预定时间抵达目标空域所致;在随后的6∼8min内,红方区域制空权占比迅速下降至约30%,而不确定区域也随之下降,这是由于蓝方的地面防空系统对红方的空中力量进行了打击,导致红方制空权占比迅速下降;在后续的实验时间内,红方区域制空权占比基本稳定在30%,未夺取制空权的区域约占40%,而不确定区域也稳定在30%左右,此时对抗双方处于僵持阶段.

按照包围规则判定算法,对探测实验中的不确定结果进行处理,部分处理结果对比情况如图6所示,其中图6(a0)、图6(b0)、图6(c0)和图6(d0)为原始测量结果,图6(a1)、图6(b1)、图6(c1)和图6(d1)为经包围规则判定算法处理后的结果.从可视化的对比结果可以看出,被某种确定方格完全包围的灰格被判定为与邻近方格的结果相同,这与人们基于作战态势的对区域制空权的认知基本一致.

经包围规则判定算法处理后的结果统计曲线对比如图7所示.对test_result=1的情况处理结果仅有部分细微的变化,包围规则判定算法将20个灰格判定为红格,约占总转换格数的4.1%;对test_result=0的情况作用效果比较显著,算法将470个灰格转换为蓝格,约占总转换格数的95.9%,其中转换最多的时段出现在6:51∼6:56,算法将28个灰格判定为蓝格;对test_result= −1的情况,算法在整个考察时段内共转换490个方格,占灰格总数(1614个)的约30.4%.总的来看,包围规则判定算法将部分人的认知验固化为判定规则,经在一定程度上减少了单纯基于兵棋推演实验的认知盲区,在处理不确定结果方面发挥了较为显著的作用.

5 结论

对于联合作战评估来讲,采用传统评估方法如专家打分法、德尔菲法、模糊综合评判法等,由于人工介入环节较多而导致效率较低且易受人为主观因素的影响,而采用模拟实验的方式对作战条件与过程进行控制,能够较大程度地还原战场的真实状况,给出较为客观的评估结果.同时,采用工程化的实验方法获取评估结果,既可以为评估速度的快速提升创造条件,也可为基于机器学习的评估模型构建提供训练样本支撑.针对兵棋推演实验耗时较长的问题,下一步可考虑采用并行实验的方式进一步提升兵棋推演实验效率.