王江,罗旭辉,朱承,钱猛
(国防科技大学 信息系统与管理学院,湖南 长沙 410073)
作战行动方案(course of action,COA)是作战组织为实现其使命而制定与实施的整体有序的行为,是执行使命的任务流程[1]。其核心元素是作战行动(action),其他元素都和这个元素相关。对COA进行效能评估能使指挥员了解不同COA的作战效果,进而为指挥员优化和选择COA提供支持。
如何在不确定环境下实现COA的评估,一直是国内外作战计划领域关注的热点。国内军事评估领域大多集中于作战武器装备层面,而关于COA的效能评估较少。美军于20世纪80年代末开始了作战计划评估的相关研究,提出了基于效果(effects based assessment,EBA)[2-6]的评估方法,对传统的作战计划评估理论进行发展。文献[5]提出了基于贝叶斯网络的语言行动网络(action network),并开发了支持空军战役计划评估分析的工具套件(campain assessment tool,CAT)。文献[6]提出了基于效果的计划编制的贝叶斯方法论,建立了“action-nodes-effects”为框架的贝叶斯网络模型,并开发了BERT(Bayesian EBP reasoning tool)作战行动计划评估辅助工具。但行动与节点采用任务分解和实体抽象的方法,没能考虑行动之间复杂的依赖关系,且节点之间因果关系和条件概率表均由专家据经验给出,这些都使得评估的主观因素较强,说服力不足。
本文提出一种基于贝叶斯网络的COA效能评估方法,通过建立COA效能模型,探索行动之间的依赖关系来处理COA结构和过程的复杂性。运用仿真实验处理COA本身的不确定性,并建立将效能模型中依赖关系映射为贝叶斯网络中因果关系的对应规则,最终采用贝叶斯方法实现了对COA空间集进行评估和优选。
基于贝叶斯网络的COA效能评估框架如图1所示。其构成主要为4块:效能模型构建单元、数据生成单元、模型参数确定单元和评估单元。效能模型构建单元的主要任务是在COA想定空间基础上,建立COA效能模型并完成效能模型到贝叶斯网的映射。数据生成单元主要任务是通过仿真实验生成确定模型参数所需要的数据。模型参数确定单元根据仿真数据学习贝叶斯网络的参数,并且对所生成的模型进行验证。效能评估单元是对实验所得到结果进行评估和分析,选出较优的COA以及提供提高COA效能应该采取的措施。
图1 COA效能评估框架Fig.1 Evaluation framework
COA效能模型是根据评估意图对效能具有贡献要素的层次特性进行建模。至顶向下为效能逐层分解的过程,效能模型的下一层是效能单元,效能单元也可以由若干粒度更细的效能单元组成,效能单元有一个或多个属性,而属性进一步细分为自然属性和构造属性,直到分解为全部是可以观测的自然属性,属性经过度量形成指标。反之,至底向上则为效能逐层聚合的过程。
(1) 效能单元
效能单元是对COA整体效能作出贡献的单元,从不同的粒度层次,效能单元可以是作战行动,也可以是作战过程。与作战行动不同之处在于,效能单元与评估意图密切相关,即根据评估意图抽取COA相关属性与COA共同构成效能单元。记效能单元为EU,定义为
(1)
(2) 效能关系
关于活动间相互依赖关系,Malone和Crowston的协调理论从活动执行所耗用的资源出发来研究活动间的相互依赖,提出3种基本相互依赖[7],即流程依赖(flow)、分配依赖(shar)、集成依赖(fit)。再考虑到模型的结构因素和时间因素,本文将效能单元之间的依赖关系Cdepen定义为
Cdepen:=
(2)
Cdepen⊆EU×EU,
(3)
其中:Dstructure为COA效能模型组成结构的依赖,主要为效能单元之间的部分-整体关系。对于2个效能单元x和y,若x是y的一部分,则两者间有组成依赖关系,记为HAS(x→y)。
Dresource为效能单元基于资源的依赖,包含Malone协调理论中的shar,flow和fit 3种依赖。shar表示同一效能单元由多个效能单元使用,例如3个效能单元x,y和z,若x与z共同使用y,则x与y之间是分配依赖关系,z与y两者之间也是分配依赖关系,记为SHA(x→y)。flow表示一个效能单元的输出作为另一个效能单元的输入,如2个效能单元x和y,若x的输出是y的输入,则两者之间为流程依赖关系,记为FLOW(x→y)。fit即多个效能单元支持一个效能单元,如效能单元x,y和z,若x与z合并为y,则x与y两者是集成依赖关系,z与y两者之间也是集成依赖关系,记为FIT(x→y)。
Dtime为效能单元时间上的相互依赖,主要为效能单元在时间上的先后顺序。若2个效能单元x和y,从时间上看x在y之前,且x的执行结果明显的影响y,则二者间存在时间顺序关系,记为TIME(x→y)。
(3) 效能模型
效能模型由多个效能单元构成,同时效能单元之间存在多种不同的依赖关系。效能模型由节点和边构成,节点表示效能单元,边表示效能单元之间的关系。效能模型记作EM,定义为
EM:=
(4)
其中:iEU为效能单元的指标,由属性的变化来表示。
将SysML[8]的语义进行扩展,使之适合对所定义的效能依赖关系进行可视化表达。采用扩展依赖版型的需求图分析关键效能单元及确定效能单元间的相互依赖。表1定义了扩展的用例及其关系语义。
表1 扩展的SysML图例及其关系语义Table 1 Using modified SysML to model EM
图2为一个简单COA效能模型示例。椭圆表示效能单元,两个效能单元之间存在相应的依赖关系,角色表示效能单元所涉及的多种属性,注释表示效能指标信息。
图2 效能模型可视化建模示例Fig.2 Visualization of EM
确定节点之间的因果关系。COA效能模型中效能单元之间存在的各种依赖关系对应为贝叶斯网络中节点的因果关系。
令效能单元的因果关系为Ccaus,记为
Ccaus:=
(5)
其中:Unitcaus表示原因效能单元;Unitcons表示结果效能单元;它们之间的概率关系为Rprob。
对于效能模型EM,需判断EU是原因效能单元还是结果效能单元。将SysML用例图表示的依赖关系映射为贝叶斯网中的因果关系。定义如表2所示的规则。
表2 依赖关系向因果关系的映射规则Table 2 Mapping rules of dependencies
本文定义了将效能模型映射到贝叶斯网络的映射规则:
规则1:效能单元映射为结点。
规则2:效能依赖关系映射为因果关系。
规则3:依赖关系的指向按照依赖关系的分类确定,如表2所示。
最终得到的COA效能的贝叶斯网络是一个弧标记有向图,弧标记值根据依赖关系确定的条件概率作为权值。
关于贝叶斯网络节点之间连接关系的强度(条件概率表),为克服主观指定的弊端,本文采取仿真的手段获得数据。因数据集完备,故采用极大似然估计法(maximum-likelihood estimation,MLE)[9]进行参数学习。
每个网络节点对应的action具有作战双方兵力配置等属性,采用蒙特卡罗法[10]进行数据抽样,用多兵种混合作战的兰切斯特(Lanchester)方程[11]对COA效能模型进行作战仿真,步骤如下:
Step 1:确定输入变量。设置输入变量取值范围及分布函数。
Step 2:设置红蓝双方作战单元军事或经济价值,定义效能单元。
Step 3:对每个COA进行若干次仿真,得出效能值仿真数据表。
本文假设红蓝双方参战的作战单元类型及数量、作战单元之间火力分配系数相对固定,将蓝方第j类作战单元对红方第i类作战单元的作战能力指数βij以及红方第j类作战单元对蓝方第i类作战单元的作战能力指数αji作为主要的不确定输入变量,并认为其服从均匀分布。输出的效能值数据应包括战果、战损、战果战损比、双方损失的军事价值、双方损失的经济价值、效费比等等。
以蓝方损失的军事价值(即红方战果的军事价值)E为例,作为贝叶斯网络的输入,E的定义为
(6)
式中:E对应到贝叶斯网中即为节点的效能值;Si表示在作行动中蓝方第i个作战单位的损失数量;Vi表示蓝方第i个作战单位的军事价值。
通过仿真,每个网络节点得出若干个效能值E,可视为一个样本抽样,用MLE方法进行参数学习,其过程分4个步骤:
Step 1:数据特征统计与分析。统计每个COA的每个行动节点的效能值数值特征,如最大值、最小值、平均值、变化区间等等。
Step 2:确定状态数目。分析作战使命,对每个节点指定相应的状态数目,不同COA的相同action对应的节点应有相同的状态数目。
Step 3:确定状态区间分位点。分析数据分布,如区间范围,数据点分布均匀与否等,确定节点每种状态的分位点,不同COA的相同action对应的节点应有相同的状态区间分位点。
Step 4:使用极大似然估计法学习。根据样本数据,使用极大似然估计法对相关参数进行估计,计算出给定效能单元之间的条件概率表。
本文以某联合登岛作战行动为例[12],构造含5个COA的想定空间,如图3所示。每个作战行动应附有仿真所需的属性,例如兵力配置。
根据COA效能的贝叶斯网络模型建模方法,确定效能单元依赖关系,建立效能模型,并完成效能模型到贝叶斯网络的映射。图4所示为COA1的效能模型及其对应的贝叶斯网络。
图3 联合登岛作战COA想定空间Fig.3 COAs of landing operation scenario
图4 COA1的效能模型及其贝叶斯网络Fig.4 EM and BN of COA1
COA效能的贝叶斯网络分析实验结果如图5所示,由图5可知:COA1由于没有压制高地,北路行进效果很差,且港口遭遇战和机场遭遇战为poor的概率较大,导致行动结果不是很理想;COA2增加压制高地节点,抢占高地行动成功概率提高,以致整个行动结果成功概率有一定幅度提升;COA3提前炸桥阻援,效果较好,但炸桥阻援使蓝方无法增援港口作战,导致港口遭遇战中红方消灭的蓝方部队大幅下降,因本实验采用以红方战果的军事价值为效能指标,故港口遭遇战的效能值不高,使行动结果成功概率下降;COA4在COA3基础上增加电子对抗,提升了红空中编队突防概率和地面杀伤概率,战果良好;COA5在防空压制阶段伴随了雷达电磁干扰和上级情报指示(效能网络中未体现出,但计算效能值的时候合并在了防空压制节点中),对行动节点的成功概率有一个正面作用。下面分4个方面对COA的效能进行评估与分析。
(1) 行动结果评估
行动结果可为指挥员优选COA提供参考。图5中行动结果为succeed的概率:P1=0.21,P3=0.37,P4=0.49,P5=0.51,P2=0.52。因此,单从我方战果的军事价值为效能指标考虑,COA5,COA2以及COA4成功概率比较高,其次为COA3,最差为COA1。事实上,考虑到COA3和COA4提前炸桥阻援使红方消灭的蓝方增援部队减少,COA3和COA4的行动结果成功概率应比上述结果要好。
(2) 关键行动分析
采用贝叶斯网络的反向推理模式,这是一种由果到因的分析模式。设定目标节点概率为固定值,同时也可固定部分节点,观察其余节点的变化情况,这样可有效地找出影响整体效果的关键节点。对COA1进行实验的结果如图6所示。
其中P0表示COA1行动结果节点概率。调整行动结果的概率值,观察其余节点,可得出结论:行动结果成功概率大幅度提升后(从0提升达到90%),防空压制和抢滩登陆的概率变化不是很明显。比较同为行动结果父节点的港口遭遇战和机场遭遇战,机场遭遇战概率变化较大,说明抢占机场行动对整个作战行动影响较大。故针对COA1,在抢占高地后可以着眼于提高南路的兵力配置,从而提高机场方向作战效果。
图5 贝叶斯网络效能分析实验结果Fig.5 Result of BN-based effectiveness evaluation
(3) COA结构改变对结果的影响分析
COA结构的改变是指在某个COA基础之上加入或者减去某个作战行动,或者改变某些行动的执行顺序造成COA的变化。这种分析可使决策人员清楚的了解COA结构的改变导致的结果。
图6 COA1不同成功概率下各行动节点概率Fig.6 Probabilities of actions under different succeed probabilities of COA1
如COA4在COA3基础上增加电子对抗,通过反辐射无人机对蓝方雷达进行重点压制,提高红方空中编队突防概率和对地面杀伤概率。在本实验中体现为COA4在防空压制节点之前加入防空压制节点。由图5知,COA4与 COA3相比整体效果有一定提升,尤其是在有空中进攻编队参加的行动中。因此在抢占高地行动中,COA4效果明显好于COA3,导致南北两路方向蓝方损失都加大,最终COA4行动结果成功率高于COA3。
(4) COA效能的主要影响因素及提升措施
总结上述实验分析的结果,可得出一般性结论:
1) COA结构的设计至关重要。对COA1与COA2,COA3与COA4, COA2与COA5的结构进行对比可发现,两两之间仅相差个别节点,但效能值有较大差异。因此可在下一步工作中对COA探索合理的结构配置以提升其效能。
2) 对某一COA而言,对关键节点所对应的行动进行合理的兵力配置可显著影响该COA的效能。因此在确定某一COA结构之后,可通过关键行动分析来提升COA效能。
3) 指标选取对效能有很大影响。本实验采取敌方损失目标的军事价值作为效能评价标准,由于COA3和COA4提前炸桥阻援,与以效费比为指标相比,其效能值偏低。在实际应用当中,当以指挥员以及作战任务的实际情况设定评价指标。
本文重点考察了COA中各个行动之间协同模式对作战整体效能的影响,给出了COA效能模型、效能模型的贝叶斯网络建模方法、效能的贝叶斯网络参数学习过程以及COA的评估过程。实验表明,本方法较好地处理了作战环境中COA的不确定性以及行动之间依赖关系的复杂性,能够确定影响作战行动过程成败的关键行动以及实现了对COA空间进行优化和优选,从而支持指挥员的决策。另外,效能指标的选取对实验结果有一定的影响,军事人员不一定仅关心敌方被消灭的军事价值,而是考虑效费比。
下一步工作包括:
(1) 完善COA效能的表示方法,使COA结构中不依赖兵力对抗的节点的效能值得以体现。解决如清除水雷、设置路障等类型节点效能值难以表示的问题。
(2) 进一步探索 COA效能的主要影响因素及提升措施,考虑时间、环境等因素。
参考文献:
[1] 钱猛, 胡升泽, 刘忠, 等. 基于SysML的作战行动序列建模方法[J]. 火力与指挥控制, 2008, 33(8):15-19.
QIAN Meng, HU Sheng-ze, LIU Zhong, et al. An Approach of SysMl-Based COA Modeling [J]. Fire Control and Command Control, 2008, 33(8):15-19.
[2] ALBERTS D S,HAYES R E.Planning:Complex Endeavors[R].Assistant Secretary of Defense (C3I/Command Control Research Program)Washington DC,2007.
[3] Commander′s Handbook for an Effects-Based Approach to Joint Operations [M].US Joint Forces Command,Joint Warfighting Center,2006.
[4] MOREL T O,WONG E Y,KWINN Jr M J,et al.Effects Based Assessment Support System(EBASS)[R].Military Academy West Point NY Operations Research Center,2006.
[5] Peot Mark. Plan Generation and Evaluation Using Action Networks [R].Rockwell Scientific CO Durham N C,2003.
[6] Bullen Bert. A Bayesian Methodology for Effects Based Planning [R].Bae Systems Bristol(United Kingdom)Advanced Technology Centre,2006.
[7] MALONE TOMAS W, Crowston Kevin, Lee Jintae, et al. Tools for Inventing Organizations: Toward a Handbook of Organizational Processes [J]. Management Science, 1999, 45(3): 425-443.
[8] Object Management Group. System Modeling Language (SysML), Version 1.2[R/OL].[2012-05-30].http://www.omg.org/spec/SysML/1.2/.
[9] 薛万欣, 刘大有, 张弘. Bayesian网中概率参数学习方法[J]. 电子学报, 2003, 31(11): 1686-1689.
XUE Wan-xin, LIU Da-you, ZHANG Hong. Learning with a Bayesian Networks a Set of Conditional Probility Tables [J]. Acta Electronica Sinica, 2003, 31(11):1686-1689.
[10] BUSCH INGRID K, Mulvey Steve. QCOA: A Quick Course-of-Action Evaluation Toolkit [J]. Military Operations Research, 1996, 1(4): 13-21.
[11] 巨金川. 兰切斯特方程的推广及其作战应用[J]. 电光与控制, 2009, 16(10): 22-24.
JU Jin-chuan. Improvement of Lanchester Equation and It’s Application in Combat [J]. Electronics Optics & Control, 2009, 16(10): 22-24.
[12] 钱猛. 以网络为中心的联合作战行动过程协同生成与检验方法研究[D]. 长沙: 国防科技大学, 2009.
QIAN Meng. The Research on Coordinated Generation and Validation Approaches for the Network-Centric Joint Course of Action [D]. Changsha: National University of Defense Technology, 2009.