李 聪,李俊杰,黄 河
(解放军96901 部队,北京 100094)
作战效能在军用标准《GJB1364-92 装备费用—效能分析》中的定义是“在预定或规定的作战使用环境以及所考虑的组织、战略、战术、生存能力和威胁等条件下,由代表性的人员使用该装备完成规定任务的能力”[1]。作为位于作战体系与作战运用最顶层的基础性概念,作战效能在战场指挥决策、装备体系发展、编制体制优化等军事核心领域均担当着重要参照维度,也是所有服务于军事斗争而开展的战略战术行动所追求的总目标。科学有效的作战效能评估,对精准把握现代高技术战争的体系内涵和制胜机理具有重大的现实指导意义。
作战效能评估是站在体系对抗的高度,通盘考虑作战行动的各关键要素,在已知参评对象(如作战方案)的特征或性能等定量化参数的情况下,依据特定的评估准则对参评对象作出鉴别或评定的过程,首要目的在于对完成指定战斗任务的能力作出合理的评判。评估结果可以为体系优化或进一步的作战行动提供决策依据。
一般而言,作战效能评估隶属于多属性决策问题,此类问题包含3 个关键步骤:首先明确武器系统或作战行动等评估对象的效能度量准则,建立完备可测的评估指标体系;然后针对每个具体的评估对象,解算评估指标体系,即采用解析、统计或试验等方法对指标进行定量表示;最后拟出实值评估函数Γ:X→R,其中X 和R 分别代表实向量集和实数集,函数形式可以是具体的数学表达式,也可以是抽象的数据转换过程。此函数将评估指标向量映射为一个实数,作为最终评估值。通常,评估映射函数Γ 的拟定是最为关键的步骤,也是不同评估方法的本质区别所在。
一些经典的评估方法已在作战效能评估领域取得了广泛应用。基于加权和与基于加权积的多属性决策评估法是两种最常用的方法[2],两者都需要对评估指标赋予权重,之后根据指标间关联关系的强弱,采用指标的加权和或加权积形式计算评估值。然而,这两种方法均假定评估域内的数据和信息绝对精确,但针对复杂评估对象和评估环境,这种理想假定通常是不成立的。对此,出现了一些衍生方法,如模糊综合评判法[3]、灰色关联分析法[4]和突变级数法[5]等,这些方法通过不同的方式引入了不确定性或模糊性思想,能够较为有效地应对评估过程中的不确定因素。
尽管这些经典方法的评估思路各不相同,但它们都必须事先拟定好评估映射函数Γ 的精确形式,某种程度这是有违评估行为本质特征的。因为评估是属于认知领域范畴的概念,有赖于人的主观思维活动,必然存在大量难以量化的、不明晰的影响因素,这决定了映射函数应该是非精确化或抽象化的,或至少是难以直接指定其精确数学形式的。不过,如果给出一定量的函数输入输出数据,那么映射函数Γ 作为一种黑盒般的客观存在,必然隐含在这些数据中,可以凭借模式识别或机器学习技术从数据中间接挖掘而出。具体对于作战效能评估问题,就可以从评估案例数据中推断出评估函数。这个过程实际上是函数逼近问题,即从数据中学得近似函数,使,函数逼近程度取决于数据的质量与数量。沿此思路,已有人工神经网络[6-7]、支持向量机[8-9]和决策树[10]等多种技术应用于作战效能评估问题。然而,这些传统的模式识别技术需要大样本数据作为支撑,否则所得结果将是不稳定的。鉴于作战问题研究的特殊性,一般难以在特定成本约束下收集大量案例数据,这决定了所采用的方法必须容许中小样本,且能够引入样本外信息以纠正不稳定估计,贝叶斯网络技术就是一种理想的选择。
贝叶斯网络(Bayesian Network)[11-13],又称信念网络(Belief Network),是一种用有向无环图形式表示随机变量间条件概率依赖关系的图形化技术。它能够显示刻画变量间的因果产生关系,并以贝叶斯公式为基础,有效融合各方面信息对目标随机变量作出概率分布推断,适用于对不精确、不完全的事件进行知识表达与概率化建模,在处理不确定性知识推理方面具有显著优势,目前在许多智能化系统中都有广泛应用。在作战评估领域,不论是数据收集、指标测算或结果评判,都无法完全避免主观的、动态的、随机的与不可预见因素的影响,而这正是贝叶斯网络的适用情形,故本文就采用这种技术进行评估建模研究。
目前贝叶斯网络在作战评估领域已有一些典型应用[14],而本文模型与先前工作的最大区别就在于此处的模型推断是以直接集成案例数据为前提的。本节就基于贝叶斯网络技术建立用于作战效能评估的概率化案例推断模型。首先讨论模型案例数据的准备,其次给出模型的贝叶斯网络形式及数学描述,最后提出将案例数据代入模型的策略。
表1 案例集形式
在使用案例集之前,需对其进行预处理,不论是效益型(即值越大越好)或成本型(即值越小越好)指标,均统一为效益型,并归一化指标值,使其取值区间为[0,1]。对任一指标Sj,令归一化方法为:
本文模型属于一种概率产生模型(Probabilistic Generative Model)[15],它以贝叶斯推断的观点来看待效能评估问题,并视实际情况对各随机变量作出概率分布假设。图1 是此模型的贝叶斯网络形式,图中圆形节点代表随机变量,变量间的有向连接代表变量间的条件概率依赖关系,而方框则代表网络结构的复制。模型中各随机变量服从下列分布:
图1 模型的贝叶斯网络形式
至此,已经明确了模型中所有随机变量的数学意义以及整个模型的概率产生语义。而在效能评估过程中,这些随机变量也都具有相应的实际意义。下面就通过考查随机变量E 的分布特征,揭示此模型用于评估的内在运作机制。现对于,求得随机变量Ei的边缘分布为:其中,ix(W)为随机向量W 中等于1 的分量的下标值。易看出,这是典型的加权和形式[16],而经典的多属性决策评估方法的一种重要实现形式就是加权和法,即给定一个评估指标向量a,以及这些指标相应的权重向量W,将两者的加权和(向量内积)aTw作为评估结果。通过类比,可以发现随机变量W,{Sij},{Ei}的实际意义分别对应于权重、指标和评估结果。这样,在规定模型中的整数i 和j 分别指代案例索引和指标索引的前提下,参数ωj就代表指标i 的权重,参数αij代表案例i 中指标j 的解算值,概率p(Ei=1)代表案例i 的评估值。然而,模型中的指标和权重变量目前仍都是预设的先验分布,若要计算新案例的评估值,必须将历史案例数据代入模型作为“证据”。
对于任何基于案例的评估方法而言,案例数据的主要作用都是为评估新案例提供推断依据,前面提到,其基本思路是通过模式识别方法从案例集中学得一个从案例指标到评估结果的近似映射关系。由于本文模型的底层机制是加权和评估法,故为求出新案例的评估值,唯一的前提条件就是明确指标权重,而案例数据在这里的作用恰恰体现在权重变量分布的后验推断上。现若案例N 为新案例,模型评估映射关系见下式:
在贝叶斯网络中,将数据作为先验条件代入网络的一般途径是将涉及的随机变量设为特定的观测值。然而,本文模型无法采用这种方法,这是因为模型中的指标值和评估值变量都是二值化的(取值0 或1),而案例数据却取自闭区间[0,1]内的连续实数,两者不存在直接对应关系,故需要采取等效方式将案例数据间接代入模型。
注意到,案例数据实际上都可视作某种概率,比如某案例的指标S 取值0.8,可认为它是事件{S=1}的概率。而概率一般代表着观测者对一个事件出现与否的信念程度,这种具有不确定性的信念程度可以在贝叶斯网络中以虚拟证据(Virtual Evidence)形式呈现[17]。虚拟证据,也称不确定性证据(Uncertain Evidence),它可以将某种事件的不确定信念转化为此事件与其衍生事件间的概率依赖关系,通常以似然比率(Likelihood Ratio)形式表述。在贝叶斯网络结构上,引入虚拟证据只需作一项简单扩充[18],实例如图2 所示。
图2 虚拟证据的引入
本文基于某型作战仿真系统,在相同或相近的作战任务和作战环境下,通过调整作战计划、装备配置和协同力量等想定要素,拟定了6 套作战方案,在多次仿真运行每套方案后,取仿真数据的均值解算8 项效能评估指标。同时,由作战专家依经验对方案效能预先给予评判,方案6 留待模型评估,最终形成作战案例数据集,具体结果如下页表2所示,每项指标在表中也明确标注了成本型或效益型类属,据此归一化后的案例集如表3 所示。
表2 作战仿真案例数据
为便于可视化及快速模型推断,这里使用AgenaRisk[1]贝叶斯网络建模软件构建本文的作战效能评估模型,建模效果界面如图3 所示,其中,节点“weight”代表权重变量,它的6 个子节点中,节点“New Case”代表新案例(即方案6)评估结果变量,节点“F1_eval”~“F5_eval”代表案例1~案例5 的评估结果变量。每个案例评估结果节点的除“weight”以外的8 个父节点,对应于8 项效能评估指标。将表3 中案例数据以虚拟证据形式代入网络中的相应节点。
表3 归一化的案例数据
图3 实验模型的网络形式
模型参数设置为ωj=1/8,αjj=1/2,这将先验约束权重与指标变量服从均匀分布,相当于为中小样本案例数据可能带来的后验推断不稳定性附加惩罚。
在进行模型的后验推断时,AgenaRisk 实际上在后台获得了一个形如式(1)的评估映射关系,作为近似的评估函数。下页图4 为在AgenaRisk 中运行本模型后得到的方案6 评估结果,可见评估结果显示有约71%的概率等于True。这个结果有两种等效的解释方式,运用静态观点时,此方案作战效能的百分制评估值为71 左右;运用动态观点时,可以理解为此方案约有71%的概率可以达成作战预期。无论在哪种观点下,对应的评估结论本质上是一致的。随着案例集的增加,可以增量化地为模型添加相应的节点和证据。一般地,案例越多,评估结果也就愈加客观真实,这是因为大量的案例能够平滑掉模型中的随机性与数据噪声。
图4 案例评估结果
同时,作为模型最重要的“副产品”,图5 给出了模型推断后的评估指标权重分布情况。易见该分布并不均衡,这是符合预期的,因为任何作战专家在评估作战案例时都会在主观上对某些指标有所侧重。对本例来说,权重超过10%的指标为蓝方人员伤亡数量、蓝方装备损失数量、红方弹药消耗数量、红方装备损失数量和红方人员伤亡数量,这些就是评估本例的作战专家最为偏重的指标项,它们将在对新案例的评估中起到主要作用。作战专家在评估案例时,虽未明确给出权重,但实际上它们都暗含在案例评估结果中,可以从案例中学得这些权重,所以模型还具有对评估者主观评判的潜在影响因素进行量化的功能。进一步地,为了加入案例数据以外的有关指标权重的经验性知识,也可以事先为权重附加有效先验。比如,模型建立者认为蓝方参战部队规模S6指标项更为重要,且重要性是其余任一指标的4 倍,为将此先验知识以虚拟证据形式加入模型,需调整权重节点的条件概率表使其满足式(2)的似然比率关系。此时所得权重分布如图6所示,易发现与图5 相比,指标S6的权重有了近4倍提升,同时其余指标权重的相对大小关系基本维持不变,满足式(2)给定的约束,达到了为权重附加先验知识的目的。
图5 指标权重分布
图6 附加先验知识后的权重分布
总之,本模型能够结合各方面的信息,评估新案例的作战效能,同时推断出隐含的指标权重。有了这些指标权重,完全可以抛开案例数据,只用更为简单的纯加权和法进行效能评估,降低了实际使用本模型的难度。
本文提出了一种新的作战效能评估模型,此模型在贝叶斯网络的框架下,实现了基于加权和的多属性决策评估法的概率化版本。模型能以虚拟证据的形式接受一个给定指标值和评估值的案例集,之后通过后验推断的方式评估新的作战方案,获得一个从案例指标至评估值的映射关系。而且,评估指标权重是此模型的一个重要中间结果,能切实揭示出作战专家对不同指标的隐含偏重程度,同时模型也允许对指标权重附加先验知识,一方面平抑小样本案例集推断的不稳定性,更重要还可按需修正案例推断的结果。此模型为作战效能评估提供了新的思路与途径。未来的工作将致力于研究模型在大样本案例集下的性能优化方法。