杜菲菲, 冯新喜
(空军工程大学电讯工程学院,西安 710077)
现代战争要求作战双方指挥员必须在高度的不确定性和时间压力下,根据所获得的海量的包含有干扰、欺骗等不完整、不准确的信息,迅速做出决策。态势评估(SA)就成为现代战争的必然要求。国内外对态势评估从不同角度出发有不同的定义,主要有JDL模型[1-2]中的定义以及 Endsley[3]从人工智能出发给出的认知学定义。军事领域通常采用JDL的定义,即:态势评估是要建立关于作战活动、事件、时间、位置和兵力要素组织形式的一张视图,并将观测到的战斗力量分布与活动和战场周围环境、敌作战意图以及敌机动性有机地联系起来,分析并确定事件发生的原因,得到关于敌方兵力结构、使用特点的估计,最终形成战场综合态势图,帮助指挥员做出迅速准确的决策。在操作中常将Endsley态势评估三级模型作为一种功能模型[4],帮助研究人员从理论上理解态势评估,并为人工智能在态势评估中的应用奠定基础。
实用的态势评估系统需要解决从模型构建到系统实现等一系列问题。有文献[5]表明,国外已有较成熟的态势评估系统,理论和技术研究也有很大进展。国内关于态势评估的研究继承并发展了国外学者的学术观点、理论和方法路线,取得了很多成果[6-8]。但已有态势评估模型在对场景变化的适应能力、军事领域知识的表达和处理以及性能评价方面还都不够成熟,直接限制了其在实际系统中的应用。另一方面,国内信息系统建设不够完善,缺乏统一的功能模型和平台接口,态势评估系统还停留在理论研究和一些非常有限的战术试验层面[9-12]。
贝叶斯网络在1988 年由 J.Pearl[13]提出明确定义后,成为人工智能领域非精确知识表达与推理领域20多年来的研究热点。它是一个用节点表示变量,节点之间的弧表示变量发生的直接因果或相关关系的有向无环图,是人工智能、概率理论、图论和决策论相结合的产物,可以看作是一种在不确定条件下进行命题推理的标准认知模型[14],在具有内在不确定性的推理和决策问题中得到了广泛的应用。
相比态势评估领域的另外两种人工智能处理方法专家系统和神经网络来说,使用贝叶斯网络进行态势评估具有以下优点[15-17]。
1)贝叶斯网络技术是图论和贝叶斯推理的结合。同神经网络类似,贝叶斯网络也使用节点和有向边表示领域知识,节点之间可以通过有向边来传播新的信息,网络中保存的信息可以由专家指定,也可以通过样本学习。网络节点之间的连接有明显的实际意义,更符合人们对军事领域知识的理解。
2)贝叶斯网络中的知识可以进行更新,而专家系统中的知识不能自动更新;专家系统一旦构建完成,其知识是固定的,并且知识存储更加困难。
3)神经网络在开始的时候没有任何知识,必须进行学习;而贝叶斯网络在构建的过程中,已经对专家知识进行了编码。
4)时间传播算法反映了态势评估的连续性,新的证据与随时间序列到达的证据共同作用来计算对态势的累积效果,这种时间上连续的特点在无记忆的专家系统和神经网络中是不存在的。
由于贝叶斯网络具有以上优点,国外对基于贝叶斯网络的态势评估的研究十分活跃[5,18-19],国内对该领域的研究也有一些进展,一些基于无人机平台、机载航电系统[6]、舰艇导弹防御决策[7]、飞行员辅助态势评估系统[12,20]等战术级单平台的态势评估系统进入实用。态势评估贝叶斯网络的节点表示军事事件,节点之间的有向边表示事件间的因果或相关关系,节点之间的条件概率表示这种关系强度。在评估过程中,以态势觉察过程检测到的军事事件和人工情报作为证据,利用贝叶斯网络的证据传播和推理算法,更新网络中其他事件的信度。通过这样的证据推理过程,在已知不确定的证据情况下,推断其他事件发生的可能性,达到判断敌方目的、预测敌方行动的目标。一个用于态势评估的标准贝叶斯网络如图1所示。这只是贝叶
斯网络应用于态势评估的形式之一,即将军事事件以态势、事件、证据进行分层表示,类似的还有将对态势的理解和推理看作是对敌方意图的掌握,将态势评估问题转化到计划识别[9,21]领域,同样可以用贝叶斯网络对意图、计划、子计划、行动、行动线索进行建模、推理。贝叶斯网络还可用于战场信息融合的其他层次如目标识别[10,22-23]、兵力聚合[24-25]、装备/网络故障检测[26]、威胁评估[27]等等。
图1 用于态势评估的标准贝叶斯网络示意图Fig.1 An example of situation assessment Bayesian network
要使用贝叶斯网络进行战场态势评估,必须首先构建相应的态势评估贝叶斯网络。现有的贝叶斯网络构建主要通过学习和人工构建两种方式,也可以结合二者优势,进行两阶段建模[24]。战场态势评估由于其特殊性,不可能得到大量的训练数据进行贝叶斯网络的学习,因此通常由军事领域专家根据经验和情报信息给出大量用规则表示的知识,再由BN专家进行手动建模,并进行模拟训练修正网络结构。构建基本过程如下。1)确定节点内容。贝叶斯网络由节点组成,节点对应不同的事件。因此,首先必须确定态势评估领域存在哪些事件以及这些事件的完备状态空间。2)确定节点关系。态势估计包含大量的因素及各种复杂的关系,需要BN构建人员和军事领域专家共同确定这些关系,从而确定贝叶斯网络的拓扑结构。3)构造条件概率表,进行概率分配需要具有一定的军事知识,通常由军事专家根据经验指定。
可以看出,传统态势评估贝叶斯网络(SABN)是针对确定场景的,虽然对专家知识进行了编码,但由于场景的限制,编码的知识十分有限,构建过程艰难费时又缺乏可移植性,程序修改和维护也较为困难,无法满足大型复杂系统网络构建的要求。Laskey[5,18]等提出采用贝叶斯网络建立知识基,也就是BN片断,在态势估计过程中,按照一定的规则将网络片断进行连接,动态构建SABN。在此基础上,国内也出现了类似的将贝叶斯网络模块化进行动态构建的研究,并根据态势评估的特点,提出动态构建分级分层 SABN[21,28]。为了解决直接连接贝叶斯网络单元时出现的破坏网络结构、重设条件概率、推理困难的问题,有作者提出虚拟节点[8]的概念,不直接将替换网络模块接入整体网络,而是在原有网络中设置一个虚拟节点,将替换网络推理后的结果作为软证据直接输入整体网络进行推理。Koller[29]将面向对象的思想引入贝叶斯网络的构建,使概率特征包含对象关系,构建了概率关系模型,增强了其对知识的表示能力。此后,不断有学者将面向对象理论引入各种复杂问题贝叶斯网络建模[8,28-30]中,取得了很大进展。国内有学者将OOBN的理论引入了态势评估领域,并给出了用面向对象方法表示战场态势信息的例证,实现了态势信息以面向对象形式在关系数据库中的存储[30]。态势评估过程复杂,需要表达的军事事件较多,涉及的军事知识庞杂,采用面向对象的方法,可以使态势评估系统具有良好的可扩充性和可重用性,提高SABN的构建效率,但目前还未见到成型的面向对象的贝叶斯网络态势评估模型。
本文作者认为,无论是采用贝叶斯网络片断方法还是面向对象方法,都可以看作是为了用贝叶斯网络对专家知识进行充分编码而做出的努力,即贝叶斯网络如何才能与专家系统结合,一方面克服专家系统的静态限制,更好地实现知识存储、获取和更新;另一方面增强贝叶斯网络的实用意义。这是由于态势评估是一个复杂的多因素、不确定的智能处理领域,只有充分集合专家知识、具有友好人机交互界面的推理技术才能具有强大的生命力。
交战双方的对抗使得战场态势不断变化,各个战场事件之间不仅有复杂的因果关系,还包含着丰富的时间要素。但标准贝叶斯网络是静态模型,不具备时间信息表达和推理能力,无法对动态系统和有反馈的过程建模,大大限制了其使用价值。因此,有必要对标准贝叶斯网络进行改造。
现有文献在BN中表示时间主要有两种思路。
第一种思路是通过动态贝叶斯网络(Dynamic Bayesian Network,DBN),将一个系统表示成从起始时间到终止时间的一系列快照,每个快照包含一个完整的网络结构,表示系统在该时刻的状态,前后两个网络的相关节点之间添加时间因果关系,表示在不同时刻的节点变化关系。当前最主要研究的DBN[31-34],网络的拓扑结构、变量集和变量间的内部因果关系在每个时间片下都是相同的。有文献对动态贝叶斯网络在态势评估中的应用进行了研究,并在实际应用中基于现有的BN推理算法提出了一些诸如离散模糊动态贝叶斯网络[33-35]等具体的解决方法。但是由于态势评估要解决的实际问题,往往是各个时刻待决策或推理的变量发生变化或者网络结构发生变化,不是“平稳马尔可夫过程”,用DBN难以模拟这种变化。文献[36]针对这一问题提出了弹性变结构DBN,实际上就是要给出每个时间片上网络的有向无环图结构及静态贝叶斯网络的条件概率表,并给出每两个时间片之间网络的转移矩阵,建立一个随时间非平稳变化的动态贝叶斯网络,并在离散贝叶斯网络推理算法的基础上研究了相应的推理算法。显然这一方法需要建模人员对系统的整个变化过程有足够的了解,计算量偏大,在态势评估中难以实现。另外,动态贝叶斯网络是通过取样将时间均匀离散化然后用马尔可夫过程模拟系统状态的变化,这就有两个弊端:一是无法确定事件发生的具体时间和概率之间的关系;二是均匀离散导致信息传播必然要同步进行,而实际系统中各个节点发展变化的时间粒度不可能完全相同,这就需要寻找一种最优的时间粒度来离散化,实际难以做到。文献[37]针对这一问题提出了连续时间贝叶斯网络(Continuous Time Bayesian Networks,CTBN)的理论框架,将整个问题域分解为一些随时间变化的局部变量,每个变量何时变化、以及变化的取值都可以看作其当前取值和有向图中其父节点当前取值的函数,文中用马尔可夫过程来描述这种变量的动态特性,对每个变量的动态特性建模,用条件强度矩阵(CIM)描述其概率变化特征,并给出了相应的近似推理算法。
第二种思路就是对BN进行时间扩展。由Kanazawa所发展的离散时间网络将时间建模为一系列的点,认为事件(Event)是在时间瞬时发生的,而事实(Fact)是在一系列的时间点上发生的,事件和事实都以随机变量表示。Berzuni提出在网络中增加一些表示时间区间的节点,但这样可能会显著增加网络的大小和复杂性,Tawfid和Neufeld提出将节点间的条件概率视为时间的函数,这就需要有关概率随时间变化的外生知识并且需要明确网络中每个节点在不同时刻的取值。Santos根据区间代数理论提出的时间诱导问题(Temporal Abduction Problem,TAP)认为,每个事件都有一个相关的时间区间,事件在此区间内发生。事件间的关系表示为一个带权的从原因到结果的有向边和/或有向无环图结构,有向边满足可能的时间区间关系,这种方法在表示事件间的关系时具有很大的灵活性,但由于诱导随机变量的引入大大增加了系统构建和推理的复杂性[4]。文献[4]在自己的工作中引入了 Young[38]关于时间聚合体的定义,用来表示一个随时间变化的军事事件,每个时间聚合体包括一组我们感兴趣的时间区间,表示时间可能在这些时间区间内发生以及事件可能的状态集合。也就是说,时间聚合体是一组时间随机变量的集合,每个时间随机变量对应一个时间区间。时间聚合体之间的关系称为时间因果关系。通过对贝叶斯网络节点和边的时间改造,建立其具有时间推理意义的贝叶斯网络。文献[24]在对贝叶斯网络进行时间扩展时也采用了类似的方法,即均假设网络中的节点在获得新证据之前保持原有的状态,用时间聚集变量和变量间的时间因果关系构建时间贝叶斯网络,不同之处在于前者在推理时将各个时间变量看作一个时间聚合体的几个取值,从而可以直接应用传统BN推理方法进行推理,并能得到同一事件对应不同时间区间时的不同意义。后者通过对模型化简,将提出的TBN的单个节点信度更新转化为传统BN的概率推理问题,然后采用现有的概率推理算法更新被询问节点的信度。
这两种思路一是基于网络结构和条件概率关系在时间序列上的扩展,一是在网络节点和条件概率关系中加入时间语义,二者共有的一个问题就是网络拓扑结构应当保持基本平稳,否则会大大增加网络概率推理的复杂性和时间代价,甚至无法得出结果。而实际系统尤其是激烈对抗的战场领域很可能无法满足这一平稳条件。另外,军事事件不仅存在时间因果关系,还可能存在排他关系,时间限制关系等等,如何在贝叶斯网络中表示这些关系也是一个值得研究的方面。
从现有文献看,对态势评估不同的理解对应了在SABN中的不同推理算法。但总体来说,很少有专门针对SABN的推理算法。普遍采用的都是将SABN标准化,然后采用传统BN的推理算法进行推理,如Pearl的证据传播法(Belief Propagation,BP)和分层假设证据推理算法[39],联结树算法,变量消除法,卡尔曼滤波,粒子滤波,边界算法等。或者对基础算法进行改进以获得更好的态势理解和推理结果,如基于有环网络提出的LBP(Loopy Belief Propagation)算法,用于变结构离散动态贝叶斯网络的推理算法[36]、用于OOBN的面向对象的推理算法[29]等等。大多数现有算法都只适合于集中式同步概率推理,而同步在实际系统中很难做到。同步方法要求对整个系统内的信息进行充分融合以达到最好的评估效果,必须能够使整个网络中的所有节点充分通信,这一方面对系统通信容量提出了要求,另一方面由于各个节点信度更新频率的不同,导致有些信息不能充分传播或者浪费通信资源。文献[40]针对此问题提出了使用CTBN描述系统动态特性的异步动态贝叶斯网络框架,在LBP算法的基础上实现了分布式系统内节点信息的异步传播。但现有文献还未见到更多的关于此问题的研究。
具有明确意义的概率推理是贝叶斯网络区别于其他推理技术的重要特征之一,但概率理论无法用来表示所有的军事领域知识的不确定性,在信息融合的低层处理过程要针对各种数据的特征采用不同的不确定性推理方法对多源异类数据进行处理,获得的也是不确定性信息,然后交由态势评估系统进行处理。现有处理方法通常忽略了这一过程,直接设定各级事件或线索的概率意义进行推理,如何在概率推理框架内处理这些不确定性是一个很有价值的研究方向。另外,态势评估涵盖战略、战役、战术各个层次,应当利用这些层次特征和各级分系统的结构化模块化特征进行适合本层次时间要求和精度要求的局部推理,简化系统推理过程,降低通信压力。
对于算法复杂度的研究结论表明[23],贝叶斯网络的学习、精确推理、近似推理均是NP困难的。要在NP困难的贝叶斯网络概率推理中加入时间推理语义,其网络学习、推理算法的复杂性更加不言而喻。在开发一般性的推理算法的同时,应当注意结合实际态势评估系统要素、关系、层次的特征,使态势评估贝叶斯网络节点、网络片断能够更充分地反映这些特征,并能够利用其作为内置信息进行推理。模块化和分层贝叶斯网络也是目前复杂系统建模的一个趋势,针对态势评估对应的战术、战役和战略层次和地理域、功能域,建立能够互联互通的模块化分层贝叶斯网络系统,研究可靠的网络连接算法和更有针对性的推理算法,应当有助于提高态势评估贝叶斯网络的推理效率。
贝叶斯网络的常用仿真工具[41]有以下几种:Analytica,BayesiaLab,BNT,Genie/SMILE,Netica 等。这些工具在变量类型、支持的条件概率表以及推理方法,是否允许参数和结构学习,是否具有图形界面,能否允许嵌入代码,是否具有应用程序接口,是否免费提供等方面各有不同,可以根据不同的需要选择。现有态势评估贝叶斯网络的仿真通常基于Genie/SMILE和Netica等两种工具,它们提供了简明易懂的图形界面,便于建立模型,内置了多种推理算法。BNT是K.Murphy给出的用于Matlab的一个工具箱,对编程能力要求较高,在内置多种推理算法的基础上,还允许用户编写网络结构和参数的学习和推理算法,但没有提供图形界面,结果显示不够直观。
从贝叶斯网络诞生之初,就在态势评估领域中得到了有效的应用,出现了一些采用贝叶斯网络联合其他方法进行态势评估的实验室原型系统,并逐步走向了实用。一方面,它能够更好地表达军事领域知识,在网络构建之初就对专家知识进行了编码,网络节点之间的连接具有明显的实际意义,符合人们对军事领域知识的理解。另一方面,其推理算法具有坚实的数学基础。但是,贝叶斯网络在应用于态势评估领域时仍有很多问题没有解决:一是缺乏公认的态势评估贝叶斯网络模型,包括基于贝叶斯网络的态势评估功能模型、态势假设模型和贝叶斯网络数学模型;二是现有贝叶斯网络对专家知识的编码还主要是针对场景的,一个已确定贝叶斯网络所能表达的知识有限,应用范围受到限制且无法重用,建立军事知识数据库时又缺乏有效的表示存储和调用方法,无法充分利用已有知识迅速构建适应快速变化的战场态势的贝叶斯网络模型;三是缺乏在贝叶斯概率推理中结合时间推理和空间推理的有效算法。现有用于态势评估的贝叶斯网络的研究为解决这些问题提出了一些有益的思路,但对概念、模型、方法的改进和创新有待于更加深入的研究。本文作者认为,应当用系统的实践的观点考察态势评估的概念、实现方法和评价标准,将军事领域专家所具有的知识、指挥人员的认知能力、军事指挥控制系统的功能充分整合,实现知识表示、动态存储与更新、认知模型和推理技术有效结合的态势评估系统。
[1]WALTZ E,LINAS J.Multi-sensor data fusion[M].Boston MA:Artech House,1990.
[2]STEINBERG A N,BOWMAN C L,WHITE F E.Revisions to the JDL data fusion model[C]//Proceedings of 3rd NATO/IRIS Conference,Quebee,Canada,2009:45-67.
[3]ENDSLEY M R,GARLAND D J.Situation awareness analysis and measurement[M],Lavorence Erlbaum Associates 2000:23-29.
[4]孙兆林.基于贝叶斯网络的态势估计方法研究[D].长沙:国防科技大学,2005.
[5]LASKEY K B.Hypothesis management in situation-specific network construct[C]//17th Conference on UAI,San Mateo,CA:Morgan Kanfmann,2001:301-309.
[6]许阳,潘泉,张洪才,等.一种基于机载航电的信息融合仿真系统[J].系统仿真学报,2005,17(2):351-354.
[7]王朔.基于贝叶斯网络的舰艇导弹防御系统决策模型算法研究[D].长沙:国防科技大学,2005.
[8]蒋国萍.软件项目风险管理的贝叶斯网络模型研究[D].长沙:国防科技大学,2005.
[9]BULLEN B.A Bayesian methodology for effects based planning[C]//Information Fusion for Command Support,2005(5):1-8.
[10]ZAIENTZ J D,DEKOVEN E,PIEGDON N,et al.Using GOMS and Bayesian plan recognition to develop recognition models of operator behavior[C]//Proc of SPIE,2006,6227OH1-12.
[11]于昕,潘泉,韩崇昭,等.基于空中平台的态势描述[J].火力与指挥控制,2007,32(6):18-20.
[12]林晓强,常国岑,杨凡,等.模糊算法在态势评估中的应用[J].电光与控制,2008,15(2):36-38.
[13]PEARL J.Probabilistic reasoning in intelligent systems:networks of plausible inference[M].Morgan Kaufmann,San Mateo,CA,1988.
[14]PEARL J.Bayesian networks[M].Handbook of Brain Theory and Neural Networks,MIT Press,2001.
[15]李伟生.信息融合系统中态势估计技术研究[D].西安:西安电子科技大学,2004.
[16]程岳.数据融合中态势估计技术研究[D].西安:西安电子科技大学,2002.
[17]LVANSSON J.Situation assessment in a stochastic environment using Bayesian networks[D].Linkoping University,2002.
[18]MAHONEY S M,LASKEY K B.Constructing situation specific belief networks[C]//Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence,1998:370-378.
[19]CHEN B.A Bayesian sampling approach to decision fusion[C]//Proceedings of the Forth International Conference of Information Fusion,2001.
[20]蒋国萍,陈英武.时间贝叶斯网络及其概率推理.[J]管理科学学报,2007,10(2):12-18.
[21]柴慧敏,王宝树.基于分层贝叶斯网络的计划识别方法[J].系统工程与电子技术,2008,30(5):964-967.
[22]VAN GOSLIGA I S P,JANSEN M I H.A Bayesian network for combat identification[C]//RTO IST Symposium on Military Data and Information Fusion,2003(14):1-11.
[23]KRIEG M.Multi-sensor kinematic and attribute tracking using a Bayesian belief network framework[C]//RTO IST Symposium on Military Data and Information Fusion,2003.
[24]张明远,王宝树.态势觉察中目标分群技术的实现[J].电光与控制,2004,11(1):40-43.
[25]BAKERT T,LOSIEWICZ P B.Force aggregation via Bayesian nodal analysis[C]//IEEE,1998:6-9.
[26]霍利民,朱永利,贾兰英,等.基于贝叶斯网络的电网故障诊断方法[J].华北电力大学学报,2004,31(3):30-34.
[27]BRYNIELSSON J,ARNBORG S.Bayesian games for threat prediction and situation analysis[C]//Proceedings of the Seventh International Conference on Information Fusion,2005:1-8.
[28]SHI J G,GAO X G,LIU Z,et al.Studies for hierarchy DDBN and its inference algorithm[J].International Journal of Information Technology,2005,11(6):124-132.
[29]KOLLER D,PFEFFER A.Object-oriented Bayesian networks[C]//Proceedings of the Thirteenth Annual Conference on Uncertainty in Artificial Intelligence(UAI-97),August 1-3,1997:302-313.
[30]WEIDL G,MADSEN A L,DAHLQUIST E D.Object oriented Bayesian network for industrial process operation[EB/OL].[2009-09-11].The First Bayesian Applications Modeling Workshop,2003.http://citeseerx.ist.psu.edu/viewdoc.
[31]MURPHY K P.Dynamic Bayesian networks[EB/OL].[2009-09-11].http://www.ai.mit.edu/murphyk.
[32]MURPHY K P.Dynamic Bayesian networks:representa-tion,inference and learning[D].Berkley:University of California,2002.
[33]史建国,高晓光,李相民.基于离散模糊动态贝叶斯网络的空战态势评估及仿真[J].系统仿真学报,2006,18(5):1093-1100.
[34]史建国,高晓光.离散动态贝叶斯网络的直接计算推理算法[J].系统工程与电子技术,2005,27(9):1626-1630.
[35]康长青,郭立红,罗艳春,等.基于模糊贝叶斯网络的态势威胁评估模型[J].光电工程,2008,35(5):1-5.
[36]高晓光,史建国.变结构离散动态贝叶斯网络及其推理算法[J].系统工程学报,2001,22(1):9-14.
[37]NODELMAN U,SHELTON C R,KOLLER D.Continuous time Bayesian networks[D].Stanford University,2007.
[38]YOUNG J D.On Unifying time and uncertainty:the probabilistic temporal network[D].Xi'an:Air University,Air Force Institute of Technology,1996.
[39]程岳,王宝树,李伟生.贝叶斯网络在态势估计中的应用[J].计算机工程与应用,2002,23:206-208.
[40]PFEFFER A,TAI T.Asynchronous dynamic Bayesian networks[Z].2006.
[41]Appendix B,Software packages[EB/OL].[2009-09-11].http://csse.monash.edu.au/bai/book/appendix B.pdf.2003-11-25.