王 维,高晓利
(四川九洲电器集团有限责任公司,四川 绵阳 621000)
随着科学技术的发展,现代战争已经由平台中心战发展成为网络中心战。在网络中心战时代,多平台多域协同作战已经成为一种常见的作战手段。协同作战的前提是态势共享,即各个平台对战场态势的感知结果通过数据链共享给网内其他平台,达到网络内各平台对战场态势统一的、最大化的掌握,从而提高协同作战的效能[1-2]。在此过程中,多个作战平台对同一目标的决策级识别结果需要进行融合。融合方式主要有集中式融合和分布式融合[3-5],由于集中式融合对网络通信资源要求较高,因此实际中一般采用分布式融合[3]。目前分布式决策级融合研究大多聚焦在单周期传感器信息路由、信息融合方式选择、单周期信息冲突条件下的解决方案等方面[6-11]。在实际协同作战中,多平台对目标的观测是持续的,对信息的协同共享和处理也是多周期的连续进行的,因此本文聚焦于分布式多周期决策级融合方法研究,分析分布式多周期决策融合可能遇到的问题,并提出一种分布式多周期决策融合方法。
在分布式决策融合中,无论是各个单站单周期多传感器决策融合、多周期决策融合,还是融合中心多站决策信息融合,都需要一种决策融合算法。本文根据这种需求采用DS(Dempster Shafer)证据组合理论[12-13]为基础展开研究。
DS证据理论自提出以来,因其对不确定事件描述和处理方面的优越性,而被广泛应用于模式识别、多传感器信息融合、图像识别、不确定性决策等领域。在DS证据理论中,识别框架Θ指所研究对象的全集,Θ中元素之间互不相容且为离散值。由识别框架Θ中所有子集构成的集合称为Θ的幂集,记作2Θ。若存在映射m:2Θ→[0,1],且满足
(1)
则称符合上述条件的映射m为框架Θ上的一个基本概率指派函数。∀A⊆Θ,函数m(A)反映了证据对事件A的相信程度,若m(A)>0,则称A为框架Θ的一个焦元。φ表示空集,m(φ)=0表示对空集不产生信任。
(2)
传统的多平台传感器融合主要分为分布式融合和集中式融合两种。分布式融合研究主要集中在多传感器单周期融合架构及算法实现,其重点是对融合算法的研究,如基于证据理论的、基于神经网络的研究等[5-6,8]。对于多周期条件下的决策级融合研究甚少,但是多周期决策级融合在实际中应用广泛,如在基于预警机的空中目标识别过程中,前出的战斗机或者侦察机可看作分布式的单站,预警机作为观测平台之一,可作为融合中心进行目标身份信息融合和判决。各单站需要对目标进行连续多周期的身份识别和上报,预警机则需要迭代的进行多周期的融合和判决输出,因此可看作是一个分布式多周期融合决策系统。
1.2.1 单站多周期融合算法
在分布式融合系统中,单站在多周期时间内对本平台传感器获取的目标身份证据进行迭代融合,获取从0时刻起到当前周期时刻的目标身份的局部融合结果。假设单站k在第n个周期内通过本平台传感器获得了关于目标身份的r个证据,这r个证据的基本概率赋值分别为m(Ekn1),m(Ekn2),…,m(Eknr),则根据DS证据理论,这r个证据可以获得关于目标身份融合结果为
(3)
(4)
依据以上递推计算式,单站可以进行基于本站传感器的识别结果的决策级身份信息融合判决。
1.2.2 融合中心多周期融合算法
对于融合中心而言,单站一般会将n个周期对目标身份的累积识别结果m(C)k(n/n)传送到融合中心,在融合中心进行全局融合判决。融合中的融合方式包括了迭代融合方式和非迭代融合方式。
(1)迭代融合方式。迭代融合方式类似于单站的融合处理思想,假设n-1周期末融合中心累积的历史识别结果为m(C)(n-1/n-1),在第n周期当顺序收到1到M个单站的识别结果m(C)k(n/n),k=1,…,M后,将其依次与m(C)(n-1/n-1)或者是中间融合结果进行融合,最终得到第n周期末融合中心全局融合结果m(C)(n/n),m(C)n/n可表示为
(5)
迭代融合方式的优点为融合中心随时都保存有全局的融合结果,且只需要一个存储单元存储全局融合结果即可。但该融合方式最大的问题是对单站信息的重复利用,导致融合中心的融合结果加速收敛和决策结果的错误。
以单站k在第n-1周期累积识别结果m(C)k(n-1/n-1)为例,在n-1周期,融合中心根据式(4)得到的历史累积识别结果m(C)(n-1/n-1)中已经融合了m(C)k(n-1/n-1);在第n周期,单站k根据式(4)在其得到的n周期累积历史识别结果m(C)k(n/n)中融合了m(C)k(n-1/n-1),而融合中心在该周期根据式(5)融合了m(C)k(n/n),同时又融合了m(C)(n-1/n-1),可见在m(C)k(n/n)和m(C)(n-1/n-1)中都包含了m(C)k(n-1/n-1)的证据,因此导致了单站证据的重复利用;
(2)非迭代融合方式。非迭代融合方式是指融合中心每周期只融合当前周期每个单站上报的识别结果,不再融合历史累积的识别结果,即是在式(5)中不再融合项m(C)(n-1/n-1)。但需要考虑到,假设在该周期内,某个单站没有新的传感器证据,其识别结果也不会更新,那么它是否还有上报识别结果地必要性。若上报,则该单站本周上报结果与上一周期上报结果将一致,增加网络开销;若不上报,融合中心需要存储其上一周期上报的识别结果用于本周期融合。假设单站没有更新时不上报识别结果,在融合中心融合算法可表示为
m(C)(n/n)=(∑m(C)1(n/n)·…·m(C)M(n/n)·
m(C)M+1(n-x/n-x)·…·m(C)N(n-x/n-x))/(1-K)
(6)
其中,N表示所有单站个数,M表示该周期上报识别结果单站个数,共有N-M个单站未更新,因此未上报识别结果,x∈[1,n)。
非迭代融合方式的优点是不会重复利用单站的识别证据,但缺点是会增加融合中心的存储单元,即有多少单站就需要增加多少存储单元。更重要的是,融合中心无法实时获得全局融合结果,只有在每周期末完全确定了每个单站上报的识别结果后才能融合出全局识别结果。
此外,两种融合方式都无法避免单站识别结果置信度累积过高导致的“一票否决”问题。单站传输到融合中心的决策级结果m(C)k(n/n)经过多周期累积,基于DS证据理论的决策结果的置信度在多周期结果一致时很容易累积到接近1。由于单站和融合中心通信带宽限制,单站到融合中心的信息传输精度总是有限的[14-17]。因此,当单站的决策结果置信度非常接近于1时,传到融合中心,置信度就变成了1。而基于DS证据理论的证据融合中,当其中一个证据对某个焦元的基本概率赋值为1时,将导致对其它所有证据所有焦元的“一票否决”,产生不合理的融合结果。两种融合方式优缺点比较见表1。
表1 融合中心两种融合方式优缺点比较
根据上文描述,单站在进行多周期局部融合后,将多周期局部决策结果共享到融合中心进行全局融合将带来诸多问题。究其原因主要是信息量的高度重复性和高指向性导致融合中心产生了信息重复利用或者是“一票否决”问题。因此,在分布式多周期融合过程中,不应该将单站多周期局部融合结果传输到融合中心,而是应该在每个周期将单站在该周期的决策“增量”传输到融合中心,再进行全局决策融合。即在1.2节中的单站多周期决策融合中,不是将局部融合结果m(Ck)k(n/n)传输到融合中心,而是将单周期决策“增量”m(Cq)kn传输到融合中心,进行全局决策融合判决。在没有决策“增量”时不传输任何信息。
单站处理参考1.2.1节不变,融合中心选择迭代融合的架构,不考虑周期限制,当接收到某个单站“增量”决策后,即可与当前最新全局决策结果进行融合,更新最新全局决策结果。因此单站具有周期概念,进行周期性决策融合和“增量”共享。融合中心不受周期限制,实时融合单站“增量”决策,可以避免多站之间周期同步和等待问题,提高融合中心决策的实时性。
假设融合中心当前全局融合结果为m(C),单站k在第n周期上报的决策“增量”为m(Cq)kn,则融合中心全局融合结果更新式如下
(6)
基于式(6),融合中心进行迭代融合,并基于融合结果进行实时决策判决输出。据此,基于“增量”共享的分布式多周期融合架构如图1所示。
图1 基于增量信息的分布式多周期融合架构
新方法具有以下优点:
(1)单站的“增量”m(Ck)k(n/n)决策来自于当前周期内传感器证据融合结果,因此每周期单站传输到融合中心的“增量”决策都是最新周期内证据的累积,不包含重复的信息量,避免了单站信息重复利用问题;
(2)单站的“增量”m(Ck)k(n/n)决策只是融合了单周期内的决策证据,证据量少,即便所有证据指向一致,也不可能融合出较高的置信度,因此可以有效避免“一票否决”问题;
(3)融合中心不再有周期的概念,在有单站“增量”决策时,实时更新全局融合结果,在不增加存储单元或者网络传输开销的情况下提高了融合中心全局判决结果输出的实时性。
假设Θ={A,B},有两个单站K和G,以及一个融合中心。每个单站都有两个传感器,假设在每个周期单站K的两个传感器的决策证据都为m(A)=0.52,m(B)=0.4,m(Θ)=0.08,其中m(Θ)表示对识别框架的信度分配,可以理解为传感器对“未知”的信度分配。在每个周期,单站G两个传感器的决策证据都为m(A)=0.54,m(V)=0.4,m(Θ)=0.06。前两个周期两个单站和融合中心决策融合结果如表2所示。
表2 用例1单站及融合中心融合结果
从表2中可以看到,在单站局部融合结果传输到融合中心时,在第二周期开始的融合结果与集中式融合结果(最优融合结果)存在差异。对信息的重复利用导致对焦元A的收敛速度过快是造成差异存在的主要原因。而在单站仅将周期内的决策增量传输到融合中心的方法中,融合中心的融合结果与集中式融合结果完全一致,达到了最优的融合性能。在多周期条件下,融合中心3种融合方式对焦元A的融合结果如图2所示。
图2 多周期3种方法对焦元A的融合结果对比
从图2可以看到,在多周期融合过程中,基于传输增量信息的方法始终与集中式融合的性能一致,而单站传输局部融合结果的传统方法对焦元A的融合结果收敛过快,始终高于其他两种方法,在给定硬判决输出门限时,会导致判决输出错误。
假设Θ={A,B},有两个单站K和G,以及一个融合中心。每个单站都有两个传感器,假设在每个周期单站K的两个传感器的决策证据都为m(A)=0.56,m(B)=0.1,m(Θ)=0.34,在每个周期,单站G两个传感器的决策证据都为m(A)=0.15,m(B)=0.76,m(Θ)=0.09。两个周期的融合数据如表3所示。
表3 用例2单站及融合中心融合结果
在前两个周期中,两个单站的决策结果冲突。在第2周期时,单站G的局部融合结果中m(B)=0.993 6,由于传输编码精度限制,传到融合中心时变成了m(B)=1,导致融合中心出现了强冲突的一票否决问题。因此基于传输局部融合结果的方式与集中式融合以及基于增量的融合方法在结果上出现了较大差异。
如果从第3周期开始单站K证据持续支持A不变,而单站G的观测结果发生变化,基本概率赋值变为m(A)=0.5,m(B)=0.4,m(Θ)=0.1,这在电子战传感器中经常发生。则多周期融合中心的融合结果如图3所示。
图3 证据变化时多周期融合结果对比
从图3可以看到,当第3周期单站G的证据发生变化后,本文的方法融合结果也随之发生相应变化,从支持焦元B逐渐变为支持焦元A,符合客观认知。而传统的传输单站局部融合结果的由于出现对焦元B置信度1的结果,导致多周期融合结果始终无法随证据改变而改变,最终将直接导致判决出错。因此基于增量的多周期融合方法融合判决结果更准确。
目前分布式决策级融合研究大多聚焦在单周期分布式决策级融合方法,以及对经典方法的优化上。而实际中传感器对目标的观测总是持续的,因此基于分布式决策级融合应该是多周期的,且多周期决策级融合对目标身份判定更加准确可靠。因此,本文对分布式多周期决策级融合进行了深入研究,分析了可能遇到的问题,并针对问题提出了一种基于“增量”共享的分布式多周期决策级融合方法。该方法在不增加传输信息量、存储资源的条件下,保证了融合中心的决策结果的最优性,并通过仿真验证了该融合方法的有效性。分布式多周期决策级融合判决在无线传感器网络、目标识别等领域具有重要的应用价值,后续将结合工程实践,继续探索分布式多周期决策级融合判决新算法和架构。