基于可能性理论的测试信息融合及 不确定性处理方法与分析

2018-06-22 11:27余学锋张红清
计量学报 2018年1期
关键词:后验先验算子

余学锋, 于 杰, 张红清

(63870部队, 陕西 华阴 714200)

1 引 言

常规武器鉴定试验过程可分为鉴定试验数据获取和鉴定试验数据处理两大部分,其中在鉴定试验数据处理环节存在大量的先验信息(被试品设计信息、仿真数据信息、子系统信息、相似型号信息、专家信息等)和后验信息(靶场试验测试信息)。同时,无论是先验信息还是后验信息都存在不确定性问题,包括随机不确定性和认知不确定性。因此,在鉴定试验数据处理环节有两大关键问题:一是先验信息和后验信息的有效融合;二是多源信息不确定性处理。长期以来,Bayes理论以其能够充分利用多源信息进行统计验证推断而被广泛用于处理精确化测量的先验信息[1,2]和靶场试验信息。但由于Bayes理论是基于概率论基础,在进行统计推断时一般要进行先验分布假设,含有一定的主观性。因此,在处理数据不确定性方面,只适于处理随机不确定性(外延清晰的信息),而对于实际中存在的认知不确定性(外延模糊的信息)则很难处理。文献[3,4]提出了最大熵原理方法,但仍然是在概率论基础上用样本数据确定概率分布,且不具有多源信息处理能力;文献[5]提出了随机和认知不确定性量化的置信区域法,但同样只能分析当前随机不确定性和认知不确定性对测量结果的影响,不能对多源信息进行融合处理;文献[6]虽然提出了用可能性理论处理不确定性问题,但主要从理论层面探讨了基于可能性理论的测量误差、测量不确定度的表达处理等,不涉及先验和后验信息融合问题。为此,本文提出了采用可能性理论来处理先验信息和靶场试验信息融合及不确定性问题,从而更有效地提高鉴定效率以及试验结果的可信度。

2 基本原理

2.1 原理和思路

基于可能性理论的先验信息和后验信息不确定性融合处理的基本原理是将被处理信息用随机模糊变量的可能性分布来描述,通过其先验信息分布和样本信息分布综合,根据可能性理论得出后验信息分布,最后根据后验信息分布去推断被处理信息的不确定分布。也就是说“先验分布+样本→后验分布”。可能性分布是可能性理论中的一个支撑性概念,其重要性类似于概率论中的概率分布。利用可能性理论处理不确定性,往往只需要较少的信息和较低的时间复杂度。

因此,本文提出的基本思路是用随机模糊变量代替随机变量,以近似精度更高且具有统一形式的可能性分布密度函数替代任意独立随机变量的概率密度函数,并在此基础上,通过对应的可能性分布计算方法进行先验信息和靶场试验测试信息的有机融合。

由可能性理论可知[7,8],随机模糊变量(random fuzzy variables,RFV)以及对应的可能性分布(possibility distributions,PD),在表达测量结果以及相应的测量结果不确定度时,随机模糊变量定义了一个函数,该函数将随机试验的每种可能结果映射成模糊集,来模拟模糊与随机相耦合的不确定性。随机模糊变量的可能性分布由两部分构成,如图1所示。

图1 随机模糊变量及其可能性分布

PDrint称为内部PD,代表所有非随机分量对测量结果不确定性的贡献,包括没有补偿的系统误差。PDrran称为随机PD,代表所有随机分量对测量结果不确定性的贡献,而PDrext称为外部PD,是由PDrint和PDrran组合而成,代表所有分量对测量结果不确定性的贡献。PDrint和PDrran都可以通过有效的测量信息获得。

采用可能性理论对测试信息的不确定性进行表征后,还需对先验和后验信息进行融合,参照贝叶斯方法在处理测试信息融合方面的思路,通过建立条件可能性分布的方法,并使用条件可能性分布获得测量结果最终信息。

2.2 条件可能性分布

从概率论角度来看,武器装备的先验信息和靶场试验测试信息的有机融合可以看作是两个随机变量相依性关系,而描述这种相依性最有力的工具就是条件分布与条件期望。只要构造出它们的联合分布就可获得最终测量结果以及测量不确定度。

由此可以构造它们的联合分布,如果能够得到随机变量X的密度函数pX(x)及在X给定条件下Y的条件密度函数p(y|x),则由其乘积的积分可得Y的边缘分布:

(1)

也就是说,如果能够得到先验信息所代表的随机变量X的分布pX(x),以及在给定条件下现场测试信息(后验信息)所代表的随机变量Y的条件分布p(y|x),则通过一系列数学运算,可以获得最终实际结果的分布(Y的边缘分布)。

同样,当采用可能性理论处理先验和后验信息融合时,则用可能性分布取代概率分布,先验信息和后验信息融合则采用可能性条件分布与可能性隶属函数。在可能性理论框架下,概率论下的随机变量X和Y就变为RFV。由可能性相关理论可以得到条件可能性分布数学表达式[9]:

T[rX(x),rY(y,x)] =T[rY(y),rX(x|y)]

=rX,Y(x,y)

(2)

式中:rX(x)和rY(y)分别是其可能性分布边缘密度函数;rY(y|x)和rX(x|y)分别为可能性分布的条件密度函数;rX,Y(x,y)为可能性分布联合密度函数。而T为可能性分布下的算子,称为t模,或称T为[0,1]上的三角范数。

由式(2)可以看出,概率分布下的算术乘积运算,在可能性分布中变成了取T算子(t模)运算。也就是说在不确定性分布表达上,概率分布与可能性分布的主要不同是在可能性分布中引用了T算子(t模)。或者说,可以通过T算子实现由概率分布到可能性分布的变换。

现在从一般T算子中选择一个专用的T*算子(t模),式(2)可以写为[10]:

T*[rX(x),rY(y|x)] =T*[rY(y),yX(x|y)]

=rX,Y(x,y)

(3)

rX(x|y)=F*[rX,Y(x,y),rY(y)]

(4)

式中:F*是T*算子的逆运算。

可以看出,只要知道被测试对象(参数)先验信息X(rX(x))的可能性分布,以及在给定条件下后验信息Y(rY(y|x))的条件可能性条件分布,选择合适的T*算子(t模),就可获得被测试对象(参数)的联合可能性分布rX,Y(x,y)。按照最大熵原则,测试得到的数据可用来导出对所估计的可能性分布的约束集,而所估计分布的熵在约束集的约束下达到最大,就可得到被测试对象(参数)的边缘可能性分布结果[11]。

最大熵法的基础是Jaynes原理,最优的可能性分布是使熵在根据已知的信息附加的约束条件下最大。后验信息的可能性边缘分布rY(y)表达式为:

(5)

式中:sup表示在可能性理论中的边缘分布在给定约束条件下的上确界运算。

显然,如何选择最合适的T*算子(t模)完全取决于表达不确定性信息的随机模糊变量r(不确定分量)的可能性分布情况,因此,随机模糊变量r的内部和外部可能性分布将直接关系到T*算子(t模)的选择。

3 可能性分布的建立

3.1 内部可能性分布的建立

当把先验和后验信息看做是随机模糊变量时,其可能性分布的获取和构造是一个至关重要的问题。由图1可知,随机模糊变量的可能性分布由两部分组成,即内部可能性分布和随机可能性分布。随机模糊变量的内部可能性分布描述了所有非随机分量对测量结果不确定性的贡献,包括没有补偿的系统误差。这类信息集合的数学运算采用相应的T*算子(最小t模)以及最大熵原则,使得在只掌握部分信息的情况下对系统状态进行推断时,在所有满足给定约束条件的众多可能性隶属函数中,信息熵最大的可能性隶属函数为最佳(即偏差最小)。这是可做出的唯一不偏不倚的选择,任何其它选择都意味着添加了额外约束或改变了原有假设条件,而这些约束和假设条件根据所掌握的既有信息是无法得到的[12]。

最大熵原理或最小特异性原则所对应的T*算子(最小t模),适宜用于表征这类信息集合的数学运算。因此式(2)就变为[13]:

(6)

用随机模糊变量X的可能性分布代表被测试量值的先验信息分布,Y随机模糊变量的可能性分布代表被测试量值的后验信息分布,ym是当前测量值,如图2、图3所示。

图2 先验信息随机模糊变量可能性分布

图3 后验信息随机模糊变量可能性分布

(7)

(8)

这意味着,如果后验测试结果不能对先验分布提供任何信息,没有交集,那么先验分布就仍然表示对总体分布的未知。

3.2 随机可能性分布建立

随机可能性分布描述了由于随机不确定分量导致的对测量结果不确定性的贡献,根据文献[12]的有关分析,当熵值达到最小时,对可能性分布的限制最少,可能性分布的边界点为所包含在矩约束中的最大信息量。也就是说,在测量信息的随机分量分布区域内(近平衡态),当测量信息熵产生取极小值时,可能性分布一定处于与外界约束条件相适应的确定状态。

因此,将采用最大特异性准则(最小熵原则)处理这类信息集合的数学运算以及确定相应的T*算子(Frankt模)[14]。参照概率论方法中随机分量的置信概率取值为0.95,对应可能性分布的α截集为α=0.05,因此得到T*算子(Frankt模)为[15]:

(9)

式中:γ=0.05。

此时式(2)就变为:

(10)

式(4)就变为:

(11)

也就是说,与内部(系统分量)可能性分布类似,如果分别知道先验信息随机分量可能性分布和后验信息的随机分量条件可能性分布,就可通过式(10)获得它们的随机分量联合可能性分布。尽管整个数学原理推导过程复杂,但基于可能性分布的先验信息和靶场试验测试信息的融合处理实际操作过程却比较简单。

4 实际应用

弹药保温车验收项目,主要检测保温车内控制温度不确定度。先验信息为保温车技术指标及厂家出厂测试结果,温度控制精度为Δθ=±0.01×θset℃,其中θset是设置温度值。温度稳定性为σθ=0.03℃。从可能性理论可以把Δθ看作是先验信息随机模糊变量分布中的内部PD即PDrint,而把σθ看作是先验信息随机模糊变量分布中的随机PD即PDrran。在靶场测试时选择测试点温度为θset=50 ℃,因此可以得到先验信息随机模糊变量分布见图4(点画线)所示。

在靶场验收测试中采用的是Hart 1560堆栈式测温仪和标准铂电阻温度传感器,其技术指标为:Δθ=±(0.15+0.002θ)℃,温度和电阻变换模型为:R=R0[1+aθ+bθ2]。实际测量值为θm=49.62℃,测量重复性为σm=0.01℃,同理可以得到测试信息随机模糊变量的可能性条件分布PDrθ|θm见图4(实线)所示。

按照可能性分布运算法则,可得到保温车内控制温度误差在当前测量条件下的可能性分布如图5所示。从图5可以看出,最终评估结果的随机模糊变量可能性分布由先验信息构成的随机模糊变量可能性分布(点画线)与测试信息构成的随机模糊变量可能性分布(实线)通过求所有数据集合的最小融合区间得到。可以看出,一方面,通过靶场测试,精确了先验信息(技术指标及厂家出厂测试结果)中的不确定部分;另一方面,借助先验信息,排除了不可能出现的温度测量范围,减少了现场测试工作量。

图4 先验信息分布和后验信息分布

图5 融合后的可能性分布和测量点

由图5可以得到测量结果的可能性间隔以及相应的可能性置信水平(1-α),为了与以往基于概率论的测试报告估计结果一致,其95%置信概率对应随机模糊变量可能性分布的α截集为α=0.05,对应的可能性区间为θ=(49.68±0.19)℃。对应不同的温度测试点,采用可能性条件分布均可获得其相应的不确定度范围。

在实际应用过程中,还存在2种情况:一是测量值没有落在最终评估结果的随机模糊变量可能性分布中,这往往是因为当前测量所用设备不满足测量设备与被测量的不确定度比为1/3的要求;二是先验可能性分布与后验可能性分布没有重叠,这说明一定有信息集合存在较大的随机或认知不确定性。对于这2种情况的出现都要对先验和后验信息进行重新分析挖掘,对现场测试设备进行更换,以满足测试要求。

5 结 论

通过实例分析证实,基于可能性理论的测试信息融合及不确定性处理方法符合靶场鉴定试验测试信息需求,既发挥了先验信息的主观能动性,又充分尊重试验所得数据的不确定信息,求解方法直观、简单,物理意义明确。特别是在多源数据集中、当非随机分量相对于随机分量而言对测量结果不确定度的贡献占有主导地位时,本文提供的测后信息的条件可能性分布确定方法是一种简单有效的方法。

以可能性理论为基础的先验信息和试验测试信息的有机融合及不确定性处理方法,是以随机模糊变量以及相应的条件可能性分布为核心的测试数据处理分析方法。它摒弃了传统的测量数学模型(如真值、误差等),代之以集合、分布、信息摘、信息传递等现代信息论模型。在获取被估计量的先验信息可能性分布的基础上,结合当前实际测试结果以及条件可能性分布算法和最大熵原理,获得被估计量的最终可能性分布及测量结果的不确定度范围,具有良好的实用性和有效性。

[参考文献]

[1] 刘乐平,袁卫.现代贝叶斯分析与现代统计推断[J].经济理论与经济管理,2004,5(6):64-69.

[2] 姜瑞,陈晓怀,王汉斌,等. 基于贝叶斯信息融合的测量不确定度评定与实时更新[J]. 计量学报,2017, 38(1): 123-126.

[3] 程亮,童玲.最大熵原理在测量数据处理中的应用[J].电子测量与仪器学报,2009,23(1):47-50.

[4] 朱坚民,郭冰菁,王中宇,等.基于最大熵方法的测量结果估计及测量不确定度评定[J].电测与仪表,2005,42(8):5-8.

[5] 孙东阳,陈国平,张保强.随机和认知不确定性量化的置信区域法[J].振动测试与诊断,2015,35(5):908-912.

[6] 肖明珠,陈光楀.基于可能性理论的测量数据处理[J].信息与电子工程,2006,4(2):98-102.

[7] 严巍,赵川.可能性理论研究[J].数字通信,2014,41(5):24-27.

[8] 余学锋,于杰,王柯,等. 基于证据理论的测量不确定度评定与分析[J]. 计量学报,2017, 38(2): 252-256.

[9] 武彩萍,刘雪琴,王丽明.模糊选择函数合理性指标与正规性指标的研究[J].太原理工大学学报,2015,46(1):119-123.

[10] Klement E P,Mesiar R, Pap E.Triangular norms. Position paper II: General constructions and parameterized families[J].FuzzySets&Systems, 2004,145(3):411-438.

[11] 赖雄鸣,王成,张勇,等.最大熵法在可靠度计算中的应用[J].计算力学学报,2015,32(1):41-47.

[12] 程亮.最大熵原理与最小熵方法在测量数据处理中的应用[D]. 西安:西安电子科技大学,2008.

[13] Ferrero A,Prioli M,Salicone S. Processing dependent systematic contributions to measurement uncertainty[J].IEEETransInstrumMeas, 2013,62(4):720-731.

[14] 樊东红,曾彦.关于t-范数的构造方法[J]. 湖南科技学院学报,2011,32(8):32-35.

[15] Ferrero A,Prioli M,Salicone S. The construction of joint possibility distributions of random contributions to uncertainty[J].IEEETransInstrumMeas,2014,63(1): 80-88.

猜你喜欢
后验先验算子
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
拟微分算子在Hp(ω)上的有界性
Heisenberg群上与Schrödinger算子相关的Riesz变换在Hardy空间上的有界性
各向异性次Laplace算子和拟p-次Laplace算子的Picone恒等式及其应用
基于无噪图像块先验的MRI低秩分解去噪算法研究
基于贝叶斯理论的云模型参数估计研究
基于自适应块组割先验的噪声图像超分辨率重建
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
康德审美判断的先验演绎与跨文化交流
基于平滑先验法的被动声信号趋势项消除