基于可信度区间的不确定性推理

2012-09-06 01:19张红日
山西电子技术 2012年5期
关键词:真值不确定性结论

张红日

(长治供电分公司,山西长治 047300)

不确定性推理是人工智能研究的重要内容,所谓不确定性推理就是根据已有的不确定性知识,模拟专家的思维,推出具有一定程度的不确定性但却合理的结果[1]。现在不确定性推理领域研究的问题主要集中在不确定性知识的表示、新的不确定推理算法、不确定性的匹配计算、不确定性的更新算法、不确定性结论的合成等几个方面。如:文献[2]提出了基于可信度的带权不确定性推理,文中充分利用了神经网络的结构和自学习能力来对知识进行表示和不确定推理,实验结果证明不仅可以自动学习,而且充分模拟了专家经验实现了推理。文献[3]对推理过程中几种不确定性更新算法(主观Bayes、确定性理论和灰色定性法)进行了详细的介绍,并对他们的优缺点进行了分析比较,提出了较为合理的更新算法。文献[4]提出了两个模糊子集的匹配函数的定义,并在此基础上提出了推理过程中模糊规则匹配的一些方法。

本文从不确定性规则的组成、不确定性推理的模型、不确定性知识表示和不确定性的匹配问题上进行了研究,提出了一种基于可信度区间的电力系统不确定性推理方法。

1 不确定性的规则表示方法

不确定性知识表示的规则一般由前提、结论、证据、条件、推论、结果组成:

(1)前提(Premise):规则的前项,一般由领域专家根据经验直接给出,它由很多子前提组成。前提的真值用T(P)表示,指在没有任何证据存在时的真实程度。

(2)证据(Evidence):即已知的事实,包括用户输入的原始证据和推理过程中得出的中间结果,证据的真值用T(E)表示,它反映了前提事实的真实程度。证据和前提共同计算匹配程度,然后判断规则是否被激活。对于初始证据,它由专家提供,对于运用规则推出的值,可由不确定性递推算法计算得到。

(3)结论(Hypothesis):规则的后项,它和前提相对应,用真值T(H)表示,指前提完全满足时的真实程度,一般由专家根据经验统计出来。其中由前提推出假设的真值用T(H/P)表示,也即规则的真值。

(4)条件(Condition):证据和前提匹配后所产生的命题,它的真值既不是证据真值,也不是前提真值,而是二者的综合结果。条件的真值用T(P/E)表示,条件不确定值的计算直接影响后面推理的结果,因此有很多人研究它的计算方法,主要方法有合取运算、析取运算、加权平均运算。此外文献[5]针对合取、析取、加权平均运算的缺点,提出了广义逻辑关系运算。

(5)结论(Conclusion):是由条件真值T(P/E)和规则的可信度T(H/P)按一定的函数关系计算出来的真值。结论的真值用T(H/E)表示。

(6)结果(Result):它是一条规则的最终输出,可以作为其它规则的证据,结果的真值用T(R)表示,由推论的真值T(H/E)和假设的真值T(H)按一定算法得出。

2 不确定性推理模型

不确定性推理的一般过程如图1所示。主要包括:(1)知识和证据的不确定性表示和度量;(2)不确定性的匹配算法;(3)不确定性更新算法。其中知识和证据的不确定性表示和度量是推理的基础;不确定性匹配是推理的前提,只有经过匹配才能从规则库中激活规则进行推理;更新算法是推理的核心部分。

图1 不确定性推理之间的关系

不确定性知识是相对精确知识而言的,是指具有不确定特性的知识,如不精确、不完备和模糊的知识。不确定性知识的表示和处理方法主要有:基于概率的、基于可信度的、基于模糊的不确定性表示和处理。

证据,即已知的不确定性事实,包括用户输入的原始证据和推理过程中得出的中间结果,它的真值反应了前提事实的真实程度,它是推理的出发点,因此必须把证据的不确定性用适当的方法表示出来。

匹配就是指检测两个知识结构是否完全一致或者近似一致。不确定性匹配是指两个模式不完全一致,但总体上来说,近似程度又在一定范围内[1]。要想从给定的初始证据中推出相应的结论,必须从知识库中选出可与证据匹配的规则,当匹配度大于给定的阈值时规则才能被激活,然后应用这些规则进行推理,最后推出结论。否则认为不匹配,规则不可用,再对其它规则进行匹配运算。

不确定性更新算法是不确定性推理的核心,合适的更新算法可以使得证据和规则的不确定性恰当的反应在结论的不确定性中。早期主要有确定性理论、主观贝叶斯方法、证据理论等;20世纪80年代以后随着理论工作者的深入研究,又提出了粗糙集理论、灰色系统理论、集对分析[6]等。这些理论从不同角度对不同类型的不确定性进行了分析研究。

3 基于可信度区间的不确定性推理方法

不确定性知识有各种表示方法,主要有以下三种方法:基于概率的不确定性推理、基于可信度的不确定推理、基于模糊的不确定性推理。概率论是不确定性推理的基石,最早的用概率来处理的不确定推理是经典概率,但都是在理想系统下,实际中并不理想。后来提出了主观贝叶斯方法,通过引入主观概率来表示知识和证据的不确定性,从而推出结论。但这种方法需要专家的主观概率,而有些时候专家也未必知道,所以又给推理带来了一定的难度,在此基础上引入了基于可信度的不确定性推理,引入了确定性因子来作为不确定性的度量,即把每个证据和规则都赋予一个可信度,最终通过推理机得出的结论也用可信度来表示。文献[7]引入了动态规则的可信度,即通过先验证据和结论的文献[7]可信度以及观测之下证据的可信度来算出动态规则的可信度,从而提高了推理能力。但在实际中往往有些非常模糊的东西不能用可信度来描述,只能判断它属于什么范围,在这种情况下提出了模糊规则的推理,文献[8]提出的不确定模糊推理的方法是通过引入模糊控制中的隶属度函数来评价确定性程度,从而对模糊空间进行了查询。

在实际中由于有些不确定性知识的可信度就连专家也不能给出一个具体的值,只能给出一个范围。针对这种情况,本文提出了一种基于可信区间的不确定性推理方法,可信度区间由两个可信度因子组成,分别是上限和下限,通过匹配函数匹配后进行推理运算,使得推理更加接近实际应用的需要。

3.1 不确定性知识表示

不确定性知识的表示如下:

其中,P1,P2,…Pn分别表示子前提;[x11,x12],[x21,x22]…[xn1xn2]表示各个子前提的可信度区间;C表示由前提推出的结论;CF(C/P)表示规则的可信度,用区间表示;λ∈[0,1]为规则的阈值,它是规则激活的度量值,当匹配度大于λ时,规则被激活,进行推理,否则不被激活。

3.2 匹配度计算

为了对不确定性知识表示的规则进行推理,必须判断规则的前提P和事实E是否匹配,其匹配函数:

其中,P表示规则的前提;E表示匹配的事实,它可以表示成(E1,[y11y12])and(E2,[y21y22]) … and(En,[yn1yn2]),其中 E1,E2…En表示前提,[y11y12],[y21y22]…[yn1y22]表示给出的事实中前提的可信度区间。

式(2)中P'和E'分别表示由规则前提和匹配事实中的隶属值所构成的两个1×n的区间矩阵:

P″和E″分别表示P'和E'的转置矩阵,是n×1的区间矩阵。

3.3 结果的取优确定

首先根据上面提出的匹配函数计算事实与所有前提的匹配度M(E,Pi)i=1,2,…,n,然后判定各个匹配度是否大于专家给出的阈值λ,判断的标准为:

(1)当所有规则的匹配度 M(E,Pi)<λ i=1,2,…n时,规则不被激活,不进行推理。

(2)当只有一条规则的匹配度M(E,P)>λ时,激活该规则,推理结果只有一种。

(3)当有多条规则的匹配度时M(E,P)>λ,多条规则被激活,推理会有多种结果。那么到底哪个结果更优呢,下面提出了一种用权重法来衡量的方法。

由于基于可信度区间的不确定性推理结果的表达形式也是用区间来表示。设有两个 a=[a-,a+],b=[b-,b+],记 l(a)=a+-a-,l(b)=b+-b-,则称:

当有区间ai=[ai-,ai+],i=1,2,…,n,其中第 i和 j第个区间比较的可信度为Pij(ai>aj),则这n个区间的大小关系可用权重系数wi来衡量。

3.4 发电机故障计算实例

假设一个发电机设备出现故障,可能出现的故障现象的一个集合定义为P={P1,P2,P3,P4},导致故障的原因的集合定义为H={H1,H2,H3,H4},领域专家给出的匹配函数的阈值为λ=0.7。

知识库中含有以下四条规则:

Rule 1 IF(P1,[0.60 0.74])and(P2,[0.85 0.95]and(P3,[0.56 0.78]and(P4,[0.82 0.99])

THEN H1 CF:[0.70 0.90]

Rule 2 IF(P1,[0.90 0.98])and(P2,[0.6 0.75]and(P3,[0.45 0.64]and(P4,[0.85 0.96])

THEN H2 CF:[0.80 0.95]

Rule 3 IF(P1,[0.86 0.95])and(P2,[0.25 0.34]and(P3,[0.54 0.68]and(P4,[0.65 0.76])

THEN H3 CF:[0.80 0.90]

Rule 4 IF(P1,[0.20 0.35])and(P2,[0.75 0.85]and(P3,[0.12 0.28]and(P4,[0.90 0.99])

THEN H4 CF:[0.85 0.95]

现有设备出现故障时的一些现象所具有的不确定性程度为:

E={(E1,[0.80 0.90]),(E2,[0.32 0.40]),(E3,[0.60 0.70]),(E4,[0.68 0.76])}

根据公式(3)求出P'和E';公式(4)求出P'P″,P'E″和E'E″;公式(5)求出[m1,m2]和[M1,M2]。最后带入公式(1)算出匹配度。

得到:M(P1,E)=0.72 > λ,M(P2,E)=0.75 > λ,M(P3,E)=0.98 > λ,M(P4,E)=0.65 < λ。由此可见规则1、2、3被激活。从而得到结论的可信程度为:

CF(H1)=0.72* [0.80 0.90]=[0.58 0.65]

CF(H2)=0.75* [0.70 0.85]=[0.53 0.64]

CF(H3)=0.98* [0.80 0.90]=[0.78 0.89]

由公式(6)可得可信度区间的可能性矩阵P为:

由公式(7)可得H1、H2、H3的权重分别为:

通过上述公式的推断,得出该发电机故障可能性为H1>H2>H3,其中H1的可能性最大。

4 结论

本文在阐述不确定性推理规则和模型的基础上提出的区间不确定性推理算法,引入了可信度区间来衡量各个规则前提的可信程度,在此基础上提出了基于区间的匹配函数来衡量规则与事实的匹配程度,最后在结果的取优过程中引入了权重系数。该方法充分体现了推理过程中的不确定性知识的表达,减少了推理过程中信息的丢失,更能反映推理的复杂性和不确定性,而且计算清晰简单,在人工智能的不确定性推理中具有很好的应用。最后以发电机故障为实例,对本推理进行了验证。

[1]敖志刚.人工智能与专家系统导论[M].合肥:中国科学技术大学出版社,2002.

[2]施明辉,周昌乐.一种用ANN实现带权不确定性推理的方法[J].哈尔滨工业大学学报,2007,39(9):1491-1495.

[3]黄元亮,李冰.不确定性推理中确定性的传播[J].计算机仿真,2008,25(7):133-136.

[4]肖伟跃.一个基于模糊逻辑的不确定性推理模型[J].湖南文理学院学报(自然科学版),2005,17(4):50-53.

[5]Hei Xingui.Fuzzy Computational Reasoning and Networks[M].Beijing Institute of System Engineering,1990.

[6]Joseph C.Giarratano,Gary D.riley.Expert System Priniples and Programming[M].China Mechine Press,2006.

[7]Chang-tseh Hsieh,Huiqing Yang.Roles of Knowledge Management in Online Procurement System[J].Industrial Management+Data System,2002,102(7):365-370.

[8]Huiqing Yang.A Fuzzy Spatial Querying Model for Improving Apartment Web Services[J].Journal of Systemics,Cybernrtics and Informatics,2008,6(1).

猜你喜欢
真值不确定性结论
由一个简单结论联想到的数论题
法律的两种不确定性
立体几何中的一个有用结论
英镑或继续面临不确定性风险
10kV组合互感器误差偏真值原因分析
具有不可测动态不确定性非线性系统的控制
结论
真值限定的语言真值直觉模糊推理
基于真值发现的冲突数据源质量评价算法
写真法、写假法探析