不完备信息系统的直觉模糊决策粗糙集

2021-05-24 06:56张利亭

郑州大学学报（理学版） 2021年2期

张利亭，冯涛，李欢

(河北科技大学理学院河北石家庄 050018)

0 引言

在日常生活中，有很多客观或主观的因素导致信息系统中某些对象的属性值缺失。或许是人为所致，或许是系统所含缺陷所致，各种因素直接或间接地影响信息系统中所含对象的属性值的不完整性。在一个信息系统中，如果对象的某些属性值是未知或部分已知，那么这一信息系统将被定义为不完备信息系统(incomplete information system，IIS)[1]。不完备信息系统中的缺失属性值有三类：第一类是该属性值是存在的，但是我们不知道，为此，文献[2-4]对容差关系、等价关系以及限制容差的关系进行了讨论[5]；第二类是不能确定属性值是否存在，为此，文献[6]提出了一种新的限制相似关系，文献[7]依据新建立的非对称相似关系得到了近似集的概念；第三类是属性值不存在。在已知的针对不完备信息系统的处理方法中包含数学统计法、模糊集理论法以及粗糙集理论法三种。在以往的粗糙集理论中，对于上下近似的定义是基于概念之间的相交或者包含关系，而没有对概念之间相交的程度进行考量，其定义方式不够细致完善，会影响决策方案的选择。为了解决这一问题，文献[8]在经典粗糙集理论中引入了具有容错能力的阈值，用阈值来描述概念之间相交的程度。

为了处理决策粗糙集的方法在决策过程中产生风险损失的问题，文献[9]引入了损失函数，并将损失函数与贝叶斯决策理论相结合提出了三支决策理论，给出了三支决策理论模型中正域、负域、边界域的语义描述。目前针对三支决策的研究分为三大类：第一类是对理论模型的扩展[10-13]；第二类是对属性约简等方法的研究[14-16]；第三类是三支决策在医学、信息学和管理学等领域的应用[17-18]。该理论的核心问题之一是三支模型的确定，已有的三支模型方法大多是处理完备信息的，对一些信息不完备的情况，需要对决策粗糙集模型中已存在的模型进行拓展补充。文献[19-20]在处理不完备信息时引入区间数；文献[21]考虑到区间内概率取值相同会对决策结果产生误差，进而引入三角模糊数，提出不完备信息系统的三角模糊数决策粗糙集模型；文献[22]结合梯形模糊数比三角模糊数更具一般性、灵活性和易于计算等特点，提出不完备信息系统的梯形模糊数三支决策。在此基础上，考虑到直觉模糊数同时具有隶属度与非隶属度两方面的信息，能更好地刻画事物的“非此非彼”的模糊本质，其在理论方面也有一些扩展[23-24]。

上述研究在处理不完备信息时，将缺失值视为与系统中已知属性值的类型一样或者是进行填补。本文将缺失值视为每个属性上已知属性值集合的幂集，利用幂集的特点，借助直觉模糊关系引入两个对象的相似关系和相异关系，得到直觉模糊信息粒，为不完备信息系统的直觉模糊三支决策打下基础。在此基础上，与三支决策思想相结合，可以进一步研究直觉模糊决策粗糙集模型的三支决策方法，并针对不同决策者给出不同的决策分析。

1 基础知识

1.1 直觉模糊集的相关知识

定义1[25]设U为给定的论域，则称A={(x,μA(x),νA(x))|x∈U}为U上的直觉模糊集，其中μA(x)称为x属于A的程度，νA(x)称为x不属于A的程度，简称为隶属度和非隶属度。∀x∈U，0≤μA(x)+νA(x)≤1，称πA(x)=1-μA(x)-νA(x)为x属于A的犹豫度，πA(x)∈[0,1]。

定义2[26]设A、B为U上的任意两个直觉模糊集，其运算如下：①A⊆B当且仅当∀x∈U，μA(x)≤μB(x)且νA(x)≥νB(x)；②A∩B={x,min(μA(x),μB(x)),max(νA(x),νB(x))|x∈U}；③A∪B={x,max(μA(x),μB(x)),min(νA(x),νB(x))|x∈U}；④AC={(x,νA(x),μA(x))|x∈U}。

定义3[26]设A={(x,μA(x),νA(x))|x∈U}是直觉模糊集，∀x∈U，(μA(x),νA(x))是直觉模糊数，简记为x=(μx,νx)。

基于直觉模糊集的定义和运算，文献[25]定义了直觉模糊相似度的概念。

定义4[25]称sim(A,B)为A和B的直觉模糊相似度，若满足如下条件：①sim(A,B)为直觉模糊数；②sim(A,B)=(1,0)当且仅当A=B；③sim(A,B)=sim(B,A)；④ 若A⊆B⊆C，则sim(A,C)≤Lsim(A,B)且sim(A,C)≤Lsim(B,C)。

1.2 概率粗糙集的相关知识

定义5[27]设R为U上的等价关系，∀xi,xj∈U，[xi]R={xj|(xi,xj)∈R}称为xi关于R的等价类。

定义6[28]设U为非空有限论域，R为U上的等价关系，对于∀X⊆U，定义

定义7[28]设(U,R,P)为概率近似空间，对于任意实数θ、η满足0≤η<θ≤1，X⊆U，定义集合X依参数θ、η的概率上、下近似为

1.3 决策理论粗糙集模型

决策理论粗糙集模型[19]利用两种状态集和三种行动集来描述决策过程。状态集Ω={X,X}，其中X和X分别表示对象属于X和对象不属于X。行动集Λ={aP,aB,aN}，其中aP表示接受决策，aB表示延迟决策，aN表示拒绝决策。考虑到采取不同的行动会产生不同的损失，表1给出了对应的决策代价损失。其中λPP、λBP、λNP分别表示对象x属于状态X时，采取行动aP、aB、aN下的损失；λPN、λBN、λNN分别表示对象x不属于状态X时，采取行动aP、aB、aN下的损失。因此，采取三种不同行动aP、aB、aN下的期望损失可表示为

表1 决策代价损失

R(aP|[x]R)=λPPP(X|[x]R)+λPNP(X|[x]R)，

R(aB|[x]R)=λBPP(X|[x]R)+λBNP(X|[x]R)，

R(aN|[x]R)=λNPP(X|[x]R)+λNNP(X|[x]R)，

依据贝叶斯最小风险决策规则，可以获得如下决策规则。

接受规则(P)：若R(aP|[x]R)≤R(aB|[x]R)且R(aP|[x]R)≤R(aN|[x]R)，则x∈POS(X)；

延迟规则(B)：若R(aB|[x]R)≤R(aP|[x]R)且R(aB|[x]R)≤R(aN|[x]R)，则x∈BND(X)；

拒绝规则(N)：若R(aN|[x]R)≤R(aP|[x]R)且R(aN|[x]R)≤R(aB|[x]R)，则x∈NEG(X)。

2 不完备信息系统的直觉模糊相似关系

2.1 不完备信息系统

定义8[1]令四元组IS=(U,AT,V,f)为信息系统，U为非空有限的对象集合；AT为非空有限的属性集合；V=∪a∈ATVa为属性值值域，Va为属性a的值域；f：U×AT→V为信息函数。对于∀a∈AT，x∈U有f(x,a)∈Va。

若f(x,a)=*为未知值，则V=∪a∈ATV′a，V′a=Va∪{*}，此时(U,AT,V,f)为不完备信息系统[1]。若有f(x,a)=*，规定f(x,a)⊆2Va-{∅}。本文不完备信息系统中的“*”被认为是遗漏的。

2.2 直觉模糊相似关系

定义9[29]设U和V为非空有限论域，定义在直积空间U×V上的直觉模糊子集R称为从U到V之间的二元直觉模糊关系，记为

R(x,y)=(μR(x,y),νR(x,y))，∀x∈U,y∈V，

其中：μR：U×V→[0,1]，νR：U×V→[0,1]满足0≤μR(x,y)+νR(x,y)≤1。IFR(U×V)表示U×V上的直觉模糊关系的全体。

定义10[29]R∈IFR(U×U)，称R为相似关系，若R满足：① 自反性。∀x∈U，μR(x,x)=1，νR(x,x)=0。② 对称性。∀(x,y)∈U×U，μR(x,y)=μR(y,x)，νR(x,y)=νR(y,x)。

不完备信息系统IIS=(U,AT,V,f)中，∀a∈AT，当f(x,a)=f(y,a)时，认为x和y在属性a下不可区分。当f(x,a)∩f(y,a)=∅时，认为x和y在属性a下完全可区分。

定义11令IIS=(U,AT,V,f)为不完备信息系统，x和y为论域U中的任意两个对象，∀a∈AT，则x、y关于属性a的相似度Sa(x,y)和相异度Da(x,y)分别为

定理1令IIS=(U,AT,V,f)为不完备信息系统，x和y为论域U中的任意两个对象，∀a∈AT，Sa(x,y)、Da(x,y)分别为对象x、y关于属性a的相似度和相异度。sima(x,y)=(Sa(x,y),Da(x,y))则为对象x、y关于属性a的直觉模糊相似度。

性质1设IIS=(U,AT,V,f)为不完备信息系统，sima(x,y)=(Sa(x,y),Da(x,y))，∀a∈AT，则

1)f(x,a)=f(y,a)当且仅当sima(x,y)=(1,0)。

2)f(x,a)≠f(y,a)∧(f(x,a)≠*∧f(y,a)≠*)当且仅当sima(x,y)=(0,1)。

基于定理1，定义了一种新的直觉模糊相似关系来描述论域U中对象x与y的相似度。

定义12设IIS=(U,AT,V,f)为不完备信息系统，U={x1,x2,…,xm}，AT={a1,a2,…,an}。∀x,y∈U，∀a∈AT，直觉模糊相似关系SR(x,y)定义为

定义13设U={x1,x2,…,xm}，AT={a1,a2,…,an}，SR(x,y)是U上的直觉模糊相似关系，∀λ1,λ2∈[0,1]，0≤λ1+λ2≤1，

1)定义SR的(λ1,λ2)-截关系SR(λ1,λ2)为

2)∀x∈U，定义(λ1,λ2)-截直觉模糊相似类为

[x]SR(λ1,λ2)={y∈U|(x,y)∈SR(λ1,λ2)}。

接下来定义直觉模糊关系SR的(λ1,λ2)-截关系的近似和三支决策。

定义14令IIS=(U,AT,V,f)为不完备信息系统，SR(λ1,λ2)为直觉模糊相似关系SR的(λ1,λ2)-截关系，∀λ1,λ2,p,q∈[0,1]满足0≤p

由定义14生成的正域、负域、边界域分别为

正域代表接受决策，负域代表拒绝决策，边界域代表延迟决策。当p=0，q=1时，此时退化为经典粗糙集。

3 基于不完备信息系统的直觉模糊三支决策

贝叶斯决策过程由两种状态和三种行动组成，设不同状态采取不同行动所带来的损失以直觉模糊值的形式给出，则不同状态下对应的直觉模糊损失值如表2所示。

表2 不同状态下对应的直觉模糊损失值

实际决策时，不同的决策者对同一件事物进行决策往往会有不同的态度，有的决策者持乐观态度，有的决策者持悲观态度，有的决策者保持中立的态度。通过对表2的分析可得：1-ν(λkl)(k=P,B,N；l=P,N)表示乐观决策者的损失值，μ(λkl)表示悲观决策者的损失值，(μ(λkl)+1-ν(λkl))/2则表示中立决策者的损失值。为了把三种决策者的损失值统一到一个模型里，引入风险系数h来表示不同决策者的风险态度[30]，其中0≤h≤1。于是给出定义15。

定义15[30]设λkl=(μ(λkl),ν(λkl))为决策者在两种状态下采取不同行动的直觉模糊损失值，h为决策者的风险系数，则不同风险态度的决策者在不同状态下采取不同行动的风险损失Eh(λkl)定义为

Eh(λkl)=(1-h)μ(λkl)+h(1-ν(λkl))。

当h为0、0.5、1时，分别代表悲观型、中立型、乐观型的决策者。因此，采取三种不同行动aP、aB、aN下的期望损失可表示为

R(ak|[x]SR(λ1,λ2))=Eh(λkP)P(X|[x]SR(λ1,λ2))+Eh(λkN)P(X|[x]SR(λ1,λ2))，k=P,B,N,

式中：[x]SR(λ1,λ2)表示对象x的(λ1,λ2)-截直觉模糊相似类；P(X|[x]SR(λ1,λ2))=1-P(X|[x]SR(λ1,λ2))。

依据贝叶斯最小风险决策规则，可以获得如下决策规则。

接受规则(P1)：若R(aP|[x]SR(λ1,λ2))≤R(aB|[x]SR(λ1,λ2))且R(aP|[x]SR(λ1,λ2))≤R(aN|[x]SR(λ1,λ2))，则x∈POS(X)；

拒绝规则(N1)：若R(aN|[x]SR(λ1,λ2))≤R(aP|[x]SR(λ1,λ2))且R(aN|[x]SR(λ1,λ2))≤R(aB|[x]SR(λ1,λ2))，则x∈NEG(X)；

延迟规则(B1)：若x∈U-POS(X)-NEG(X)，则x∈BND(X)。

考虑到实际情况，做出一个正确决策产生的损失小于做出错误决策产生的损失，故有

其中：

对λ1、λ2和h的取值进行分析，可得在定义13中λ1、λ2的值决定着决策偏好的粒度。λ1值越大、λ2值越小，表示不可区分关系越强。在定义15中h为决策者的风险系数，风险规避者讨厌高风险并将更高的成本用于错误的损失，因此风险规避者选择的h值较小。风险爱好者追求高风险、高回报，他们通过错误的决策来降低成本，因此风险爱好者选择的h值较大。

4 实例分析

以不完备医学流感诊断决策表[21]为例，U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10}为病人编号；条件属性集C={a1,a2,a3,a4,a5,a6,a7}表示病人的7种症状：体温、咳嗽、流鼻涕、头疼、恶心、痰多、肌肉疼痛；决策属性集D={X,X}，其中X表示病人得流感，X表示病人未得流感。根据医生的经验，X={x1,x4,x5,x7,x8}时，这些病人更容易得流感，病人患病的实际情况如表3所示。

表3 病人患病的实际情况

为了方便描述，在表3中根据医生的经验和每个属性的属性值有如下定义:对于a1，1、2、3分别代表高、较高、正常; 对于a2、a3、a5、a6，1、2分别代表是、不是;对于a4、a7，1、2、3分别代表很严重、有点严重、不严重；*代表缺失值。

对象U中任意两位患者xi、xj的直觉模糊相似关系为：SR(xi,xi)=(1,0),i=1,2，…,10。SR(x1,x2)=SR(x2,x5)=SR(x9,x10)=(0.068,0.823)，SR(x1,x3)=SR(x5,x7)=SR(x5,x10)=(0.238,0.667)，SR(x1,x4)=SR(x1,x9)=SR(x2,x10)=SR(x5,x9)=(0.639,0.252)，SR(x1,x5)=SR(x3,x7)=SR(x3,x10)=SR(x7,x10)=(0.381,0.524)，SR(x1,x6)=(0.088,0.741)，SR(x1,x7)=SR(x3,x5)=(0.667,0.238)，SR(x1,x8)=(0.810,0.079)，SR(x1,x10)=(0.190,0.746)，SR(x2,x3)=SR(x2,x7)=SR(x3,x9)=SR(x7,x9)=(0.354,0.537)，SR(x2,x4)=(0.184,0.694)，SR(x2,x6)=(0.612,0.239)，SR(x2,x8)=(0.116,0.728)，SR(x2,x9)=(0.020,0.892)，SR(x3,x4)=SR(x4,x5)=SR(x4,x7)=(0.497,0.395)，SR(x3,x6)=SR(x6,x10)=(0.517,0.313)，SR(x3,x8)=(0.286,0.571)，SR(x4,x6)=(0.327,0.525)，SR(x4,x8)=SR(x8,x9)=(0.544,0.299)，SR(x4,x9)=(0.612,0.265)，SR(x4,x10)=(0.211,0.680)，SR(x5,x6)=(0.231,0.599)，SR(x5,x8)=(0.381,0.508)，SR(x6,x7)=(0.374,0.440)，SR(x6,x8)=(0.136,0.646)，SR(x6,x9)=(0.184,0.668)，SR(x7,x8)=(0.714,0.143)，SR(x8,x10)=(0.238,0.651)。

假设给定λ1=0.5，λ2=0.5，则直觉模糊相似关系SR(x,y)的(λ1,λ2)-截直觉模糊相似类[xi]SR(λ1,λ2)(i=1,2,…,10)为：[x1]SR(λ1,λ2)=[x8]SR(λ1,λ2)={x1,x4,x7,x8,x9}，[x2]SR(λ1,λ2)=[x10]SR(λ1,λ2)={x2,x6,x10}，[x3]SR(λ1,λ2)={x3,x5,x6}，[x4]SR(λ1,λ2)={x1,x4,x8,x9}，[x5]SR(λ1,λ2)={x3,x5,x9}，[x6]SR(λ1,λ2)={x2,x3,x6,x10}，[x7]SR(λ1,λ2)={x1,x7,x8}，[x9]SR(λ1,λ2)={x1,x4,x5,x8,x9}。

下面讨论λ1、λ2取不同值时对应的悲观、中立、乐观决策者的决策，结果如表4所示。在表4中，随着决策偏好粒度(λ1,λ2)的变化，决策者的选择也会发生变化。当(λ1,λ2)=(0.5,0.3)时，悲观、中立、乐观决策者认为x3需要做进一步诊断；当λ2≤0.2时，悲观、中立、乐观决策者认为x3不需要做进一步诊断。当λ2≤0.2时,与文献[21]中L≥0.8的结果相同。本文方法在粒度较细时，直觉模糊相似关系的截关系中的元素将发生变化，产生新的决策结果，可以在一定程度上纠正实际经验值产生的误差。

表4 λ1、λ2取不同值时对应的决策结果

5 结束语

本文在不完备信息系统中，从决策粗糙集出发，利用直觉模糊数来设定损失函数，采用新定义的直觉模糊相似关系的截关系代替等价关系来进行分类。然后结合贝叶斯决策过程，在不完备信息系统中应用直觉模糊决策粗糙集，提出了一种基于不完备信息系统的直觉模糊数的决策粗糙集模型，给出了该模型的三支决策规则和方法。通过一个实例说明决策过程，并对该模型中的参数进行了分析。本研究为不完备信息系统中三支决策理论模型拓展提供了一种新方法。