尹龙军, 刘 勇
(重庆邮电大学 理学院, 重庆 400065)
三支决策是Yao[1-3]在长期研究粗糙集,特别是概率粗糙集和决策粗糙集过程中,总结和提炼出来的一种符合人类实际认知能力的决策模式.三支决策粗糙集将传统正域、负域二支决策语义拓广成正域、负域和边界域3种决策语义[4-7],从而做出接受、拒绝和延迟决策3种决策,很好地对应了人类的决策思想.三支决策粗糙集通过引进贝叶斯风险理论并计算最小风险代价确定了正域、负域和边界域的划分,为选取最优决策提供了理论依据.计算过程中基于最小风险代价的概率阈值计算方法也使得传统概率粗糙集模型的概率阈值有了理论基础.
近几年来,三支决策理论已成为国内外专家学者研究的热点.刘盾等[8]对三支决策理论提出了新的研究方法和应用领域;杜丽娜等[9]将贝叶斯原理和基于决策粗糙集的三支决策规则引入到模糊综合评判中,提出了基于三支决策风险最小化的风险投资评判模型;张里博等[10]采用代价敏感三支决策方法求得相应粒度下的最小代价决策.
本文主要在以上研究的基础上,将被决策者所处的状态由X和X的补集2种状态推广为多种状态,并提出了一种状态概率的计算方法,然后利用状态概率和不同状态的决策代价计算出最终做出3种决策的决策代价.
定义1.1[11](上下近似集) 给定知识表达系统S=〈U,R,V,f〉,对于每一个子集X⊆U和不分明关系B、X的上近似集和下近似集分别可以由B的基本集定义如下:
B-(X)={x|(x∈U∧[x]B⊆X)},
B-(X)={x|(x∈U∧[x]B∩X≠Ø)},
即当且仅当[x]B⊆X,x∈B-(X);当且仅当[x]B∩X=Ø,x∈B-(X);集合BNDB(X)=B-(X)B-(X)称为X的B边界;POSB(X)=B-(X)称为X的B正域;NEGB(X)=U-B-(X)称为X的B负域.
定义1.2[12]((α,β)-上下近似集) 给定信息表达系统S=〈U,R,V,f〉,对X⊆U,令0≤β<α≤1,则概率粗糙集的(α,β)-上下近似集可以表示为:
在概率粗糙集中,(α,β)-上下近似集将论域分为3个部分:
POS(α,β)(X)={x∈U|Pr(X|[x])≥α},
BND(α,β)(X)={x∈U|β NEG(α,β)(X)={x∈U|Pr(X|[x])≤β}. 利用粗糙集的3个论域,可以获得最直观、简单的三支决策模型: 当Pr(X|[x])≥α时,接受;当Pr(X|[x])≤β时,拒绝;当β 当α=1,β=0时,称为Pawlak粗糙集[13-14],Pawlak粗糙集接受条件比较严苛,而对于拒绝的条件过于宽松,这种模型在容错率方面很差,完全不考虑实际应用中可能存在错误分类.因此产生了0.5-概率粗糙集,这种模型完全基于多数服从少数的原则,这种方案往往在实际应用中显得接受条件过于宽松,相对于Pawlak粗糙集和0.5-概率粗糙集,(α,β)-粗糙集则比较灵活,可以通过适当的设定α、β值来控制接受、拒绝和延迟的条件,其决策过程也更为灵活和合理.粗糙集在决策过程中,往往仅考虑阈值形式,当Pr(X|[x]R)≥α时,x∈POS(X);当β 通常情况下,α、β的取值由专家给定,并没有回答如何给定,刘盾等[12]通过详细讨论α+β>1、α+β=1、α+β<1等条件下的三支决策模型,给出了基于概率粗糙集的三支决策模型. 定义1.3[15-16](三支决策) 设Ω={X,X}表示2种状态集合,分别表示对象属于集合X和对象属于集合X的补集.集合A={aP,aB,aN}对应3种决策动作:接受、拒绝和延迟.决策过程中往往存在不同的代价损失,设λPP、λBP和λNP表示当一个对象属于集合X时分别采取行动aP、aB、aN时所付出的代价,λPN、λBN和λNN分别表示当一个对象属于X补集时分别采取行动aP、aB、aN所付出的代价. 因此,对集合[x]中的对象采取3种决策所产生的代价函数分别为: R(aP|[x])=λPPPr(X|[x])+ λPNPr(X|[x]), R(aB|[x])=λBPPr(X|[x])+ λBNPr(X|[x]), R(aN|[x])=λNPPr(X|[x])+ λNNPr(X|[x]). 根据最小风险决策规则: 1) 如果R(aP|[x])≤R(aB|[x])且R(aP|[x])≤R(aN|[x]),则x∈POS(X)选择行动决策aP; 2) 如果R(aB|[x])≤R(aP|[x])且R(aB|[x])≤R(aN|[x]),则x∈BND(X)选择行动决策aB; 3) 如果R(aN|[x])≤R(aP|[x])且R(aN|[x])≤R(aB|[x]),则x∈NEG(X)选择行动决策aN. 由于Pr(X|[x])+Pr(-X|[x])=1,根据实际情况,当一个对象属于X时,选择接受的代价一般不应该大于延迟决策和拒绝的代价.同理,当一个对象属于X的补集时,选择拒绝的代价一般不应该大于延迟决策和接受的代价,因此有 0≤λPP≤λBP≤λNP, 0≤λNN≤λBN≤λPN. (*) 目前大多数的研究中,主要是在状态集Ω={X,-X}共2种状态下,讨论分别做出3种决策A={aP,aB,aN}时的代价,从而做出代价最小的决策.本文主要针对被决策者本身处于多种状态下,利用条件概率及决策代价矩阵,结合参与决策者的可信度(权重),从而获得3种决策的代价值,最终选取代价最优的决策方案. 2.1多状态下三支决策代价表设状态集为Ω={X1,X2,…Xk},决策集为A={aP,aB,aN},对不同状态分别采取aP、aB、aN共3种决策会导致不同的损失,记λPi、λBi、λNi(i=1,2,…,k)为[x]的真实状态为Xi时,分别采取aP、aB、aN共3种决策的代价值,见表1. 表 1 多状态下三支决策代价函数 一般来说XiXj=Ø(i,j=1,2,…,k,i≠j);λPi、λBi、λNi(i=1,2,…,k)一般不具有(*)式的比较关系. 例1顾客对某企业员工进行评价,评分为1~10分,记为Xi(i=1,2,…,10),企业根据顾客的评价对员工进行考核,记为(aP,aB,aN)=(优秀,合格,不合格).当X1=10时,考核决策为优秀的代价显然低于考核决策为合格和不合格,即λP1<λB1<λN1.当X3=8时,且决策者倾向于分数较高为优秀,在此时考核决策为优秀的代价将会比考核决策为合格高,同时考核决策为不合格的代价应该高于考核决策为合格,即λP3>λB3,λB3<λN3. 2.2Pr(Xi|[x]R)的获取以Pr(Xi|[x]R)表示[x]属于状态Xi的概率,一般应该满足 (1) (2) … (3) 3种决策下的代价分别为: (4) (5) (6) 根据三支决策规则: 若R(aP|[x]R)≤R(aB|[x]R)且R(aP|[x]R)≤R(aN|[x]R),则实施决策aP; 若R(aB|[x]R)≤R(aP|[x]R)且R(aB|[x]R)≤R(aN|[x]R),则实施决策aB; 若R(aN|[x]R)≤R(aP|[x]R)且R(aN|[x]R)≤R(aB|[x]R),则实施决策aN. 根据上述的决策模型,以某高校学生评价教师为例,某班级的学生(参与决策者)对任课教师(被决策者)做出评价,需要利用学生(参与决策者)的评价结果对教师(被决策者)做出优秀(aP)、良好(aB)、合格(aN)共3种决策过程.学生(参与决策者)对教师(被决策者)的评价从状态集Ω={X1,X2,X3,X4}={非常满意,满意,一般,不满意}共4个方面进行模糊评价,设决策代价如表2. 表 2 决策代价函数 选取某一教师的评价结果为 Vji={(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0) (1,0,0,0);(0,1,0,0);(0,1,0,0);(0,1,0,0); (0,1,0,0);(0,1,0,0);(0,1,0,0);(0,1,0,0) (0,1,0,0);(0,1,0,0);(0,1,0,0);(0,0,1,0); (0,0,1,0);(0,0,1,0);(0,0,0,1)}, 即有16人对该教师评价为非常满意,10人对该教师评价为满意,3人对该教师评价为一般,1人对该教师评价为不满意. 设30个学生评价的权重系数分别为 σj={0.81,0.98,0.95,0.8,0.9,0.81,0.99, 0.91,0.93,0.92,0.96,0.90,0.98,0.90,0.97, 0.83,0.93,0.80,0.97,0.87,0.81,0.98,0.95, 0.92,0.96,0.97,0.87,0.95,0.89,0.84}. 利用(1)~(3)式计算得到: Pr(X1|[x]R)=0.533 6, Pr(X2|[x]R)=0.336 1, Pr(X3|[x]R)=0.099 4, Pr(X4|[x]R)=0.030 1. 再利用(4)~(6)式得到3种决策的代价值分别为: R(aP|[x]R)=0.337 05, R(aB|[x]R)=0.262 10, R(aN|[x]R)=0.895 47. 由三支决策的原则,故对该教师的最终评价确定为良好代价最小. 从整个决策过程可以看出,虽然对该教师评价为非常满意和满意的人数已经超过86%,但由于代价函数表中λP2和λB1比较高,即认为评价状态为“满意”时决策为“优秀”的代价和评价状态为“非常满意”时决策为“良好”的代价比较高,即认为评价状态为“满意”的情况下更倾向于决策为“良好”,如果决策者认为“满意”更加倾向于“优秀”的话,只需要调低λP2和调高λB1可以得到不同的决策结论.该模型在实际应用中可以根据参与决策者(评价者)的评价偏向对决策代价进行相应的调整,从而获得最优的决策.例如在评价过程中,多数评价者认为“满意”已经是很高的评价了,则只需要将表2的λP2调低,将λB1调高即可. 本文将概率粗糙集与三支决策思想相结合,在X和X的补集2种状态下,将三支决策代价的研究推广到X1,X2,…,Xk多种状态下进行三支决策的代价研究,并在获取对象的各状态概率时引入决策者权重,最终利用参与决策者的模糊评价结果对被评价者(被决策者)做出最优决策.现实生活中,各行各业都广泛应用顾客满意度调查,而在调查中,往往不是由顾客(参与决策者)直接给出分数,而是从不同的方面对被决策者给出模糊的评价.本模型即可以利用大量的模糊评价来计算三支决策的代价,从而对被评价者(被决策者)做出最优的决策. 致谢重庆邮电大学教改项目(XJG1423)和重庆邮电大学自然科学基金(A2011-22)对本文给予了资助,谨致谢意.2 基于粗糙集的多状态下的三支决策模型
3 算法实例
4 结束语