鲍忠奎,杨善林
(1.合肥工业大学 管理学院,合肥 230009;2.安徽大学 数学科学学院,合肥 230601)
波兰数学家Pawlak提出的粗糙集理论[1],是一种处理含糊和不确定信息的新型数学工具,近年来引起了人们的极大关注,已在机器学习、归纳推理、模式识别、决策分析等方面取得非常成功的应用。Greco等利用序决策系统中属性值之间递增或递减的序关系,用优势关系代替经典粗糙集中的等价关系,提出基于优势关系的粗糙集理论[2-4]],为经济、管理等领域中大量存在的多属性决策问题提供了一个新的研究思路。然而,序决策系统中的很多属性值在获取过程中往往因为种种原因,丢失或无法获得。因此如何在不完备序决策系统中进行优势关系的粗糙集拓展成为研究的热点。
目前,已有文献[5-9]对不完备序决策系统中优势关系的拓展主要是基于对未知属性值的两种不同语义解释:(1)所有的未知属性值仅仅是被遗漏的,但又是确实存在的,是一种遗漏型的未知属性值;(2)所有的未知属性值被认为是缺席的,是不允许被比较的,是一种缺席型的未知属性值。文献[5~8]从遗漏型未知属性值角度出发,分别提出了基于扩展优势关系、广义扩展优势关系、限制扩展优势关系的拓展粗糙决策分析模型,对目标对象的分类更加准确,符合实际;文献[9]从缺席型未知属性值的角度出发,综合相似关系与优势关系的优点,提出了基于相似优势关系的粗糙决策分析模型,并利用拓展的相似优势关系解决了不完备序决策系统中的属性约简等问题。然而,以上文献均假定不完备序决策系统中的未知属性值仅有一种可能的语义解释,即遗漏型或缺席型的,但在现实信息系统中,未知属性值往往既有遗漏型也有缺席型的,针对同时具有缺席和遗漏型未知属性值的广义不完备序决策系统,如何拓展粗糙集模型进行决策分析呢。
文献[10]在同时具有缺席和遗漏型未知属性值的广义不完备序决策系统中提出了特征优势关系的概念,并给出了基于特征优势关系的属性约简方法。文献[11]在广义不完备序决策系统中给出扩展的优势特征关系,集中讨论了属性值粗化细化时,上下累积集的增量更新规律及其算法。但两文在处理遗漏型未知属性值时,为讨论方便,均认为其可以等于任意值,既优于任意值又劣于任意值,显然这对未知属性值的要求太过宽松,容易将不属于同一类的对象误分到同一类中,影响粗糙集模型的应用效果。本文针对这一问题,深入分析属性值域的偏序关系,在广义不完备序决策系统中提出一种新特征优势关系,并依据定义的新特征优势关系给出累积集的近似集和边界,从而获取分类决策规则。同时与已有的基于特征优势关系的粗糙决策模型进行了对比分析,理论和实例均验证了基于新特征优势关系的粗糙决策模型的有效性和实用性。
假设决策属性集D把论域U分成有限的决策类,CL={Clt,t∈T},T={1,2,…,n},每个对象属于一个且仅属于一个决策类Clt,并且假定这种分类是有序的,即对于所有的r,s∈T,若r>s,则Clr中的对象优于Cls中的对象。为了处理多属性的偏好信息,定义两种累积集。
定义1设Clt是一决策类,定义向上累积集和向下累积集分别为:
定义2给定广义不完备序决策系统S′=<U,AT∪D,V,f> ,集合 P⊆AT ,P 上的特征优势关系CD(P)定义为:
新特征优势关系充分利用优势关系中属性值域的偏好次序,既保留了缺席型未知属性值不允许被比较的特点,又对确实存在且仅是被遗漏的遗漏型未知属性值进行了有效的约束。当决策系统S′中的所有未知属性值都被看作是遗漏型时,特征优势关系则退化为限制扩展优势关系[8];当S′中的所有未知属性值都被看作是缺席型时,特征优势关系则退化为相似优势关系[9],所以新特征优势关系是限制扩展优势关系和相似优势关系的进一步推广,对于信息不完全样本对象的分类更加符合实际。
由定义知,新特征优势关系具有下列性质:
性质1新特征优势关系满足自反性和传递性,对称性不一定满足。
(2)证明同(1)。
定理1表明了P的特征优势集与P的特征劣势集之间的关系。
(1)根据式(6)可得以下决策规则:
证明由定义6、7和定理2及其推论1易得。
定理3表明,基于新特征优势关系的粗糙决策模型的近似分类精度和近似分类质量都要高于已有的特征优势关系下的粗糙决策模型的近似分类精度和近似分类质量,即本文提出的拓展粗糙集决策分析模型要优于已有的决策分析模型。
表1为某班级教师对部分学生的一个综合评价表(表中的“?”表示该生没有选修相应的课程,“*”表示该生选修了相应课程,但成绩弄丢了)。
表1 某学校教学管理信息系统中的一个信息表
在表1中,对象全集U={1,2,…,8};c1,c2和c3是条件属性,分别表示课程1,2和3;总评d是决策属性。令P={c1,c2,c3},VP={优,良,中,差},优>良>中>差;Vd={优秀,良好,合格},优秀>良好>合格;Cl1={x∈U|f(x,d)=合格}={1,5} ,Cl2={x∈U|f(x,d)=良好}={2,3,6,7,8},Cl3={x∈U|f(x,d)=优秀}={4}。
利用已有特征优势关系下的粗糙决策分析方法计算结果如下:
(1)c1≤中∧c2≤中∧c3≤中→d∈Cl1,即学生三门课程的成绩至多为中,则学生的综合评价为合格;
(2)c1≤中∧c2≤差∧c3=?→d∈Cl1,即学生课程1的成绩之多为中,课程2的成绩为差,课程3的成绩为缺席型未知值,则学生的综合评价为合格;
(5)c1=优∧c2=优∧c3≥良→d∈Cl3,即学生课程1和课程2的成绩为优,课程3的成绩至少为良,则学生的综合评价为优秀。
应用粗糙集方法直接在不完备信息系统中获取决策规则,避免了因完备化信息系统而造成信息丢失的影响,可以较好地解决不完备信息下的多属性决策问题。本文在同时具有缺席和遗漏型未知属性值的广义不完备序决策系统中,提出一种基于新特征优势关系的粗糙决策分析方法,克服了已有方法在粒度划分上过于宽松的不足,是已有粗糙决策分析方法的进一步推广。同时,本模型较好的处理了广义不完备序决策系统的规则获取问题,对系统的决策分析提供了一定的决策支持。
[1]Pawlak Z.Rough Sets:Theoretical Aspect s of Reasoning about Data[M].Norwell,Mass,USA:Klumer Acadimic Publishers,1991.
[2]Greco S,Matarazzo B,Slowinski R.Rough Approximation of a Preference Relation by Dominance Relation[J].European Journal of Operation Research,1999,117(1).
[3]Greco S,Matarazzo B,Slowinski R.Rough Sets Theory for Multi-criteria Decision Analysis[J].European Journal of Operational Research,2001,129(1).
[4]Greco S,Matarazzo B,Slowinski R.Generalizing Rough Set theory Through Dominance-based Rough Set Approach[C].Heidelberg:Springer-Verlag,2005.
[5]何亚群,胡寿松.不完全信息的多属性粗糙决策分析方法[J].系统工程学报,2004,19(2).
[6]Shao M W,Zhang W X.Dominance Relation and Rules in an Incomplete Ordered Information System[J].International Journal of Intelligent Systems,2005,(20).
[7]胡明礼,刘思峰.基于广义扩展优势关系的粗糙决策分析方法[J].控制与决策,2007,22(12).
[8]骆公志,杨晓江,周德群.基于限制扩展优势关系的粗糙决策分析模型[J].系统管理学报,2009,18(4).
[9]Yang X B,Yang J Y,Wu C,et al.Dominance-based Rough Set Approach and Knowledge Reductions in Incomplete Ordered Information System[J].Information Sciences,2008,178(4).
[10]杨习贝,窦慧莉,宋晓宁等.广义不完备序值系统中的优势关系粗糙集[J].江苏科技大学学报(自然科学版),2011,25(3).
[11]Chen H M,Li T R,Ruan D.Maintenance of Approximations in Incomplete Ordered Decision Systems while Attribute Values Coarsening or Refining[J].Knowledge-Based Systems,2012,31.