郭 庆, 戴习民
(1.合肥工业大学 数学学院,安徽 合肥 230009; 2.合肥工业大学 管理学院,安徽 合肥 230009)
区间值信息系统的多粒度粗糙集及其决策
郭 庆1,2, 戴习民1
(1.合肥工业大学 数学学院,安徽 合肥 230009; 2.合肥工业大学 管理学院,安徽 合肥 230009)
文章从多粒度视角研究了区间值信息系统(interval-valued information system,IvIS),定义了多粒度容差关系,给出了乐观和悲观的2种模型,研究了其性质及其与单粒度模型的联系与区别;然后定义了区间值决策系统(interval-valued decision system,IvDS)的多粒度决策规则的置信度因子及决策规则提取方法,并且给出了决策规则支持定理及其证明;最后通过一个算例验证了所提理论方法的正确性与有效性。
多粒度;粗糙集;区间值信息系统(IvIS);决策规则;置信度因子
粗糙集理论经过了30多年的研究与发展,已在理论和应用中取得了长足的进展,被广泛应用于数据挖掘、知识获取等领域中[1-2]。但从粒计算角度来说,现有的模型都是建立在单粒度基础上的,称之为单粒度粗糙集。这种单个等价关系从某种程度上限制了对数据的处理。为此,文献[3]在此基础上将单粒度粗糙集模型拓展到多粒度情形。近几年来多粒度粗糙集吸引了大量的研究学者,例如文献[4]研究了悲观多粒度粗糙集的决策问题;文献[5]于模糊近似空间建立了模糊粗糙集的多粒度模型并加以应用;文献[6]建立了邻域信息系统的1-型和2-型多粒度粗糙集模型。
在许多现实问题中,信息系统中的数据由于噪声、获取缺损的信息等因素,导致许多数据不再是确定的值,而属于某一范围即以区间值形式存在。例如政府信息公开中,各种指标的评价值往往只是一个范围,高校学生对教师教学水平各项指标的评价值也是一个范围等。这种形式的数据表称为区间值信息系统(interval-valued information system,IvIS)[7]。近年来,IvIS的属性约简理论得到了大量的研究与应用,详细内容可参考文献[8-10]。
但是现有的多粒度粗糙集模型涉及到IvIS的研究甚少。本文针对此问题引入多粒度容差关系,构建IvIS的乐观多粒度粗糙集模型和悲观多粒度粗糙集模型,对它们的基本性质和单粒度模型之间的区别及其联系进行讨论,从多粒度视角给出了区间值决策系统的规则提取方法与规则的置信度因子。
1.1 区间值信息系统(IvIS)
定义2[8]设T=(U,A)是一个IvIS,a∈A,λ∈[0,1]。定义T上关于a的λ-容差关系如下:
其中,|·|表示集合的基数。关于区间数的交与并运算可参考文献[7]。样本x关于a的λ-容差类定义为:
1.2 多粒度粗糙集
在多粒度粗糙集中,一个目标概念是用一族等价关系而非单个等价关系来近似的,根据近似的要求不同,通常分为乐观多粒度粗糙集与悲观多粒度粗糙集2种模型。
其中,[x]Ai={y:(x,y)∈RAi}是由所有与样本x基于属性集合Ai导出的等价类组成的集合。
定义4 设T=(U,A)表示一个信息系统,Ai⊆A(i=1,2,…,m)表示m个属性子集,对任意的X⊆U,关于Ai的悲观多粒度下、上近似集分别定义为:
2.1IvIS的多粒度粗糙集模型
定义6 设T=(U,A)是一个IvIS,Ai⊆A(i=1,2,…,m)表示m个属性子集,λ∈[0,1]。对任意的目标集合X⊆U,上述容差关系下的乐观多粒度下近似集、上近似集及边界集定义为:
定义7 设T=(U,A)是一个IvIS,Ai⊆A(i=1,2,…,m)表示m个属性子集,λ∈[0,1]。对任意的目标集合X⊆U,上述容差关系下的悲观多粒度下近似集、上近似集及边界集定义为:
2.2 模型相关性质
由定义6与定义7可得下列性质。
性质1 设T=(U,A)是一个IvIS,Ai⊆A(i=1,2,…,m)表示m个属性子集,λ∈[0,1],X,Y⊆U,则
证明 此处只证明乐观的情况,悲观的情况类似。
性质2 设T=(U,A)是一个IvIS,Ai⊆A(i=1,2,…,m)表示m个属性子集,λ∈[0,1],X⊆U,则
证明 只证明每个性质的前半部分,后半部分证明类似。
(2) 证明与(1)类似,从略。
性质2揭示了目标集合在单个粒度与多个粒度下的上下近似之间的等价关系。
从决策表中导出决策规则是粗糙集理论最重要的应用之一,区间值决策系统(interval-valued decision system,IvDS)中的决策规则可由下近似集中的对象所支持,所得到的决策规则是确定型规则;而可能型规则由边界域中对象所支持。本节给出多粒度背景下IvDS决策规则的前件的逻辑连接词是“或”而非“且”的决策规则。
其中,[x]d表示在决策属性d下与x同一等级的对象。
(2) 证明与(1)的证明类似。
定理1表明在IvDS中的确定性“或”规则可由乐观多粒度下近似集中的对象支持;可能性“或”规则可由悲观多粒度边界集中的对象支持。
基于多个专家评估的决策系统见表1所列,其中xi表示学生;ai表示第i个专家基于本领域的知识给出的评价值。考虑到评估的不确定性,
这里都用区间值来表示,设Ai={ai},d表示学生综合分值,U/D={D1,D2,D3}={(x4),(x1,x3),(x2,x5,x6)}。
取容差水平λ=0.2,由定义2、定义6和定义7可计算出:
表1 专家评估决策系统
由定理1可得该决策系统的确定性“或”决策规则如下:
f(x,a1)∩[1.35,2.12]>0.2∨f(x,a2)∩[1.42,2.09]>0.2∨f(x,a3)∩[3.58,3.93]>0.2∨f(x,a4)∩[1.87,2.62]>0.2→d(x)=1,由样本x4支持。
f(x,a1)∩[2.17,2.86]>0.2∨f(x,a2)∩[2.45,5.11]>0.2∨f(x,a3)∩[5.32,7.23]>0.2∨f(x,a4)∩[3.21,3.95]>0.2→d(x)=2,由样本x1支持。
f(x,a1)∩[1.83,2.70]>0.2∨f(x,a2)∩[1.78,2.98]>0.2∨f(x,a3)∩[7.23,10.27]>0.2∨f(x,a4)∩[2.96,4.07]>0.2→d(x)=2,由样本x3支持。
f(x,a1)∩[3.37,4.75]>0.2∨f(x,a2)∩[3.43,4.85]>0.2∨f(x,a3)∩[7.24,10.47]>0.2∨f(x,a4)∩[4.00,5.77]>0.2→d(x)=3,由样本x2支持。
f(x,a1)∩[1.00,4.75]>0.2∨f(x,a2)∩[3.37,5.11]>0.2∨f(x,a3)∩[6.37,10.28]>0.2∨f(x,a4)∩[3.76,5.70]>0.2→d(x)=3,由样本x5支持。
上述结果表明,多粒度模型能够从决策系统中导出更为宽松的决策规则,从而使实际决策更合理。
本文研究了IvIS的多粒度粗糙集理论,定义了乐观和悲观2种模型,研究了其性质以及与单粒度模型之间的关系,并且给出了多粒度IvDS决策规则的置信度因子及其决策规则的获取方法,最后通过实例加以验证。作为粗糙集理论的一个较新的研究方向,多粒度粗糙集为决策问题提供了新的思路与方法,下一步研究工作的重点是在多准则决策分析方面的应用。
[1] PAWLAK Z.Rough set theory and its applications to data analysis[J].Cybernetics and Systems,1998,29(7):661-688.
[2] 张勇,张丽,刘心报,等.基于限制优势关系粗糙集的高校学生心理危机预警要素分析[J].合肥工业大学学报(自然科学版),2013,36(12):1523-1527.
[3] QIAN Y H,LIANG J Y,YAO Y Y.MGRS:A multi-granulation rough set[J].Information Sciences,2010,180(6):949-970.
[4] QIAN Y H,SANG Y L,LIANG J Y.Pessimistic rough set based decisions:a multi-granulation fusion strategy[J].Information Sciences,2014,264(2):196-210.
[5] XU W H,WANG Q R.Multi-granulation fuzzy rough sets in a fuzzy tolerance approximation space[J].International Journal of Fuzzy Systems,2011,13(4):246-259.
[6] LIN G P,QIAN Y H,LI J J.NMGRS:Neighborhood-based multigranulation rough sets[J].International Journal of Approximate Reasoning,2012,53(7):1080-1093.
[7] 郭庆,刘文军,焦贤发.一种基于模糊聚类的区间值属性约简算法[J].模糊系统与数学,2013,27(1):149-153.
[8] LEUNG Y,MANFRED M F.A rough set approach for the discovery of classification rules in interval-valued information systems[J].International Journal of Approximate Reasoning,2008,47(2):233-246.
[9] DU W S,HU B Q.Approximate distribution reducts in inconsistent interval-valued ordered decision tables[J].Information Sciences,2014,271(1):93-114.
[10] ZHANG H Y,LEUNG Y,ZHOU L.Variable-precision dominance based rough set approach to interval-valued information systems [J].Information Sciences,2013,244(1):75-91.
(责任编辑 朱晓临)
Multi-granulation rough set and decision in interval-valued information system
GUO Qing1,2, DAI Ximin1
(1.School of Mathematics, Hefei University of Technology, Hefei 230009, China; 2.School of Management, Hefei University of Technology, Hefei 230009, China)
Interval-valued information system(IvIS) is investigated from the perspective of multi-granulation. The optimistic model and pessimistic model are proposed by multi-tolerance relation. Then their properties are researched and the differences and relationships compared with single-granulation model are discussed. Moreover, the certainty factor of the decision rule as well as acquisition method of interval-valued decision system(IvDS) is given. The decision rules support theorem is proposed and proved. Finally, a numerical example is given to demonstrate the correctness and effectiveness of the proposed method.
multi-granulation; rough set; interval-valued information system(IvIS); decision rule; certainty factor
2015-08-17;
2015-11-23
国家自然科学基金资助项目(71131002);中央高校基本科研业务费专项基金资助项目(2015HGZX0019);安徽省省级质量工程专业综合改革试点资助项目(2012zy007)和名师(大师)工作室资助项目(2015msgzs126)
郭 庆(1979-),男,安徽霍邱人,合肥工业大学讲师.
10.3969/j.issn.1003-5060.2017.02.027
O159
A
1003-5060(2017)02-0284-05