不完备决策信息系统规则提取的一种新方法

2016-04-06 01:06李长清张燕兰
关键词:约简粗糙集信息系统

李长清,张燕兰

(1.闽南师范大学 数学与统计学院,福建 漳州 363000;2.闽南师范大学 计算机学院,福建 漳州 363000)

不完备决策信息系统规则提取的一种新方法

李长清1,张燕兰2

(1.闽南师范大学 数学与统计学院,福建 漳州 363000;2.闽南师范大学 计算机学院,福建 漳州 363000)

针对不完备决策信息系统问题,文章引入容差关系下包含集的概念,并由此提出一种基于包含集的不完备决策信息系统规则提取的新方法.相对于常规方法,该方法计算量较少.最后,文章通过实例验证了该方法的可行性和有效性.

不完备决策信息系统;容差关系;包含集;规则提取

经典粗糙集理论是波兰数学家Pawlak Z于1982年提出的[1],它是一种处理不确定、不精确和不完全信息的数学工具,现已广泛应用于决策与分析、数据挖掘、机器学习、人工智能、专家系统、故障诊断[2-7]等领域.这种经典粗糙集理论研究的对象主要是基于等价关系下的信息系统.然而在实际应用中,由于数据测量、数据理解或获取的限制等原因,大量的数据存在不完全的现象,信息系统也成为不完备的.近年来,对不完备信息系统知识的获取已成为研究的热点.

1997年,Krysckiewicz M[8]在不完备信息系统中引入容差关系,给出了一种不完备信息系统下基于容差关系的粗糙集拓展模型.随后,很多学者针对不完备决策信息系统的不同情况,得到了许多规则提取的方法.例如,翟育明等[10]针对不完备信息系统中的偏好多属性决策问题,提出了一种基于均值限制相似优势粗糙集的决策分析模型;于海燕等[11]在不完备决策信息中将决策表进行分解,然后按决策表提供的确定信息进行分层提取而得到确定规则;黄兵等[12]研究了相容矩阵和分配决策矩阵,通过矩阵间的相互关系得到不完备信息系统的约简集,并实现对决策规则的提取;汪凌[13]引入相容关系下条件属性矩阵和决策属性矩阵的相关概念,并由此提出一种基于矩阵的不完备信息决策系统规则获取算法;胡峰等[14]提出了一种基于决策熵的不完备知识约简和规则提取方法.

为了推进不完备决策信息系统的进一步研究,本文基于不完备决策信息系统中容差关系的分类特点,给出包含集的概念,借助这个概念给出了一种有效的决策规则提取的新方法.

1 不完备决策信息系统的相关知识

定义1[4]设为一个决策信息系统,其中U是论域,A∪{d}是非空有限属性集,A为条件属性集合,{d}为决策属性集合,且A∩{d}≠∅.∀a∈A∪{d}有a∶U→Va,其中Va为a的值域.若存在u∈U,a∈A,使a(u)=*,则称S是不完备决策信息系统;否则称S是完备决策信息系统.

定义2[4]设S为不完备决策信息系统,∅≠B⊆A,B上的容差关系定义为:

TB满足自反性和对称性,但不满足传递性.u在B上的容差类为:TB={v∈U|(u,v)∈TB}.

定义3[4]设S为不完备决策信息系统,∅≠B⊆A.定义函数∂B∶U→2Vd为

则称∂B为S中的广义决策函数,其中2Vd为Vd的幂集.若∀u∈U,|∂B(u)|=1,(其中|∙|表示集合的基数),则称S是协调的不完备决策信息系统;否则,称S是不协调的不完备决策信息系统.

2 不完备决策信息系统的规则提取方法

在不完备决策信息系统的规则提取中,常规方法主要基于上、下近似进行决策.然而该方法不但要频繁计算上、下近似,而且忽视系统协调性的考虑.鉴于这个问题,以下我们定义决策属性相对于条件属性集的包含集,进而得到一种更简便有效的决策方法.

定义4 设S为不完备决策信息系统,∅≠B⊆A,U/TB={TB(u)|u∈U},定义U/TB的子集LB为:

在不完备决策信息系统中属性值存在许多空值情况,而对系统进行决策分析时,我们需要的是在空值任意取值时,都能保持规则为真.在进行大型的不完备决策信息系统的规则提取时,去掉U/TB中较大的类而得到子集LB,进而在子集LB中考虑问题,不仅可以有效地进行决策规则提取,而且可以减少工作量.定义5 设S为不完备决策信息系统,∅≠B⊆A,U/d={D1,D2,…,Ds}.d对B的协调包含集定义为:

d对B的不协调包含集为:

Ed(B)和(B)统称为d对B的包含集.以下我们给出d对B的包含集的分析:

(i)Ed(B)中的元素表示LB中能被U/d中某个元素所包含的类,得到的是系统中的确定性规则,表现了协调性.

(iii)当B={a}时,若U/TB={U},则a冗余.

步骤1 删除条件属性值都取空值的对象(因对象的属性值都取空值时得到的决策无任何意义),而得到新论域U0.

步骤2 在论域U0中,求La(a∈A)和U/d,根据定义5求Ed(a)和(a),删除冗余属性,得到新属性集A0.根据d对B的包含集得到单个属性所确定的所有决策(包含确定性和可能性规则).

步骤3 在A0中,由两个属性开始,逐次计算d对B的包含集,去掉冗余规则,从而得到所有规则(确定性和可能性规则).

3 实例分析

以下我们以一个实例来分析.

表1 不完备决策信息系统Tab.1Incomplete decision information system

4 小结

规则提取一直以来都是粗糙集理论的热点课题.在前人已有成果的基础上,本文在不完备决策信息系统容差关系下进行研究,通过简化容差类规则提取,但是不用计算上、下近似集,从而相对简便,而且规则提取时考虑了系统的协调性,更具有合理性.有关结论对不完备决策信息系统的研究具有一定的参考价值.

[1]Pawlak Z,Busse J G,Slowinski R,et al.Rough sets[J].Communications of the ACM,1995,38(11):89-95.

[2]王国胤.Rough理论与知识获取[M].西安:西安交通大学出版社,2001.

[3]张文修,仇国芳.基于粗糙集的不确定决策[M].北京:科学出版社,2005.

[4]杨春玲,张传芳.基于集对分析的混合型多属性决策方法的研究[J].数学的实践与认识,2008,38(21):134-142.

[5]莫京兰,吕跃进,郭恒.广义不完备信息系统中一种拓展粗糙集模型[J].计算机工程与应用,2012,48(19):126-130.

[6]陈家俊,苏守宝,金萍.一种对象完备度优先填补的决策树规则提取算法[J].计算机应用与软件,2014,31(5):264-267.

[7]Kryszkiewicz M.Rough set approach to imcomplete information systems[J].Information Sciences,1998,112(1-4):39-49.

[8]Kryszkiewicz M.Rules in imcomplete information systems[J].Information Sciences,1999,113(3-4):271-292.

[9]翟育明,阎瑞霞,李竹宁,等.均值限制相似优势粗糙集及决策分析模型研究[J].数学的实践与认识,2012,42(19):127-136.

[10]Pawlak Z:.Rough sets[J].International Journal of Computer&Information Sciences,1982,11(5):341-356.

[11]于海燕,王道平,张霞.基于粒计算的不完备信息系统的规则提取方法[J].计算机工程与应用,2009,45(8):143-145.

[12]黄兵,周献中.不完备信息系统分配约简与规则提取的矩阵算法[J].计算机工程,2005,31(17):20-22.

[13]汪凌.不完备决策系统规则获取的相容矩阵算法[J].计算机工程与应用,2015,51(1):130-142.

[14]胡峰,陈曦,王小燕.基于决策熵的不完备信息系统的知识约简方法[J].计算机工程与设计,2013,34(1):289-292.

责任编辑:吴兴华

A New Method for Rule Acquisition in Incomplete Decision Information Systems

LI Changqing1,ZHANG Yanlan2
(1.School of Mathematics and Statistics,Minnan Normal University,Zhangzhou363000,China;2.School of Computer,Minnan Normal University,Zhangzhou363000,China)

To solve the problem of incomplete decision information systems,the article introduces the concept of inclusion set under tolerance relation and proposes a new method for rule acquisition in incomplete decision information systems based on inclusion set.Compared with the common method,the new method requires minor calculation.Finally,an illustrative ex⁃ample is given to show the feasibility and effectiveness of this method.

incomplete decision information systems;tolerance relation;inclusion set;rule acquisition

TP 18

:A

:1674-4942(2016)04-0369-04

10.12051/j.issn.1674-4942.2016.04.003

2016-09-22

国家自然科学基金(11526109,11471153,11571158);福建省自然科学基金(2016J01671,2015J05011);福建省省属高校专项资助项目(JK2014028);福建省杰出青年人才培育计划

猜你喜欢
约简粗糙集信息系统
企业信息系统安全防护
基于粗糙集不确定度的特定类属性约简
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
优势直觉模糊粗糙集决策方法及其应用
基于区块链的通航维护信息系统研究
实值多变量维数约简:综述
信息系统审计中计算机审计的应用
广义分布保持属性约简研究
多粒化粗糙集性质的几个充分条件