陈生海++罗水琼
摘 要:本文通过给出例证指出历史文献中关于决策规则的性质的不完备之处。并且给出使这些性质成立的充分必要条件,这能更好的运用粗糙集理论的方法选择准确的决策规则,从而提高决策的高效性。
关键词:粗糙集,决策表,决策规则
0 引言
为了从海量数据中提取未知的、隐藏的有用的知识,近几年来,已经提出了许多基于归纳学习的理论方法,其中1982年Pawlak教授提出来的粗糙集理论[1],在这方面起着重要的作用。它已被成功应用于模式识别、机器学习和知识获取等领域[2][3]。
命题1:设决策规则r:C→xD,则如下的性质成立。
说明:性质(5)和(6)是通过性质(1),(2),(3),(4)推理得来的。
我们通过一个例证对命题1进行验证,指出其不完备之处。同时,给出使命题1中性质成立的充分和必要条件,这些结果将有助于分析人员通过粗糙集理论的方法选择正确的决策规则,提高决策的有效性。
1 决策规则
1.1 规则定义
粗糙集理论为决策表表示的样本数据提供了产生规则的方法,决策表中每一行表示一个对象,列为描述对象的属性,那么决策规则可以定义为:
定义1.1 给定决策表S=(U,C,D),其中U为非空的有限论域,C和D分别为条件属性和决策属性集合,。对于,有一个序列C(c1(x),…, cn(x)),D(d1(x),…,dn(x)),其中{c1(x),…,cn(x)}为条件属性集,{d1(x),…, dn(x)}为决策属性集,则一条决策规则可以表示为c1(x),…, cn(x) →d1(x),…, dn(x)或简写为当且仅当C(x)∩D(x)≠?。
1.2 规则度量
用粗糙集理论进行分类规则挖掘时,往往产生大量的分类规则,其中包含了由于噪声的影响而产生的规则。
给定决策表S=(U,C,D),C(x)和D(x)分别为根据条件属性和决策属性对论域的划分;
为条件类粒度和决策类粒度,其中|U|表示集合U的基数。
定义1.2
称为决策表S中规则 的支持度,规则支持度表示了满足此规则的对象占全部样本的百分比,亦可理解为规则 的强度。
2 性质成立的充要条件
根据上述实例的分析可知,规则的性质只针对部分对象是成立的。在本章中我们将从规则度量的指标层面给出一些使命题1中性质(1)-(6)成立的充分必要条件。
我们根据粗糙集理论中等价类的概念,可得如下的引理。
引理1:对于任意对象x, y∈U,可以得出:
(1) C(x)=C(y) iff y∈C(x)
(2) D(x)=D(y) iff y∈D(x)。
首先,我们来讨论命题1中的性质(1)和(2)。
定理1:对于给定对象x∈U,决策规则C→xD,那么以下表达式是等价的。