粗糙集理论条件属性重要性的确定

2021-03-11 09:39:56丽江师范高等专科学校教师教育学院何天荣
数学大世界 2021年2期
关键词:决策表约简流感

丽江师范高等专科学校教师教育学院 何天荣

一、涉及的基本概念

1.抽象知识和知识库

二、例谈知识约简的方法

不必要的知识(条件属性)对决策是没有任何参考价值的。以下通过某些病人的决策表来阐述知识约简的具体过程。

注:知识约简只需考虑条件属性,不需要考虑决策属性,为了节省篇幅,例1、例2 共用一个知识表达系统,所以本例的表格中也列出了决策属性。

例1:表1 是某些病人的决策表。

表1

U 是集合{m1,m2,m3,m4,m5,m6,m7,m8},C={头痛,肌肉痛,体温},设S=(U,A,V,f)为一知识表达系统,A 是属性集,即C ∪D,C ∩D 非空,C 表示条件属性集,D 表示决策属性集。我们称具有条件属性以及决策属性的知识表达系统为决策表。

设C1={头痛},C2={肌肉痛},C3={体温},则:

U/C1={{m1,m2,m3},{m4,m5,m6,m7,m8}},

U/C2={{m1,m2,m3,m4,m6,m8},{m5,m7}},

U/C3={{m1,m4},{m2,m5,m7},{m3,m6,m8}},

U/indC={{m1},{m2},{m3},{m4},{m5,m7},{m6,m8}},

因为U/ind(C-{c1})={{m1,m4},{m2},{m5,m7},{m3,m6,m8}}≠U/indC,所以条件属性C1在属性集C 中是必要的,即在诊断病人是否为流感时,{头痛}是必要考虑的症状。

因为U/ind(C-{c2})={{m1},{m2},{m3},{m4},{m5,m7},{m6,m8}}=U/indC,所以条件属性C2在属性集C 中是必要的,即在诊断病人是否为流感时,{肌肉痛}是不必要考虑的症状。

同理,U/ind(C-{c3})={{m1,m2,m3},{m4,m6,m8},{m5,m7}}≠U/indC,故条件属性C3在属性集C 中是必要的,即在诊断病人是否为流感时,{体温}是必要考虑的症状。

所以{C2,C3}是条件属性集C 的约简,得出的结论是,在考虑病人是否得流感时,{头痛}和{体温}是有必要参考的症状,而肌肉痛是没有参考价值的,即肌肉痛不痛与是否得流感没有逻辑关系。

三、条件属性重要性的确定

在决策表中,对于决策属性而言,不同的条件属性的重要性不是完全相同的,例如, 当由临床症状描述病人的情况时,有的条件属性(症状)对于诊断病人的病症具有更重要的意义。

为了找出某些条件属性的重要性,具体的处理方法是从表格中剔除某些属性,再来考查该属性的分类会如何变化,如果去掉该属性,分类变化较大,则说明这个条件属性的重要性高,反之,则说明该条件属性的重要性低。以下通过医生诊断病情的实例(决策表见例1)来说明确定条件属性重要性的具体过程。

综合以上计算的数据,得到的结论是,在决策表表1 中,在判断病人是否得流感的诊断中条件属性的重要性为:{体温}最重要,其次是{头痛},{肌肉痛}不重要,没有参考价值。

本文通过具体实例阐述了条件属性的约简方法及条件属性重要性的确定,对医生诊断病人的症状有一定的参考价值。

猜你喜欢
决策表约简流感
基于决策表相容度和属性重要度的连续属性离散化算法*
冬春流感高发 加强防治最重要
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
自动化学报(2018年2期)2018-04-12 05:46:01
基于模糊贴近度的属性约简
秋季谨防牛流感
兽医导刊(2016年12期)2016-05-17 03:51:15
正反转电机缺相保护功能的实现及决策表分析测试
一种改进的分布约简与最大分布约简求法
河南科技(2014年7期)2014-02-27 14:11:29
猪流感病的预防与治疗
不相容决策表求核方法