样本信息处理中一种属性约简方法的研究

2005-04-29 12:14:47夏克文沈钧毅李昌彪
西安交通大学学报 2005年6期

夏克文 沈钧毅 李昌彪

摘要:为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似精度科学地定义了条件属性重要性,进而提出一种对样本信息进行属性约简的有效、简便方法.该方法主要包括信息核的求取、可省条件属性的重要性计算和相对属性约简集的确定.其中,为连续属性的离散化处理提供了一种基于模糊相似比原理的快速离散化算法,它能起到剔除模糊噪声的作用.典型实例计算和在油水层识别系统中的实际应用表明,这种属性约简方法的识别准确率可达90%以上,应用效果显著.

关键词:属性约简;样本信息;近似精度;连续属性离散化;模糊相似比

中图分类号:TPl8文献标识码:A文章编号:0253—987X(2005)06—0558—04