约简
- 基于最小约简的粗糙集数据挖掘算法研究*
,需要寻求有效的约简算法以扩展经典粗糙集理论。本文提出一种基于最小约简的粗糙集数据挖掘算法,优化改进传统粗糙集在数据挖掘领域应用的不足。2 算法原理约简算法在数据挖掘领域,用于在原始数据集中发现最小子集,并将数据进行分类。相关学者通过分析数据的内在关联提出了几种主流约简算法。Connolly等[7]提出利用属性值获取最小约简的方法,但计算准确度较差;Y.He 等[8]利用深度层次聚类算法计算最小约简,计算的准确度有所提高,但耗时较大;B. Xu 等[9]提
计算机与数字工程 2023年1期2023-05-12
- 知识库的相对约简与拓扑约简
糙集理论中,知识约简是重要的课题,也是获取知识的重要步骤.论域U上的知识指U上的某个等价关系,知识库指的是U上的一族等价关系,文献[2]论述了知识库的多种约简理论.赵静,徐罗山在文献[3]中研究了知识库的知识约简和知识表达系统的属性约简的转化和联系.王长忠等在文献[4]中把知识库推广为关系信息系统,它实际为U上的一族二元关系.文献[5]则把U上的任一子集族称为一个抽象知识库.本文强调与抽象知识库的区别,把关系信息系统仍称为知识库.李旭等在文[6]中定义了相
高校应用数学学报A辑 2022年3期2022-09-29
- 基于贴进度的模糊决策表属性约简启发式算法
,此过程称为属性约简〔6〕。目前几乎所有的关于基于模糊粗糙集的属性约简的研究都是从文献〔7〕开始的,但是由于这种方法完全是从形式上把经典粗糙集中相应的方法甚至符号照搬过来,对基于模糊粗糙集的属性约简的本质没有清楚的认识,因而导致设计的属性约简算法不收敛。对此,Cheng 等〔8〕通过模糊粗糙集的粒结构引入辨识矩阵的方法来计算属性约简,但是通过实例发现,某些情况下求出核属性后条件属性却无法进行有效约简。本文提出一种新的约简算法,首先利用贴进度生成可辨识矩阵,
大理大学学报 2022年6期2022-07-07
- 基于分离优势覆盖集的Pythagorean模糊决策信息系统的属性约简
了应用空间.属性约简是指从原始的属性集中去除冗余的属性且保持核心属性不变,这在信息处理方面有着重要的作用.去除冗余数据,不仅减少干扰决策的影响因素,还能充分利用运行空间,避免不必要的浪费.由此可见,属性约简是数据分析的重要组成部分.对于基于正域的属性约简,邓大勇等[8]提出了可变正域的约简,即允许正域在一定范围内发生变化,因此提高了泛化能力; 对于基于商集的属性约简,Thuy等[9]提出了分离商集及D-分离商集,并将其用于决策信息系统的属性约简中,提高了处
河北师范大学学报(自然科学版) 2022年2期2022-03-08
- 基于确定性因子的启发式属性值约简模型
4-5]。属性值约简是粗糙集理论研究和应用的核心课题之一,也是构建规则提取算法[6-13]和归纳规则分类器[14-15]的重要技术基础。属性值约简是指在不影响决策系统知识表达能力的前提下,去除其中冗余属性值的过程[16],它不但能够从原始数据库中直接提取出可读性高、便于应用的简约规则,而且还能在不降低专家系统可分辨性的基础上提高其清晰度,并从中揭示出以往未知、有潜在价值的信息,从而实现知识发现[10,16]。目前,针对构建属性值约简模型这一问题,学术界已经
计算机应用 2022年2期2022-03-01
- 多源数据矩阵增量约简算法
计算动态多源数据约简的问题,因为不能有效利用原有的计算结果,导致求解动态分布数据约简就会花费很多时间,使得计算效率很低。为了克服上述静态算法的缺陷,一些研究者把增量学习技术应用到粒计算和粗糙集理论中。增量学习技术可以充分利用原有的计算结果,避免重复计算,提高计算效率。目前很多学者把增量技术应用到求解信息系统约简的问题中。这些增量方法主要用来去计算信息系统对象、属性和属性值发生变化后的约简问题。首先,一些学者针对对象添加到信息系统后如何迅速计算其约简问题,提
计算机工程与应用 2022年3期2022-02-24
- 基于粗糙集不确定度的特定类属性约简
糙集理论中,属性约简是核心内容与研究热点,其主要在保持相同分类能力的前提下进行冗余属性删除,从而达到数据表的优化处理.决策表具有3层粒度结构[2],在约简方面涉及到系统决策分类与局部决策类2种主体.传统的属性约简是决策分类约简,主要考虑所有决策类的整体优化.针对实际中存在的局部优化需求,特定类约简应运而生,并改进了决策分类约简的盲点.文献[3]基于正域首先建立特定类约简,文献[4-5]分别从信息度量与三支决策角度推进特定类约简,文献[6-8]分别从邻域粗糙
四川师范大学学报(自然科学版) 2021年6期2021-11-15
- 一种局部视角的类别近似质量属性约简加速方法
)0 引 言属性约简,作为粗糙集理论研究的核心问题,不仅能有效降低数据的维度,且所得约简结果具有明确的语义解释,因而受到广泛的关注[1-7]。所谓属性约简,是指利用在某种度量标准上构造的约束条件,删除数据中冗余的属性,以提升后续学习算法的性能[8-9]。在粗糙集理论中,近似质量[10]作为一种常用的度量标准,可以用于刻画样本空间的不确定性。具体而言,近似质量用下近似集合中的样本占所有样本比例的大小来表征不确定性的程度。近似质量的变化可以表现为下近似集合中样
计算机应用与软件 2021年11期2021-11-15
- 基于区间值信息系统的信息熵增量式属性约简算法
38000)属性约简是粗糙集理论和粒计算理论的重要研究问题[1-2],其目的是为了消除数据集内部的冗余属性,提高数据集的知识发现性能。然而实际应用中的数据集总是处于不断动态更新之中,针对这类数据环境,一种被称为增量式属性约简的方法被提出[3-5],从而提高了动态数据的属性约简性能。针对增量式属性约简,学者在各种类型的信息系统进行了相关的研究。Shu等[6]在传统的完备型信息系统中提出了对象增加时的增量式属性约简算法;在不完备信息系统方面,丁棉卫等[7]利于
绥化学院学报 2021年9期2021-09-01
- 面向连续参数的多粒度属性约简方法研究
论与方法中,属性约简问题[5-10]一直是众多学者关注的焦点。作为一种特征选择机制,约简的目的是获得满足给定约束条件的最小属性子集,进而达到降低不确定性、提升学习器泛化性能等目的。在数据分析中,属性约简中的约束条件往往可以通过一些度量准则进行构造,如近似质量、条件熵等[6,8]。经典粗糙集方法仅能处理符号型数据,但在解决实际应用问题时,连续型数据是广泛存在的。因此已有诸多学者构建了很多拓展的粗糙集模型以用于分析及处理连续型数据:如基于高斯核函数的模糊粗糙集
计算机与生活 2021年8期2021-08-07
- 基于可辨识矩阵的属性约简算法及应用
[3-4].属性约简[5-7]是粗糙集理论研究的主要内容之一,由于在原始数据集中,往往存在大量冗余和不确定性的信息,严重影响到后续数据挖掘和处理的效率.因此,通过删除冗余属性,能获得数据集合的本质信息和保持原始数据分类信息的完整性,从而提高数据的分类质量.目前粗糙集属性约简方法的研究已经取得了很多成果,各种高效的启发式约简算法相继被提出,这些启发式约简算法主要目的是寻找一个约简或近似约简.譬如,鲍迪等针对区间值决策表中对象集动态增加的情况,提出了区间值决策
大学数学 2021年3期2021-07-09
- 基于差别矩阵的区间值决策系统β分布约简
于许多领域。属性约简[1-7]是粗糙集理论的核心研究内容之一。当前,消除不必要的属性、缩小数据规模从而加速数据的处理显得尤为重要,而属性约简的目的就是尽可能消除数据中不必要的属性,得到决策系统中某种分类特征不变的最小属性子集。通过属性约简既可以缩小数据规模又不会破坏知识的原始信息,恰好满足了当前的需求。目前已经有许多学者对知识约简做了大量工作。1992年,Skowron 等[8]提出了一种基于差别矩阵的正域约简方法,随后国内外许多学者对此做了大量的扩展工作
计算机应用 2021年4期2021-04-20
- 快速求解粒球粗糙集约简的属性划分方法
域粗糙集进行属性约简[4-6]这一问题的研究时,往往需要通过大量的尝试或采用一定的参数搜索策略来设置邻域半径的大小[7-9],这势必会带来极大的时间消耗。为了克服邻域粗糙集中半径选取这一困难,已有相关学者借助自适应的理念,提出了一些能够自主确定半径大小的策略。例如,Zhou等[10]面向在线特征选择问题,提出了Gap邻域的概念,其使用样本间距离的差值确定邻域的大小,从而生成较为紧凑的Gap邻域粒结构;Xia等[11]为提升大规模数据中分类任务的效率,提出了
南京理工大学学报 2021年4期2021-04-09
- 基于0-1规划的最小属性约简算法
前提下,通过知识约简,导出问题的决策或分类规则[1]. 属性约简是粗糙集理论中的核心内容之一.数据库中的属性并不是同等重要的, 甚至其中某些知识是冗余的,通过属性约简, 可以去除数据库中的冗余、无用的成分, 揭示数据中隐含的规律.从粗糙集理论的角度来理解, 在一个信息系统中, 有些属性对于分类来说是多余的, 去掉这些属性后,信息系统的分类能力不会改变, 所以属性约简后仍然反映了一个信息系统的本质信息[2-6].一般来讲,一个信息系统的属性约简不是唯一的,通
洛阳师范学院学报 2021年2期2021-03-31
- 伪标签邻域粗糙集下的属性约简加速策略
邻域粗糙集。属性约简[14-17]作为粗糙集理论中备受关注的问题之一,已经得到众多学者的重视。目前,有关约简求解的方法主要有:穷举法[18,19]和基于适应度函数的启发式方法[14]。尽管穷举法可用于求解所有的约简,但过于复杂和耗时。这也是基于适应度函数的启发式方法受到广泛关注的原因。基于伪标签邻域粗糙集的属性约简问题,可以使用启发式方法来进行求解。但值得注意的是,在不同的半径下进行属性约简时,往往会得到不同的约简结果,而对于不同约简结果,其意义或泛化性能
计算机工程与设计 2020年11期2020-11-17
- 基于矩阵方法的区分度增量式属性约简算法
的重要分支,属性约简[2]是粗糙集理论的重点研究内容。属性约简的目的是为了将原始信息系统的冗余属性进行甄别和删除,从而提高数据集的知识发现性能。然而随着信息技术的发展以及数据采集技术的提高,实际应用环境下的数据总是时刻处于动态更新之中,传统的各种属性约简算法是针对静态的数据设计的,而对于动态的数据集,这些算法的处理效率较为低下,不能很好地适应实际的工程需求[3-4]。为了改善动态数据下的属性约简性能,学者们提出了一种改进的属性约简方法——增量式属性约简[5
计算机应用与软件 2020年9期2020-09-09
- 二进制辨识矩阵的属性约简及不必要属性的求解
的研究.其中属性约简是粗糙集理论研究的主要内容.在对约简的研究中,利用二进制求约简是一个重要分支.二进制辨识矩阵是对skowron辨识矩阵[1]的改进,采用二进制表示形式,使计算更加简单直观.因此,采用二进制辨识矩阵进行属性约简具有一定的意义.Hu等人在1995年提出了基于skowron矩阵的核属性求解算法[2].Felix等人[3]在1999年提出了只由0和1构成的二进制可辨识矩阵.文献[4]利用Felix提出的二进制可辨识矩阵计算核属性并得出相应的属性
太原师范学院学报(自然科学版) 2020年3期2020-08-13
- 带权决策表的属性约简
了成功应用。属性约简是粗糙集研究的重要内容之一,其主要思想就是根据特定规则要求,删除冗余属性,得到知识分类最小属性子集。目前,属性约简已取得了大量的理论研究成果。将决策表和不同应用背景相结合,研究人员提出了正域约简[2-3]、变精度约简[4-5]、分配约简[2,6]、覆盖约简[7-8]、分布约简[9]、局部约简[10-12]等多种类型的约简。已有的研究已通过容差关系[13]、量化容差关系[14]、限制容差关系[15]等拓展了正域约简的应用范围。Liu[16
计算机工程与应用 2020年12期2020-06-18
- 信息系统的最大可能约简算法
前提下,通过知识约简,导出问题的决策或分类规则.经过多年的发展,该理论已被成功地用于机器学习、决策分析、过程控制、模式识别和数据挖掘等领域[1].属性约简是粗糙集理论中的核心研究内容之一[2-3].数据库中的属性并不是同等重要的, 甚至其中某些知识是冗余的,通过属性约简, 可以去除数据库中的冗余、无用的成分, 从而揭示数据中隐含的规律.从粗糙集理论的角度看, 在一个信息系统中, 有些属性对于分类来说是多余的, 去掉这些属性后,信息系统的分类能力不会改变,
洛阳师范学院学报 2020年2期2020-03-23
- 带权决策表的变精度约简算法
的应用领域.属性约简是粗糙集理论研究的重要内容,其主要思想就是根据特定规则要求,删除冗余和不相关属性,构成知识分类最小属性集.许多学者对正区域约简、变精度粗糙集模型进行了深入研究,在经典粗糙集模型约简中,二元关系是等价关系,为了更好处理信息丢失的决策表,已有研究通过容差关系[3]、相似关系[4]、量化容差关系[5]、限制容差关系[6]拓展了粗糙集约简研究.目前,Liu[7]在一致决策表和不一致决策表上提出了一般关系,从而推广了决策表中的二元关系,并研究了关
小型微型计算机系统 2019年10期2019-11-11
- 基于知识粒化的信息系统增量式属性约简
35000)属性约简是粗糙集理论[1]在机器学习和知识发现等领域中一种常用的数据处理工具,它通过对数据中冗余属性进行删除从而达到更好的分类性能。在现实的数据中,数据快速更新,每时每刻都有新的数加入,而传统的非增量式属性约简在求动态数据的约简集时需要进行大量的重复计算,这样消耗了大量的时间和空间,不能很好地满足实际的需求[2,3]。增量式属性约简[2,3]相对于传统的属性约简,是一种专门针对动态数据集的约简方法,它能够在原先约简集的基础上进一步导出更新后数据
测控技术 2019年8期2019-09-10
- 面向特定类的三支概率属性约简算法
高维数据进行属性约简可以提高分类算法的效率和分类性能,且能降低分类过程中的测试代价和误分类代价,因此,属性约简在近些年得到了广泛关注和研究.然而,在经典粗糙集模型的属性约简中,不确定性度量呈现的单调性在三支决策的属性约简中不再成立,于是研究学者们相继提出三支属性约简,这些三支约简方法主要分为三支宏观属性约简和三支微观属性约简.三支宏观属性约简适用于决策类是相互关联的决策系统,即获取所有决策类下的三支属性约简.例如,Chen等人为邻域系统构建基于条件熵的三支
小型微型计算机系统 2019年9期2019-09-09
- 面向局部多约束的属性约简方法研究*
的构建以外,属性约简[2-5]是粗糙集理论中公认的一个核心研究问题。所谓属性约简,一般来说可以理解为从所有属性中找出一些满足给定约束条件的属性子集。这些约束条件大多是建立在由粗糙集模型与方法所得到的一些度量(如近似质量[6]、条件熵[7]、决策错误率[8]等)基础上的,具体的约束可以是找到一些属性子集能够保持这些度量或在给定的阈值范围内达到预期的度量标准。例如,将近似质量作为约简约束条件中的度量,利用启发式算法可以求得一个使得近似质量满足给定约束的最小属性
计算机与生活 2019年5期2019-07-18
- 直觉模糊序决策系统的部分一致约简*
序信息系统的属性约简,其中包括一致直觉模糊序决策系统的相对约简。针对不一致直觉模糊序决策系统,国内学者提出了分布约简和最大分布约简,并证明了二者的等价性[12-13]。另外,与基于等价关系的不一致系统类似[14-15],序决策系统还存在分配约简[16]、部分一致约简[17]以及其他形式的约简[18-20]。徐伟华等将分配约简引入到直觉模糊序决策系统[21],并将部分一致约简推广到区间值模糊序决策系统的情形[22],但对直觉模糊序决策系统目前尚未展开相关的讨
计算机与生活 2019年3期2019-04-18
- 几类拓展粗糙集模型属性约简研究综述
广泛应用,其属性约简算法作为数据预处理的有效方法也受到国内外学术界的广泛关注.属性约简也称特征选择,指的是从原始属性集合中选出具有代表性的属性子集,是粗糙集理论研究的重点内容之一.特征选择可以在不影响最终决策质量的前提下,有效去除数据的噪声和冗余特征,提高学习效率[26]. 目前,各国学者经过不断努力,基于概念格、决策树、随机森林、支持向量机、粗糙集等理论设计出各类特征选择算法. 其中,基于粗糙集理论的特征选择算法不仅可以求解最优或次优约简结果,而且能够在
宜宾学院学报 2019年12期2019-03-05
- 邻域粗糙集约简算法在图像特征选择中的应用
的数值型数据属性约简算法,但该算法为静态约简算法。现在已经有学者在其基础上提出动态约简算法,这些算法都从代数观分析其动态更新过程。而通过文献[4]可知信息观在不一致决策方面要优于代数观。因此,从信息观研究基于邻域粗糙集的动态约简算法具有重要的理论意义。行人检测在计算机视觉等领域有着重要的应用[4-6]。目前基于计算机视觉的行人检测大多是基于特征提取和机器学习的方法[7-9]。运用特征描述行人与背景的区别。经过这些年的科学发展,学者已经提出很多有效的行人检测
现代电子技术 2018年21期2018-11-13
- 模糊决策表中基于OWA算子的三支属性约简
前提下,通过知识约简导出问题的决策规则。这种模型在完备的信息系统中得到了成功运用[1,2]。在模糊决策表中,数据往往被认为是一个模糊概念,于是研究者们对经典的粗糙集理论进行扩充[3,4]。许多学者在构造各种不同区分关系的基础上,讨论各种属性约简的理论和方法,并进行了相关应用研究[5,6]。管涛[7]等基于模糊集合的贴近度,构造模糊相似关系,取其截集后得到不可区分关系,利用水平集粗糙成员函数给出分布约简与分配约简;Jensen和Shen提出以依赖度函数作为启
数据采集与处理 2018年4期2018-09-10
- 不协调区间值决策系统的最大分布约简
64005)属性约简[1-7]是粗糙集理论[1-3]的核心研究内容之一,在数据挖掘、机器学习、决策分析、智能信息处理等领域取得了诸多研究成果。属性约简的目的是删除冗余属性,只保留使决策表某种分类特征不变的最小属性子集。差别矩阵方法是一种用于求取所有属性约简的有效方法,该方法由Skowron[8]于1982年提出,并将差别矩阵应用于正域约简中。诸多学者在此基础上做了大量的研究工作。Kryszkie-wicz[9]于1999年在不完备信息系统下引入广义决策保持
智能系统学报 2018年3期2018-07-20
- 矩阵增量属性约简算法
化后决策信息系统约简问题,是信息科学领域研究的一个普遍关注热点.如果使用非增量属性约简方法[1-3]来处理动态数据属性约简问题时,需要重新计算变化后决策信息系统的属性约简,不能充分利用先前知识粒度和约简,导致运行速度较慢.为了有效解决非增量约简算法在处理动态数据时存在的缺陷,许多研究者提出了增量属性约简方法.针对决策信息系统对象变化增量属性约简问题,杨明针对决策信息系统对象集动态更新问题,对差别矩阵进行改进,分析了改进差别矩阵的增量更新机制,设计了增量属性
小型微型计算机系统 2018年6期2018-07-04
- 置信优势关系粗糙集的属性约简方法
IODS).属性约简是粗糙集理论及其扩展模型研究的核心问题之一[5,6].在完备有序信息系统中,多种约简方法被提出.其中,Dembczyński[1]等给出了基于分类精度的约简概念,却没有提出相应的约简方法.徐伟华等提出了多种基于DRSA的约简方法,包括分布约简和最大分布约简[7],可能分布约简(分配约简)及相容分布约简[8].Inuiguchi等提出了基于决策属性联合类的上、下近似、边界域不变的约简方法[9],Kusunoki进一步给出决策属性基于类的上
小型微型计算机系统 2018年2期2018-03-27
- 广义分布保持属性约简研究
广义分布保持属性约简研究高学义1,2,张楠1,2,童向荣1,2,姜丽丽1,2(1. 烟台大学 数据科学与智能技术山东省高校重点实验室,山东 烟台 264005; 2. 烟台大学 计算机与控制工程学院,山东 烟台 264005)属性约简是粗糙集理论的重要研究内容之一。分布约简保证约简前后每个对象的概率分布保持不变,即保证每条规则的置信度在约简前后不发生改变。实际应用中,人们往往更加关注可信度较高或较低的规则。因此,在本文中引入了广义分布保持属性约简,该属性约
智能系统学报 2017年3期2017-08-01
- 基于MapReduce的高效粗糙集属性约简算法
的高效粗糙集属性约简算法吕 洁1刘利民1胡皎月1许志伟1,21(内蒙古工业大学信息工程学院 内蒙古 呼和浩特 010080)2(中国科学院计算技术研究所 北京 100086)针对粗糙集理论中传统的基于正域的属性约简算法和基于信息熵的属性约简算法无法得到最小约简集的问题,给出基于信息熵改进的属性约简算法,即先使用条件熵识别出重要度值最大的属性,使用正域进行约简判断。在此基础上,设计了高效的基于MapReduce的信息熵改进属性约简算法。以真实海量气象数据为基
计算机应用与软件 2017年4期2017-04-24
- 基于决策表的保边界域不变及保负域不变约简
不变及保负域不变约简赵思雨,魏玲*(西北大学数学学院,陕西省西安市邮编:710127)属性约简是粗糙集理论的重要研究方向之一。本文针对决策表, 从三支决策的角度提出了保持负域不变的约简及保持边界域不变的约简, 并研究保持负域不变的约简、保持边界域不变的约简与基于粗糙集理论代数角度的约简之间的关系。决策表;属性约简;边界域;负域引言粗糙集理论作为一种数据分析处理理论,由波兰科学家Pawlak于1982年提出,在数据的决策与分析、模式识别、机器学习与知识发现等
数码设计 2016年1期2016-10-13
- 基于信息量的动态属性约简算法仿真实现
信息量的动态属性约简算法仿真实现陈丽芳*,王云华北理工大学理学院,河北省唐山市邮编:063009基于信息量的动态约简算法充分利用了原信息系统的约简结果,从约简效率上,比静态算法有很大的提高。但在实际应用中,该算法的计算工作量令许多非数学专业的科技人员感到力不从心。鉴于这种情况,本文针对基于信息量的动态属性约简算法,编程仿真了整个计算过程。对该算法进行设计并用C语言编写了源代码,使计算过程简单化,输入待解决问题的数据和新增动态数据即可计算得出相应的约简结果。
数码设计 2016年1期2016-10-13
- 基于粗糙集的可变正区域约简
糙集的可变正区域约简邓大勇1,2,李亚楠1,薛欢欢1(1.浙江师范大学 数理与信息工程学院,浙江 金华321004;2.浙江师范大学 行知学院,浙江 金华321004)属性约简是粗糙集理论的研究重点之一.现有的各种粗糙集约简几乎都是保持某种约简准则不变,用这种方法处理一些存在异常点的数据时,在泛化能力方面存在一定的问题.针对此类问题,提出了一种可变正区域的约简方法,该方法在进行属性约简时允许正区域存在一定程度的变化.理论分析和示例表明了该方法的有效性.粗糙
浙江师范大学学报(自然科学版) 2016年3期2016-09-29
- 面向成组对象集的增量式属性约简算法
象集的增量式属性约简算法钱进1,2,朱亚炎1(1.江苏理工学院 计算机工程学院,江苏 常州 213015; 2. 南京信息工程大学 江苏省大数据分析技术重点实验室,江苏 南京 210044)现实世界中数据集都是动态变化的,非增量式属性约简方法从头重新计算原始数据集,而且未考虑先前约简结果中的信息,将耗费大量的时间和空间。为此,讨论了动态数据环境下约简的不变性,提出了一种面向成组对象集的增量式属性约简算法,利用先前约简中信息来快速获取强传承性的约简,从而提高
智能系统学报 2016年4期2016-09-27
- 一种最小测试代价约简的改进算法
一种最小测试代价约简的改进算法何华平, 陈光建(四川理工学院 计算机学院 四川 自贡 643000)传统属性约简的目标是在决策表中的所有条件属性中,选择一组分类代价最小的约简,算法构建了测试代价最小的约简.以往的测试代价约简算法查找成功率不够理想,性能不稳定,提出了一种改进的测试代价约简算法.通过运行2个UCI数据集实验,证明算法是有效的,并为提高测试代价约简算法性能提供了新途径.代价敏感学习; 属性约简; 最小测试代价0 引言在数据挖掘中,要删除冗余数据
郑州大学学报(理学版) 2015年1期2015-02-11
- 一种改进的启发式最优相对属性约简算法
发式最优相对属性约简算法陶加云1,李英顺2,赵玉鑫2(1.沈阳工业大学信息科学与工程学院,辽宁沈阳110870;2.沈阳工业大学化工过程自动化学院,辽宁辽阳111003)针对在传统的粗糙集理论相对属性约简算法中因需计算可区别矩阵和正区域而导致的约简效率低下这一问题,提出一种改进的启发式最优相对属性约简算法加以解决.通过引入属性集的相对分类能力的定义给出相对属性约简的判定条件,在此基础上导出的改进相对属性约简算法既能保证约简过后的条件属性是最优的,又能提高约
宜宾学院学报 2015年12期2015-01-18
- 粗糙集属性约简方法研究
成功[2]。属性约简是粗糙集理论的核心内容之一。目前已经出现了很多属性约简的方法,例如基于正区域的属性约简[3]、基于差别矩阵的属性约简[4]、基于信息熵的属性约简[5]、基于分布的属性约简及基于近似的属性约简[6]、基于云模型的约简方法[7]、基于相对粒度的约简算法发[8]等。本文通过将决策信息系统树形化,并定义了在此树形结构上的属性约简,发现属性可约简并不需要再次求得下上近似集,可直接由等价类所包含的决策属性来决定,由此可增加属性约简的效率。进而给出了
电子设计工程 2015年12期2015-01-04
- 概念格约简与覆盖约简之间的关系
4900)概念格约简与覆盖约简之间的关系李立峰1, 俞 伟2(1.西安邮电大学 理学院, 陕西 西安 710121;2.中国人民解放军69213部队, 新疆 喀什 844900)以一类与覆盖粗糙集相对应的形式背景为工具,对概念格属性约简和覆盖粗糙集约简进行研究,结果表明覆盖粗糙集与形式背景之间存在一一对应关系,并且证明了覆盖粗糙集的交约简可化为概念格的属性约简。概念格; 属性约简; 覆盖0 引 言概念格是根据对象与属性之间的二元关系建立的一种层次结构[1]
陕西理工大学学报(自然科学版) 2014年3期2014-09-22
- 电控发动机故障诊断属性约简算法应用研究
动机故障诊断属性约简算法应用研究谢春丽,张东兴,米志飞(东北林业大学 交通学院,黑龙江 哈尔滨 150040)利用粗糙集理论中的区分矩阵属性约简算法对电控发动机的几种典型故障参数进行属性约简,为验证约简结果是否有利于下一步的故障诊断,采用较成熟的BP神经网络对其进行诊断验证,将约简结果作为网络的输入,待诊断故障作为网络的输出。通过学习训练结果表明:利用区分矩阵方法所获得的核约简不能作为故障诊断的特征参量,其导致网络不收敛,而其它3组约简可以用于区分现有故障
湖北汽车工业学院学报 2014年1期2014-07-12
- 变精度覆盖决策信息系统的约简
盖决策信息系统的约简许晴媛1,李进金2,张燕兰11.闽南师范大学计算机科学与工程系,福建漳州 3630002.闽南师范大学数学与信息科学学院,福建漳州 363000把变精度方法引入到覆盖决策信息系统中,给出变精度覆盖下近似与变精度覆盖上近似的定义。进而讨论了变精度覆盖下近似与变精度覆盖上近似的若干性质及约简。分析了它们与覆盖分布约简、最大覆盖分布约简、覆盖下近似约简、覆盖上近似约简之间的关系。并给出实例进行说明。变精度;覆盖;决策信息系统;约简1 引言由P
计算机工程与应用 2014年6期2014-07-07
- 综合属性选择和删除的属性约简方法
50001)属性约简利用粗糙集[1-2]等理论,旨在保持信息系统决策能力不变的条件下,去除冗余属性,从而减少数据的冗余度,是机器学习和人工智能最重要的研究方向之一.属性约简方法有很多,譬如基于依赖度的属性约简方法[3]、基于互信息的属性约简方法[4-5]、基于模糊粗糙集的属性约简方法[6-8]等.Skowron于1992年提出了辨识矩阵和辨识函数的概念[9],利用辨识矩阵和辨识函数实现了属性约简,并得到了广泛的研究[10].然而,基于辨识矩阵的属性约简方法
智能系统学报 2013年2期2013-09-24
- 基于变精度粗糙集的不完备决策表属性约简
不完备决策表属性约简林春杰1,张瑞玲1,韩晓琴21.洛阳师范学院 信息技术学院,河南 洛阳 471022 2.洛阳师范学院 教育科学学院,河南 洛阳 4710221 引言粗糙集理论[1]是一种无需先验知识,能够处理不精确、不确定、不完备数据的数学工具,是经典集合论的重要发展,在知识定义、知识约简、规则发现等方面[2-5],为知识获取提供了一种崭新的工具。然而经典粗糙集模型对噪声敏感,其对数据的过拟合而降低了对对象的预测能力。为了克服这些局限性,Ziarko
计算机工程与应用 2013年13期2013-07-20
- 基于互信息的并行约简*
中求得一个稳定的约简结果,Bazan[1-2]提出了动态约简的概念.该理论的主体思想是先把要处理的决策表划分成若干个具有强烈概率因素的子表,然后求出全部子表的所有约简并取其交集.通常认为利用这种方式求得的约简结果较为稳定.然而,动态约简有2个缺点:一是必须求出全部子决策表的所有约简,时间复杂度很高;二是动态约简得到的结果有可能为空,理论本身不完备.邓大勇在文献[3-6]中借鉴动态约简的分表思想提出了并行约简理论.并行约简和动态约简类似,都是将一个决策表拓展
浙江师范大学学报(自然科学版) 2012年3期2012-12-17
- 一种改进的最小属性约简算法*
发现等领域.属性约简是粗糙集理论中的一个核心内容,目前有很多研究都是针对属性约简方面的.求解属性约简的算法可以划分为如下几类:(1)基于正区域的求解算法,有时在求解的过程中会结合属性的重要性、互信息等;(2)基于差别矩阵的求解算法;(3)基于智能计算的求解方法,如基于遗传算法和神经网络.随着问题规模的增大,基于差别矩阵求解算法的缺陷会愈加凸显.有时在利用正区域或差别矩阵求解时,常结合属性的重要性[1]、互信息[2]、属性出现的频率[3]等,使得算法更加高效
武汉理工大学学报(交通科学与工程版) 2012年3期2012-12-01
- 基于D-S证据理论直接求代数约简和代数核*
究热点之一。属性约简是Rough 集理论的核心问题之一,也是知识获取的关键步骤之一,因此属性约简研究深受各研究者的关注。目前已有多种属性约简方法被提出,归纳起来主要有Pawlak原始定义的属性约简,称之为代数约简; 基于条件信息熵的属性约简(称之为信息熵约简)[2-3];基于包含度理论的分布约简、最大分布约简、分配约简及近似约简等[4];基于D-S证据理论的属性约简方法等[5-7]。其中信息熵约简与分布约简是完全等价的[8],分配约简与近似约简也完全等价。
中山大学学报(自然科学版)(中英文) 2011年5期2011-07-24
- 真度约简与计量逻辑学推理模式的关系
理和命题集的近似约简.本文的目的就是探讨命题集F(S)上的近似推理框架与命题集近似约简之间的关系.本文中,首先给出了n值 Lukasiewicz 命题集的真度约简及α-真度约简的概念,将命题集的精确约简转化为近似约简,然后指出了这种近似约简与计量逻辑学中近似推理模式的内在联系,为在F(S)上展开近似推理提供了新的途径.1 n值Lukasiewicz 命题系统中的真度约简定义1s={p1,p2,…}是一个可数集,F(S)是由S生成的(,∨,→)型自由代数,是
陕西科技大学学报 2011年5期2011-02-20
- 真度约简与计量逻辑学推理模式的关系
理和命题集的近似约简.本文的目的就是探讨命题集F(S)上的近似推理框架与命题集近似约简之间的关系.本文中,首先给出了n值 Lukasiewicz 命题集的真度约简及α-真度约简的概念,将命题集的精确约简转化为近似约简,然后指出了这种近似约简与计量逻辑学中近似推理模式的内在联系,为在F(S)上展开近似推理提供了新的途径.1 n值Lukasiewicz 命题系统中的真度约简定义1s={p1,p2,…}是一个可数集,F(S)是由S生成的(,∨,→)型自由代数,是
陕西科技大学学报 2011年5期2011-02-20