汪际和
【摘 要】在挖掘关联规则的过程中,人们往往不仅关心项集出现的频率而且关心项集的重要性,为此,本文应用权重来综合考虑项集的频率和重要性,在构建概念格的过程中应用加权的值来更新概念和相应的边。
【关键词】概念格;频繁项集;建格算法
0 引言
概念格是由德国的数学家Wille.R于1982年提出的一种基于序理论的数据分析工具,由于它的特殊结构等一些特点,在知识发现,信息检索等方面得到广泛应用。关联规则的关键步骤是找出符合最小支持度条件的频繁项集,体现于概念格中则表现为找出满足条件的内涵集之间的关联性。而频繁项集和概念格中的节点存在一种对应关系,所以,寻找频繁项集的过程可以看作是根据最小支持度构建概念格的过程。
如何构造和简化概念格,一直是形式概念分析中的重要内容,为了更好地构建概念格,许多学者进行了大量研究并取得了比较丰硕的成果[3-6]。
3 结论
本算法综合考虑了项集在事务数据库中出现的频率(即支持度)和重要性(即用权值表示),根据用户对频率和重要性的关心程度来设置权重?琢。当然,在该算法中,由于加权频繁项集的超集不一定频繁,所以就不能对候选项集剪枝。另外,对于不同的项集可以动态地设置权重等。对它们的研究将是下一步的工作。
【参考文献】
[1]Jiawei Han,Micheline Kamber.范明,孟小峰,译.数据挖掘概念与技术(第二版)[M].北京:机械工业出版社,2008.
[2]Bernhard Ganter.Rudolf Wille.马垣,等,译.形式概念分析[M].北京:科学出版社,2007.
3]简宋全,胡学钢,蒋美华.扩展概念格的渐进式构造[J].计算机工程与应用,2001,37(15):132-134.
[4]王德兴,胡学钢,王浩.基于量化概念格的关联规则挖掘[J].合肥工业大学学报,2002,25(5):678-682.
[5]张继福,张素兰,郑链.加权概念格及其渐进式构造[J].模式识别与人工智能,2005(2):171-176.
[6]翟悦,郭文书,王立娟.利用扩展概念格进行关联分类的算法[J].辽宁工程技术大学学报(自然科学版),2015,34(11):1280-1284.
[责任编辑:王楠]