传统关联规则算法的改进及其验证研究

2024-04-28 17:20桑沐晨王业
电脑知识与技术 2024年4期
关键词:Apriori算法关联规则数据挖掘

桑沐晨 王业

摘要:針对传统的Apriori算法在处理大规模数据集时面临的计算复杂度高和内存消耗大的问题,提出了在使用二进制编码的Apriori算法并采用Ray分布式框架以及与Sample动态采样算法结合——RBE-Apriori算法。将事务、候选集、频繁项集转化为二进制,并使用Sample动态采样算法对候选集进行处理,在生成关联规则的过程中使用Ray分布式框架,可以有效的减少生成关联规则的时间,从而提高算法效率。通过实验结果表明,改进的算法相比于经典Apriori算法,在生成相同频繁项集下,组合次数减少了65%,生成关联规则的时间上减少50%。

关键词:数据挖掘;关联规则;Apriori算法;Apriori改进算法;频繁项集

中图分类号:TP301 文献标识码:A

文章编号:1009-3044(2024)04-0080-04

猜你喜欢
Apriori算法关联规则数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于云平台MapReduce的Apriori算法研究
关联规则,数据分析的一把利器
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究