宋余庆 王立军 吕 颖 谢从华
摘要:在分析类Apriori算法存在效率瓶颈的基础上,提出了一个高效改进算法——基于分类树的关联规则挖掘算法。该算法只需要两次访问数据库,把数据库中的数据利用分类树来存储,减少了访问数据库的次数;并且由分类树的全部或部分来求得频繁项目集,减少了求频繁项目集的比较次数。此算法通过结合Apriori和FP-tree两种算法来提高挖掘效率,降低了挖掘算法的时间复杂度和空间复杂度,通过多次试验证明该算法比Apriori及其改良算法的挖掘效率高2到8倍。
关键词:数据挖掘;关联规则;分类树;频繁项目集
中图分类号:TP317.4
文献标识码:A
文章编号:1671—7775(2006)01—0051—04