管恩政 常晓宇 王 喆 周春光
摘要:为解决从数据库中挖掘长模式可能遇到较高的计算复杂度问题,提出一种新的算法FFSPAN。传统上,要判断一个序列是否频繁,需要在原数据库中判断整个序列是否频繁;而算法FFSPAN是通过在序列数据库中寻找一个频繁项或一个频繁项集来代替寻找一个完整的频繁序列,而且FFSPAN算法每次扫描的数据库都是迅速减小的,这使得算法在挖掘的序列模式越长时越有效.在标准测试数据集上的实验结果表明,FFSPAN算法非常有效。
关键词:序列模式;长模式;深度优先;数据挖掘
中图分类号:TP31
文献标识码:A
文章编号:1671-5489(2005)06-0768-05