带重现概念漂移的不平衡数据流分类研究

2019-09-10 07:22季梦遥袁磊

季梦遥 袁磊

摘 要:数据流广泛存在于现实应用中,重现概念漂移和数据分布不平衡性是其重要特性,它们会导致传统数据流分类器负偏离、性能下降及学习时间倍增。针对重现概念漂移和数据分布不平衡的特点,本文提出重现概念漂移不平衡数据流的随机平衡采样集成分类算法(RBSRISEA),首先用随机平衡采样算法重新平衡数据分布,之后对预处理的数据流再进行重现概念漂移探测。实验表明,RBSRISEA对重现概念漂移有较强的敏感性和泛化能力。RBSRISEA可以处理带重现概念漂移的不平衡数据流分类问题。

关键词:重现概念漂移;不平衡流數据;随机采样;集成分类器

中图分类号:TP311.11

文献标识码: A