基于自适应阈值的改进孤立森林算法研究与验证

2024-06-01 02:48魏斐斐
电脑知识与技术 2024年10期

魏斐斐

摘要:为改善孤立森林算法建立二叉树时随机选择属性进行数据分割,构建孤立森林时可能出现一些性能较差的冗余二叉树,导致模型精度不高的问题,应用一种区间套搜索算法对初始构建的孤立森林搜索森林划分阈值,去除性能较差的孤立二叉树,构建性能更优的孤立森林,提出一种自适应阈值的改进孤立森林算法(Adaptive-iForest) 。选取UCI经典数据集中Breastw、Ionosphere、Satellite、Shuttle、Pendigits 5个数据集进行实证分析,对比iForest、LOF两个算法,AdaptiveiForest算法的精度与AUC值均有不同程度提升。

关键词:异常数据检测;改进孤立森林算法;区间套搜索算法;自适应阈值;UCI数据集

中图分类号:TP301.6 文獻标识码:A

文章编号:1009-3044(2024)10-0020-03