杨赫 孙广路 何勇军
摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.
关键词:邮件过滤;朴素贝叶斯;机器学习
摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.
关键词:邮件过滤;朴素贝叶斯;机器学习
摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.
关键词:邮件过滤;朴素贝叶斯;机器学习