基于朴素贝叶斯模型的邮件过滤技术

2014-06-23 13:40杨赫孙广路何勇军
哈尔滨理工大学学报 2014年1期
关键词:机器学习

杨赫 孙广路 何勇军

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

猜你喜欢
机器学习
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
下一代广播电视网中“人工智能”的应用
基于支持向量机的金融数据分析研究
基于Spark的大数据计算模型
基于朴素贝叶斯算法的垃圾短信智能识别系统
基于图的半监督学习方法综述
机器学习理论在高中自主学习中的应用
极限学习机在图像分割中的应用