基于MapReduce并行SVM的垃圾邮件分类

2016-07-09 13:18甘冬连张永刘博
软件导刊 2016年6期

甘冬连 张永 刘博

摘要:针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。

关键词:MapReduce;SVM;KNN分类算法

DOIDOI:10.11907/rjdk.161466

中图分类号:TP301文献标识码:A文章编号:1672-7800(2016)006-0010-03

参考文献:

[1]杜玲玲.基于MapReduce的数据挖掘算法研究与应用[D].桂林:桂林电子科技大学,2012.

[2]邰建华.Hadoop平台下的海量数据存储技术研究[D].大庆:东北石油大学,2012.

[3]曹聪.云计算支持下的数据挖掘算法及其应用[D].广州:广州大学,2012.

[4]牛科.基于Hadoop云平台的分布式支持向量机研究[D].临汾:山西师范大学,2014.

[5]汪海燕,黎建辉,杨风雷.支持向量机理论及算法研究综述[J].计算机应用研究,2014(5):1281-1286.

[6]张国云.支持向量机算法及其应用研究[D].长沙:湖南大学,2006.

[7]桑应宾.基于K近邻的分类算法研究[D].重庆:重庆大学,2009.