甘冬连 张永 刘博
摘要:针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。
关键词:MapReduce;SVM;KNN分类算法
DOIDOI:10.11907/rjdk.161466
中图分类号:TP301文献标识码:A文章编号:1672-7800(2016)006-0010-03
参考文献:
[1]杜玲玲.基于MapReduce的数据挖掘算法研究与应用[D].桂林:桂林电子科技大学,2012.
[2]邰建华.Hadoop平台下的海量数据存储技术研究[D].大庆:东北石油大学,2012.
[3]曹聪.云计算支持下的数据挖掘算法及其应用[D].广州:广州大学,2012.
[4]牛科.基于Hadoop云平台的分布式支持向量机研究[D].临汾:山西师范大学,2014.
[5]汪海燕,黎建辉,杨风雷.支持向量机理论及算法研究综述[J].计算机应用研究,2014(5):1281-1286.
[6]张国云.支持向量机算法及其应用研究[D].长沙:湖南大学,2006.
[7]桑应宾.基于K近邻的分类算法研究[D].重庆:重庆大学,2009.