基于聚类的KNN算法改进

2011-12-31 00:00:00樊东辉王治和陈建华许虎寅
电脑知识与技术 2011年35期


  摘要:通过研究KNN算法,提出了一种利用训练集文本聚类结果改进KNN算法的方法,首先将训练集文本采用DBSCAN算法聚进行聚类,将训练集文本分为若干个簇,然后采用KNN算法对测试文档进行测试,最后用距离最近的n个簇中的若干训练集文本使用KNN算法对测试文本进行分类。实验表明,改进后的算法降低了计算量,提高了效率,同时对聚类结果有了一定的改进。
  关键词:KNN算法;DBSCAN算法;训练集
  中图分类号:TP391文献标识码:A
  An improved KNN Algorithm Based on Clustering
  FANDong-hu