李清 沈彤 关毅
摘要: 针对大规模日志数据的聚类问题,提出了DBk-means算法。该算法使用Hadoop对原始日志数据进行预处理,并结合了k-means和DBSCAN聚类算法各自的优势。实验结果表明,相比k-means算法进行聚类分析,文中使用DBk-means算法进行聚类,能够取得更好的聚类效果,正确率可以达到83%以上。
关键词:
中图分类号:TP391文献标识码:A文章编号:2095-2163(2012)05-0042-04
智能计算机与应用2012年5期
1《师道·教研》2024年10期
2《思维与智慧·上半月》2024年11期
3《现代工业经济和信息化》2024年2期
4《微型小说月报》2024年10期
5《工业微生物》2024年1期
6《雪莲》2024年9期
7《中小企业管理与科技》2024年6期
8《现代食品》2024年4期
9《卫生职业教育》2024年10期
10《浙江临床医学》2024年3期