面向大规模日志数据的聚类算法研究

2012-04-29 03:48:09李清沈彤关毅
智能计算机与应用 2012年5期
关键词:李清标识码日志

李清 沈彤 关毅

摘要: 针对大规模日志数据的聚类问题,提出了DBk-means算法。该算法使用Hadoop对原始日志数据进行预处理,并结合了k-means和DBSCAN聚类算法各自的优势。实验结果表明,相比k-means算法进行聚类分析,文中使用DBk-means算法进行聚类,能够取得更好的聚类效果,正确率可以达到83%以上。

关键词:

中图分类号:TP391文献标识码:A文章编号:2095-2163(2012)05-0042-04

猜你喜欢
李清标识码日志
发光的招牌
一名老党员的工作日志
华人时刊(2021年13期)2021-11-27 09:19:02
扶贫日志
心声歌刊(2020年4期)2020-09-07 06:37:14
火烈鸟
童话世界(2019年26期)2019-09-24 10:57:36
游学日志
Process Mineralogy of a Low Grade Ag-Pb-Zn-CaF2 Sulphide Ore and Its Implications for Mineral Processing
Study on the Degradation and Synergistic/antagonistic Antioxidizing Mechanism of Phenolic/aminic Antioxidants and Their Combinations
润滑油(2014年3期)2014-11-07 14:30:02
A Comparative Study of HER2 Detection in Gastroscopic and Surgical Specimens of Gastric Carcinoma
科教导刊(2014年14期)2014-06-20 04:03:27
Significance of 18F—FDG PET / CT imaging in the evaluation of the efficacy of lymphoma
科教导刊(2014年6期)2014-03-17 12:05:24
一种基于粗集和SVM的Web日志挖掘模型