一种高效的用于话题检测的关键词元聚类方法

2012-04-29 00:44杨攀桂小林田丰王刚
西安交通大学学报 2012年10期
关键词:聚类精度效率

杨攀 桂小林 田丰 王刚

摘要:针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法,该算法在进行词元簇选择时,为簇问相似度分配权值,并借鉴正态分布函数评估词元簇的个数,提高词元簇的选择精度,从而减少所需的词元聚类次数,实验结果表明,将改进的方法应用到舆情监控的话题检测中,能在不影响检测精度的前提下有效地提高算法的运行效率。

猜你喜欢
聚类精度效率
提升朗读教学效率的几点思考
基于DSPIC33F微处理器的采集精度的提高
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
GPS/GLONASS/BDS组合PPP精度分析
跟踪导练(一)2
一种层次初始的聚类个数自适应的聚类方法研究
改进的Goldschmidt双精度浮点除法器
“钱”、“事”脱节效率低
巧用磨耗提高机械加工精度