基于改进TF睮DF的微博短文本特征词提取算法

2016-07-09 13:18邓丹君姚莉
软件导刊 2016年6期

邓丹君 姚莉

摘要:针对微博短文本特征难以提取的特点,结合微博文本的3种专属特殊符号:“@”、“//”和“#”分析微博文本的特点,从而对TF-IDF算法进行改进,并且考虑用户兴趣时间的长短来进行微博短文本特征词的选取。实验结果表明,相对于原有算法,该算法能够有效提高微博短文本特征词提取的准确度。

关键词:TF-IDF;微博短文本;特征词提取

DOIDOI:10.11907/rjdk.161165

中图分类号:TP312文献标识码:A文章编号:1672-7800(2016)006-0048-02

参考文献:

[1]杨福强.基于微博扩展的用户兴趣主题挖掘算法[J].计算机工程与设计,2015,36(5):1214-1217.

[2]何天翔,张晖,李波,等.一种基于情感分析的网络舆情演化分析方法[J].软件导刊,2015,14(5):131-134.

[3]周磊,覃俊,刘晶. 基于微博交互信息的社交网络推荐算法[J].软件导刊,2015,14 (4):63-66.

[4]陶永才.基于加权动态兴趣度的微博个性化推荐[J].计算机应用,2014,34(12):3491-3496.

[5]秦雨.基于特征映射的微博用户标签兴趣聚类算法[J].Journal of Data Acquisition and Processing,2015,30(6): 1246-1252.

[6]赵华.基于话题相关空间的微博用户兴趣识别及可视化方法[J].计算机科学,2015,42(6A): 500-502.

[7]曾东红.一种基于指数遗忘函数的协同过滤推荐算法[J].科技广场,2013(7):10-15.