基于贝叶斯分类的大学生关注热点事件微博文本分类方法研究

2016-07-09 08:08殷复莲张晓宇冯晴王思佳
软件导刊 2016年6期
关键词:文本分类大学生

殷复莲 张晓宇 冯晴 王思佳

摘要:针对互联网,尤其是微博平台中大学生用户的海量文本,应用贝叶斯网络分类器对微博评论进行分类。基于贝叶斯,通过先验概率和似然度求出后验概率的原理,针对具体事件选择不同的训练集和调整特征词库,得到大学生对热点事件关注相较于整体网民更加理性、冷静的结论,可为研究大学生心理健康及大学生舆情提供参考。

关键词:贝叶斯分类;文本分类;文本分词;概率估测;大学生;热点事件

DOIDOI:10.11907/rjdk.161251

中图分类号:TP319文献标识码:A文章编号:1672-7800(2016)006-0112-03

参考文献:

[1]中国互联网络信息中心.第36次中国互联网络发展状况统计报告[R].北京:中国互联网络信息中心.2015.

[2]吴保来.基于互联网的社交网络研究[D].北京:中共中央党校,2013.

[3]田野.基于微博平台的事件趋势分析及预测研究[D]武汉:武汉大学,2012.

[4]李荣陆.文本分类及其相关技术研究[D]上海:复旦大学,2005.

[5]许林杰.中文文本分词研究[D]济南:山东师范大学,2003.

[6]李原.中文文本分类中分词和特征选择方法研究[D]长春:吉林大学,2011.

[7]蒋良孝.朴素贝叶斯分类器及其改进算法研究[D]北京:中国地质大学,2009.

[8]冯永,李华,钟将等.基于自适应中文分词和近似SVM的文本分类算法[J].计算机科学,2010,37(1):251-252.

猜你喜欢
文本分类大学生
带父求学的大学生
大学生之歌
新大学生之歌
基于组合分类算法的源代码注释质量评估方法
基于贝叶斯分类器的中文文本分类
基于朴素贝叶斯分类的Java课程网络答疑反馈系统
基于K—means算法的文本分类技术研究
文本分类算法在山东女子学院档案管理的应用
大学生实习如何落到“实处”
让大学生梦想成真