殷复莲 张晓宇 冯晴 王思佳
摘要:针对互联网,尤其是微博平台中大学生用户的海量文本,应用贝叶斯网络分类器对微博评论进行分类。基于贝叶斯,通过先验概率和似然度求出后验概率的原理,针对具体事件选择不同的训练集和调整特征词库,得到大学生对热点事件关注相较于整体网民更加理性、冷静的结论,可为研究大学生心理健康及大学生舆情提供参考。
关键词:贝叶斯分类;文本分类;文本分词;概率估测;大学生;热点事件
DOIDOI:10.11907/rjdk.161251
中图分类号:TP319文献标识码:A文章编号:1672-7800(2016)006-0112-03
参考文献:
[1]中国互联网络信息中心.第36次中国互联网络发展状况统计报告[R].北京:中国互联网络信息中心.2015.
[2]吴保来.基于互联网的社交网络研究[D].北京:中共中央党校,2013.
[3]田野.基于微博平台的事件趋势分析及预测研究[D]武汉:武汉大学,2012.
[4]李荣陆.文本分类及其相关技术研究[D]上海:复旦大学,2005.
[5]许林杰.中文文本分词研究[D]济南:山东师范大学,2003.
[6]李原.中文文本分类中分词和特征选择方法研究[D]长春:吉林大学,2011.
[7]蒋良孝.朴素贝叶斯分类器及其改进算法研究[D]北京:中国地质大学,2009.
[8]冯永,李华,钟将等.基于自适应中文分词和近似SVM的文本分类算法[J].计算机科学,2010,37(1):251-252.