基于敏感信息主题的情感分析技术研究

2019-10-21 18:28姚海申
文存阅刊 2019年18期
关键词:情感分析舆情神经网络

姚海申

摘要:本文提出了一種基于敏感信息主题的情感分析技术,以快速、有效地实现人们对某一舆情事件的情感倾向的判定。

关键词:情感分析;舆情;神经网络

一、情感分析研究方法综述

情绪分析(Sentiment analysis)或意见挖掘(opinion mining)[1]是对人们对产品、服务、组织、个人、问题、事件、主题及其属性等实体的看法、情绪、评价和态度的计算研究,该领域开创和快速发展与网络上出现的大量社交媒体密切相关,例如,新闻评论、论坛讨论、博客、微博、Twitter和社交网络等。

目前,常用的文本情感分析方法大致可分为三类:基于情感词典和规则的方法、基于机器学习的方法以及基于深度学习的方法。

基于情感词典的文本情感分析方法首先识别文本中的情感词,然后根据现有的情感词典计算情感词的情感倾向。最后,使用预先制定的计算规则计算文本的最终情感倾向,这类方法的关键在于构建一个精确而全面的情感词典。基于情感词典的方法太过于依赖人工构建情感词典,如何设计一种有效的自动情感词典构建方法是该方法需要解决的问题之一。

基于机器学习的方法在文本情感分析研究中使用较为广泛,其不依赖于情感词典,且具有多种自动特征提取方法。基于机器学习的方法的分类性能在很大程度上取决于所选择的特征提取方法,因此,在使用基于机器学习的方法时,提取有效特征成为关键任务。

基于上述对情感分析技术的分析,本文将基于深度学习方法对情感分析技术进行研究。

二、融合敏感信息主题的情感分析技术

(一)研究方法

对于敏感事件主题的提取,已在文献[10]中进行了详细研究,本文将在敏感事件主题的基础上进行事件内部文本的情感倾向性研究,提出了一种融合敏感信息主题的文本情感分析模型(Sensitive Information Topics-Based Sentiment Analysis Model,SITSAM)。

此模型将敏感事件主题词融入到文本表示学习中,以进行有效的情感描述主体的捕捉。此外,为了更好的挖掘带有情感倾向的词对句子情感倾向性的贡献程度,本文将注意力机制引入到神经网络中,以计算在特定主题下的词对句子的情感贡献。

本模型以词的词向量作为输入,输入到BiLSTM(Bidirectional Long-Short Memory Network)句子编码器中进行学习,以得到句子的向量化表示,然后使用softmax函数对句子情感进行判别。为了将敏感事件主题信息融入到句子的表示中,本文以以下方式进行融合:

在进行某一敏感事件主题下的文本情感分析时,将该主题的主题描述词的词向量作为BiLSTM神经网络的输入,然后对隐层输出使用Average-Pooling层来聚合主题词所有隐层输出以产生单个主题表示,的计算如下:

(1)最终将得到的主题描述与句子中每个词的输出进行语义连接,得到每个词的最终语义表示:

(2)然后对得到的词的语义表示进行注意力权重的计算,以提高情感词对句子的情感贡献。

最后将得到的文本表示s输入到softmax层,该层通过sigmoid函数来计算出文本情感倾向概率。

(二)结果分析

为了验证本文所提出模型的有效性,本文以支持向量机(SVM)算法、FastText、卷积神经网络(CNN)、长短期记忆网络(LSTM)、双向长短期记忆网络(BiLSTM)及本文方法SITSAM进行对比实验。本文采用在分类方法中使用广泛的准确率P、召回率R及F1值进行结果的评价。结果显示模型在准确率、召回率及F1值上都较其他模型要好,对于正向类的识别准确率达到了90.83%,对于负向类更是达到了91.27%的准确率,其结果均比其他模型要好,可以看出情感词语义的融入及注意力机制的加入对情感倾向性的判定效果具有明显的提升,验证了本文方法的有效性。

三、结语

本文所提出的情感分析模型以长短期记忆(Long-Short Term Memory ,LSTM)网络为基础进行改进优化,由于本文所进行的情感分析任务是在特定敏感信息主题下进行,所以本文将主题语义信息与文本语义通过神经网络进行融合,以更好的识别描述主体。实验结果表明具有较好的情感分类效果,能够有效的对公众的态度和见解进行情感分析,以帮助政府机构了解公众意向和社会舆情。

参考文献:

[1] Liu Bing. Sentiment analysis and opinion mining[J]. Synthesis lectures on human language technologies, 2012, 5(1): 1~167.

[2]Pang B,Lee L,Vaithyanathan S. Thumbs up? sentiment classification using machine learning techniques[C]. In: Proceedings of Cnference on Empirical methods in natural language processing. Philadelphia: [s.n.],2002: 79-86.

[3]Pang B,Lee L. Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales. In: Knight K, ed. Proc. of the Association for Computational Linguistics (ACL). Morristown: ACL,2005. 115-124.

[4]Goldberg A B,Zhu X. Seeing stars when there aren't many stars: graph-based semi-supervised learning for sentiment categorization[C]. In: The Workshop on Graph Based Methods for Natural Language Processing. Association for Computational Linguistics,2006:45-52.

猜你喜欢
情感分析舆情神经网络
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于自适应神经网络的电网稳定性预测
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
消费舆情
基于SVM的产品评论情感分析系统的设计与实现
基于词典与机器学习的中文微博情感分析
在线评论情感属性的动态变化
文本观点挖掘和情感分析的研究
月度最热舆情事件榜11月