牛长安
摘要
作为微博情感分析的主要特征,表情符号在提升分类效果方面具有的作用已经获得了大多数人的认可。文章首先对微博所应用表情符号的特征进行了概述,然后结合实际情况,以词向量输入、情感语义增强等层次为切入点,围绕着能够对微博情感进行分析的、具有情感语义增强特征的深度学习模型的构建工作展开了讨论,以期能够在某些方面给人以启发。
【关键词】微博情感分析 情感语义增强 深度学习模型
对微信、微博等新兴社交媒体而言,最突出的优势在于人们可以在此平台上,通过图片、文本或是视频的形式,表达意见、交流信息或是对个人内容进行发布,从情感的角度对用户数据加以分析,可以达到对产品满意度或其他内容进行获取的目的,正是因为如此,情感分析的重要性开始为人们所熟知,微博内容具有的特殊性,在无形之中增加了微博情感分析的难度,围绕着微博情感分析展开探究,具有的现实意义自然不言而喻。
1 表情符号概述
越来越多的人选择使用表情符号在微博中对自己的情感进行表达,正是因为如此,微博平台提供的、用于对情感需要加以表达的表情符号的数量与过去相比也呈现出了明显的上升趋势。通过对常用网络原创表情符号进行分析能够发现,不同表情符号在表达情感能力的方面往往存在一定的差异,需要注意的是,虽然情感符号的使用频率较高,能够代表该情感符号感情明确或是含有特定感情,但是,即使感情符号的适用频率较低,上述两种可能仍旧存在,因此,研究人员不应忽视低使用频率的感情符号的重要性。除此之外,在人工标注的过程中不难看出,对情感符号具有的情感倾向加以判断,往往具有较高难度,因此,本文最终选定基于情感符号的EMCNN作为深度学习模型,应用在对微博情感进行分析的过程中。
2 深度学习模型的构建
通过上文的分析能够看出,常用表情符号往往蕴含相应的情感,并且具有明确的情感语义,另外,与情感词相比较而言,表情符号的优势体现在情感的区分和指示两方面,因此,本文所讨论深度学习模型具有的情感语义,选择表情符号所对应词向量作为增强工具。EMCNN模型的架构符合自底向上、多层前向神经等诸多要求,接下来以功能为依据,将深度学习模型进行划分,共包括词向量输入,情感语义增强,卷积采样以及情感得分输出四层。
2.1 词向量输入
作为模型输入层而存在的底部词向量词典,其构成分为数据集中词语、表情符号两大类,每一列代表一个词向量,若词典包含n个元素,词向量维度是d,那么We∈Rd·N,该式代表词向量词典所对应的整个矩阵。将文本序列中与单词元素相对应的词向量,根据所处位置进行拼接,可得出对文本序列词向量加以表示的矩阵,RS=,其中,代表的是在行向量方向上进行的拼接操作。
2.2 情感语义增强
如果想要得到情感空间中微博对应的特征表示,应当以向量语义合成原理为依据,完成下列运算:E=(RE)T·RM,其中,E代表的是情感空间中微博对应的特征表示,RE代表的是通过拼接操作得出的表情符号序列,RM是微博所对应词向量的矩阵表示,作为表示微博文本序列的形式之一,RM的优势在于为后续应用矩阵运算完成语义合成操作提供便利,(RE)T代表的是RE转置,也就是说,如果选取表情符号为de个,RE∈Rd·de。需要注意的是,数据集中的微博在长度方面往往存在一定的差异,因此,如果想要保证深度学习模型具备应有的作用,所选择微博长度的最大值就应当是dm,此时,RM∈Rd·dm,如果微博长度不足dm,则可以通过将全。列向量添加在末端的方式,使微博长度与dm相等。
2.3 卷积采样
在完成上述操作后,可针对微博特征开展卷积操作,例如,在指定窗口合成微博文本语义,假设卷积算子:Wf∈Rde·dwin,其中,dwin代表的是卷积窗口的具体大小,卷积操作则可以通过如下方式进行表示:,其中,rijf代表的是第J个词语处,第i个卷积算子对应的卷积结果,zj代表的是在dwin范围,E对应的分块矩阵,bif表示的是i卷積算子i的偏置值。以E所对应卷积操作方式存在的区别为依据,卷积窗口的滑动类型可分为两种,分别是宽型和窄型,本文所讨论深度学习模型应用的为宽型卷积窗口。
2.4 情感得分输出
将上文计算得出的向量x向多层感知器进行输入,可得出比原有层次更高的特征表示,本文所讨论深度学习模型不存在隐含层的多层感知器,对输出向量进行变换后,可得出如下情感得分向量:Score(S)-B(Whx+bh),其中,Score(S)代表的是情感得分向量,Wh代表的是多层感知器所对应参数矩阵,bh代表的是多层感知器所对应偏置量。另外,该深度学习模型所选用非线性变化以函数为基础。
3 结论
综上所述,文章以情感语义增强为核心,围绕着深度学习模型的构建展开了分析,首先以表情符号列表为对象,完成人工情感的标注工作,这样做的目的是对表情符号在情感指示方面具有的作用进行突出,通过分析不难看出,虽然无论是情感词还是表情符号,在情感语义的区分度方面都具有较好的表现,但是与表情符号相比,情感词的判别度稍显欠缺,因此,文中基于表情符号列表所对应词向量,完成了对深度学习模型的构建工作。
参考文献
[1]何炎祥,孙松涛,牛菲菲,李飞.用于微博情感分析的一种情感语义增强的深度学习模型[J].计算机学报,2017,40(04):773-790.
[2]张仰森,郑佳,黄改娟,蒋玉茹.基于双重注意力模型的微博情感分析方法[J].清华大学学报(自然科学版),2018,58(02):122-130.