俞定国 孙学敏 朱 琳 刘良模
情感是预测网络舆情的风向标,也是触发舆情事件的重要因素。情感社会学家帕累托认为公共事件中情感对行动产生的作用及影响更大。[1]突发公共卫生事件与人的生命安全息息相关,具有前兆性缺失、持续性诱发、不确定性、快速传播等特点,容易造成公众恐慌和焦虑,情感共鸣现象愈发强烈[2],产生的影响不会只局限于个别群体或单独区域,且话题中一旦含有虚假信息,极易引起舆情危机。情感倾向作为一种社会属性对研究突发事件舆情传播具有重要作用[3]。目前,舆情信息处理方法主要是利用深度学习从海量文本中挖掘情感信息,试图建立适用于多类型事件的标准化模型,很少从情感社会学角度结合定量方法对情感本体作出深度解读。本文将从三个方面进行探讨:一是基于情感社会学理论,构建突发公共卫生事件的舆情分析模型,为突发公共卫生事件网络舆情治理提供新思路;二是基于Word2Vec-BiLSTM神经网络,以提高情感倾向的预测效果;三是在已构建模型与理论基础上,从情感唤醒、认知归因、情感移情三个维度展开分析。具体以吉林省新冠疫情为例,依据时间序列对事件中舆情主客体进行综合分析,探究公众情感变化特征,深度解读情感本体与舆情事件之间的关系。
社会学对情感的研究主要着眼于情感和社会的互动关系。情感社会学作为社会学的分支已应用于网络舆情研究,如彭广林[4]认为网络舆情研究应实现显舆论转向潜舆论、舆情本体转向舆情主体、危机管理转向综合治理;余红[5]等人基于情感社会学分析敏感热点舆情的发生演化动力机制。本文基于情感社会学理论,从情感唤醒、归因与移情构建面向突发公共卫生事件的舆情分析模型。情感唤醒、归因与移情是情感产生的要素,情感唤醒是经过外界刺激、主观认知经验,产生反应的心理状态;归因源于格式塔心理学,是一种认知基模不断变化的过程,其结果会影响情感,是情感唤醒机制的前提;情感移情是一种情感聚集与情感扩散机制,因他人境遇映射产生的情感反应。
情感分析方法主要有情感词典、机器学习及深度学习。基于情感词典的分析方法通过构建情感词典[6]实现情感极性划分,但一些网络用语和集外词给情感词典构建带来不便,需要不断更新扩展,耗费大量时间和精力。机器学习方法包括支持向量机[7]、朴素贝叶斯、随机森林和深度森林,但该方法也存在一定缺陷,未能充分利用语义信息。因此,深度学习算法开始被广泛应用于这一领域,该方法利用人工智能神经网络深度挖掘语言知识,逐渐成为情感分析的主流方法。针对情感分析的研究不断深入,一方面体现在算法的创新。目前,国内外学者创新混合的模型算法,可以有效弥补单一模型存在的不足,成为主流的情感分析模型。另一方面是其应用领域的延伸,如商品评论,股票预测及网络社交媒体。
针对突发公共卫生事件,构建Word2Vec-BiLSTM模型,从情感社会学理论视角分析突发公共卫生事件舆情,为突发公共卫生事件网络舆情治理提供新思路。
该模型由数据处理层、情感分析层与舆情分析层三部分组成。基于数据处理层得到规则化的文本数据;基于情感分类层预测情感倾向;基于时间序列结合生命周期理论、情感社会学理论进行舆情分析。模型结构见图1。
图1 突发公共卫生事件网络舆情分析模型
在对网络舆情分析前需要对获取数据进行规则化处理。数据处理层是舆情分析的基础环节,主要对文本进行清洗,包括去除无效文本、垃圾广告、特殊符号、空格和表情符号;对文本进行分词、停用词过滤等。
1.词向量
将文本中对应的词语以向量的形式表示。使用Word2 Vec词向量训练模型,基于SGNS(Skip-Gram with Negative Sampling)训练的中文维基百科文本语料集合而成的词向量,抽取生成本文语料的词向量。
2.BiLSTM算法
长短期记忆神经网络(LSTM)通过增加长期状态Ct实现长期状态信息的保存。LSTM由遗忘门ft、输入门it及输出门Ot组成,计算公式如①-⑥所示:
其中Wf、Wc、Wi与Wo代表权重,bf、bc、bi和bo代表偏置值。
基于情感分类层预测情感倾向是舆情分析的关键。学者在研究过程中一般引入生命周期理论,实现舆情传播阶段划分。如任凯[8]等将舆情划分为潜伏期、扩散期、爆发期、波动期和衰退期;宴敬东[9]等将舆情划分为潜伏期、预热期、热议期和衰退期;刘国威[10]等将舆情演变划分为酝酿期、爆发期与衰退期。也有学者将发文量、转发量与评论量、情感分析值及百度指数与周期理论结合作为舆情周期划分的指标,但并没有统一的划分标准。本文引入权威百度指数与周期理论共同作为舆情周期的划分依据。
以“吉林疫情”为关键词,按时间顺序爬取2022年2月28日—2022年5月5日的微博数据,共62445条。考虑到官方主流媒体发布的信息对网民有预“情感设置”功能,剔除官方账号发布内容,最终得到42229条数据。
本文实验环境基于PyTorch实现,设置模型参数。
将人工标注数据分为训练集、测试集和验证集,采用准确率及综合度量指标F1值评估模型。模型预测性最终达77%,可用于“吉林疫情”中舆情主体情绪分析。
本文以百度指数与生命周期理论作为舆情划分依据,将此事件划为酝酿期(2022年2月28日—2022年3月8日)、爆发期(2022年3月9日—2022年3月22日)、波动期(2022年3月23日—2022年4月8日)与消退期(2022年4月9日—2022年5月5日),见图2。
图2 吉林省新冠疫情百度指数
根据图2舆情阶段划分,统计情感分类结果,见表1。消极情绪在波动期占比最高,达到46.4%。但总体上积极与理智情感占比较高,也从侧面说明舆情主体的消极表现与疫情的严重程度简单共振,存在更大理性空间。
表1 舆情各阶段情感分类统计
为剖析吉林省疫情传播周期内拐点出现的原因,用户的情感特征及变化的原因,利用TF-IDF算法提取不同舆情阶段文本的关键词绘制词云图,见图3。
图3 不同阶段关键词云分析
1.酝酿期:认知归因未触及非理性情感机制
认知归因是情感唤醒的前提,当事件中包含的信息刺激公众认知时,情感会在短时间被唤醒。2月28日,吉林省珲春市最先发现阳性病例,经专家研判此次病毒传播呈现出传播性强、隐匿性强等特点。图3(a)显示“疫情”“确诊”“病例”等主题词出现频次最高,说明公众对吉林疫情的关注表现为通过新闻发布会、新闻报道等权威信息了解疫情动态。在舆情酝酿阶段,吉林市每天官方通报感染人数只有零星几例。自2019年底疫情暴发至今,人们将这一漫长时期存于记忆中,形成认知基础。当类似事件发生时,会刺激大脑已有的认知记忆网络。虽然舆情主体的负面情绪呈现增长,但这种非理性情感并没有完全被唤醒,而是与理性相互交织,理性在一定程度占据主导地位。
2.爆发期:情感移情背后的“价值”转向
情感移情意味着某些群体身上发生的事件能够引起真实情感的出现,从而引发情感聚集。其通过“中介”认知归因,唤醒相应情感类型,进而影响舆情走势。在舆情爆发阶段,感染人数逐渐上升,尤其在3月9日—11日期间舆情主体的消极与积极情绪出现“高峰低谷”现象。主要由于吉林出现校园聚集性疫情,学生作为受保护群体而广受社会关注,注意力的投射唤起人们心理上的共情氛围。校园疫情发生后,网民情绪顿时高涨,认知理性受到冲击,成为负面情绪的集中爆发期。图3(b)“拜托”“结束”等词包含了人们对高校防疫滞后导致蔓延的无奈与质疑,以及对高校学生生命健康的担忧。大量网民在微博发文呼吁主流媒体发声,推动地方政府及时介入并启动舆情应急管理机制,对相关涉事人员进行问责处置。负面情绪逐渐得到消减,公众焦点再次转回疫情防控,“希望”“加油”“公益”“捐款”等积极情感倾向的表述明显增加,表示人们团结一致共同抗疫,体现了情感背后的“共同价值”,积极情绪呈现上升趋势。
3.波动期:认知归因触发情感意识重塑与增强
在信息资源接触有限致认知归因不确定的情况下,主体情感意识会加强。波动阶段每天新增感染人数破千,诸如“长春朝阳沟殡仪馆成隔离场所”“四平铁东区某小区提前解封”“白山支援长春人员没有住处”等谣言不断滋生,主体信息诉求得不到满足。随着感染人数激增,人们对自身及周围环境安全产生的恐慌情感被激发,消极情绪明显呈上升趋势,积极情绪逐渐下降。图3(c)“真的”“希望”“加油”杂糅了主体复杂的情感色彩:对病毒的怨恨,对长时间封闭式管理的焦虑以及对疫情结束的期盼。积极、消极及理性情感扩散到公众彼此的互动中,相互交织、此消彼长,主体表现出理性与感性共存的复杂状态。
4.消退期:情感唤醒与认知归因通过移情共同作用于舆情消减
在舆情消退时期,吉林省本地疫情处于稳定阶段。根据相关报道,吉林在这一阶段实现社会面清零,但很多地区并未立刻解封。消退前期各类情绪都出现明显的小频率波动,但总体而言积极和理性情绪逐渐下降并趋于平稳。一方面,随时间推移,吉林省成功控制疫情,实现社会清零。图3(d)“解封”“结束”“希望”等积极信息话题涌现,体现主体风险感知下降。另一方面,25日前后吉林省政府发布高校学生放假通知,“回家”这一新的话题再次吸引网民注意力。吉林省虽实现解封,但各地返乡政策标准不一,学生面临如何回家、回家是否会继续隔离等固有认知再次启动情感唤醒机制,担忧与困扰情绪滋生,导致消退期中后段负面情绪出现回升。随着各地针对吉林省返乡政策的落实、推进,负面情感密度下降,舆情信息传播量递减,人们的关注度下降。
经分析发现,情感唤醒、认知归因与情感移情贯穿事件各个阶段,主体情感变化与客体事件的发展相吻合。情感通过移情强化表达效果以推动舆情发展,而舆情事件通过影响人的固有认知唤醒情感。在整个疫情阶段,爆发期与波动期的主体情感交织出现。在具体舆情事件的触发下,主体在各个阶段的情感随周期变化而变化。但总体来看,此次疫情中主体消极情绪表现与疫情的严重程度简单共振。在疫情防控常态化背景下,主体情绪存在更大的理性空间。但舆情监管部门更应注意公众情绪引发的负面效应,如在舆情爆发阶段,政府及相关部门应及时启动舆情应急机制,定位负面情绪累积形成的非理性归因;在波动期,媒体及政府应及时辟谣,发挥权威信息发布的优势,扩散正向情感;在消退期,各地加强对疫情防控地区相关政策落实情况的披露,从根本上疏导和控制负面舆情。
本文基于情感社会学理论和Word2Vec-BiLSTM模型的情感测量方法,从情感唤醒、归因及情感移情三个维度分析舆情主体情感变化特征及诱因,并提出相应对策。未来在模型设计上将会考虑表情符号对文本语义挖掘的影响;情感上融合地理空间角度把握情感特征分布;舆情引导上将情感疏导与技术处理相结合,实现突发公共卫生事件网络舆情综合治理。