事件系统视角下网络舆情态势感知研究*

2024-03-01 00:38张培颖黄晓怡李轶芳
情报杂志 2024年2期
关键词:画像态势舆情

周 欢 张培颖 黄晓怡 李轶芳

(湖南工业大学商学院 株洲 412007)

0 引 言

互联网技术的发展,使得我国网民结构和网络环境产生了极大的变动,网络舆情热点敏感事件频发,舆情事件具有突发性、不确定性和难控性等特征,易对社会和谐稳定发展造成一定威胁。现有网络舆情相关研究,大多仅对舆情事件中实体内部特征进行分析,未从事件整体层面全面探析网络舆情发展态势,导致难以较好地对网络舆情进行监管,社会和谐稳定受到冲击。而事件系统理论通过对事件的时间、空间和强度等要素展开分析,能够从更全面的角度对有关事件的现象进行描述与解释,并对事件的冲击力进行衡量[1]。因此,从事件系统视角,感知网络舆情态势并预测其后续演化态势,从而实现网络舆情的有效治理,有利于保障整个社会的健康、和谐与稳定发展。基于此,本文将网络舆情作为研究对象,从事件系统视角,建立融合态势感知理论和用户画像的网络舆情态势感知模型,通过划分舆情演化阶段开展动态性的网络舆情研究,并通过改进预测模型实现更为科学合理的舆情态势预测,为网络舆情管理部门的舆情引导与治理提供参考。

1 文献综述

1.1 事件系统理论相关研究

事件系统理论是由Morgeson等[1]提出的一种包括事件时间、空间与强度属性的动态系统性理论,其中,时间属性涉及事件发生时机和所存在时长等,空间属性重点关注事件效果的传播,强度属性主要关注事件的新颖性、颠覆性和重要性。该理论自提出以来,被广泛应用于组织管理和个体行为研究领域。在组织管理方面,现有研究聚焦于事件对组织合作伙伴选择、组织安全行为、组织管理能力提升等的影响[2-4];在个体行为方面,研究重点关注组织的领导者[5]、现有成员[6]以及求职者[7]的感知与行为的产生、发展及影响;随着交叉学科研究的兴起,学者们逐渐将研究扩展到信息管理领域,基于事件系统理论提出信息管理研究框架[8]。

事件系统理论的发展为连接定性研究与定量研究提供了桥梁,但现有组织管理与个体行为的研究更多采用量表研究,量表制定、采访者、受访者等均对研究质量具有较大影响,且研究对于事件内容的关注度不足。在信息管理领域,事件内容受到关注,但现有研究仅停留在理论框架的提出阶段,尚未有研究从定量分析的角度展开。此外,将该理论应用于网络舆情领域,有助于综合考虑定性和定量两个层面,结合舆情事件实际内容,从系统的角度分析现实中的舆情问题,然而,尚未有基于事件系统理论来分析网络舆情信息的研究涌现。

1.2 网络舆情态势感知相关研究

网络舆情是指针对特定网络事件,广大网民在平等与开放的网络平台中,公开、自由地发表其对该事件的态度、观点与倾向等,也被称作“看得见的声音”[9]。态势感知即在一定的时空范围内,提取环境中的要素、理解要素内涵并预测未来可能发生的情况,包括要素感知、态势理解和态势预测3个层次[10]。态势感知最初运用在航空、国防领域和网络安全领域,能够评估战场复杂形势从而做出预测行动[11]。随着网络舆情环境的复杂化,学者们开始将态势感知理论应用于网络舆情治理领域,研究主要包括网络舆情态势感知概念界定、内容分析、状态评估与预测三个方面。在概念界定方面,现有研究认为网络舆情态势感知指的是分析网络环境中存在的意识形态、思想价值观念、道德观念等[12];在内容分析方面,研究重点围绕情感、主题、观点等方面展开分析[13-14];状态评估与预测相关研究综合考虑了舆情所涉及的主体信息、文本内容和环境信息等,构建状态评估数理模型,并对后续舆情演化趋势进行预测[12,15-16]。

态势感知理论为网络舆情研究提供了新的研究落脚点,然而,大部分研究关注的重点实际在于态势理解层次,而较少涉及要素感知与态势预测层次,且已有关于态势预测的研究较少采用定量分析方法开展研究,削弱了网络舆情态势感知研究的科学性。

1.3 用户画像相关研究

用户画像是指以用户整体为核心,基于多方面的用户真实数据,对用户的属性进行分类,并抽取出用户的属性特征,构建能够全方位描绘用户的模型[17]。现有关于用户画像的研究大多集中于用户画像构成要素、构建方法、特征等方面。在用户画像构成要素方面,用户的基本信息、社交关系、用户行为、兴趣爱好等要素均为构成用户画像的基本要素[18-19]。除以上基本要素外,不同领域的研究构成要素有所不同,如情感倾向是构成舆情传播领域用户画像的重要要素之一[20]。在构建方法方面,基于机器学习或统计分析的方法是构建用户画像最常用的方法,其中基于机器学习的构建方法着重于利用机器学习算法对目标用户的属性特征进行提取[21],基于统计分析的构建方法主要通过统计分析不同维度的用户真实数据,勾画出用户画像[22]。在画像特征方面,用户画像具有真实性、独特性、应用性、动态性四大基本特征[23]。

用户画像有助于全面实现网络舆情态势感知,然而,针对用户或者群体等主体的研究较多,针对网络舆情整体的研究还较少,且用户画像与网络舆情态势感知研究往往独立展开,较少有研究将其结合起来。

综上,本研究基于事件系统的视角,结合网络舆情态势感知与用户画像,从要素感知、态势理解、态势预测三个层面剖析网络舆情事件发展的本质特征和内部规律,探究网络舆情事件时间、空间、强度要素的属性特征,刻画网络舆情发展态势,并预测其未来发展趋势。

2 事件系统视角下网络舆情态势感知模型构建

2.1 模型设计

本研究融合态势感知理论和用户画像,构建事件系统视角下网络舆情态势感知模型,模型分为要素感知层、态势理解层和态势预测层3层。在要素感知层首先构建网络舆情画像标签体系,再通过Python对事件时间、空间和强度要素等相关数据进行采集,并对采集后的数据进行预处理。在态势理解层,基于预处理后的数据,通过确定舆情生命周期,实现舆情事件时间要素理解;通过统计微博用户关注数、粉丝量和点赞数,博文评论数、转发数和点赞数分别计算舆情扩散潜力和舆情扩散效果,实现舆情事件空间要素理解;通过情感分析,实现舆情事件强度要素理解;再综合要素理解结果生成各阶段的舆情画像。在态势预测层,界定舆情事件回应时间,构建Grey-BP神经网络对界定时间内的空间要素和强度要素进行预测。模型框架图如图1所示。

图1 事件系统视角下网络舆情态势感知模型

2.2 要素感知层

新浪微博是我国用户量最多的一个社交网络平台,也是网络舆情事件发酵的主要场所[24]。因此,本研究以微博作为数据来源,从事件系统视角,围绕舆情事件时间、空间和强度要素构建网络舆情画像标签体系,并以舆情生命周期作为事件时间要素的一级标签,发博时间为其二级标签;以舆情扩散潜力和舆情扩散效果为事件空间要素的一级标签,关注数、粉丝量和发文量作为舆情扩散潜力的下级标签,评论数、转发数和点赞数作为舆情扩散效果的下级标签;以舆情情感强度作为事件强度要素的一级标签,博文文本为其二级标签。再通过Python采集要素相关数据,并对其进行分词、去停用词、剔除无用无效信息、数据规范化等数据预处理,获得易于处理的结构化数据。

2.3 态势理解层

网络舆情随着时间的推移而呈现不同的特征,因此,本研究以事件系统理论为基石,利用时间序列分析方法对用户发博时间进行分析,从而确定舆情生命周期,探究网络舆情事件时间要素特征。同时,网络舆情事件涉及舆情用户、舆情信息以及舆情发生行为,而用户的关注数、粉丝数和发博量,舆情内容的情感倾向,舆情内容的评论数、转发数和点赞数能够在一定程度上体现舆情事件在发酵过程中的影响力、情绪性和传播性,因此,本研究通过统计用户的关注数(d1)、粉丝数(d2)和发博量(d3)计算舆情扩散潜力(D),通过统计舆情内容的评论数(o1)、转发数(o2)和点赞数(o3)计算舆情扩散效果(O),通过基于情感词典的文本情感分析方法计算舆情内容的情感强度(E)。最后,综合舆情生命周期划分结果、D、O和E计算结果,生成不同阶段的舆情画像。

第一,D和O的计算方法如下:

D=wd1*d1+wd2*d2+wd3*d3

(1)

O=wo1*o1+wo2*o2+wo3*o3

(2)

表1 二级标签数据矩阵X

其次,根据公式(3)对数据矩阵X进行归一化处理,得到计算矩阵Y:

(3)

其中,max(xj)表示X中第j列的最大值,min(xj)表示第j列最小值。

再通过公式(4)构造母序列Hj:

hi=max(yi1,yi2,…,yim)

(4)

其中,i为第i阶段,m为指标数。

接着,根据公式(5)计算两级最小差a和最大差b:

(5)

然后,通过公式(6)计算指标的灰色关联度:

(6)

(7)

(8)

(9)

(10)

对于wj,利用基于博弈论的组合权重确定模型,实现纳什均衡,获得最优标签权重:

首先构建优化模型计算最小组合权重与基本权重的差值:

min‖α1w1+α2w2-wf‖2,(αf>0,f=1,2)

(11)

其中,α1w1+α2w2为主客观权重的线性组合,α1+α2=1。

然后获得满足模型一阶导数条件最优的线性方程组:

(12)

(13)

最后得到各标签的组合权重wj:

(14)

第二,E通过基于BosonNLP情感词典的文本情感分析方法计算,该情感词典中的情感词来源于微博、新闻以及论坛等,更符合微博文本分析情境。首先,整合百度、哈尔滨工业大学、四川大学机器智能实验室和中文停用词表及人工添加无意义的emoji符号,形成更全面的停用词表;然后,采用Jieba对所获取的博文文本进行分词处理,结合停用词表去除无用词;最后,计算博文文本的情感得分,并对其进行加总与平均得到各阶段的E。

第三,建立舆情事件处于不同阶段的舆情画像如图2所示,包括该阶段时间范围、数据总量、数据来源、舆情扩散潜力、舆情扩散效果和舆情情感强度,根据画像结果,探究各要素在不同阶段对舆情事件的冲击力特征。

图2 舆情画像模型

2.4 态势预测层

对舆情事件发展态势进行预测,能及时地发现事件可能存在的风险因素,帮助有关部门制定及时、科学且合理的应对方案。高容错性、自学习性与自适应性使BP神经网络[29]成为预测研究中的常用模型之一。从微博中获取湖南省高校网络舆情事件数据,并对其预处理后输入传统的BP神经网络模型进行训练,训练结果如图3所示。结果表明,当实际结果数据为离散数据时,其分布具有较大的随机性,易导致预测结果与实际结果的差异较大,致使预测结果的可信度存疑。

图3 离散数据预测结果对比

为解决上述问题,本文借助灰色系统理论[30],发掘数据之间的特定联系,提出了一个Grey-BP神经网络模型,从系统的角度对输入神经元数据进行整理,弱化数据的随机性,探求数据的整体规律,从而提高BP神经网络预测结果的科学性。较传统BP神经网络,本文提出的Grey-BP神经网络包含离散数据处理层、输入层、隐含层和输出层四个部分(见图4):

图4 Grey-BP神经网络模型

模型的改进步骤为:

Step2:对输入的原始节点数据进行加和化处理,将离散数据连续化:

(15)

输入原始离散数据x(0),经离散数据处理后输出节点值x(1),再将其传至输入层,得到输入层的输出信息,将其传至隐含层,再将隐含层输出的信息传至输出层,将输出层的输出结果与期望阈值进行对比,若未达到期望阈值,则将不满足精度要求的误差信号向前反馈至各层单元,对各层神经元之间联系的权重wij和wjk以及期望阈值进行调整,经过多次反馈调整后得到最终期望输出。

3 实证分析

高校网络舆情是一种典型的网络舆情类型,由于高校网络舆情的主要群体为学生,其正处于价值观的构建时期,对事件的认知与分辨能力尚且不足,容易造成舆论焦点不实、病毒式传播以及从众或极端现象的出现,若不及时且恰当地处理高校网络舆情,则易对学生的学习与心理状态、高校的正常教育教学以及社会的稳定发展造成不良影响。因此,对高校网络舆情的演化态势进行研究,具有重要的意义。本研究以湖南省本科院校官方微博博文下的微博评论和转发信息作为舆情信息来源,应用所构建事件系统视角下网络舆情态势感知模型,对湖南省本科院校网络舆情事件发展态势进行感知与预测。

3.1 高校网络舆情要素感知

首先,根据百度指数工具确定湖南省高校网络舆情事件的发生范围为2022年2月20日至6月21日;然后,通过python爬虫,从湖南省本科院校官方微博博文中爬取相关舆情事件数据共1 442条,包括官方微博ID、微博博文ID、博文文本、博文评论与转发用户ID及用户粉丝,关注和发博量、博文评论与转发文本及文本评论,转发和点赞量、博文评论与转发时间等;经过分词、去停用词、去除无效文本等数据预处理操作后,获得相关舆情数据共1 350条。

3.2 高校网络舆情态势理解

3.2.1舆情事件时间要素理解

对预处理后的舆情数据进行统计分析获得其分布特征,并划分舆情生命周期如图5所示,高校舆情生命周期分为为潜伏期(2月20日至3月11日)、爆发期(3月12日至3月14日)、震荡期(3月15日至5月31日)、消退期(6月01日至6月21日)。

图5 高校网络舆情生命周期

3.2.2舆情事件空间要素理解

a.权重确定

①客观权重确定

表2 二级标签矩阵

②主观权重确定

表3 专家-标签评价矩阵

③组合权重确定

b.舆情扩散潜力计算

根据公式(1)得到舆情演化各阶段的D如表4所示,结果清晰地刻画了D的变化趋势,随着高校网络舆情热度的上升,舆情相关用户及其行为的增加,使得D从潜伏期到爆发期得到巨大提升,而从爆发期到震荡期又得到了进一步增长,在震荡期时达到巅峰,而震荡期过后,随着相关舆情用户对舆情事件的关注度下降,D又显现出急遽下降的趋势。

表4 舆情扩散潜力D

c.舆情扩散效果计算

表5展示了舆情演化各阶段O,结果表明,O的变化趋势总体与D的变化趋势相同,随着高校网络舆情信息的增多,O从潜伏期到爆发期得到一定增长,再从爆发期到震荡期实现“爆发式”增长,而随着舆情热度的下降,又显露出“断崖式”下跌现象。不同的是,O从爆发期到震荡期的增长幅度较D的增长幅度更大,舆情得到了广泛的扩散。

表5 舆情扩散效果O

3.2.3舆情事件强度要素理解

使用基于BosonNLP情感词典的文本情感分析方法计算高校网络舆情演化各阶段的情感强度E,并通过可视化的形式展示强度的变化趋势,可视化结果如图6所示:

图6 舆情情感强度E变化趋势

E呈现先升后降趋势,其中潜伏期时,E较弱,此时为高校网络舆情事件的初始阶段,舆情相关主体对事件产生的原因以及事件的危害性等尚未明晰,因此未产生易影响高校和谐与社会稳定的相关言论。爆发期时,高校网络舆情情感倾向为强正向,E达到最高,这与舆情事件发生后,高校方针对网络舆情事件,立刻召开会议、制定方案并实施应对措施等行为紧密相关。震荡期时,经过上一阶段的有效处理后,高校网络舆情情感倾向仍为正,但E有所下降,直至消退期时,高校网络舆情情感倾向逐渐趋向于中性,E趋向于0。

3.2.4高校网络舆情画像生成

根据舆情事件系统的要素感知和态势感知结果,分别获得高校网络舆情于潜伏期、爆发期、震荡期和消退期的舆情画像如图7-10所示,其中R表示评论数据,P表示转发数据。

图7 潜伏期高校网络舆情画像

图7表明,高校网络舆情的潜伏期较长,有效数据较少,且均匀分布于评论与转发数据。此外,此时期的D、O与E均较弱,舆情扩散的程度较差,舆情事件的发生尚未引发网络用户的激烈讨论,大多数人仍对事件本身保持沉默态度。由此可知,潜伏期时,空间与强度要素均对高校网络舆情事件具有较弱的冲击力,与之相反,时间要素的冲击力极强。

由图8可知,高校网络舆情事件爆发期很短,但有效数据量却是最多的,这与其他网络舆情事件中爆发期的特征一致,且此阶段的评论数据约为转发数据的2.93倍,可知高校网络舆情事件中,造成事件爆发的主体主要为评论用户。此外,此阶段D与O均较高,E极高且达到了整体最高状态,舆情事件已扩散到了一定的程度,且此时舆情事件所处的网络环境较为正向,大多数人选择以积极的态度在微博上对舆情事件展开讨论。由此可知,在爆发期时,时间要素对高校网络舆情事件的冲击力较弱,空间要素的冲击力较强,强度要素冲击力极强。

图9 震荡期高校网络舆情画像

图10 消退期高校网络舆情画像

结合震荡期高校网络舆情画像可知,高校网络舆情事件的震荡期极长,产生的有效数据也较多,且此阶段评论数据为转发数据的9.84倍,进一步验证了高校网络舆情事件发展的主要推动力来源于评论用户。在此期间,D与O得到了“火箭式”提升,舆情事件扩散的程度达到了整体峰值,而此时的E却在削弱,表明舆情事件所处于积极的网络环境,但持正向观点的网络用户却在减少。由此可知,震荡期时的高校网络舆情事件受时间和强度要素的冲击力影响较大,而受空间要素的冲击力影响极大。

消退期期高校网络舆情画像显示,该阶段持续时间较长,有效数据量较少,且以5∶1的比例分布于评论数据和转发数据。此外,D、O、E三者均大幅度下降,大量用户退出此舆情事件,致使舆情事件发展形势的关注度急剧减少,扩散程度较弱,网络舆情事件中所充斥的个人情绪较少,网络环境趋于稳定。此时,时间要素对高校网络舆情事件的冲击力较强,空间要素上的冲击力较弱,强度要素的冲击力极弱。

3.3 高校网络舆情态势预测

考虑样本量大小对神经网络预测效果的影响及网络舆情日益变化的特点,本文以舆情全生命周期所涉及的1 350条数据作为样本数据,根据国务院办公厅颁布的相关舆情回应通知,官方对舆情事件的回应最迟不超过2天,将舆情事件回应时间界定为2天,并通过增减法遍历预期范围内的隐含层神经元个数,再计算最小平均均方误差,确定各预测单元最终的隐含神经元个数。

3.3.1D预测

隐含神经元个数lu取值范围为[3,12],通过计算取值范围内的最小平均均方误差,确定lu=4,在此基础上对D进行预测,结果为Dt1=39 663.97,Dt2=39 669.45。如图11所示,D的预测值与真实值对比结果呈现高度一致状态,仅有极少部分的预测值与真实值有较大差异,预测结果具有强可信度。

图11 D预测结果对比

3.3.2O预测

隐含神经元个数ls取值范围为[3,12],ls=9时,平均均方误差最小。因此,设置ls=6,对O进行预测,结果为Ot1=-170.543,Ot2=-170.543。预测对比结果如图12所示,结果表明预测值与实际值总体变化趋势相同,预测值的出入较小,因此,预测结果是可靠的。

图12 O预测结果对比

3.3.3E预测

将博文文本的正向情感强度(e1)、中性情感强度(e2)、负向情感强度(e3)作为E预测单元的输入神经元,E作为输出神经元,计算得到隐含神经元个数le取值范围为[3,12]。le=9时,平均均方误差最小,此时的预测结果为Et1=2.1915,Et2=2.1917。预测对比结果如图13所示,结果表明经调整后,情感得分预测值与实际值变化的趋势保持高度一致,数值之间的差异较小,预测结果具有可靠性。

图13 E预测结果对比

由预测结果可知,消退期之后,高校网络舆情事件后续的D将与消退期时的状态保持一致,而O将朝负向发展,E将由消退期的中性情绪向正向情绪转变,即下一阶段,高校网络舆情事件的冲击力又将表现出极其不一样的特征,若直接实施以往的舆情治理措施,则可能导致无效治理甚至反向治理的后果。

4 结 语

本研究以湖南省高校网络舆情事件为例,分析了事件的时间、空间与强度要素特征的演化过程。总的来说,事件时间、空间与强度要素呈现不同的变化特征,且不同演化阶段的时间、空间与强度要素冲击力特征也截然不同。由此建议:高校网络舆情事件相关管理部门需:a.提前构建预警与研判机制,及时察觉舆情事件产生以及事件可能经历的发展阶段及各阶段持续的时长,并根据冲击力特征研判结果,制定个性化治理对策;b.找到舆情事件扩散潜力较大的评论用户,联合相关调查部门与权威机构,鼓励并引导其在最佳扩散时机对舆情事件中的事实性与科普性信息以及政府与高校相关政策进行解读;c.加大“疏”的力度,减少“堵”的行为,协同多个部门共同发声与行动,并将责任与权力分配到个人,做到及时发现、分析与解决问题,避免网络舆情情绪转移线下而造成的一系列社会问题,以免小问题演化为大危机;d.重视对事件发展趋势的预测与演练,提前预测下一阶段情况,并进行演练,避免舆情危机事件的发生。

本文所构建的事件系统视角下网络舆情态势感知模型能够有效地理解网络舆情态势,并准确地预测出网络舆情各属性的未来演变态势。但本文囿于数据来源的单一性问题,仅针对微博中特定的网络舆情事件展开研究,未能充分利用到微信、快手、抖音等网络平台中多种类型的舆情数据。因此,在未来的研究中,拟结合多个平台的舆情事件数据,扩大舆情事件的范围,提高研究成果的普适性与科学性。

猜你喜欢
画像态势舆情
威猛的画像
“00后”画像
画像
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
我国天然气供需呈现紧平衡态势
舆情
舆情
舆情
县乡一体化探索呈加速态势