基于社会网络分析的突发事件网络舆情关键节点识别研究——以#李文亮医生去世#话题为例

2022-03-18 07:45杨露露金如和王丽华
网络安全技术与应用 2022年3期
关键词:李文亮网络分析谣言

◆杨露露 金如和 王丽华

基于社会网络分析的突发事件网络舆情关键节点识别研究——以#李文亮医生去世#话题为例

◆杨露露 金如和 王丽华

(中国人民警察大学 河北 065000)

网络社会的深入发展为突发事件网络舆情的传播提供助力,为了维护社会的和谐稳定以及平复公众的焦虑心理,及时有效地处理突发事件网络舆情传播刻不容缓。本文通过社会网络分析理论以及复杂网络分析工具Gephi,构建突发事件微博舆情传播网络,以定量的方法识别出关键节点及传播路径,并提出相应的干预及引导策略。研究表明:根据本文案例研究结果,为识别出突发事件网络舆情传播中的关键节点,应对那些连入度、连出度、中介中心度等度数较高的节点保持密切监控,同时分离那些联系较为紧密的传播模块,突破谣言传播的壁垒。

社会网络分析;Gephi;网络舆情;关键节点识别

1 研究背景

当前,随着网络社会的深入发展,信息的发布、传播以及互动的方式产生了巨大的改变。各类突发事件更是借助互联网的形式以更快的速度进入人们的视野,成为网络舆情传播和热议的焦点。然而,突发事件影响重大,在事件未明之前就进行大肆传播,不仅有可能成为谣言传播的温床,影响社会的和谐稳定发展,还有可能在公众之间形成舆论导向,造成社会心理的紧张与焦虑。

此外,互联网时代的多极化势头,使得舆情传播的速度可谓是一泻千里,舆情在传播过程中不断扩散和变异,使得我们对舆情的影响难以控制。

因此,面对突发事件造成的网络舆情,我们应如何应对以化解危机,成为亟待解决的当务之急。

面对2019年底突然爆发的新冠肺炎疫情,社会各界议论纷纷,作为最先发现新冠肺炎的八位“吹哨人”之一的李文亮医生,其救治过程牵动人心。2019年2月7日凌晨三时许,经其所任职的医院武汉中心医院证实,李文亮医生已于当天2点58分去世。#李文亮医生去世#一度登上当天的微博热搜话题。本文拟基于社会网络分析方法,以#李文亮医生去世#微博热搜产生当天发表观点的新浪微博用户为研究对象,研究此话题产生当天的首发节点、扩散节点等,识别出话题传播的关键节点,并据此提出引导话题走向的策略。

2 理论基础

本研究采用社会网络分析方法研究此微博传播网络中各节点与节点之间的关系。社会网络指的是社会行动者以及他们之间关系的集合,研究行动者之间的关系特征并探索这些关系对行动者的影响是社会网络分析的主要研究对象。本研究利用复杂网络分析工具Gephi,构建出微博舆情传播网络。通过此微博舆情传播网络,可以直观地观察微博用户关系的组成结构、整体网络的分布形态等,通过Gephi找出网络节点之间的关系。

赵蓉英、王旭采用社会网络分析方法,进行突发事件网络舆情关键节点识别研究,通过网络社群图分析、接近中心性分析和K-丛分析等,发现舆情传播网络中的意见领袖等关键节点,挖掘出舆情传播的内在结构特征以及演变规律,并提出相应的突发事件网络舆情引导对策;邱晨子利用复杂网络分析工具Gephi,构建出微博舆情网络图谱,并据此观察某一热点话题下微博用户关系的组成和网络结构,基于此提出引导与控制微博舆情信息传播的策略及建议。

在相关学者的研究基础上,本文采用社会网络分析方法以及复杂网络分析工具Gephi,以典型突发事件为例,对其舆情传播网络进行定量分析,尝试识别关键节点,发现其内在传播规律,并据此提出干预及引导策略。

3 突发事件网络舆情关键节点识别分析

3.1 数据提取

本文选取#李文亮医生去世#微博热搜话题当天发表观点的新浪微博用户作为研究样本。研究过程中发现,将所有发布该话题的用户收集起来,用户数量过于庞大,难以展开分析。之后缩小样本范围,以武汉中心医院发布李文亮医生去世讣告的时间2020年2月7日凌晨2点58分为截点,定义此前发布#李文亮医生去世#话题的微博用户均属于传播谣言,将这些用户及与该用户存在转发或评论关系的用户数据爬取下来,共计获得56696个节点,59975条边。随后将其导入复杂网络分析工具Gephi中进行分析。

3.2 实证分析

(1)载入数据

将收集到的数据处理,转换成可供复杂网络分析工具Gephi识别的.csv数据表格文件,Source为发布#李文亮医生去世#相关微博的用户节点,Target为转发或评论Source节点的微博用户节点。将数据导入软件中,得到初始的节点关系图,如图1所示,该微博网络中有56696个节点、59975条边。

图1 初始节点关系图

(2)度数与度的分布

对导入进Gephi的数据进行度的运算,得到网络的平均度为1.058,节点度的比例分布如图2所示。从图2中可以直观看出,此微博网络中绝大多数的节点都拥有很小的度,即和其他节点相连接的概率很小。只有少数节点拥有较大的度数,因而这些度数较大的节点就是该网络舆情传播中的核心节点。

由图2和图3可以看出,图中大面积覆盖的颜色是紫色,他们在网络图中的度为1,表示只有一个节点与其相连,这些节点占到全部节点比重的94.39%;度数为2的节点为绿色,放大网络图后发现,这些绿色的节点均匀地分布在网络图的中部,表示有2个节点与其相连,占全部节点的3.82%;度数为3的节点为蓝色,表示有3个节点与其相连,占全部节点的0.2%;度数为4的节点为黑色,表示有4个节点与其相连,占全部节点的0.61%;度数为5的节点为橙色,表示有5个节点与其相连,占全部节点的0.1%;以此类推。由于该网络中节点总数大,因此,即便一些度数高的节点在网络中占比较小,但是在网络图中也可以找到。

然而,该网络中约占98%的节点都拥有较小的连接度,且这些节点的连入度和连出度也大多为1和0,说明在该网络中,绝大多数的节点属于自关联节点,即在微博网络中他们对网络信息发出个人观点,但不再有人对其进行评论或转发。

图2 节点度的比例分布(部分)

图3 节点的连接与度的分布比例

观察表1展示的部分表格可以看出,度和连出度较高的部分节点,其连入度并不高,说明这些节点发表个人观点之后,有较多的节点对其评论或转发,但这些节点却很少再去评论或转发别的节点。

表1 节点的度、连入度和连出度(部分)

IDModularity Class连入度连出度度 经济观察报0076927692 央视新闻42047714771 深蓝财经64024912491 凤凰网华人佛教2115021502 优医邦23113451345 医生妈妈欧茜8010391039 扎西-德乐211986986 中国校园之声50983983 严锋300957957 头条新闻490808808 皮肤科博士-陈奇权1090685685 钛媒体APP11593593 万能的大熊60583583 九爪小蟹91573573 支点财经921567567 历史影像回忆录60566566 传媒接班人761531531 凤凰网科技30510510 小白测评1320466466 福布斯中文网110457457

综上所述,我们在观察微博网络舆情传播的过程中,应实时监控这些度数大的节点的舆情动向,控制其转发和评论动向,从而引导舆情的生长,使舆情信息能够及时得到有效控制。

(3)平均路径长度及中心度分析

①平均路径长度

通过对网络数据进行平均路径分析,得到网络中的平均路径长度约为1.005,结果如图4所示,即表明在此网络中,信息只传播一步之后便不再继续传递,信息传播的深度不大,网络整体层次不强。

图4 平均路径长度运算结果

②中心度分析

由Gephi软件分析可得各个节点的中介中心度(Betweenness Centrality)和接近中心度(Closeness Centrality),如表2所示。

表2 中心度数据(部分)

IDCloseness CentralityBetweenness Centrality 大肥皂1.076.0 一路上有你ZL1.047.0 疏风袭雨1.024.0 Dr.Summer1.024.0 茶健身1.023.0 我是那小谁谁谁1.020.0 才仁冷珠1.020.0 华创传媒老薄1.012.0 分析师谢漠烟1.010.0 老怪中国blog1.09.0 导演宋健君1.06.0 历史影像回忆录1.00.0 头条新闻1.00.0 建筑-FAN1.00.0 香港紫荆卫视1.00.0

中介中心度表示处于网络中最短路径上的节点出现的频率。由图2展示数据可以看出,中介中心度大于0的节点在56696个节点中只有11个,剩余的绝大多数节点的中介中心度均为0。所以,只有11个节点在处于网络其他节点传播的最短路径上,说明这些节点占据着至关重要的作用,对信息传播的影响最大。

接近中心度表示网络中某一节点到网络中其他可达节点的距离。由图2展示数据可以得出,该网络中接近中心度大于0的节点数目约为471个,这表示在该网络中只有很小一部分节点与其他节点存在最短路径,在第一时间转发一个热点话题的可能性较大。因此,在该网络中,绝大多数的节点都难以在第一时间到达其他节点,我们只需要对这些接近中心度大于0的节点保持监控,就可影响信息传播的过程。

综合中介中心度和接近中心度的分析结果,可以得出前11个节点的中介中心度和接近中心度较高,因此,在对网络舆情进行引导和控制的时候要尤为关注这些节点,以及时发现和控制不良信息的传播。

(4)模块化分析

利用Gephi对网络数据进行模块化分析,如图5所示得到的结果将网络中所有用户分为162个社区。

图5 网络模块化报告

图6和7表示各模块节点的度数所占的比例和模块化图示,从图4.3可以看出,节点之间呈现出不同的颜色,不同颜色的节点就代表着不同的模块,模块即相关联的节点间组成的社区。从图7中可以很明显地看出,该网络有8个较大的模块,每种颜色代表一个模块,每种颜色的模块中间有一个中心节点,这个节点拥有很大的连出度和少量的连入度。只有少量的模块拥有较多关联节点,绝大多数的模块拥有的关联节点都很少,这体现了微博网络信息传播的无标度性,即网络中少数节点拥有极其多的连接,大多数节点只有很少量的连接,各节点之间的连接状况(度数)具有严重的不均匀分布性,网络具有严重的异质性。在无标度网络中,几个大节点对网络起着主导作用,如果我们对这些大节点保持监控,那么就可以影响舆情信息的传播。

图6 模块化分层节点度比例(部分)

图7 网络模块化分布结构

4 结论

4.1 分析结论

(1)从节点的度来看,连入度取值大于等于10的节点只有4个,分别是“V奉天承运V”、“才来凭寄”、“农家皇甫”、“武漢YASU共赏圈”4名用户,说明这4名用户曾经对超过10名发布#李文亮医生去世#微博谣言信息的用户进行过转发或评论。然而,同时比对这几名用户的连出度,发现他们的连出度取值均为0,表明这些用户虽然积极地转发或评论了关于#李文亮医生去世#的谣言话题,但是这些谣言只影响了他们自己,并没有通过他们影响更多的人。我们在引导谣言传播的过程中,可以采取重点对这几名用户进行官方私信辟谣等做法,使其免受谣言欺骗。

(2)从节点的度来看,连出度取值越大,表示该节点被转发或评论的次数越多,其发布的谣言被更多的人知道的概率越大。从数据表格中可以发现,连出度取值最大的为7692,最小的为3,共471名用户连出度大于0,其中有119名用户的连出度取值大于等于100。在这119名用户中,有36名用户的连入度大于0,这表明这36名用户在发布谣言并得到大量转发或评论的同时,也对其他用户进行了转发或评论,说明这36名用户不仅影响他人,也受到其他人的影响。但是检查发现,这些用户的连入度均为1,表示这些用户并未受到过多其他谣言的影响,我们的重点仍应放在其连出度方面。在引导谣言传播的过程中,我们应重点识别这119名受到大量转发或评论的微博用户,并采取有效及时的措施控制其对谣言的传播。

(3)从此微博网络的平均路径长度来看,平均路径长度为1.005,也就是说大部分节点只传播一步便不再传播,这说明该微博网络传播的深度不大,比较容易得到控制。同时,从平均路径长度我们也可以得出该网络的中介中心度和接近中心度。中介中心度表示处于网络中最短路径上的节点出现的频率,接近中心度表示网络中某一节点到网络中其他可达节点的距离,综合中介中心度和接近中心度的分析结果,有11个节点的中介中心度和接近中心度较高,分别是大肥皂、一路有你ZL、疏风袭雨、才人冷珠等。同时检查这些节点的度发现,他们的连入度取值均在100以下,连出度取值在1到3。这说明这些节点不仅影响其他节点,还受到其他节点的影响,还能作为其他节点之间联系的桥梁。因此,在引导谣言传播的过程中,这11名用户应受到重点监控。

(4)从模块化分析来看,该微博传播网络可以分为8个比较明显的模块。观察发现,紫色、草绿色、蓝色、青绿色和肤粉色的模块大多只有完整的一块,而橙色、黄色和粉红色的模块则由多个连接在一起的小模块组成,其余灰色的小模块由于分布较广,难以整合,不予估计。同时参考模块化度量值,模块度越高,表示该模块内部联系越紧密,受到外部的影响越弱,分组质量越好。在该网络的模块化分组中,草绿色、蓝色和肤粉色模块的模块度较高,且在整体网络中占比可观,在数据表格中发现,草绿色、蓝色和肤粉色模块的中心节点分别是央视新闻、深蓝财经和优医邦。在引导谣言传播过程中,应注意分离这几组模块。

4.2 引导策略

(1)信息控制

首先,控制网络中连出度比较大的节点。连出度较大说明该节点发布的信息有较大的转发量或评论量,控制住这些节点可以抑制谣言的大范围扩散,初步遏制谣言的传播。

其次,截断中介中心度和接近中心度较高的节点。节点的连出度高,但并不能覆盖整个网络范围,我们还需要注意处在节点之间最短连接路径上的节点。将这些节点截断,那么多个节点之间的连接路径就会被切断,难以进行信息交换,谣言的传播自然无法蔓延。

再次,持续关注那些连入度较高的节点。连入度较高,说明该节点多次转发或评论其他节点发布的谣言,那么该节点信谣传谣的可能性就较大。及时对这些连入度较高的节点进行私信辟谣,可以提高这些节点的警惕心,降低信谣传谣的可能性。

最后,分离谣言传播网络中的大型传谣群体。这些传谣群体内部联系可能十分紧密,一人发布,多人之间互相转发评论,这一方面会增加个人对谣言的信任,提高信谣的可能性,另一方面也会使谣言在更多节点之间传播,扩大谣言传播的范围。因此,要注意分离这些谣言传播群体,降低谣言在更广范围内的信任和持续传播。

(2)舆论引导

①官方媒体主动辟谣。在谣言大肆传播的同时,建议官方媒体同步跟进,主动对谣言信息进行辟谣和辩驳,并发布正确、正面的信息,以达到官方媒体的正面引导作用。这不仅有利于遏制虚假信息的传播,还可以将真实的信息及时推送到用户手中。此外,对于已经识别为谣言的信息,微博官方也可以在其所发布的信息上标注“谣言”等字样,主动告知各类用户此为谣言,并限制对该信息的转发和评论。另外,就此次疫情为例,微博官方还专门开辟了每日辟谣专题和话题,对于减少谣言的传播、提高公众的理智、维护社会的稳定发挥了重要作用。

②意见领袖跟随转发。所谓意见领袖,即那些在各类话题中活跃度较高、对其他用户影响力较大的用户。微博意见领袖所发布的信息,一般拥有较大的转发量和评论量,容易形成热点话题。由微博意见领袖跟随转发的辟谣信息,一方面可以拉动当前处于弱势地位的正面信息,将官方发布的辟谣信息更快地送到人们眼前,让其与谣言对垒,瓦解谣言传播链;另一方面,多位意见领袖发布辟谣信息形成辟谣信息网,将更快覆盖谣言,将谣言遏制在传播阶段。

[1]刘军.整体网分析:UCINTE软件实用指南[M].上海:格致出版社,2014.

[2]赵蓉英,王旭.突发事件网络舆情关键节点识别及导控对策研究——以大贤村遭洪灾事件为例[J].现代情报,2018,38 (01):19-24+30.

[3]罗家德.社会网分析讲义[M].北京:社会科学文献出版社,2005:96-156.

[4]邱晨子.微博网络舆情热点生长分析模型研究[D]. 大连海事大学,2013.

[5]王佳秋.基于用户行为及关系的微博电企业影响力度量[D]. 哈尔滨商业大学,2013.

[6]邓君,马晓君,毕强.社会网络分析工具Ucinet和Gephi的比较研究[J].情报理论与实践,2014,37(08):133-138.

[7]李学兰. 基于Gephi的物流金融研究可视化[J].牡丹江大学学报,2017,26(01):26-28+46.

国家民委民族研究项目“新媒体时代涉民族因素网络舆情风险建模与治理研究”(编号:2020-GMD-023);河北省社会科学发展研究课题“重大突发事件网络舆论新生风险治理机制研究”(编号:20200403102);全国统计科学研究重点项目“基于舆情大数据的社会稳定风险建模与预警研究”(编号:2019LZ07);中国人民警察大学研究生创新计划项目“基于社会网络分析的舆情情报挖掘研究”

猜你喜欢
李文亮网络分析谣言
基于交通运输业的股票因果网络分析
中国使馆驳斥荒谬谣言
基于ISM模型的EPC项目风险网络分析
低轨卫星互联网融合5G信息网络分析与应用
如何科学识别谣言?
李文亮:最早预警疫情的“吹哨人”
李文亮
认知重评和表达抑制情绪调节策略的脑网络分析:来自EEG和ERP的证据*
李文亮医生的最后40天
你被养生谣言忽悠过吗?