面向重大突发社会安全事件的新闻媒体国际影响力分析

2020-04-09 14:49张绍武张冬瑜林鸿飞
计算机应用 2020年2期
关键词:安全事件新闻媒体影响力

陈 晨,张绍武,杨 亮,张冬瑜,林鸿飞

(大连理工大学计算机科学与技术学院,辽宁大连116024)

0 引言

云计算、物联网等科技的发展,数据的快速增长和累积,标志着大数据时代的到来[1]。而Twitter、微博等社交网络承载着大数据时代信息传输的重任,越来越多的人在自己的社交账户中分享自己的生活,发表自己的看法。如何利用社交网络中的信息做好舆情监控和分析是大数据时代的一个重要课题。

突发社会安全事件是由人为故意造成并在社会上产生广泛影响力的一类事件,主要包括恐怖袭击事件、经济安全事件和涉外突发事件等[2]。恐怖袭击、群体骚乱等重大突发社会安全事件的发生往往会涉及经济、政治和社会等多方面的问题。重大突发社会安全事件不仅会在爆发地产生影响,还会在全世界引起不同程度的影响,也因为其突发性和破坏性会严重影响人们的日常生活,所以本文选择对此类事件进行研究。重大突发安全事件主要通过新闻媒体传播,而新闻媒体的传播能力和新闻内容在很大程度上决定了人们接收到的信息。随着社交网络的兴起和发展,它逐渐成为了人们获取信息的主要渠道之一。

Twitter 作为现在流行的国际社交平台之一,因其拥有海量的用户而承载着多元的数据信息,对网络舆论的传播起着重要作用。目前全球大部分新闻媒体都拥有自己的Twitter账号,且获得了Twitter认证,这些新闻媒体一定程度上拥有更多的关注度和话语权,影响着消息的传播和舆论的走势。通过量化在重大突发社会安全事件中新闻媒体的国际影响力,可以为此后同类事件的研究分析提供思路,如在我国事件的国际舆情监控中可重点关注影响力大的新闻媒体等。

因突发社会安全事件的紧急性和危害性,冯毅[2]从社会危害和经济损失两个方面对突发社会安全事件进行了界定,陈亮[3]对国外社会安全预警防范理论和方法进行了梳理。随着互联网的发展,近年来对突发社会安全事件的网络舆情研究也得到关注。王国华等[4]对昆明暴恐事件中人民日报的微博进行研究,对重大社会安全事件的微博传播特征进行了总结;陈璟浩等[5]发现了对突发社会安全事件生存周期有影响的三个因素;杜洪涛等[6]从网络舆情演化的角度研究突发事件。对于暴力恐怖事件这一类的突发社会安全事件,胡成等[7]通过量化暴力恐怖事件的特征分析其危害。

同时社交网络中用户影响力的研究也得到多方研究人员的持续关注。目前对如Twitter、微博等社交媒体上用户影响力的研究可以总结为研究决定用户影响力的因素、计算用户影响力的大小以及分析影响力传播方式等。由于社交网络中用户间的关注和粉丝关系与网页的链入和链出关系相似,有许多基于PageRank 算法[8]来研究用户影响力的算法被提出。Weng等[9]提出了TwitterRank算法,该算法是PageRank算法的扩展,根据关注网络构建好友关注图。传统的基于PageRank的算法得到的结果具有一定的权威性,然而这些算法仅考虑了社交媒体中用户之间的链接关系,忽略了其他影响因素。社交媒体中用户的影响力因子主要包括两方面:一类是用户关系,包括用户的跟随者和粉丝数;另一类是用户行为,如发帖、点赞、评论、提及等,文献[10]通过利用Twitter平台中用户的粉丝数、转发数、被@数作为指标计算用户个人的影响力。Pal 等[11]也利用了Twitter 平台中用户的发推文的个数、回复数、转发数、被@数和粉丝数等信息,并以此提出了用户的各种行为影响力,如转发影响力、扩散影响力等。文献[12]通过模拟关注网络中的信息传播,以用户的有效读者数来衡量一个用户的影响力。文献[13]中将社交影响力划分为3 种影响力、5种排序准则,利用等级相关系数,对5种排序准则进行了计算比较,并得出“回复数对用户社交影响力的作用最大”的结论。毛佳昕等[14]利用微博用户发布微博的时间和数量来分析用户影响力。

目前,无论是针对Twitter 平台还是针对微博中用户影响力的评价方法均存在以下不足:1)大多没有考虑特殊用户群体的个性化信息。例如新闻媒体一般有很高的权威性,所以几乎都有官方认证以及比一般用户拥有更多的跟随者。2)现有的用户影响力评价方法中还缺少对具体事件的研究及应用。例如在同一事件中,每个用户的关注度就不同,以及不同的事件之间话题性的差异会对用户影响力产生影响。为了解决上述问题,本文从事件层面评价分析新闻媒体的国际影响力,综合Twitter网络中用户间的关系网络和用户行为,考虑到各新闻媒体对于同一事件的关注度不同以及不同事件话题度的差异,提出了Media Influence Rank(MIRank)评价方法。

一篇新闻媒体的报道,往往从侧面反映了该地区甚至国家对于某一事件的立场、态度。在Twitter平台上,我们可以搜索到很多新闻媒体关于新疆暴恐事件的推文,如BBC(英国广播公司)的Twitter 账号于2015 年3 月发布的推文“‘Xinjiang terrorists’shot dead by police in China state media says.”这条推文中将“Xinjiang terrorists”打上了引号,表达了他们对恐怖分子这个说法的不认同,这一现象值得深思,因此研究各国新闻媒体在此事件中的影响力就十分有意义。考虑到重大突发社会安全事件给社会带来的负面影响,以及网络新闻对于消息传播和舆论形成的重要作用,本文以Twitter 平台中的新闻媒体相关信息为基础,研究在以新疆暴恐事件等暴恐事件为代表的重大突发社会安全事件的传播过程中新闻媒体的国际影响力。

1 基于事件的新闻媒体影响力计算模型

1.1 基于用户关系网络的评价方法

PageRank 算法是通过计算页面链接的数量和质量来确定网站的重要性的评价方法。它主要包含三点思想:

1)一个页面有越多的入链,那么这个页面就越重要;

2)指向一个页面的链接所在的页面质量越高,这个链接的权重就越大;

3)网页浏览满足随机性。

PageRank计算式如下:

其中:Mpi是所有对pi网页有出链的网页集合,L(pj)是网页pj的出链数目,N是网页总数,α是阻尼因子。

因为Twitter 平台中用户关系网络类似于Web 网络中各网页间的关系,所以在衡量Twitter中用户影响力时,可以借鉴PageRank 的思想。Weng 等[9]提出了TwitterRank 算法验证了基于PageRank 算法的影响力计算模型可以针对社交网络的特有性质计算用户影响力。本文研究的是新闻媒体在新疆暴恐事件为代表的重大突发社会安全事件中的影响力,新闻媒体与新闻事件自身包含了许多个性化的信息,如新闻媒体对不同事件的关注度和新闻事件的话题性等,这些在一定程度上影响着新闻媒体影响力的大小,所以本文依据这一思路对PageRank 算法进行了改进。基于用户关系网络的评价方法Twitter Influence Rank(TIRank)的核心思想是:1)一个新闻媒体的重大突发社会安全事件相关推文的转发数越多,它在这一事件下的影响力越大;2)转发一新闻媒体推文的用户的影响力越大,该新闻媒体的影响力越大;3)使事件话题度更高、对事件关注度更高的新闻媒体的推文更容易被转发。

本文先构造出在新疆暴恐事件下的转发网络。设网络中用户集合为V,推文集合为E;E 中的每条边(i,j)代表用户i转发了用户j 的推文;集合Fu代表E 中所有指向u 的用户集合,Du代表E 中所有u 指向的用户集合。式(2)中,α 是PageRank式子里的转发概率。该式子表示,用户v以α的概率转发集合Dv中用户的推文,接着以Av,u的概率转发用户u的推文;以1-α 的概率转发普通用户的推文,这里的普通用户指所有用户,接着以见式(3))的概率转发用户u的推文。

文献[18]中提出了加入用户个性化信息的思想,但只是对用户行为的简单累加,针对新闻媒体的特征,以及不同事件的个性,且本文对新闻媒体影响力分析是基于事件层面的,因为不同新闻媒体的报道角度不同,这点可以体现在新闻媒体对事件的关注度上,同时这也使得同一事件在不同新闻媒体的报道下话题度不同,所以本文引入了两个个性化特征:新闻媒体对事件的关注度n1和事件的话题性n2。式(3)中nu,i表示用户u 对应的两个个性化特征,nv,i表示用户v 对应的两个个性化特征。每个新闻媒体用户的属性,在文中包括两部分:第一部分是全局属性,即新闻媒体用户的粉丝数Num_fans 和总的推文数Num_tweet;第二部分是个性属性,分别为在新疆暴恐主题下,新闻媒体用户对此事件的关注度n1和事件话题性n2。n1即新闻媒体发布关于新疆暴恐事件的推文数占总推文数的比值;n2即为某一新闻媒体新疆暴恐事件相关推文的转发数、点赞数和评论数之和与该新闻媒体的粉丝数之比。它们的计算公式如式(4)、(5):

其中新疆暴恐事件中各新闻媒体的用户推文发布数、转发数、点赞数和评论数分别为x1、x2、x3、x4。文献[18]中利用Av,u代表用户v 到用户u 边的权重,可以很好地体现用户v 和用户u之间的转发关系,用以下式子表示:

其中,rv,u代表用户v转发过用户u推文的数目。

1.2 基于用户行为的评价方法

上述评价方法从Twitter网络中新闻媒体与其他用户间关系网络入手,弱化了用户之间的行为特性。新闻媒体用户v在社交网络中的行为影响力可以分为个人行为影响力和他人行为影响力。本文将个人行为影响力量化为新闻媒体推文影响力,主要衡量其推文的价值,对于新闻媒体而言,其推文影响力是一个积累的过程,所以本文用一个新闻媒体用户所有推文影响力的平均值作为其推文影响力。

其中,tweet(ui)表示新闻媒体用户u 的第i 条关于新疆暴恐事件的推文的影响力,在这里本文将每条推文的影响力定量成其点赞数、评论数和转发数之和。在社交网络中,他人行为影响力体现在两个方面:直接影响力和级联影响力

直接影响力可以理解为其推文对其粉丝的影响,新疆暴恐相关推文数越多,其粉丝可以关注到新疆暴恐事件信息就越多,其对于粉丝的影响也就越大;同样,粉丝数越多,同一条推文就有更大的可能被推广,影响更多的人,因此,直接影响力与粉丝数和推文数成正比。

而级联影响力可以理解为一个新闻媒体用户的一条推文通过他的粉丝进行了下一级的传播,被更多的人关注到,使得该用户的影响力得到了扩散。

其中uj表示新闻媒体用户u 的第j个粉丝,同时本文假设所有粉丝均转发了该条推特。由个人行为影响力和他人行为影响力得到基于用户行为的评价方法Users Influence(UI)。

本文通过使用层次分析法[15]来计算UI 模型中的权重项λ=1/3。

1.3 新闻媒体影响力评价方法

TIRank 评价方法从Twitter 平台用户之间的网络链接关系来计算新闻媒体用户的影响力,忽略了很多推文属性及行为属性。而UI 评价方法从新闻媒体的推文属性及行为属性来计算影响力,忽略了Twitter 平台中用户关系网络。本文将两种评价方法的评价结果进行融合,得到既考虑了新闻媒体用户之关系网络又考虑了新闻媒体行为属性的新闻媒体影响力评价方法Media Influence Rank(MIRank)。

首先对计算结果进行归一化,再对TIRank和UI的计算结果求调和平均数,可以保证只有当TIRank 和UI 值都高时,MIRank的值才会高。

2 实验结果与分析

2.1 语料来源

本文选择新疆暴恐事件这一重大突发社会安全事件作为研究对象,数据集的获取首先利用twitter api,以文献[16]中利用基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的动态主题模型(Dynamic Topic Model,DTM)计算出的TOP20 新疆暴恐相关词语作为查询词,爬取了种子tweets 共3 200 条[18],得到初始的用户集合V,然后迭代地进行以下操作:对V 集合中没被标记的用户u 进行标记,爬取u 关于新疆暴恐的推文,并从这些推文中抽出被转发的用户添加到V里,直到用户数目达到指定上限10 000 或V 里没有新用户为止。由于本文中关于新疆暴恐的推文中评论数只占了1%,它对计算结果的影响可忽略不计,所以以下实验中只考虑了粉丝数、转发数、推文数以及点赞数在影响力计算中的作用。以新华社(@XHNews)这个新闻媒体用户为例,本文数据集主要包含的信息如表1和表2所示。

表1 与新疆暴恐事件有关的Twitter信息Tab.1 Twitter messages related to the violent and terrorist event in Xinjiang

表2 新闻媒体用户的基本信息Tab.2 Basic information of news media user

本文对数据集中数据进行了统计。集合V 里总共有8 785个用户,其中306个是新闻媒体用户,图1展示了所有用户在各个国家中所占的比例。图1 中:颜色越深,表明数据集中该国家拥有的新闻媒体用户的比例越大;反之颜色越浅,数据集中该国家拥有新闻媒体用户的比例越小。从图1 中可以看出,美国、中国、英国、印度、巴基斯坦、澳大利亚、加拿大等国家参与新疆暴恐相关新闻传播的用户比较多。这点与各国新闻媒体的发展以及各国外交策略密切相关。图1 中美国和英国的比例最大,尤其是美国,首先因为Twitter是一家美国公司,在美国的用户更多,而且全球著名媒体大部分都来源于上述国家,尤其是美国和英国,如CNN、BBC 等新闻媒体巨头。因为本文的研究针对Twitter平台,该社交平台中国用户较少,拥有Twitter 账号的中国新闻媒体就更少了,所以图1 显示的各国拥有的新闻媒体比例,中国新闻媒体占比明显小于美国的也是情理之中。

图1 各国新闻媒体用户的比例示意图Fig.1 Proportion of news media users in different countries

2.2 实验结果分析

1)参数设置。

在实验中,本文通过层次分析法得到UI 模型中各影响因子的权重。表3展示了UI模型中各影响因子的判定矩阵及最终的权重值。经计算得权重值λ=1/3。

表3 UI模型中影响因子权重Tab.3 Influence factor weights in UI model

2)实验方法有效性。

采用肯德尔秩相关系数τ 作为实验的评价指标,它是一个用来测量两个随机变量相关性的统计值。在这里的随机变量指各个算法产生的影响力排名序列。τ的取值范围在-1到1 之间:τ=1,两个随机变量的等级相关性是一致;τ=-1,则表示两个随机变量等级相关性是相反的;τ为0表示两个随机变量是相互独立的。

表4 列举了各个算法与本文提出的MIRank 算法进行计算得到的肯德尔相关性系数τ 值。从表中可以看出,MIRank计算得到的影响力排名与经典算法PageRank、TunkRank、Follow_count 和Retweet_count 具有一致的等级相关性。由表4 还可以看出影响力与粉丝数的关联性小于转发数,这个结论与文献[17]的结论不谋而合,这也充分说明了MIRank方法的合理性和有效性。

表4 各个算法的τ值对比Tab.4 τ values comparison of different algorithms

3)不同地区同类事件间的对比。

为了体现MIRank评价方法的泛化能力,本文选择了将其应用于新疆暴恐事件和2015 年法国巴黎暴恐事件这两大重大突发社会安全事件中,并对结果进行对比分析。表5 列举了MIRank 方法对新疆暴恐事件和法国巴黎暴恐事件计算出的影响力TOP10 的新闻媒体。从表中可以看出路透社(@Reuters)和纽约时报(@nytimes)对此类暴恐事件的影响力较大,也从侧面反映了它们对此类事件的关注度更高。在新疆暴恐事件中,中国的新闻媒体新华社(@XHNews)和人民日报(@PDChina)的影响力值大,而在法国巴黎暴恐事件中法新社(@AFP)和法国24 电视台(@FRANCE24)的影响力值大,由此可以看出事件发生国的新闻媒体在该事件中的影响力更大。

表5 不同地区暴恐事件中影响力TOP10的新闻媒体Tab.5 TOP10 influential news media in violent and terrorist events of different regions

本文通过数据集中各新闻媒体属地的信息对各国新闻媒体的影响力进行了累加计算,图2 显示了在新疆暴恐事件和法国巴黎暴恐事件中,各国新闻媒体的影响力值。颜色越深代表影响力值越大,颜色越趋近浅灰色代表其影响力越小。从图中可以看出,在事件发生国周边的国家的影响力值也较大,体现了各国都更关心周边国家的局势。美国在两起事件中的影响力值都很高,这也体现了美国对于全球事件的关注度很高。

经统计,新疆暴恐事件在Twitter 平台中共有22 个国家的306 个新闻媒体对其进行了报道,法国巴黎暴恐事件共有13个国家193 个新闻媒体对其进行了报道。从这个统计量可以看出,我国暴恐事件在世界范围内受到的关注更高。

图3 可以从数值上看出,美国的新闻媒体在这两起暴恐事件中的影响力值远大于其他国家,这点也说明了美国的新闻媒体更具有全球眼光,在新疆暴恐事件中,我国新闻媒体的影响力值虽然位于第二,但从数值上看明显低于美国新闻媒体的影响力,在非我国的事件中,我国新闻媒体虽然有一定的影响力,但十分微弱,因此提升我国新闻媒体的影响力对我国事件国际舆情的监控、扩大我国的话语权有重要意义。

图2 各国新闻媒体影响力热度图Fig.2 Heat map of the influence of news medias in different countries

图3 各国新闻媒体影响力值Fig.3 Influence values of news media in different countries

3 结语

本文主要研究以新疆暴恐事件等暴恐事件为代表的重大突发社会安全事件中新闻媒体的国际影响力,对Twitter 上的各国新闻媒体用户进行了影响力分析。通过改进传统的PageRank 算法,结合事件的话题性以及新闻媒体对事件的关注度,然后在转发网络中迭代计算,得到基于用户关系网络的TIRank 评价方法。又考虑到用户关系网络不能直观反映新闻媒体用户与普通用户之间的行为关系以及新闻媒体推文的特性,所以提出了基于这两个因素对于影响力计算的影响的UI 评价方法。综合考虑两种评价方法的优缺点,本文对TIRank 和UI 评价结果进行融合得到了最终的MIRank 评价方法。

本文比较分析了不同地区同类事件的异同,使用MIRank评价方法对新疆暴恐事件和法国巴黎暴恐事件中新闻媒体的国际影响力进行了对比和分析,从中发现一些现象:如事件发生国的新闻媒体在该事件中的影响力更大,事件发生地周边国家对事件关注度更高,以及我国新闻媒体在此类事件中虽然有一定影响力但仍与美国有差距等。在未来工作中,会尝试通过对新闻文本的立场分析来丰富对新闻媒体国际影响力的解读。

猜你喜欢
安全事件新闻媒体影响力
太极拳,风縻世界的影响力
雪中放牧新风景
2020年度区块链领域安全事件达555起
天才影响力
黄艳:最深远的影响力
河北“全覆盖式”对各级新闻媒体进行财政支持
现代社会新闻媒体的信息传播与监管
优质护理干预对精神科护理安全事件发生率的影响探析
3.15消协三十年十大影响力事件
新形势下新闻媒体在群众工作中的角色定位与传播策略