郭培伦
摘要:微博由于其特殊的传播方式成为当前社交网络信息传播和舆情产生的重要平台,因此针对微博信息传播的分析对舆情控制、广告宣传等众多社会媒体应用领域越来越显示出其指导意义。该文通过对微博社交网络和微博转发网络的重构,分析了不同类别的微博其不同的传播特性,并根据微博传播不同模式的特点,提出了传播力指标以评价微博的传播效果;另外,该文通过研究微博传播过程中的爆发现象,分析了舆情的传播特性,这对舆情的预测有一定的指导意义。
关键词:舆情;微博;监控
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)04-0040-03
1 概述
微博是近几年刚刚兴起的一种信息交流媒体,相比于传统社会媒体,其发展态势相当强劲,已表现出后来居上的趋势。微博作为一种新型媒体,是一个基于草根用户的关系构建及个性化用户信息的即时传播、共享和获取的平台,具有信息实时性、内容简洁性、用户交互性强等特点。
基于微博以上特点,越来越多的针对微博的研究层出不穷。最新的研究成果是基于层次分析的短文本特征计算方法,针对用户行为的微博转发预测研究。由于微博逐渐成为人们生活中不可缺少的信息传播平台,其信息的真实性就有待考证,在2016年,林向义等人对微博的可靠性进行了评测研究。更多的学者利用微博的社交关系网络对社交甚至是上市公司的媒体信息进行研究。而文坤梅、闫幸等人早在前几年就对微博的基础性研究、沟通研究和价值进行了相关的总结。近几年,随着计算机的迅猛发展,硬件的高速升级,微博平台服务器的不断升级,给我们提供了信息愈加快速传播的平台,这在一定程度上促进了基于微博进行舆论监控的研究,使微博进一步成为舆情监控的重点研究对象。
传统的研究只是给出了微博传播的过程特征以及利弊分析,并没有给出一个衡量微博传播力度的评价指标。而对微博舆情的监控研究,也只是基于传统的微博传播特点,并没有一个具体的判定标准,这个给相关部门的舆情监控工作带来了很大的困难。
本文着重提出一套包括微博传播特征和规模,分析评估各类微博传播特点的评价体系,为以后的微博舆情监控提供良好的评价指标,使得舆情监控相关工作人员,可以对微博信息更方便的监控管理。
随后将介绍本文用到的数据信息,以及数据的预处理工作;然后从微博社交网络、微博传播网络、微博传播模式等详细介绍本文中的研究方法和关键技术,最后是本文的实验结果分析和总结。
2 数据描述及预处理
本文使用数据城堡大数据竞赛平台中的微博热度预测竞赛数据作为实验数据,文中用到了其训练数据中的源微博转发数据,包括被转发的用户,产生转发行为的用户,微博的内容、发布时间;用户与用户之间的关注关系。具体数据字段见表1、2、3。
表1 微博原文数据字段
[微博id 微博内容 ]
表2 微博转发数据字段
[微博id 被转发用户id 转发用户id 转发时间与源微博发表时间的间隔 微博内容 ]
表3 微博用户关注关系数据字段
[用户id1 用户id1关注的用户列表 ]
先对微博内容进行分词、去停用词。同时,去除了没有转发的微博以及只转发了一次的微博。因为,本文认为只有一次转发的微博相对来说,对舆情监控研究的价值较小。最后,对得到的微博数据进行统计建模分析。
3 研究方法与关键技术
3.1 社交网络重构
基于表3所描述的数据,本文首先对数据中涉及的微博用户之间的社交网络进行了重构。社交网络G(V,E)刻画用户及用户之间的关注关系,其中V为用户节点集合,每个用户在图G中表现为一个独一无二的节点。有向边集合E表示用户之间的关注关系。如果用户A被另外一个用户B关注了,那么就存在一條从A用户指向B用户的有向边。边的方向也表明了可能的信息传播的方向。
3.2 传播网络建模
基于表2所描述的微博转发数据,本文对每一条微博的传播网络进行了建模。传播网络图G(V,E)为3.1生成的微博社交网络图的子图,其中V表示参与该微博传播的用户集合,即图中的节点为微博传播源用户或者转发了该微博的用户,有向边集合E表示微博的传播走向,如果用户A的微博被用户B转发了,就存在一条从用户A指向用户B的边。如果用户A的微博同时被用户B和用户C转发,那就存在从A分别指向B和C的边。
3.3 微博传播力
每个微博在传播过程中体现出不同的传播效果,本文从传播过程所覆盖的用户数量的角度定义微博的传播效果,把微博传播的效果从两个维度进行刻画—传播广度和深度。有些微博会短时间内在发起者的粉丝中大规模传播,但传播的深度不够,这种微博的传播网络呈星型;而有些微博会在纵深方向传播,在传播网络中体现为其传播过程更倾向于带状,其舆论的持续时间也更久。针对以上两种传播模式,本文定义了一个综合衡量微博传播有效性的指标:传播力,其计算方法由公式(1)描述
(1)
其中p为微博传播力,N为转发深度,是第i层的转发数。式中为第i层的转发设置权重i,表明在离源点越远的节点传播,说明该微博的传播能力越好。最终计算得到的传播力P的值则总体刻画出一条微博在社交网络的传播效果。
3.4 研究步骤
步骤一:社交网络与传播网络重构
根据用户关注数据和微博转发数据,将基于用户关注的社交网络和基于传播行为的传播网络进行重构,最终获得一个基于现有数据的微博社交网络和针对每个微博的转发过程的大量微博传播网络。
步骤二:微博信息分类
本文利用搜狗的类别关键词词库,对微博短文本进行分类。该词库共有12类,根据舆情分析的需要,本文将词库整合为6大类:运动、社会科学、自然科学、生活百科、娱乐、其他。通过使用jieba分词后的微博与相应的词库进行匹配,匹配度最大的那个类别作为该微博的类别标签。
步骤三:微博传播分析
本文以深度、传播力、传播源点度与传播力的相关性以及舆论爆发情况等多个指标分析了微博传播的特征。并比较了不同类别的微博其传播过程的差异性。
4 实验结果分析
4.1 微博社交网络分析
从图1中,可以看出,娱乐的传播力度最大,说明其具有更大的传播力度。而自然科学,相对娱乐来说传播力较小,但是它的频次在全部中排名第二,说明大部分人对自然科学的兴趣还是比较高的。相对自然科学来说,人们更关注娱乐的动向,这个也符合人群的兴趣分布。
本文随后计算了用户粉丝数与传播力的皮尔逊相关系数,结果只有1.8%。说明微博传播的规模与粉丝数相关性不大,说明有的用户粉丝很多,但是关于某些微博他的粉丝们只是看看,并没有进行转发,这个就给有关舆情监控部门以及绝大多数人的惯性思维产生了巨大差异,更加体现出本文对不同类别微博传播影响的研究价值。
4.2 微博传播网络分析
4.2.1 传播网络深度分析
从图2可以看出,运动这个类别的传播相对其他来说,传播深度要大,可能因为绝大部分微博用户中喜欢运动的人爱好相对来说比较一致。而娱乐传播的深度越大,比例越小,可能因为青少年比例较多,而青少年相对来说关注娱乐只是一时兴起。而图3中的方差分布反映出娱乐相关的波动非常大,因为娱乐的更新速度非常快,而人们对娱乐的关注基本局限于那些当红娱乐明星。其中,生活百科和社会科学的方差相对来说较小,这个说明人们一般只会关注那些自己感兴趣的有关生活方面的微博,进而进行转发,而那些被转发的微博也与大部分人的生活息息相关。
4.2.2 传播网络转发量分析
图4中的各个类别的趋势基本一致,转发量越多,微博中所占的比例越少,说明微博传播符合长尾分布特点。而生活百科在转发量等于300左右的地方出现一个峰值,说明人们对于有关生活部分的微博的转发,会引起某个或某些圈子中部分人认可,进而进行转发。从图5中,可以发现,娱乐与运动的转发量的波动性很大,因为对于某些比较热的运动信息或者是娱乐事件会得到广大微博用户的疯狂关注并转发,而那些不太热的事件或消息可以说几乎是没有传播的生命力。
4.3 微博传播爆发点分析
除了上述的实验,随后,我们对微博传播的规模进行了分析,結果如下表所示:
从表4,可以看出,微博传播的两种爆发模式。一种是从大到小再变大,另外一种是一直小,随后变大。舆情监控可以针对不同微博的传播特点,给予不同的监控手段。针对第一种,可以应该尽量在3度被转发前进行控制。而针对后者,更不能小觑其前期的小规模传播,对于某些敏感的小规模传播的微博,应该尽早制止。
5 结论
从本文的实验结果可以看出,人们关注的焦点集中在娱乐和运动两个方面,而这两个方面的波动性也较大,更有可能出现舆情事件信息传播的发生。因此,有关部门应该重点监控这两个方面。其次,应该根据不同的微博传播模式,制定相应的监控策略,尽量在舆情爆发前进行有效制止。尤其关注那些起初不起眼的不良信息,因为它们更可能在接下来的传播过程中突然爆发。
参考文献:
[1] 邹学强, 包秀国, 黄晓军等. 基于层次分析的微博短文本特征计算方法[J]. 通信学报, 2017, 37(12):50-55.
[2] 刘玮, 贺敏, 王丽宏等. 基于用户行为特征的微博转发预测研究[J]. 计算机学报, 2016, 39(10):1992-2006.
[3] 卢兴. 体育热点事件微传播特质研究——基于微博传播关键节点的实证分析[J]. 上海体育学院学报, 2016, 40(4):37-41.
[4] 李洋, 陈毅恒, 刘挺. 微博信息传播预测研究综述[J]. Journal of Software, 2016, 27(2).
[5] 林向义, 李秀成, 罗洪云. 社交媒体中信息可靠性测评研究——以微博为例[J]. 现代情报, 2016, 36(7):24-29.
[6] 何贤杰, 王孝钰, 赵海龙, 等. 上市公司网络新媒体信息披露研究: 基于微博的实证分析[J]. 财经研究, 2016, 3: 16-27.
[7] 王连喜, 蒋盛益, 庞观松等. 微博用户关系挖掘研究综述[J]. 情报杂志, 2012, 31(12):91-97.
[8] 文坤梅, 徐帅, 李瑞轩等. 微博及中文微博信息处理研究综述[J]. 中文信息学报, 2012, 26(6):27-38.
[9] 闫幸, 常亚平. 微博研究综述[J]. 情报杂志, 2011, 30(9):61-65.
[10] 陈劲松, 杨均. 微博舆论的社会监督[J]. 新闻前哨, 2016 (3):50-52.