微博信息传播模型及其演化研究综述

2018-12-26 02:20:09崔金栋
图书馆论坛 2018年1期
关键词:网络结构节点用户

崔金栋,郑 鹊,孙 硕

微博信息传播模型及其演化研究综述

崔金栋,郑 鹊,孙 硕

文章针对微博信息建模过程中影响因素众多、过程复杂现状,梳理模型构建的依据及其演化脉络。文章对现有微博信息模型进行功能解析和演化分析,从节点自身属性、链接关系到整体拓扑结构演化的视角,解析微博信息传播模型中的社会网络特征;从传播模式、传播影响因素和传播规律演化的角度,阐释微博信息传播模型的复杂网络特性;从传播预测和传播控制的视角,揭示微博信息传播模型的双重网络特质。文章提出微博信息传播模型的演化方向,即微博信息传播中节点、节点链接与信息内容的融合,复杂网络与多重网络的融合,微博信息传播与大数据的融合。

微博信息传播 网络结构 传播规律 传播预测

0 引言

移动互联网已经成为信息传播的主要途径,微博作为一个可以自由发表观点和态度的平台,具有信息传播多样化、信息交互便捷化等特性,同时意味着其信息的传播具有不可控的属性。因此,有效监管信息的真实性、准确性和时效性,控制不良信息扩散范围,对规范网络环境,促进微博平台健康发展具有重要意义。

国外对微博信息传播的研究大都建立在对Twitter研究的基础上,在微博网络结构、传播机制和传播模型等方面取得了一定的成果。国内对微博信息传播的研究起步较晚,大多数是基于目前国内最先进、最活跃、用户数量最高的新浪微博,对其信息传播特征、影响因素[1-2]、传播模式[3]、传播预测模型和影响力等展开研究[4-5]。然而,学者们普遍从自身的研究角度出发,采用的信息传播模型侧重点各有不同,研究结论多样化。因此,笔者以微博信息传播功能为视角,在解析微博信息传播模型演化规律基础上,提出未来微博信息传播的技术发展趋势。

1 微博信息传播模型基本支撑理论

微博作为在线社交平台,每一个用户可以视为一个节点,各个节点相互关联构成整个微博网络。为了更加科学且合理地解析微博网络结构及其节点属性,研究者普遍将复杂网络理论、多重网络理论和社会网络分析法作为基础支撑理论。

1.1 复杂网络理论

复杂网络是复杂性理论的分支,具有结构复杂、节点多样、网络结构多变等特征,是抽象于复杂系统的框架性表示形式[6],主要特征包括:(1)由多个节点或子系统组成;(2)易受外界环境影响,并与外界不断进行物质、能量和信息交换;(3)在特定情况下,网络内的节点之间存在某种链接关系,并且互相作用,从而给彼此带来影响;(4)节点间的相互作用和整个系统存在某种复杂的非线性关系。在理论研究方面,复杂网络主要运用图论和统计物理作为理论支撑,深入探讨网络拓扑结构及其特性[7]。20世纪末小世界网络和无标度网络被发现,并通过实例论证真实世界网络同时拥有小世界网络属性和无标度网络属性,并非以往认知中的规则网络或随机网络,因此科学家将拥有这两种属性的网络统称为复杂网络[7]。随着对复杂网络认知的深入,研究快速发展。目前相关理论研究趋于完善,主要将其运用到其它学科领域。

1.2 多重网络理论

随着对微博网络研究的深入,学者们发现微博网络不仅仅是一个单层次复杂网络,因此提出多重网络(Multiplex Network)概念,即在一个网络结构中具有多层网络,每层网络的参与节点相同[8-12],但不同节点之间的链接属性存在一定的差异。多重网络可以看作是一种多个平行网络层动态相互耦合的网络,各子网络层间具有一定的关联性。多重网络亦称为多层次网络、相互依赖网络、多关系网络[13-14]。多重网络作为特殊的相互作用的网络,它的结构和动态演化过程受到越来越多的关注,研究者从多角度在多个学科领域对其展开研究[15-16]。通过研究多重网络的内部属性,节点之间的链接关系等,可实现对子网络之间相互影响和动态关系的挖掘;亦可运用多重网络对微博网络进行仿真,探索微博网络结构的内部属性和传播规律。

1.3 社会网络分析法

从实践角度看,社会网络分析(SocialNetwork Analysis)是一种解析社会网络结构及其属性的技术方法;从理论视角来说,亦可以视作一种结构分析思想[17]。社会网络分析法将整个网络看作由若干个节点构成,每个节点之间有一定的链接关系,网络结构内的链接关系决定了信息的传播路径及其特征[18]。社会网络分析法通常用于分析不同社会单位(个人、群体)乃至整个社会网络结构内的个体和整体的属性以及节点的链接关系特征[18],其中个体属性主要涵盖点度中心性、中间中心性和接近中心性[19]。点度中心性指在网络结构中某个节点与其他节点的关联程度,直接关联的数量决定该节点成为中心节点的概率[20];中间中心性指通过衡量节点之间占有信息和资源的程度,从而实现评估网络中心性的目的;而接近中心性则主要用来比较分析节点之间的差异性,节点差异值表示了节点接近网络核心的距离。常见的社会网络分析软件有Ucinet、Pajek、Netminer等。

这三个基础理论是开展微博传播研究的基石,也是微博信息建模的出发点。笔者以上述理论为主线对微博传播模型及其演化进行阐述,总结现有成果的不足以及技术发展趋势。

2 基于社会网络的微博信息传播模型及其演化

微博信息传播的主体主要由传播者、信息、接收者构成。在微博信息传播的研究过程中通常将传播者和接收者(即用户)看作节点,用户的相互关注视作节点关联形成的边,把整个微博网络抽象成一种有向网络图。因此,节点自身属性、节点链接关系和网络拓扑结构的演化是挖掘传播过程中关键节点的重要因素。

2.1 基于节点自身属性的微博信息传播模型及其演化

节点自身属性是识别微博网络关键节点的重要因素,分析节点自身属性,计算节点权重值,从而识别关键节点是学界普遍采用的方法。权重值越大,作为关键节点的概率就越大。早期模型中,节点权重值计算方法主要通过对不同节点自身属性进行对比,将用户微博贡献值、社会影响力等作为指标,进行权重值计算。这类方法最大的不足在于准确度低、时间复杂度高。随后研究者发现节点传播影响力对识别关键节点具有重要作用,因此,将信息扩散广度、速度和深度作为评价用户传播影响力的指标,分别赋予权重系数,构建基于WSD-Rank算法的传播影响力模型。与传统PageRank算法对比,这种算法对节点传播影响力的表达更加直接,提高了适用性[21]。随着拓扑结构研究的融入,学者基于拓扑结构将紧密中心度和介数中心度作为评价指标衡量节点传播影响力,但这种方法仅从节点自身属性出发,忽略了节点链接关系带来的影响,缺少整体性,准确度低[22]。因此,后续模型将近似计算节点和边的中介中心性作为识别关键节点的评价指标,基于Brandes算法,执行Betweenness算法,最终求出每个节点的唯一中介性值。这种方法不仅提高了计算效率,而且提升了识别准确度[23]。

构建信息传播模型也是研究节点自身属性的常用方法之一。研究者在独立级联模型(IC)和线性阈值模型两个经典模型的基础上,提出递减级联、DRUC等演化模型。递减级联模型认为,在传播过程中,随着时间的推进,节点之间的传播概率会逐渐下降。DRUC(Decaying Reinforced User-Centric)模型是在线性阈值模型的基础上,结合信息内容和用户轮廓,综合考虑用户兴趣度、接收者传播意愿和被感染的邻居节点三个因素的反作用。但是,独立级联模型和线性阈值模型及其演化模型的最大缺陷在于:模型构建的前提是假设任意两个节点之间的信息传播时间是相同的,整个传播过程是离散的、同步的。然而在实际的传播过程中,任意两个节点之间的传播时间是有差异的,整个传播过程是连续的、不同步的。因此,通过引入传播延迟时间,提出AsIC(Asynchronous IC Model)非同步模型(如图 1),即在对传播主体特征(影响力、权威度和活跃度)、传播客体特征(传播意愿)和传播的信息特征(情感属性、是否包含URL链接、是否包含标签)进行讨论分析后,构建基于AsIC模型的细粒度社会网络信息传播模型[24]。实证表明该模型提升了信息传播过程中的预测准确率。

图1 IC模型和AsIC模型

2.2 基于节点链接关系的微博信息传播分析及其演化

节点链接关系表示两个节点之间相互作用所产生的对彼此的影响。不同节点的链接关系不同,对微博信息传播的影响和作用也不同。现有的节点链接关系算法大多从PageRank算法演化而来,比较成功的演化算法有TwitterRank算法、SpreadRank算法。TwitterRank算法通过融入话题影响力、关注关系网络、用户发布微博数量和用户兴趣相似度等影响因子,提高识别话题的敏感度;SpreadRank算法将转发时间间隔作为影响因子,并考虑不同用户在传播过程中的级别,提升影响力计算的准确度[25-26]。

节点链接关系最直接的表现就是节点之间的关注度,因此可运用程度中心法衡量节点的直接关注度。直接关注度越高,成为关键节点的概率就越大。但是,这种方法只考虑节点的局部环境,忽视其他间接关联节点的影响作用。基于此,有学者提出了接近中心法,将节点与其他节点的最短路径和作为衡量指标,最短路径和越短,接近中心度就越高,成为关键节点的概率越大。虽然与程度中心法相比,接近中心法的准确度和整体性都有所提升,但这种算法的约束性和计算复杂度很高,必须在所有节点完全相连的网络中才能够执行。为解决该问题,在同质节点的所有子网络中引入超级节点,这些超级节点令整个网络内的所有节点完全相连,然后运用接近中心法计算节点最短路径和。这种方法不仅突破了原算法的约束性,而且提高了适用性,可以分别从全网络、同质子网络、异质子网络进行测量,算法更加全面合理[27],见图2。

图2 基于节点链接关系的判定方法及其演化

2.3 基于网络拓扑结构的微博信息传播分析及其演化

网络作为微博信息传播的载体,它的属性对微博信息传播的影响大。因此,分析网络拓扑结构属性,或通过构建网络拓扑结构找出信息传播规律是重要的研究方向。通过分析微博社会网络中心性,发现当信息敏感度超越某个临界点,关键节点影响力将会随着敏感度的提升而减弱[28],因此,精准、及时识别关键节点对控制事件的传播扩散具有重要作用。以突发性事件的传播作为研究对象,分析事件发展的时间阶段特性,采用邻接矩阵的方式表示节点和边,构建信息传播网络拓扑结构,为找出控制事件恶性发展的关键时间和节点提供有效手段[29]。虽然这种方法能有效识别关键节点,但不具有通用性。因此,构建两个双向“关注”网络,通过分析网络的中心性指标(节点度、紧密度、介数、K-核),证实节点中心性指标的差异给信息传播的深度和广度带来的影响有所不同,而紧密度和K-核指标的应用提高了寻找网络核心节点的准确度[30]。随着研究及学科之间交互作用的深化,借鉴社会物理学思想,以微博信息传播网络特征向量为出发点,将传播过程中的影响因素以及传播模式类比作动力学变量,从而建立微观动力学方程:

公式1中Xi(t)表示t时刻用户获取信息继续传播的概率;v0表示信息价值;e-λix(t-t)表示信息关注程度;其余部分表示时效性以及参与信息传播的用户比例。此模型说明信息价值与信息关注度、被传播的概率成正向相关关系。信息关注度越高,用户继续传播的可能性也就越大[31]。

3 基于复杂网络的微博信息传播模型及其演化

3.1 基于复杂网络的微博信息传播模式分析

复杂网络的信息传播动力(即网络内信息的传播形态)机制研究一直是微博网络研究的热点问题。区别于人人网等熟人关系网络,微博的公开性令其成为一种由信息推动的弱关系网络。弱关系型网络最明显的特征就是用户之间的关系可以是单向的。单向关联关系的优势在于令网络内的节点互联性更优、网络结构更加紧密。微博网络存在较多单向关联关系,促使其信息传播路径更长,传播速度更快,具有很明显的小世界网络特质,符合六度分隔理论[32]。在此基础上,研究者对信息转发的传播动力模式进行研究,将其分为三种传播模式(见图3):(1)单关键点型,传播速度快,传播节点大多数是强势节点;(2)链式型,传播范围小,影响力小;(3)多关键点型,在传播过程中需要大量的强势节点和关联中介节点,传播范围广,影响力较大。这种分类方式略为粗糙,在详细分析新浪微博若干个热点信息的传播动力模式后,发现其主要传播动力模式有七类:波纹型、蒲公英型、菌落型、烟花型、蜂巢型、双子星型、随机引爆型,其中比较普遍的是波纹型和蒲公英型。

图3 信息转发传播模式

3.2 基于复杂网络的微博信息传播影响因素分析

时间、用户行为特征、发布的信息都有可能引起微博信息传播网络结构的演化,从而给信息传播带来影响。因此,笔者从网络结构整体属性、局部属性以及演化时间规律三方面分析影响网络结构演化的主要因素。

3.2.1 整体网络结构影响因素

小世界、无标度特性通常被用来形容复杂网络的整体宏观结构。正是因为这些特性,微博网络在演化进程中,存在择优连接的现象,即节点粉丝数量越多,被新节点关注的概率就越大[33]。因此,将节点被新节点连接的概率P(ki)表示为:

其中,ki是节点i的度值。除了这种择优连接现象,微博平台会通过相关规则实行推荐机制,包括推荐好友、推荐微博信息等随机因素,所以网络内还拥有大量的随机连接。将择优和随机模式融入无标度网络模型,则节点被新节点连接的概率表示为:

其中αi为吸引力因子;ρ为可调参数,取决于择优和随机的权重,当ρ较小时择优权重占优,反之随机占优。从公式3可以看出,节点被新节点连接的概率取决于网络的随机性、节点的度和吸引力。节点度值大、吸引力高,被连接可能性就非常大;节点度值小,吸引力高,被连接的可能性会较高。这类节点通常指新注册的社会名人,或是受一些事件影响突然成为焦点的普通用户;节点度值大、吸引力低,被连接的概率小,如名人退出微博平台,不再发表信息,其吸引力随之会迅速减弱;节点度值小、吸引力低,则被连接的概率更低,这类节点普遍是粉丝数量较少的普通用户。

3.2.2 局部网络结构主要影响因素

(1)共同邻居节点的影响。对真实网络进行实证分析,结果表明陌生节点是否能建立联系,与它们的共同邻居节点有很大关系[34]。共同邻居节点越多,建立直接联系的可能性就越大。在微博网络中,可以将两个互相关注节点看作是一个子网络,则微博信息传播过程是由若干个子网络所构成的网络结构,子网络数量越多,共同邻居节点越多,延长信息传播路径、扩大信息传播广度的几率就越高。

(2)共同属性的影响。在微博网络内,具有共同属性(相同兴趣、职业等)的节点往往会形成一个小集体网络。很显然,小集体网络内原本陌生的两个节点变成互相关注链接关系的概率将会大大增加。共同属性的存在驱动着小集体网络的构建,提高了节点之间的直接联系概率,进而促进微博信息的传播。

(3)镀金效应。镀金效应是指在微博网络中借助其他用户力量来提高自身影响力的行为。具体做法就是将增加粉丝数量作为共同目的进行用户之间的互相推荐,或是通过与名人互动,吸引名人的关注、评论和转发,从而获得关注量,提升自身影响力。镀金效应的前提在于用户活跃度以及发布的信息价值。信息价值高,镀金效应发生的概率就较大,扩大信息传播范围的概率就越大。

3.2.3 演化时间规律因素

网络结构的演化不是一种稳定的结构变动。用户的活跃时间分布情况、突发事件的发生等不确定性因素都会对信息源节点的网络结构带来一定的影响。经统计分析,用户活跃度日高峰期处于 11:00-12:00、17:00-18:00、22:00-23:00三个时间段,周高峰期则在周五、周六、周日三天。由此可见,活跃度高峰期几乎处在用户的休息时段内。通过对微博网络的演化情况进行监测,发现在高峰期演化较快,低谷期则比较平稳。突发性事件作为影响网络结构演化的一种不确定因素,一般会经历三个时期:酝酿期、飞涨期、消退期。从以往的调查数据可以看出,事件发生后较短时间内,信息转发量和信息相关节点的关注度会暴增,从而令整个网络结构发生显著变化。

3.3 基于复杂网络的微博信息传播规律模型及其演化

3.3.1 经典传染病毒(SIR)传播模型

微博信息传播模型多数是基于SIR模型所构建的。根据动力学方法构建的SIR模型,早期主要用于病毒传播及其发展规律的定量研究;后期则用于研究信息传播,并逐渐成为应用最广泛的模型之一。SIR模型将S定义为易感染节点,I定义为传染节点,R定义为免疫节点,每个节点都有可能变为这三种类型之一。但是,SIR模型的最大不足在于,它的假设前提是网络内用户总数量不变,易感染节点变为传染节点和传染节点变为免疫节点概率值都是固定的;并且只考虑随时间的变化节点之间内在因素的影响,忽略了外部环境影响因素,因此出现了SIR模型的演化模型。

3.3.2 SIR传播模型的演化

(1)融入新影响因素的SIR模型。SIR模型是一种单向传染机制,但是真正的传染方式是双向的、不固定的。因此,将遗忘机制(可能将感染节点和免疫节点变成易感染节点)和遏制机制(可能将感染节点转变成免疫节点)作为影响信息传播的重要因素融入SIR模型(见图4),依据此模型所构建的微分动力学方程如公式4所示。

通过计算节点密度变化趋势及传播速率,发现遗忘机制和遏制机制对信息传播具有显著的影响作用[35]。由于网络社会因素同样会给传播路径带来影响,所以将社会加强因素融入,提出CSR(在线社交网络谣言传播)模型,但CSR模型的针对性较强,不具有通用性。因此,通过更新传播规则,运用动力学方程,融入个人接受阈值,提出一种基于移动社交网络的谣言传播模型[36],该模型验证了信息在均匀网络结构中的传播速率更快。但是,上述研究都将拓扑结构置于规则网络中,与实际的网络结构有一定的差异,研究结果缺少实用性。因此,有学者加入用户相对影响力因子来构建RWSIR模型,通过引入节点转化概率系数λ,并在随机网络、小世界网络、无标度网络中进行仿真分析,研究结果显示RWSIR模型与实际的微博信息传播过程更加贴合[37]。

(2)SIR模型节点形态的演化。通过改进节点形态而构建的SIR演化模型有SEIR、SIRS和SEIRS等。这些模型依据不同研究方向和目的,通过融入潜在节点E或是改变节点感染流程进而改良SIR模型。另外,为了研究信息传播周期、传播速度、传播深度与节点状态的关系,研究者将传播节点分为S态(易感染用户)、Ia态(感染用户,且与传播者观点一致)、Id态(感染用户,与传播者观点不一致)和R态(免疫用户),依据经典SIR微分方程推导原理,计算节点感染概率、信息忽略概率和感染用户衰减度。实证结果表明,信息传播过程中的初始节点感染率越高,传播速度越快;信息忽略概率越高,被感染用户越少;已感染用户衰减速率越快,传播周期越短,传播范围越小[38]。亦有为研究信息传播有效率和节点规模大小的影响程度,将节点分为S态(未收到信息)、I态(收到信息,确定会继续传播),IR态(收到信息,不确定是否会继续传播)和R态(收到信息,确定不会继续传播)四种形态,从网络结构特征、信息属性和用户主观差异性进行分析,通过模型仿真,认为这两种因素对信息传播的速度和深度产生的影响可以忽略不计[39]。SIR演化模型在挖掘微博信息传播模式和传播规律的研究中取得了突破性的进展。

4 基于多重网络的微博信息传播预测和控制模型及其演化

微博网络可以看作是由线上网络和线下网络构成的一种多重网络,线上网络由微博平台内的节点用户构成,线下网络由现实世界的微博用户构成。因此,基于多重网络对线上网络开展传播预测研究,为线下网络制定信息传播控制策略提供依据;对线下网络进行微博信息传播控制研究,为网络环境安全提供保障。

图4 SIR经典模型及其演化

4.1 基于多重网络的线上网络微博信息传播预测模型及其演化

早期的线上网络微博信息传播预测模型主要对用户的转发行为、信息的传播路径进行预测分析,将用户名、直接链接节点数量、信息内容等特征作为预测指标。若预测指标过少,预测精度难以保证;当预测指标数量满足条件时,虽提高了精确度,但由于特征向量过多,量化处理非常复杂,难以达到预测目的。因此,一种信息传播路径级联概率模型出现了。通过运用贝叶斯网络、朴素叶贝斯和逻辑回归三种经典算法,分析影响用户转发行为的相关因素,从而实现用户转发行为和传播路径的预测,实验证明该模型预测精度比较理想[40]。随着研究的深入,最初运用的判定树、贝叶斯、朴素叶贝斯、逻辑回归等经典算法已经不能满足微博信息传播预测研究的需要。基于此,学者提出了一种改良的决策树算法——随机森林微博转发预测算法,其构建过程如图5所示。通过提取重要特征,加入用户间微网络关系和用户权重等系数,预测用户的转发行为,实验证明随机森林微博转发预测算法性能高于其他经典算法,并取得较高的预测精度[41]。

图5 随机森林微博转发预测算法的构建过程

4.2 基于多重网络的线下网络微博信息传播控制模型及其演化

由于微博网络的特殊性,一旦不良信息形成爆发式传播,将对微博平台、网络环境带来诸多不利影响。微博信息传播研究的最终目的就是为了控制微博信息传播的流向和流速,因此,对控制策略的制定和实施方式进行研究具有重要意义。微博信息控制策略模式分为个体式、分割式、诱导式以及改变式四类[42]。最初的微博信息传播控制研究提出一种随机控制策略,其缺点在于如果想要达到控制的目的,需要选取的控制节点数量过于庞大。为了解决这一问题,学者提出了一种目标控制策略,然而微博网络的巨大规模令目标控制同样难以实现。因此熟人控制策略应运而生,熟人控制策略将随机控制策略和目标控制策略相融合,首先运用随机策略选取部分节点,然后找到与其相关联的邻居节点,最后对部分邻居节点采取目标控制策略。仿真分析验证了这种方法不仅容易实现,而且实施效果非常理想[43]。博弈论是一种研究特定条件下,个体如何选取令自己收益最大化的策略的理论。借鉴博弈论思想,分析信息传播策略演化,计算遇到突发事件时采取不同策略分别可能获取的收益,可为控制微博信息的恶意传播,制定适合事件良性发展和演化的最优策略提供依据。仿真分析结果显示,参与传播用户多、爆发时间长并且规模较大的群体事件更加适合透明公开处理;参与传播用户少、爆发时间短并且在未变为热点事件前可适当对信息进行屏蔽处理[44]。

5 微博信息传播模型的演化方向

5.1 微博信息传播中节点、节点链接与信息内容的融合

从微博信息传播模型及其演化看出,研究侧重点主要集中在微博传播节点属性和传播路径属性,却忽略了关键主体——信息。在微博传播过程中,信息可以划分为多种类型,不同类型信息的传播路径、影响力等都会存在较大的差异。不仅节点之间存在链接关系,节点与信息内容同样有一定的联系,节点用户的心理行为、关注信息的类别、发布信息的类型等都关联着不同的信息属性。由于微博网络可看作由多个子网络构成,所以信息属性与子网络的匹配度、信息在传播过程中的演化等问题同样是微博传播研究的重要方向。划分微博信息类别,构建指标体系来评估信息差异性以及其在传播过程中带来的影响,不仅可促进信息传播特征以及传播机制的挖掘深度,而且可为制定信息调控监管策略、规范微博网络环境提供更可靠的依据。

5.2 微博信息传播中复杂网络与多重网络的融合

现实微博网络的复杂性,线上线下的多重关系,子网络结构链接关系的差异性,用户的个性化特征、信息的多种类别都给微博网络的属性增添了复杂性。运用单一的网络结构研究微博信息传播显然不够贴合实际,研究成果现实适用性并不强。因此,运用大数据解析微博网络的基本特征,并引入复杂网络与多重网络的理念,令整个微博网络既具有小世界和无标度等复杂网络的特性,同时又兼具多重网络的线上线下网络结构特性。从微博网络的整体性来看,将微博传播规律研究与预测控制研究相融合,不仅令所构建的网络结构模型更贴合实际,而且可通过网络结构的整体性研究,进一步提升信息传播的路径及其演化规律的准确度。从微博子网络角度来看,将线上网络与复杂网络融合,对网络结构自身特性及其复杂性进行研究,有利于拓展微博信息传播研究深度,进一步提升预测精度,使成果应用更具实践价值;将线下网络与复杂网络融合,优化控制策略方案,提高控制策略实施点的精准度,可为微博信息监管调控提供更可靠的依据。

5.3 微博信息传播与大数据的融合

随着大数据技术的飞速崛起,将大数据技术与微博信息传播管理相融合,不仅为研究微博信息传播提供了新的研究工具,而且为传播监管提供重要的技术支持(见图6)。在理论研究方面,运用大数据技术,分析归纳总结微博信息传播主要影响因素、关键路径等,为理论研究提供准确度更高的实践依据。在实践应用方面,运用大数据技术,解析整个微博网络结构所有因子的属性,从中找到每一类因子的共通特性,以此为基础识别用户性质,严加监管“水军”类型用户,甚至可将其设置为黑名单用户。同时,利用大数据识别信息性质,辨别虚假消息并进行相应的封闭处理。最后,可利用大数据预测信息传播路径以及用户转发行为,实现对舆论信息爆炸性传播的有效控制。

图6 基于大数据的微博信息传播

[1]崔金栋,于圆美,王新媛,等.信息管理技术视角下微博研究综述与趋势分析[J].图书馆论坛,2015(4):92-99.

[2]袁毅.微博客信息传播结构、路径及其影响因素分析[J].图书情报工作,2011(12):26-30.

[3]刘继,李磊.基于微博用户转发行为的舆情信息传播模式分析[J].情报杂志,2013(7):74-77,63.

[4]马捷,孙梦瑶,尹爽,等.微博信息生态链构成要素与形成机理[J].图书情报工作,2012(18):73-77.

[5]张海涛,宋拓,张连峰,等.基于信息内容与信息属性的微博热点信息生态化的实现研究[J].图书情报工作,2014(15):123-127.

[6]方锦清,毕桥.统计物理与网络科学面临的若干挑战与思考[J].复杂系统与复杂性科学,2010(4):29-38.

[7] 刘建香.复杂网络及其在国内研究进展的综述[J].系统科学学报,2009(4):31-37.

[8]Peter J M,Thomas R,Kevin M,et al.Community structure in time-dependent,multiscale,and multiplex networks[J].Science,2010,328:876-878.

[9]Kyu-MinL,CharlesD.Brummitt,K.I.Goh.Threshold cascades with responseheterogeneity in multiplex networks[J].Physical Review E Statistical Nonlinear&SoftMatterPhysics,2014,90 (6):062816.

[10]Gomez-Gardenes J, Rrinares I, Arenas A, et al.Evolution of cooperation in multiplex networks[J].ScientificReports,2012,2:620.

[11]GiuliaM,DanielR,PietroP,et al.Weightedmultiplex networks[J].PlosOne,2014,9 (6):e97857.

[12]Nicosia V,Bianconi G,Latora V,et al.Growing multiplex networks[J].PhyscialReview Letters,2013,111(5):058701.

[13]BoccalettiS,BianconiG,CriadoR,et al.The structure and dynamicsofmultilayer networks[J].PhysicsReports,2014,544 (1):1-122.

[14]Mostafa S,Rajesh S,Moreno M,et al.Spreading processesin multilayer networks[J].IEEE Transactionson Network Science and Engineering, 2015, 2 (2) :65-83.

[15]Federico B,Vincenzo N,Vito L.Structural measures for multiplex networks[J].Physical Review E Statistical Nonlinear&Soft Matter Physics, 2014, 89 (3) :032804.

[16]Azimi-Tafreshi N,Gomez-Gardenes J,Dorogovtsev S N.K-core percolation on multiplex networks[J]Physical Review E Statistical Nonlinear&Soft Matter Physics,2014,90 (3):032816.

[17]H X WU,M JXIN.Aquick emergencyresponsemodel for micro-blog public opinion crisis oriented to mobile Internetservices:Design and implementation[J].Advances in Intelligent and Soft Computing,2012,7(6):1-7.

[18]周秀云,娄策群.信息生态群落演替的概念、过程与特征[J].情报理论与实践,2011(6):12-14.

[19]吴少华,崔鑫,胡勇.基于SNA的网络舆情演变分析方法[J].四川大学学报(工程科学版),2015(1):138-142.

[20]Rafa D,Jan S,Wojciech F.The application of social networkanalysisalgorithmsin asystem supportingmoney laundering detection[J].Information Sciences, 2015,295:18-32.

[21]蒋侃,唐竹发,隋浩.基于微博信息扩散质量的网络舆情关键节点识别[J].情报科学,2016(7):64-69.

[22]钟杰,陈兴蜀,王文贤,等.面向微博话题传播的重要节点测量研究[J].计算机应用研究,2016(8):2290-2293.

[23]邓小龙,李欲晓.面向应急管理的大图重要节点中介度高效近似计算方法[J].系统工程理论与实践,2015(10):2531-2543.

[24]周东浩,韩文报,王勇军.基于节点和信息特征的社会网络信息传播模型[J].计算机研究与发展,2015(1):156-166.

[25]Z Y DING,Y JIA,B ZHOU,et al.Measuring the spreadabilityofusersin microblogs[J].JournalofZhejiang UniversitySCIENCEC ,2013,14(9):701-710.

[26]袁毅,杨成明.微博客用户交流的机制、结构及特征研究[J].图书馆论坛,2010(6):82-86.

[27]武澎,王恒山,李煜.突发事件信息传播超网络中枢纽节点的判定研究[J].管理评论,2013(6):104-111.

[28]郑蕾,李生红.基于微博网络的信息传播模型[J].通信技术,2012(2):39-41.

[29]庄亚明,余海林.群体性突发事件信息传播网络特性研究——以抢蜡烛事件为例[J].情报杂志,2013(7):37-42.

[30]苑卫国,刘云,程军军,等.微博双向“关注”网络节点中心性及传播影响力的分析[J].物理学报,2013(3):502-511.

[31]贺筱媛,胡晓峰.网络信息传播动力学建模研究[J].系统仿真学报,2010(11):2511-2514,2518.

[32]易成岐,鲍媛媛,薛一波,等.新浪微博的大规模信息传播规律研究[J].计算机科学与探索,2013(6):551-561.

[33]KimB J,TrusinaA,MinnhagenP,et al.Selforganized scalefreenetworksfrommergingandregeneration[J].The European Physical Journal B Condensed Matter and ComplexSystem,2005,43(3):369-372.

[34]G.Kossinets,D.J.Watts.Empirical analysis of an evolvingsocialnetwork[J].Science,2006,311(5757):88-90.

[35]王超,刘骋远,胡元萍,等.社交网络中信息传播的稳定性研究[J].物理学报,2014(18):87-93.

[36]王辉,韩江洪,邓林,等.基于移动社交网络的谣言传播动力学研究[J].物理学报,2013(11):106-117.

[37]王金龙,刘方爱,朱振方.一种基于用户相对权重的在线社交网络信息传播模型[J].物理学报,2015(5):71-81.

[38]黄宏程,蒋艾玲,胡敏.基于社交网络的信息传播模型分析[J].计算机应用研究,2016(9):2738-2742.

[39]田占伟,王亮,刘臣.基于复杂网络的微博信息传播机理分析与模型构建[J]情报科学,2015(9):15-21.

[40]曹玖新,吴江林,石伟,等.新浪微博网信息传播分析与预测[J].计算机学报,2014(4):779-790.

[41]罗知林,陈挺,蔡皖东.一个基于随机森林的微博转发预测算法[J].计算机科学,2014(4):62-64,74.

[42]Thomas W V.Network interventions[J].Science,2012,337 (6090):49-53.

[43]顾亦然,夏玲玲.在线社交网络中谣言的传播与抑制[J].物理学报,2012(23):544-550.

[44]肖人彬,张耀峰.网络群体事件信息传播的演化博弈分析[J].复杂系统与复杂性科学,2012(1):1-7.

A Review of the Study on Microblogging Information Dissemination Model and Its Evolution

CUI Jin-dong,ZHENG Que,SUN Shuo

A review of the basis on which microblogging information dissemination model is constructed and the evolutionary process of the model is instrumental for the microblogging information transmission,since the impact related to the process is various and complex.In this paper,analysis is performed on the functions and evolution patterns of the existing microblogging information dissemination model,attempting to interpret that it is of the traits of a social network in terms of the own properties of the nodes,the link relation and the overall topology evolution;of the characteristics of a complex network in terms of the dissemination patterns,influencing factors and evolutionary laws of the model;of the qualities of a dual network in terms of information transmission prediction and control.After analyzing the functions and technical trends of the model,the authors point out the evolution direction of microblogging information dissemination model,that is,the fusion of nodes,node links and information content,the integration of complex networks and multiple networks,and the application of big data technology.

microblogging information dissemination; network structure; dissemination law; dissemination prediction

格式 崔金栋,郑鹊,孙硕.微博信息传播模型及其演化研究综述[J].图书馆论坛,2018(1):68-77.

*本文系国家社科基金规划项目“基于信息生态的微博信息管理机理研究”(项目编号:16BTQ068)研究成果。

崔金栋,博士,东北电力大学经济管理学院副教授;郑鹊,孙硕,东北电力大学经济管理学院研究生。

2017-04-09

何燕)

猜你喜欢
网络结构节点用户
CM节点控制在船舶上的应用
Analysis of the characteristics of electronic equipment usage distance for common users
基于AutoCAD的门窗节点图快速构建
关注用户
商用汽车(2016年11期)2016-12-19 01:20:16
关注用户
商用汽车(2016年6期)2016-06-29 09:18:54
关注用户
商用汽车(2016年4期)2016-05-09 01:23:12
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用
管理现代化(2016年3期)2016-02-06 02:04:41
沪港通下A+ H股票网络结构演化的实证分析
管理现代化(2016年3期)2016-02-06 02:04:13
复杂网络结构比对算法研究进展