袁信,王永滨
(中国传媒大学计算机与网络空间安全学院,北京 100024)
近年来,随着互联网技术的不断发展,在线社交网络迅速普及,越来越多的用户加入到在线社交网络中,使得在线社交网络成为现代社会信息传播的重要途径。同时,以微信、微博为代表的在线社交网络使人们对信息的多样化和个性化需求得到空前释放,海量信息在这些平台上以前所未有的速度和广度进行传播,一方面极大地改变了信息传播模式,另一方面也给舆情监控带来了挑战。在在线社交网络上,不同传播主体对同一信息会产生多样化的观点,不同观点之间的相互竞争对信息的传播有着促进作用,例如社会热点、娱乐消息等容易引起舆论热点的新闻,针对此类信息的争论促进了信息的广泛传播。如何探索出信息在社交网络上的传播机制,并对信息的传播趋势加以控制,已经成为当前的热门研究话题。深入研究这一信息传播机制,能为社会治理中网络舆情的引导和监管提供特定程度的理论依据和价值。
信息传播过程和传染病染病过程有相同点,所有信息传播模型的研究主要是借鉴经典传染病模型及其变种模型,比如经典的SI模型[1]、SIR模型、SIS模型[2]。这些模型认为,人与人接触概率相同,其传播过程是均匀混合的。后来为适应不同疾病的感染特点,学者们又提出基于经典模型的改进模型,比如考虑疾病暴露或潜伏期的SEIS和SEIR模型,带有被动免疫个体的MSIR模型[3]等。
多样的流行病模型启发了信息传播领域的研究者。针对社交网络的复杂性,有学者提出了符合社交网络信息传播的典型模型,比如SIRS[4]模型,该模型认为免疫具有时效性,免疫个体可能再次被感染。还有SEIR模型[5]考虑传播者的心理,引入潜伏者(Exposed),部分易感者变为潜伏者,再以概率转换为感染者。崔金栋[6]等人考虑到话题式信息二次传播可能性,提出H-SEIR模型,并提出静态网络和网络节点密度服从泊松分布的假设。Elena[7]等人建立了SIVR(Susceptible Infection Variant Recovery)模型,引入变异者,易感者转变为感染者后,感染者以概率转化为免疫者,内部变异者和接触变异者。Xiyang[8]等人构建了SIVRS模型将恢复者R以概率转变为S,并增加了死亡率。王志晓[9]等人构建了SPIR(Susceptible Potential Infective Removed)模型,提出PSS潜在传播集(由感染节点连接易感节点构成的集合),避免了感染节点连接的易感节点的重复计算。Zan[10]等人构建了SICR(Susceptible Infective Counterattack Removed),通过加入反攻群C构建新的谣言传播模型。
综上可知,现有的信息传播模型多集中于信息表层传播,缺乏对多种信息内部传播机制的研究。信息源的主观性对信息传播者的观点影响在当前海量信息覆盖的网络中极其常见。观点博弈在信息传播中可以帮助信息更广泛地传播,同时也是有限用户资源的竞争对手。
本文根据对在线社交网络的相关文献[11-14]阅读和研究,总结出在线社交网络有如下几个规律:
规律1:在线社交网络信息传播速度。开放式社交网络大于随机社交网络,随机社交网络大于世界社交网络。
规律2:信息传播具有主观性。一般由信息传播者先产生观点,再传播该信息。
规律3:在线社交网络存在观点博弈现象。同一信息可能会引发不同观点,对立观点的信息传播一般滞后于原观点信息的传播。
规律4:在线社交网络中存在大量沉默者。信息传播主要由表达者引起,沉默者更倾向于不参与信息的传播。但沉默者仍然会主动关注信息,并有一定概率产生观点并参与到信息传播的过程中。但其对信息的遗弃率会高于持有观点的传播者。
本文深入分析了在线社交网络中信息传播的规律,提出了SNIIR模型。该模型针对竞争性观点的信息扩散情形,引入了对抗观点感染者和沉默者,即对同一事件持不同观点的两类个体和在两类观点中保持沉默的个体。通过模拟仿真实验,详细分析了观点博弈中信息传播过程,信息扩散的最终状态,并讨论了内部参数变化的影响,还针对参数在现实网络中的映射,提出针对不同种类社交网络信息传播的应对策略和管控手段。
目前信息传播模型中包括,SIR模型、SEIR模型和H-SEIR等,其感染者或者二次传播者都是只考虑到信息的外部传播。现实的信息传播是多种观点协同扩散,互相影响达到最终状态。因此,本文吸纳现有传播模型的优点,对节点的状态做出改进,考虑到人们对信息的反应,分为对立观点节点和沉默者节点,构建出SNIIR模型,其中S为易感者,N为沉默者,I1为观点持有者,I2为对立观点持有者。
本文的信息传播模型存在如下传播规则:信源节点以概率p产生观点I1节点,并以概率p影响关联节点。I1节点在信息传播过程中,由于信息传播过程中信息的信息量不断增大,其观点被撼动,以概率δ转换为沉默者N节点。并在传播过程中以概率ω对信息丧失兴趣,转换为信息免疫者节点R。I2节点传播路径与I1同理。此外,信源节点以概率λ产生沉默者节点N,由于沉默者效应,N节点的信息传播能力远小于I1、I2,仅为转化节点。N节点虽然信息传播能力小,但并非等同于信息免疫节点R,由于在信息传播过程中信息量的增大,其保持中立的态度可能被改变,以概率p、q转换为I1、I2节点,加入到信息传播的路径中。N节点在信息传播过程中,逐渐对信息丧失兴趣,以概率μ转换为信息免疫节点R。
本模型假设在一定时间t内,在线社交网络用户总量保持不变,即网络总节点数不变,网络结构不变。用S(t)、I1(t)、I2(t)、N(t)、R(t)分别表示在t时间段内,易感节点S(Susceptibles)、I1节点(Infectives1)、对立观点I2(Infectives2)、沉默者N(Neutral)节点、对信息丧失兴趣的免疫节点R的数量。设节点总数为P,则有S(t)+I1(t)+I2(t)+N(t)+R(t)=P。对应各态节点转换公式如下。
(1)
其中p、q、δ、λ、ω、μ均为图1中节点转换概率。
图1 SNIIR模型的节点转换过程
根据其动力学机制,可用如下微分方程组描述。
(2)
(3)
S(0)=P-3,I1(0)=1,I2(0)=1,N(t)=1,N(t)=0为初始值,即除了3个各态初始节点外,其余都是易感节点。当δ=λ=q=0时,本模型与SIR模型相同。
常见的在线社交网络可分为三类:一是以微信为代表的小世界社交网络;二是以微博为代表的开放式社交网络;三是以soul为代表的随机社交网络。
以微博为代表的开放式社交网络的网络度分布符合幂律分布,网络建模为无标度网络,简称为BA网络;以微信为代表的熟人社交网络的网络度分布接近小世界网络,简称为WS网络;除此之外,本文还发现有以探探,soul等为代表的具有随机性的社交网络,网络匹配模式为地区范围内的随机匹配,称为ER网络。在本文的模拟仿真实验中,利用以上三种复杂网络作为传播底图,构建SNIIR模型传播规则,模拟本文模型传播过程。
首先生成WS网络、BA网络和ER随机网络分别模拟微信朋友圈、微博、以及陌生社交soul的在线社交网络底图。通过模拟本文模型传播过程,在每一时步统计各类节点在网络中所占有的数量,分析不同网络上SNIIR信息传播模型的传播力,节点的分布情况,及其性能指标。
WS网络节点分布均匀,具有高聚类系数,与熟人社交平台为代表的微信网络类似。BA网络节点分布不均匀,影响信息传播的枢纽节点为hub型节点,与开放式社交平台微博[15]网络类似。即同一微博号被关注人数通常符合幂律分布,例如某知名明星微博被关注人数(粉丝数)超过1亿人。ER随机网络节点分布不均,服从泊松分布,与陌生社交平台soul类似。为不失一般性,本文实验均进行100次,取平均值。假设本文网络是有向无权网络,网络参数设置及其度分布如表1所示。
表1 三种复杂网络的参数设置
针对基于传染病模型在线社交网络的参考文献的参数设定统计,本文参数设定如下:随机选取节点,以0.03的概率分别选取节点I1、I2、N,余下节点均设置为易感节点S。易感节点转换为观点I1节点的概率为0.37,易感节点转换为沉默者节点N的概率为0.44,易感节点转换为观点I1节点的概率为0.19。I1、I2节点转换为沉默者节点N的概率为0.19,转换为免疫节点R的概率为0.3,节点N转换为免疫节点的概率为0.46。共模拟出100时步下的传播状态。分别统计SNIIR模型在WS小世界网络,BA无标度网络,ER随机网络下的各类节点分布情况。
如图2所示,SNIIR模型与SIR模型在S易感人群和R免疫人群的图像变换趋势相似。通过计算,曲线分别在WS小世界网络、ER随机网络和BA无标度网络的每一时步S、R人数的相关系数分别为0.9797245、0.82286182、0.86821897,相关系数均大于0.8,为强相关关系。计算公式如下公式4,其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。可以验证SNIIR模型中S、R传播规律符合SIR模型的S、R传播规律,其传播过程是有效的。
SNIIR在ER网络的传播效果 SIR在ER网络的传播效果
SNIIR在WS网络的传播效果 SIR在WS网络的传播效果
SNIIR在BA网络的传播效果 SIR在BA网络的传播效果图2 SNIIR与SIR在三组复杂网络下的结果
(1)
图2中SNIIR模型的传播效果都在60时步内达到稳态。在前20时步,BA无标度网络明显传播速度更快。说明只要出现初始节点,BA无标度网络能更快的传播信息,这与其网络性质,临界值较小,网络度的分布不均匀相关。在20至60时步,WS小世界网络能更快达到稳态,但其R节点的数量较低于BA网络与ER网络,说明WS网络感染节点达到一定规模后,其免疫效果同步发生。但由于网络的度的限制,信息未能得到充分扩散。三幅图对立观点I2传播峰值的出现均明显晚于观点I1,体现出信息传播过程中,对立观点与原观点传播的信息博弈;沉默者峰值均高于观点I1及对立观点I2,有明显的沉默者效应。
修改网络感染方式,随机选取节点度最大的十节点之一进行感染。如图31所示,当感染网络最大节点时,WS网络、BA网络和ER网络速度均有提高,其中,BA网络中N、I1、I2节点更快达到峰值,三峰值的时间间隔缩短到3步长,体现出意见领袖[16]作用。WS网络峰值到达速度没有明显变化,其到稳定状态后仍有部分节点未感染。ER网络与WS网络的表现情况相似。这说明了在不同社交网络环境下,意见领袖对信息传播的影响为BA网络>ER网络>WS网络。
SNIIR在ER网络的传播效果 SNIIR在WS网络的传播效果
SNIIR在BA网络的传播效果图3 选取最大节点度在三组复杂网络的结果
针对SNIIR模型参数δ,即观点I1、I2转换为沉默者节点N的概率。将δ分别设置为:0.0、0.3、0.6、0.9。
如图4所示,在WS网络中,参数δ的升高会导致沉默者节点峰值数较BA和ER网络有明显的增大。除此之外,三者到达稳态的时步均延长,说明提高参数δ能增强社交网络的信息传播能力,并能提高沉默者人数。参数δ的增加在真实网络中反应为权威部门对信息真实性验证,增加了信息的客观程度。如:对新闻事件的辟谣,对某些争议性政策的补充说明。实验表明此举措不但能增加沉默者的人数,还能增强信息的覆盖率,在WS网络中表现尤为明显。
SNIIR在ER网络的传播效果 SNIIR在WS网络的传播效果
SNIIR在BA网络的传播效果图4 不同δ的三组复杂网络效果
针对SNIIR模型参数p,即观点I1的转换概率。将p分别设置为:0.0、0.3、0.6、0.9。
如图5所示,当参数p为0时,WS网络、BA网络和ER网络均没有I1节点产生。当参数p增大时,BA网络的峰值来临最早,也最早进入稳定状态,其峰值数最高,WS网络峰值数最低。说明随着p增大,即信息越真实准确,在BA网络中的传播能力最强,在WS网络中传播能力稍弱。当参数为0.9时,模型近似SIR模型。实验表明,客观、真实、准确的信息在BA网络中的传播能力最强。
SNIIR在ER网络的传播效果 SNIIR在WS网络的传播效果
SNIIR在BA网络的传播效果图5 不同p的三组复杂网络效果
实验中SNIIR模型在WS、BA、ER网络中的传播过程,S、R人数的相关系数均大于0.8,与SIR模型的S、R有强相关关系,符合一般性基于传染病的信息传播模型。在传播表现上,符合WS、BA、ER网络对应真实社交网络的信息传播速度、信息传播具有主观情绪、社交网络存在观点博弈现象、社交网络中存在大量沉默者的四条规律。实验表明,该模型是有效的。
通过感染随机节点和感染度最大节点的结果表明,在BA网络中感染意见领袖所能达到的传播效果最佳。
实验讨论了影响该模型的主要两个参数δ和p,即真实性、客观性强的信息的传播率与信息真实性验证的中和率。结果显示,真实性客观性强的信息在三个网络中均能起到增强其传播效果的作用,并在BA网络中表现最佳。信息真实性验证能增强社交网络的信息传播效果,延长信息传播时间,其在WS网络中中和效果最好。
本文以传染病动力学中的SIR模型为基础,考虑到I节点的多样性,改进了I节点状态属性,构建新的网络信息传播模型。通过研究复杂网络和社交网络的关系,模拟出了小世界社交网络、开放社交网络和随机社交网络,将其作为信息传播的底图,构建SNIIR模型传播规则,模拟本文模型传播过程。通过对参数的讨论,进一步分析其传播过程。结果显示,对舆情的管控可以针对不同社交网络产生不同的应对策略。例如:真实消息通过开放式网络中的意见领袖传播能达到更好的观点传递。在小世界网络中,迅速的辟谣能比在其余两种网络中达到的效果更好。综上,本文提出了一个通用的信息传播模型,将多种信息观点的相互作用和传播联系起来,研究观点竞争信息扩散的动力学。
本文的不足点是假设网络的拓扑图在一定时段内固定,但真实在线社交网络具有复杂性,其网络结构是动态多变的,随时都有节点的进入与退出。如何在动态网络中模拟信息传播的过程及演化趋势,将是下一步的研究方向。