■ 张 伦 胥琳佳 易 妍
在线社交媒体信息传播效果的结构性扩散度
■张伦胥琳佳易妍
本研究拟通过“禽流感”这一微博信息传播案例,探讨信息的结构性扩散度特征——这一旨在挖掘在线信息传播的结构性测量指标。具体而言,本研究探讨了结构性扩散度的分布特征、结构性扩散度与其他传播效果测量方式的相关性/差异性以及结构性扩散度的影响因素。研究发现,结构性扩散度的分布与传播广度相比,其分布更趋向于正态分布;结构性扩散度与传播广度、传播深度等广泛应用的测量在线信息传播效果的指标无相关度。此外,本研究还发现,与原发微博内容特征相比,用户特征和参与转发的信息传播者特征更能够解释结构性扩散度的差异。
传播效果;传播广度;传播速度;结构性扩散
以Web 2.0为技术构架基础的社会化媒体,其互动性、实时性、“去中心化”等技术特征变革了个体信息传播行为,具体表现在计算机辅助沟通技术能够辅助用户构建在线人际关系,并大大提高信息传播效率;同时,信息发布和接收的成本也被大大降低。从社会系统的宏观视角来说,社会化媒体技术对宏观信息传播模式也产生了实质性的影响。信息不需要到达传统意义上的大众媒介把关人,就可以以几乎无成本的条件发布到社会化媒体平台。
探讨在线信息的传播效果,判定影响信息传播效果的主要因素,并利用经验数据验证宏观信息传播模式的变革,是在上述技术背景下信息传播领域重要的理论发展路径。在过去几年中,信息传播领域针对信息传播效果进行了诸多探讨。对信息传播效果的测量,可以从绝对数量(Quantity)、时效(Timeliness)以及结构(Structure)三个维度分别进行操作化定义(Zhang & Peng,2015)①。从“数量”维度,一般用信息的传播广度(例如,微博中信息的被转发次数)来进行测量(Zhang,et al.,2014)②。从“时效”角度而言,一般用传播速度来进行测量。传播速度测量的是一条信息快速获得他人关注的程度。对于突发公共事件(例如公共卫生事件、辟谣等)等具有时效性的信息,传播速度是衡量传播效果不可或缺的指标之一。研究发现,信息之间的传播速度差异很大。例如,Cha,Mislove,&Gummadi(2009)③通过对4个Flickr中的样本信息的扩散速度研究发现,不同信息的传播速度不同,其可呈现出传播时间相对均等,长时间静止后突然快速传播或早期传播速度快、而后经历稳步传播等情形。从“结构”角度而言,最广泛应用的传播效果测量指标为传播深度。既往研究表明,如果一条信息的传播深度能够达到4步(hops),则该条信息在全网传播的可能性较大。
但是,既往研究对于探讨不同维度传播效果的影响机制存在着一定的弊端。一般而言,信息的传播广度被认为是最重要的传播效果测量指标。首先,这种单一化的评价标准忽视了社会化媒体的结构性优势以及即时性优势(Goel,Anderson,Hofman,& Watts,2013)④。传播范围测量的是信息的“广播式(Broadcasting)”传播效果。而社会化媒体由于嵌入用户社会关系,使得信息能够沿着用户的社交网络,进行在线“病毒式(Viral)”传播(或称“在线口耳相传(E-Word of Mouth)”传播)。传播广度无法有效测量信息的“病毒式传播”程度。其二,既往研究发现,信息传播广度具有高度不平均性特征。例如,一项对Flickr的研究发现,在该社交网络中,大部分的图片(1000万)信息只得到了不多于10次传播,而只有很小一部分信息(n= 252,126)能够得到上千次传播(Cha,Mislove & Gummadi,2009)⑤。这种幂律分布(Power-law)特征,使得该测量指标区分度不够。虽然传播深度也一定程度上能够反映信息传播的结构特征,但该值受极值影响较大。该测量指标用一条信息的最长子传播路径来指代整个信息传播网络的结构特征,不能够反映该信息传播网络的一般性结构特点。
综上,本研究旨在探讨测量社交媒体在线信息传播效果的另一结构指标——结构性扩散度(Structural Virality)测量信息传播效果的效度,并探讨该指标对于弥补当前传播效果测量指标既有缺陷的意义。
结构性扩散度(Structural Virality)指一条信息的传播路径倾向于代际传播的程度。一条具有n个信息节点的扩散路径(Diffusion Tree)T中,任意两个节点i、j间的平均路径距离(Goel,Anderson,Hofman,& Watts,2013)⑥。
V(T)是结构性扩散度的连续性度量。该值越高,表明代际传播越深;该值越小,表明信息传播倾向于“广播式”传播。
结构性扩散度测量的是一条信息所能经过的异质性人群的程度,其一定程度上反映了该条信息激发产生新的对话的能力(Huffaker,2010)⑦。其结构性扩散度越深,该信息越有可能得到全网络范围的传播;相反,传播深度较浅则说明该信息只能在某一局部网络(往往是同质性小圈子)里传播(Cha,Haddadi,Benevenuto,& Gummadi,2010)⑧。
本研究拟通过“禽流感”这一微博信息传播案例,探讨信息的结构性扩散度特征,即结构性扩散度的分布特征、结构性扩散度与其他传播效果测量方式的相关性/差异性以及结构性扩散度的影响因素。具体而言,本文的三个研究问题如下:
研究问题一:结构性扩散度其分布呈何特征?
结构性扩散度具有何种分布特征?其分布呈现出正态化趋势还是幂律不平等分布趋势?如果结构性扩散度的分布呈现出正态分布特征,则说明该指标能够一定程度上区分不同信息的传播效果。
研究问题二:结构性扩散度与传播效果的一般测量指标(即广度和速度)是否具有相关性?
如上文所言,信息传播效果测量指标可分为多个维度,即“数量”维度、“时效”维度以及“结构”维度。因此,代表“结构”维度的测量指标结构性扩散度如果具有区分效度(Discrimination Validity),应与其他维度测量指标(例如传播广度、传播速度等)具有一定的相关性,但不应高度相关(BagbyTaylor & Parker,1994)⑨;否则认为该测量指标的区分信度较低,即可以用其他指标代替该指标。
研究问题三:结构性扩散度的影响因素有哪些?
信息传播结构性扩散度意味着该条信息所能够到达的异质性人群。换言之,该指标测量的是信息的结构性“渗透”能力。马尔科姆·格拉德威尔(Malcolm Gladwell)提出的“引爆点”假说认为,一条信息能否得到病毒式扩散,取决于诸多条件(Gladwell,2006)⑩。其一是信息本身的特点,格拉德威尔将其称为“附着力法则”(The Stickiness Factor),即信息本身具有能够吸引受众的内容特点;其二是参与转发信息的传播者特点,作者将其称为“个别人物法则(The Law of Few)”。格拉德威尔认为,信息的成功扩散很大程度上取决于参与传播进程的具有社交天赋(Social Gift)的人。这些人往往充当着社会网络中的连接者(Connectors)、内行(Mavens)和推销员(Salesman)的角色。“连接者”往往是占据信息传播网络中的“结构洞”位置的个体,其能够连接处于不同领域、不同社交圈子的用户。“内行”指“信息专家”(Information Specialists),其能够获得最新的信息。而“推销员”则指具有协商和说服能力的人,这些人能够试图说服他人接受信息。
基于“引爆点”假说,本研究将引入“信息发布者结构特征及行为特征”“原发微博内容特征”和“信息传播者的结构特征以及行为特征”,对格拉德威尔的“附着力法则”以及“个别人物法则”进行概念化与操作化,从经验性角度分析这一假说的可证伪性,并探索影响一条信息结构性扩散度的主要因素。具体而言,“附着力法则”主要指“原发微博内容特征”,其包括信息的话题特征以及情感倾向。“个别人物法则”则指“信息发布者和信息传播者的结构特征以及行为特征”,包括信息发布者的社交媒体使用经验、在线身份、所处地理位置、结构特征(粉丝数、关注好友数)以及在线活跃度(已发微博数);信息传播者的结构特征(例如信息传播者平均粉丝数、关注好友数)、在线活跃度、平均社交网络使用经验以及参与转发的权威用户数量(详见表2)。
本研究以“禽流感数据”为例,计算每条信息的结构化扩散度以及相关传播效果测量指标。
(一)数据收集
1.关键词确定
我们首先用“禽流感”这个关键词在“新浪微博”中随机抓取1000条微博,用关键词相关性检测确定到“H7N9”这个词与“禽流感”的关联度较高。再分别用“禽流感”和“H7N9”抓取微博,发现其重合度高达95.4%,最终确定以“禽流感”作为关键词抓取数据。
本研究主要采用新浪微博最高权限的API获取数据,首先抓取了2013年全年的微博帖子带有“禽流感”关键词的帖子,帖子总数708171条,评论总数948597,转发总数为2656511。发现其中4月和12月的微博数量最多,分别为128383和93219,并核对事实发现,当时有禽流感疫情的相关信息流传。最终决定选择2013年4月的61024条微博作为研究对象。其中,纳入本研究发生多于10次转发的微博为56331条,包含于787条原发微博中。这部分数据最终纳入本研究数据分析。
(二)测量
1.帖子主题
本研究首先利用语义建模(LDA,Latent Dirichlet Allocation)算法,对文档集合进行建模,并进行主题的聚类和发现。结合对500条微博的人工编码(Cronbach’s alpha=0.91),本研究最终确定了“疫情发展”“死亡确诊”“防治方法”“应对措施”“辟谣通报”“禽类动向”“其他”共七类话题。“疫情发展”主要包括患者情况、确诊感染情况、疑似报告等;“死亡确诊”即为有患者因禽流感而死亡的信息;“防治方法”主要是预防禽流感的各种方法,杀菌、消毒等各种防护;“应对措施”主要包括政府部门的部署工作、相应的政策法规、大规模消毒等方案的制定等;“辟谣通报”主要是谣言的澄清等内容;“禽类动向”主要是鸡肉、鸡、鸟等禽类的动向以及人们对它们的态度等;“其他”即为没有包含上述内容的信息。
我们把编码结果放入全数据进行机器学习(支持向量机模型,Support Vector Machine,SVM),针对微博的主题分类,结果准确度为0.56。虽然这个结果在机器学习的结果中尚且较为理想,但是放在整体数据之下仍然不能让人满意。于是我们进一步确定了类别的相关词,然后用种子词汇进行分类,再随机抽取结果500条,发现准确度为0.85,这个结果令人满意。
2.帖子情感倾向性
倾向性包括“负面”“中性”“正面”,分别代表帖子内容对禽流感事件的态度倾向性。划分的方法是基于词库的情感分析方法,即利用HowNet情感词库进行匹配。词库的建立包括连词、否定、褒义、贬义、程度和表情。通过语法规则解析、情感褒贬判断、程度判断、表情符号修正等步骤判别微博的情感值。
3.信息发布者在线身份
本研究利用首发用户的个人描述(Description)和认证信息内容对“用户身份”进行判断,包括媒体类、政府机构、健康医疗机构、公众四类。
本研究涉及的其他变量,例如信息发布者和信息传播者所处地理位置、结构特征(粉丝数、关注好友数)以及在线活跃度(已发微博数)均通过API从微博提取。信息发布者和传播者的媒体使用经验则为用户注册时间与发布或转发微博的时间差。
1.结构性扩散度及其分布特征
结构性扩散度取值在1至5之间,均值为2.19(标准差为0.37)。由图1可见,大部分信息的结构性扩散度介于1.5至3之间,另外很少一部分信息的结构性扩散度介于3至5之间。其分布呈现出不平均趋势,但与传播广度相比,不平均趋势不明显。
图3显示了结构性扩散度与多个传播效果测量指标——即平均速度(avg.speed)、平均时间间隔(duration)、传播速度(speed)、传播广度(spreadth)、以及传播深度(depth)之间的相关性。
2.研究效果测量指标相关度
由表1可以发现,结构性扩散度与平均速度(avg.speed)、平均传播时间总长(duration)、传播速度(speed)、传播广度(spreadth)的相关系数均不显著。这说明,结构性扩散度具有一定的区分效度。为了更直观地说明问题,我们挑选出了6个案例。以图2-e为例,该信息的结构性扩散度取值较高,但其传播范围(用转发量计算)较低;而图2-f则相反,该信息的结构性扩散度非常低,却具有较广泛的传播范围。传播深度与结构性扩散度的相关系数较高,这是因为传播深度为一条信息传播网络的最大路径长度,而结构性则为该条信息传播网络的平均路径长度。
3.结构性扩散度的影响因素
本研究将结构性扩散度作为因变量,纳入“信息发布者特征”“原发微博内容特征”以及参与信息转发的“信息传播者特征”,来解释影响信息传播结构性扩散度的可能因素。
该解释模型利用线性回归模型进行分析,其R2值为0.20,这说明,本模型纳入的自变量解释了结构性扩散度20%的方差。根据表2可以看出,与原发微博内容特征相比,信息发布者特征和参与转发的信息传播者特征更能够解释结构性扩散度的差异。就信息发布者特征而言,第一,信息发布者的身份显著影响了结构性扩散度。与普通公众相比,以“媒体”和“政府”身份发布的微博,其结构性扩散度更浅(回归系数媒体=-0.14,p<0.001;回归系数政府=-0.11,p<0.05)。这说明,“媒体”和“政府”发布的信息更倾向于“广播式”传播,而较难进行具有渗透性的在线人际传播。第二,信息发布者的粉丝数能够促进结构性扩散度的增长(回归系数=-0.056,p<0.001)。第三,信息发布者所处的地理位置如果是上海,与其他地区相比,其结构性扩散度更浅(回归系数=-0.121,p<0.01)。这说明,禽流感的发生地信息更倾向于“广播式”传播。
图1 结构性扩散度与传播广度分布图
图2 不同结构性扩散度取值的H7N9信息传播案例
图3 研究效果测量指标相关度散点图
传播时间总长速度传播广度传播深度结构性扩散度平均传播速度0.733***-0.015-0.0270.0510.121传播时间总长-0.076-0.0340.0310.126速度(speed)0.346-0.175-0.152传播广度-0.061-0.173传播深度0.731***
表2 结构性扩散度影响因素回归模型
注:*** p < 0.001;** p < 0.01;* p < 0.05
就参与转发节点特征而言,信息转发者的社交网络平均使用经验(回归系数=0.02,p<0.001)以及后续信息传播中VIP用户的参与(回归系数=0.008,p<0.001)能够增大该条信息的结构性扩散度。但信息转发者的结构特征(例如平均粉丝数、平均关注好友数)以及信息转发者的活跃度对结构性扩散度均无显著影响。
本研究旨在介绍“结构性扩散度”这一能充分反映在线信息传播特征的传播效果指标,并系统性总结和比较社会化媒体信息传播效果的测量指标之间的差异。从方法论的角度而言,“结构性扩散度”这一信息效果测量指标弥补了既往主流信息效果测量指标不能够反映结构性扩散效果的缺陷,从而能够更为直接地测量社会化媒体中在线人际传播趋势。
此外,本研究还具有实践指导意义。不同类别的信息,探究其传播效果的侧重维度不同。例如,对于健康议题(Health Emergency)信息,其结构性扩散效果以及时效性更为重要。信息传播速度对于公共卫生管理部门做出有效的危机干预措施有着重要的决策意义。而对于在线营销类信息,其传播广度更为营销实践者所重视。
注释:
①Zhang,L.,Peng,T.(2015).Breadth,Depth,andSpeed:DiffusionofAdvertisingMessagesonMicrobloggingSites.Internet Research,25(3).
③⑤Cha,M.,Mislove,A.,& Gummadi,K.P.(2009).AMeasurement-drivenAnalysisofInformationPropagationintheFlickrSocialNetwork.Paper presented at the Proceedings of the 18th International Conference on World Wide Web.pp.721-730.
④⑥Goel,S.,Anderson,A.,Hofman,J.& Watts,D.(2013).TheStructuralViralityofOnlineDiffusion.Preprint.p.22,p.26.
⑦Huffaker,D.(2010).DimensionsofLeadershipandSocialInfluenceInOnlineCommunities.Human Communication Research,36(4),pp.593-617.
⑧Cha,M.,Haddadi,H.,Benevenuto,F.,&Gummadi,P.K.(2010).MeasuringUserInfluenceinTwitter:TheMillionFollowerFallacy.ICWSM,10(10-17),30.
⑨Bagby,R.M.,Taylor,G.J.,& Parker,J.D.(1994).TheTwenty-itemTorontoAlexithymiaScale—II.Convergent,Discriminant,andConcurrentValidity.Journal of Psychosomatic Research,38(1),pp.33-40.
⑩Gladwell,M.(2006).TheTippingPoint:HowLittleThingsCanMakeaBigDifference:Little,Brown.pp.1-4.
(作者张伦系北京师范大学艺术与传媒学院副教授;胥琳佳系对外经济贸易大学中国语言文学学院讲师;易妍系华东师范大学政治学系讲师)
【责任编辑:潘可武】
*本文系国家社会科学基金青年项目“社会化媒体中公共事件话语框架及其演化机制研究”(项目编号:14CXW015)的研究成果。