姜伟伟+顾程
1.广西互联网新闻传播研究中心,广西南宁 530000 2.上海微趣网络科技有限公司,上海 200235
摘 要 当前对社交媒体的研究集中于关注微博、微信的用户使用行为分析,缺乏对微博尤其是微博信息实时影响力的动态性研究。本研究以页面评级(Page Rank)算法为基础,提出改进的社会评级(Social Rank)算法,结合用户微博使用行为分析得出的权重值,并将时间因素纳入微博动态影响力评估模型之中。通过具体实例探讨了微博动态影响力指数构建的重要性和实用性。研究认为社交媒体中大量数据的深度分析与挖掘可以更好地帮助市场营销以及舆情监管部门及时掌握信息的发展动态,从而更有效地推进品牌传播和干预舆论信息的走向。
关键词 新媒体;微博;信息传播;动态影响力
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2017)11-0045-02
随着互联网技术的不断发展,许多社交平台也从最初的萌芽逐渐发展成熟,人与人之间的空间距离得以进一步拉近。特别是微博、微信等社交工具的出现,也更进一步地推动了互联网的发展,人们可以借助微博、微信,以及一些移动客户端随时进行信息的浏览、关注与分享。大量的信息浏览、关注与分享也产生了大量的数据,数据尤其是实时数据的深度分析挖掘可以帮助舆情监管部门及时发现影响力最强的信息,从而有针对性地对其可能产生的负面影响及时进行干预,避免负面信息更大范围传播所带来的负面影响。
互联网信息的影响力主要通过信息排序获取,排序越靠前的信息人们对它的关注程度越高,影响力也就越大。本研究认为新的微博影响力评估方法应强调信息辨识的问题,并考虑怎样解决时间因素对于信息影响力衰减的影响,进而实现一个兼顾全面性、及时性和真实性的实时互联网信息列表构建。基于以上分析,本研究以微博信息为研究对象,结合以往有关网页排序的Page Rank算法,在此基础上提出了Social Rank的计算方法,得到相应微博用户的权重信息,并将时间因素纳入到信息影响力排名计算之中,构建了更为合理的微博动态影响力指数。
1 基于社会评级(Social Rank)的微博影响力权重计算
腾讯和新浪微博是中国最主要的2个微博平台,其各自所拥有的注册用户超过3亿。用户与用户之间通过相互关注、单方面的关注或被关注,不仅可以实现微博使用者资讯获取或交流的目的,还可以满足使用者间情感交流的诉求。根据以往国内外学者的研究,微博使用者所发布的信息可以在其粉丝群中得到广泛和迅速的传播,从而扩大其信息传播的影响力。微博所具有的传播快、影响大、覆盖广、社会动员能力强等特点,使其在某种程度上成为推动社会发展的一个重要工具,因此,有效微博影响力的获取,可以更为准确合理的向公众传递更有价值的信息。
Page Rank近似于一个用户,是指在互联网上随机地单击链接将会到达特定网页的可能性。通常,能够从更多地方到达的网页更为重要,因此具有更高的网页排名。每个到其他网页的链接,都增加了該网页的排名。具有较高排名的网页一般都是通过更多其他网页的链接而提高的。考虑到Page Rank算法涉及的网页数量和网页链接与微博平台用户关系间的相似性,本研究将用户与用户之间的链接网络看作网页与网页之间的超链接,并由此计算出大部分活跃用户的社交权重值,即用户的Social Rank值。Social Rank的等级范围介于0到10之间,10级为满分,SR值越高说明用户(或信息)越受欢迎(越重要、影响力越大)。例如,SR值为1的用户表明该用户不太受欢迎,而SR值为7到10则表明该用户非常受欢迎(或者说极其重要)。另外,Page Rank方法不仅考虑网页链接数量,还考虑了网页质量因素,因此,对于Social Rank来说,被权重高的人关注(或信息被高权重的人关注或分享),微博用户自身的权重值也会相应提高。
所以一个微博自媒体的Social Rank值是由其他自媒体的Social Rank值计算得到。与Page Rank
算法的原理基本相同,Social Rank刚开始赋予每个微博用户或者每条微博信息相同的重要性得分,通过迭代递归计算来更新每个用户或信息节点的Social Rank得分,直到得分稳定为止。基于大量的数据和计算,最终可以获取每个微博用户或每条微博信息稳定的Social Rank值,通过实际比对,该值可以线性地评估各个微博自媒体账号及其所发布信息的传播价值。从排名计算过程可以看到Social Rank计算的结果与用户特征及其所发布的信息主题是没有任何关系的,即该算法是用户与主题无关的,因此Social Rank算法能够较好的获取微博的影响力。
2 微博实时动态影响度计算
确定了微博用户及微博信息影响力的权重之后,就获取了微博信息实时影响力测量的基础。考虑到信息传播影响度的实用价值性,需要从实时动态性及最终静态性两个角度测量信息的影响度。
信息的实时动态性强调关注信息传播过程中实时变化的影响力,微博使用者一条信息发布后,如果该信息影响力足够大,那么它可能很快获取更多受众的关注,并且在某种程度上可能会对人们的日常生活产生影响。因此,快速处理最近的消息并同时处理新出现的信息,在很短时间内评估出某一时刻信息的传播影响力,并将其随时间变化而出现的衰减性特征纳入信息影响力分析框架,则可能会更有针对性的对某些不好的信息采取提前干预的手段,避免其对人们的日常生活产生负面影响。实时动态性信息影响力的获取对于网信办快速发现重要舆情并快速处理大量舆情相关信息聚焦舆论关注点,争取应对时间方面有着较强的实战意义。对于最终静态信息,其测量无需考虑时间的衰减,获取微博所传播信息在各新媒体平台上所达到的最终用户数进行累加,即获取了该微博信息的影响力。由于信息发布后存在一段时间的衰减性,其衰减时限基本为7天,因此该静态值基本可以在信息发布后的7天后进行测量。
借助数亿个微博使用者历史数据分析,通过Social Rank算法测量出微博使用者的使用权重函数后,就可以进一步评估微博信息的传播影响力。一条信息某段时间内在微博自媒体中传播影响的一个量化的数值被看作该条信息的时间传播影响度。实时信息传播影响度数值越高,那么这条信息的受众也就越多,并且该条信息被继续扩散的可能性也就越大。因此,实时信息传播影响力本身是一个相对值,即只有两条信息比较后才使其具有一定意義,体现出其实用价值。信息实时传播影响力指标构建时涉及到三个主要参数:(1)单位时间内转发的媒体数增量;(2)每个转发节点的Social Rank权重;(3)发布时间距离现在的时间。
信息实时传播影响力指数计算过程中计入时间的因素,考虑了时间的对信息衰减的作用,更适合表达当前信息的受关注程度。信息的最终静态传播影响力关注的则是信息随时间衰减后的最终影响力,即信息最终达到了多少受众,影响了多少人群。因此,如果只是计算或评估信息在完整传播周期中的影响力,可以直接评估信息的最终静态传播影响力,信息传播的7天周期结束后,将实时传播影响力算法理论公式中的时间衰减项剔除后,便可以得到最终静态传播影响力的算法。
由于7天之后可以获取信息的最终静态传播影响力,与7天之内该信息的实时影响力价值相比,其价值有效性或对人们日常生活的影响力相对较弱,因此,本研究更关注信息的实时影响力。
3 结论
本研究在以往学者研究的基础上,结合互联网数据采集与大数据处理分析技术,对Page Rank网页排名算法进行改进后,在获取大量微博使用者及其发布信息数据的基础上,根据微博特点设计了测量微博当前影响力指数的计算方法并通过计算机实现了快速的数据处理计算,以获取实时的微博影响力信息排名,并对信息进行自动化更新处理,以寻找到当前舆论最关注的相关信息。
研究结合微博信息的实时数据通过两组数据的对比发现,将微博发布时间考虑在内的实时微博信息排行能够更有效地发现最具影响力的微博信息。基于Page Rank方法所改进的Social Rank微博动态影响力指数构建考虑了微博用户与用户、用户与信息、信息与信息之间的联系,并结合相应微博使用者的影响力以及时间变化的因素,将这些因素共同纳入微博信息影响力指数的构建之中,因此可以得到相对准确的信息影响力排名,从而帮助舆情监管部门对信息进行有效的监管。由于7天的周期会使得信息衰减到一个最终的静态排名状态,而该状态更多的依赖于微博用户自身的用户权值,时间并不会对其影响力产生实质性的影响,因此,本研究并未对其进行深入探讨。实时性信息影响力分析,更有助于为有限人力的互联信息办公室提供帮助,依靠信息技术,实现其高效捕捉高影响力信息进行监管的业务目标。
参考文献
[1]刘璐佳.微博影响力的直觉模糊评价方法[J].电脑知识与技术,2011,7(33):8195-8196.
[2]郭林,陈洁,顾程.新媒体信息传播影响度测量方法的研究[J].软件产业与工程,2016(2):51-56.