用户特征对微博信息传播影响的实证研究

2015-09-27 07:45张鹏威刘红丽汪林威张澄东华东理工大学商学院上海200237
现代计算机 2015年24期
关键词:覆盖度账号特征

张鹏威,刘红丽,汪林威,张澄东(华东理工大学商学院,上海 200237)

用户特征对微博信息传播影响的实证研究

张鹏威,刘红丽,汪林威,张澄东
(华东理工大学商学院,上海200237)

0 引言

微博,即微博客(micro-blog),是一种通过关注机制分享简短实时信息的广播式社交网络平台,用户可以通过Web、WAP以及各种客户端组件,随时随地地发布文字、图片、视频、音频等形式的信息,并实现及时分享[1]。自2006年Twitter发布之后,微博在全球得到迅速的推广和发展;2009年8月,新浪微博上线并快速成长为我国最具影响力的微博网站[2]。根据新浪微博Q1财报[3],截止2015年3月,新浪微博月均活跃用户数(MAUs)为1.98亿人,同比增长38%。移动MAU占到总MAU的86%。日均活跃用户数(DAUs)为8900万人,同比增长34%。

微博产生的时间虽然不长,但却在生活的各个方面产生着影响,尤其是在社会热点的引发和传播过程中作用尤为显著,微博上的“热门话题”极有可能就是下一个社会热点的“先头兵”。微博也正逐渐成为政府发布重要消息的正规渠道,诸如“央视新闻”、“人民日报”等官方媒体纷纷开设微博对信息进行宣传。微博作为一种新型信息传播媒体的地位正在不断上升。因此,无论是希望自己的微博能被大量转发从而引起风潮的组织或个人,还是希望监控微博信息、防止流言扩散的监管部门,研究微博传播的影响因素都十分必要。

微博近几年的快速发展及其在社会各领域的广泛应用引起了国内外广大研究者的重视,相关研究得到不断深入:靖鸣、王瑞分析了微博暴力一点引爆全局、扩散速度快、微博使用随意性及用户素质参差不齐等特点,建议运营商应加强网络监管[4];刘乙坐、黄奇杰在传播学视野下探索了对微博的基本分类,提出一种网络舆情的指导策略[5];李政泽、韩毅等提出用户分类的特征词权重优化及推荐策略,为微博用户行为分析和舆情监测提供了一种新方法[6];宋巍、张宇、谢毓彬等将微博分类用于用户兴趣的识别,得到较好的效果[7]。这些文献大都从理论层面对微博信息传播、特点传播效果等内容进行探讨,但很少从实证角度对微博信息传播效果进行研究。国外学者对微博研究的切入点比较小,与其他领域的融合性研究比较多,对微博的研究侧重实证调研,运用定性方法对采集的数据进行分析以此获得一些重要结论或发现研究中存在的问题。如Antti Oulasvirta等指出微博是用户自我表达自主选择的平台,微博相较于博客在内容上更加生活化、平凡化,利用互动反馈维持人际关系是用户参与微博的动机[8];Yuri Takhteye等人的研究发现距离在Twitter世界中依旧是影响人际关系形成的原因但距离不是唯一因素,人际关系的建立是距离语言国别航班便利程度等多因素共同作用的结果[9]。

在The Tipping Point中,作者Malcolm Gladwell提出了引发潮流的三要素,即:关键人物法则(The law of the few)、附着力法则(Stickiness factor)和环境威力法则(Power of the context)[10]。他认为信息的传播将受到传播者、信息本身内容和信息以外因素的共同影响。而这些法则也适用于微博的传播。本文将聚焦关键人物法则在微博信息传播中的影响,即用户特征对微博信息传播影响,希望能够从众多用户特征中分辨出对微博传播来说影响显著的用户特征和无关紧要的用户特征。

本文将微博信息传播中的影响定义为用户所发出信息在微博中的传播能力,从新浪微博上选取了两条具有代表性的微博,采用实证研究方法,对微博信息传播过程用户特征对信息传播的影响进行研究,以便更清晰地认识用户特征对微博信息传播的路径及效果的影响。

1 微博用户特征分析

在微博信息传播中,微博用户是微博信息的传播节点,进行信息的发布、接收和转发。基于用户特征视角对信息传播影响的研究正逐渐成为微博研究的一大分支。Java等人研究了Twitter,利用HITS算法计算Twitter上用户的中心度和权威度,将用户分成信息共享,信息搜索和朋友关系三类[11]。Naaman根据Twitter用户发布的状态信息,进行内容分析,将用户分成9大类,主要的四类是IS(信息共享)、OC(意见/抱怨)、RT(随机想法)和ME(关于我的一切)[12]。已有研究表明,微博用户拥有的粉丝越多,其微博信息节更容易得到关注和转发[13];微博热度与用户粉丝数呈正相关性,但这种相关性并不是很大[14];资深用户(账号建立时间超过一年)和新用户(最近一个月才加入)的微博更容易被转发[14];得到认证的用户所发微博通常具有权威性,会被较广泛的传播[13];不同时间段用户的活跃度不同,也会对信息传播造成影响,21:00到0:00通常是微博的最佳转发时间[15]。郭秋燕、何跃发现,明星用户对微博信息扩散有积极影响,可以扩大信息传播范围[16]。马俊等将用户属性分为行为、状态两大类属性,每个属性各有10个维度,并将这些维度重新组合成为15种特征,依次来研究用户特征对于微博信息传播的影响[17]。

根据之前的研究并结合本文选取的微博特点,本文从认证账号、加入时间、用户活跃度、用户覆盖度四个方面考虑用户特征对于微博信息传播的影响。下面对四个因素进行介绍。

认证账号:新浪微博会对一些账号进行认证,并在昵称旁加上“V”来表示认证账号。这些账号往往是一些名人或者机构,具有较大的知名度和影响力。

加入时间:用户转发某条微博的时间称为加入时间。不同的加入时间能否影响信息的传播是本文研究的内容之一。

用户活跃度:微博中,用户活跃度可由用户等级来确定。用户登记是根据用户登录天数以及发微博数确定的。如果用户登录天数多,并且发表微博数多,用户等级就会提高。

信息覆盖度:信息覆盖度反映的是用户传播信息所能覆盖的范围,本文采用用户的粉丝数来测量。

2 实证分析

2.1数据采集

为了研究用户特征对信息传播的影响,本文选取了两条微博进行分析,它们分别是新浪微博中名为“我是歌手”的用户在4月4日23点07分发布的微博一(图1a),以及名为“欢乐的云端之上”的用户在2014年2月3日12:57:12发布的微博二(图1b)。这两条微博都具有转发数多、覆盖面广的特点,用来研究信息传播具有一定的代表性。本文使用北京大学的PKUVIS[18]微博可视化工具对样本微博的数据进行采集,该工具具有操作简单、数据信息完整、提供可视化视图等优点。

图1样本微博

2.2影响因素分析

(1)认证账号对信息传播的影响

本文分别统计出了为该微博带来转发量排名前20用户的认证信息、粉丝数和转发量,如表1。

由表1中可以看出,微博一中转发量前20的用户中有7位是认证用户,且这7位用户排在前7名;微博二中前20的用户中有11人为认证用户,但前7中有5位是认证用户,带来巨大转发量的前3位用户均为认证用户。因此可以得出结论:虽然认证用户在总人数上不占巨大优势,但在影响较大的用户群中,相比非认证账号来说,认证账号对信息传播的贡献更大,带来了更多的转发量,用户是否经过认证影响信息传播,但其作用并不十分显著。

上述结论的原因可以这么解释:在新浪微博中,用户认证被分为组织认证 (“蓝V”)和个人认证 (“橙V”);而在现实中,新浪微博的用户也被分为两类——名人和非名人。名人存在一个特征,即关注数小于500,被关注数大于10000,微文数却不及被关注数的千分之一。这说明微博中的名人通过自身的影响力便能吸引大量粉丝关注,而无需关注他人或发布微博,这种现象即为“名人效应”。因此在微博的认证用户中,存在一些虽为认证用户但“名人效应”不明显的用户,也存在虽非认证用户但具有“名人效应”的用户(如微博一中的“GEM邓紫棋贴吧”),这些用户的存在使认证帐号对微博信息传播的影响产生了偏差。

(2)加入时间对信息传播的影响

本文获取了两条微博转发过程的时间轴数据,如图2。

图2a中,原微博发出后的几小时内,转发量急剧增加,形成了1个波峰;然后转发量出现一定程度的下降;之后有再一次的上升,形成一个新的小波峰;然后逐渐下降至平缓,期间有可能又会形成一些小的转发波峰,但总体趋势是用户进入减少,转发量趋于0。

图2b相比于图2a,时间轴图像显得比较独特——转发增长和减少都比较“迅速”,且有许多波峰。形成这些特点的原因是:一是因为微博二数据截取时距离微博发出的时间已过去4个月,时间轴图像由于压缩比较大因此显得变化比较“剧烈”;二是由于微博二信息本身的时效性比一来的弱,所以信息能在很长时间内被多次“引爆”。

表1 微博转发量排名前20用户相关信息(左为“微博一”,右为“微博二”)

图2 微博时间轴图像

如果均以一天为单位观察信息扩散,两条微博的时间轴数据基本一致,均是在晚上8到11点或者早上5到7点转发量会显著上升形成波峰,即不论用户什么时间加入微博的传播,这两个时间段都是微博转发量最大的时间。这点可以这么解释:虽然信息发出时间不同,但与普通的电视和广播不同,新浪微博本身能够“拦截”下用户没有看过的信息,因此对于用户来说并不需要时时关注微博来防止错过信息,只需要在空闲时查看即可,用户加入时间因此呈现出一致性——上午5到7点和晚上8到11点正是大量用户 “刷微博”的时间。

(3)用户活跃度对信息传播的影响

不难理解,用户活跃度与用户发文数目和用户在线天数有关,因此为了考察用户活跃度对信息传播的影响,本文将其分解为用户微博数和用户创建时间进行分析。用户创建时间本文采用距离新浪微博的公测开始时间(2009年8月14日)的天数。由于数值范围较大,本文对转发数、用户微博数和用户创建时间都进行了取对数的运算。为了更明显地观察用户活跃度的影响,本文分别选取了两条微博转发量跨度比较明显的前一部分用户——具体来说,微博一选取了前32位用户(转发量大于40),微博二选取了前64位用户(转发量大于100),并绘制了散点图(如图3、图4)。

从图3和图4中可以看出,除了图4a中呈现有两个高转发节点的创建时间也较早,其余图并无法明显得到转发量与微博数和创建时间的确切关系。通过数据分析可知,图4a中两个高转发节点分别为“我是歌手”和“韩磊-HL-”。虽然他们的活跃度不高,但都是微博认证用户,且分别为明星和集团账号,有很高的粉丝数,并于微博内容十分相关,故能带来很多的转发量。

这说明,用户带来的转发量受到多种因素的共同影响,认证账号和集团账号的影响远大于用户活跃度的影响,当某个用户是认证账号或者属于某一集团账号时,即使该用户的活跃度不高,也能够带来较高的转发量。

图3 微博转发数对数与用户微博数对数的关系

图4 微博转发数对数与用户创建时间对数的关系

图5 用户转发量对数与信息覆盖度对数的关系

(4)用户信息覆盖度对信息传播的影响

为了考察用户信息覆盖度对信息传播的影响,本文统计出该微博中带来转发量排名前20用户的信息覆盖度,分析用户信息覆盖度与带来转发量的关系。由于用户信息覆盖度和带来转发量的值较大,为了更好地观察结果,对用户信息覆盖度和带来转发量分别取对数,结果如图10、图11、图12所示。

从图5可以看出,转发量对数与用户信息覆盖度的对数的形状基本一致,都是随着信息覆盖度的增加而转发量增加,且趋势比较明显。即:用户信息覆盖度能给微博传播带来巨大的正向影响。相关研究表明:用户的粉丝数量可以被作为定位重要用户(如舆论领袖)的指标之一[14]。

上述结论体现了在微博信息传播过程中意见领袖的重要作用。对于大多数用户来说,自身影响力较小,从而在信息传播过程中的作用也较小;对于意见领袖来说,他们数量较小且影响力相对较大,能够引起很大的社会反响,在信息传播过程中的作用也较大。

3 结语

本文的研究表明用户特征对微博信息传播有影响。而在用户特征中,用户加入时间对于微博传播的影响最小;用户活跃度与是否认证对微博传播具有一定影响,但不一定明显;信息覆盖度对于传播的影响最为显著。其原因是:新浪微博本身能帮用户保留未查看的微博,这从一定程度上削弱了用户加入时间的影响;用户活跃度和是否认证主要作用是在影响用户“关注”行为上,对于带给用户转发的影响并不直接;而信息覆盖度则能直接影响信息总的转发量,显而易见,当转发率相对稳定时,能看到信息的人数将直接决定信息的转发数。

上述结论具有各方面的实际意义,例如:对于希望采取“微博营销”的组织来说,“增加粉丝量”往往比“认证”有用,让“粉丝数多的用户”转发应当比让“认证用户”转发来的更为有效;而对于希望捕捉社会热点的人来说,并不需要关注所有人的动态,只要关注许多微博“大咖”的转发即可,因为他们的转发更有可能带来更巨大的转发,从而形成社会热点;同理,微博监管机构也不必监管所有用户的微博,监管粉丝量多的用户一般就能得到良好的效果。

此外,本文还有一些不足之处有待改进。首先,本文仅考虑了4个用户特征,相对较少,之后的研究可增加更多的用户特征进行研究。其次,没有考虑文本和外界环境对于微博传播的影响,而考虑文本和环境对于微博信息传播的影响有待更深入的研究。

[1]陈慧娟,郑啸,陈欣.微博网络信息传播研究综述[J].计算机应用研究,2014,31(2):333-338.

[2]李杰修.微博的定义与特征分析[J].企业文化旬刊,2012(9):133-133.

[3]艾瑞网.五大数据解读微博Q1财报[EB/OL].2015-5-18.http://web2.iresearch.cn/media/20150518/249980.shtml

[4]靖鸣,王瑞.微博暴力的成因及其应对之策[J].新闻与写作,2012(2):31-34.

[5]刘乙坐,黄奇杰.传播学视野下的微博基本分类初探[J].中国科技信息,2011,(5):148-150.

[6]李政泽,韩毅,周斌,贾焰.微博用户分类的特征词权重优化及推荐策略[J].信息网络安全,2012,(8):136-139.

[7]宋巍,张宇,谢毓彬,刘挺,李生,都云程.基于微博分类的用户兴趣识别[J].智能计算机与应用,2013,3(4):80-83.

[8]Oulasvirta A,Lehtonen E,Kurvinen E,Raento M.Making the ordinary visible in microblogs[J].Personal&Ubiquitous Computing,2010,14(3):237-249.

[9]Takhteyev Y,Gruzd A,Wellman B.Geography of Twitter networks[J].Social Networks,2012,34(1):73-81.

[10]Levinson M H.The tipping point:how little things can make a big difference[J].Business Economics,2007,25(6):580-580.

[11]Java A,Song X,Finin T,Tseng B.Why we twitter:understanding microblogging usage and communities[C].proceedings of the Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis:56-65.

[12]Naaman M,Boase J,Lai C H.Is it really about me:message content in social awareness streams[J].Proc Cscw,2010,189-192.

[13]Suh B,Hong L,Pirolli P,Chi E H.Want to be retweeted large scale analytics on factors impacting retweet in twitter network[C]. proceedings of the social computing(SocialCom).2010 IEEE Second International Conference on:177-184.

[14]于晶.微博传播过程中用户影响力的特征实证分析[J].情报杂志,2013,32(8):57-61.

[15]张赛,徐恪,李海涛.微博类社交网络中信息传播的测量与分析[J].西安交通大学学报,2013,47(2):124-130.

[16]郭秋艳,何跃.新浪微博名人用户特征挖掘及效应研究[J].情报杂志,2013,32(2):112-116.

[17]马俊,周刚,许斌,黄永忠.基于个人属性特征的微博用户影响力分析[J].计算机应用研究,2013,30(8):2483-2487.

[18]Ren D,Zhang X,Wang Z,Li J,Yuan X.Weibo Events:A crowd sourcing weibo visual analytic system[C].Proceedings of the 2014 IEEE Pacific Visualization Symposium(PacificVis):330-334.

User characteristics is one of the most important influence factors of information communication on micro-blog.Collects empirical data from two typical blogs on Sina,to study the influence factors about user characteristics on the information communication.The result shows that the authorized accounts make a contribution to the process of information communication.But the contribution of the time of user taking part in and users’active degree isn’t obvious.And the number of followers has a great impact on information communication. Keywords:

Micro-Blog;User Characteristics;Information Communication

An Empirical Study on the Influence of User Characteristics on Micro-blog Information Communication

ZHANG Peng-wei,LIU Hong-li,WANG Lin-wei,ZHANG Cheng-dong
(School of Bussiness,East China University of Science and Technology,Shanghai 200237)

1007-1423(2015)24-0033-07

10.3969/j.issn.1007-1423.2015.24.009

张鹏威(1992-),男,浙江绍兴人,硕士研究生,研究方向为在线社会网络

刘红丽(1966-),女,陕西大荔人,博士,副教授,研究方向为信息系统

汪林威(1992-),男,安徽黄山人,硕士研究生,研究方向为在线社会网络

张澄东(1993-),男,浙江宁波人,本科生,研究方向为在线社会网络

2015-07-28

2015-08-20

用户是影响微博信息传播的重要因素之一。通过选取两条典型的热门微博,对用户特征在微博信息传播中的影响进行实证分析。结果发现认证用户比非保险认证用户对信息传播的贡献更大,加入时间和用户活跃度对于信息传播的效果并不明显,而用户的信息覆盖度对微博信息传播有着较大的影响。

微博;用户特征;信息传播

华东理工大学“大学生创新训练计划”项目(No.x14097)

猜你喜欢
覆盖度账号特征
根据方程特征选解法
呼和浩特市和林格尔县植被覆盖度变化遥感监测
基于NDVI的晋州市植被覆盖信息提取
彤彤的聊天账号
施诈计骗走游戏账号
辽宁省地表蒸散发及其受植被覆盖度影响研究
低覆盖度CO分子在Ni(110)面的吸附研究
不忠诚的四个特征
我国社交媒体账号的对外传播之道——以“人民日报”Facebook账号“特朗普访华”议题报道为例
抓住特征巧观察