应雨辰+纪浩+梦非
摘要:意见领袖在社交网络中的作用越来越大,准确识别和有效利用潜在的意见领袖对于传播信息、引导舆论、辅助政府决策等具有重要意义。从中心性、影响力、活跃度出发,构建了网络意见领袖识别模型,提出了采用社会网络分析、灰色关联分析对网络意见领袖进行测算的理论框架,并通过“章莹颖事件”进行实证分析。实验结果表明,该模型能较为准确地识别出网络意见领袖。通过观察法发现,粉丝数量是形成意见领袖的基础,原创帖和回复帖数量是巩固意见领袖地位的重要因素。
关键词关键词:网络意见领袖;社会网络;灰色关联;实证
DOIDOI:10.11907/rjdk.172410
中图分类号:TP319
文献标识码:A文章编号文章编号:16727800(2017)011016305
0引言
社交网络指由社会成员之间的相互作用形成的相对稳定的社会结构,具有复杂的网络形态和信息动态传播机制[1]。在社交网络中,各节点间的地位并非对等,部分节点会对其它节点产生较大影响,能干预社交网络的议程设置,对整个舆论发展起到关键导向作用,这类节点被定义为“意见领袖”(Opinion Leader)[2]。随着互联网的发展,在线社交成为人们日常生活的必要元素,近年来兴起的自媒体更是人们结交好友、共享信息、表达观点的重要渠道,并演变为社会舆论的放大器和热点事件发布的主要平台。通过网络媒介,热点新闻事件会迅速吸引网民关注,产生大量的交互式评论,在意见领袖的影响下,各类观点会被逐渐引导、聚合,进而形成具有倾向性的舆论。在此背景下,对网络意见领袖进行识别是政府部门监控舆情、引导言论、制定决策的基础和前提。
1相关研究综述
20世纪40年代,美国传播学先驱拉扎斯菲尔德(Lazarsfield)在《人民的选择》中提出“两级传播理论”,并在该理论中定义“意见领袖”概念,认为意见领袖是在信息传播和人际交往中少数具有影响力的活跃分子。随后,意见领袖的作用和意义在各领域受到广泛认可,许多学者进行了大量研究。
1.1意见领袖内涵
早期的研究工作主要集中在意见领袖的内涵、特征、作用等层面。如Burt等[3]研究政治意见领袖的内涵和作用,认为政治意见领袖是推动变革和决策的主要力量;Coulter[4]、Myers[5]及Vernette[6]等研究了意见领袖在市场营销领域的特征和应用;文献[79]研究了意见领袖在创新传播中的作用。国内学者对意见领袖的研究起步较晚,如顾品浩等[10]以突发性公共事件为例,归纳了意见领袖特征,并为政府利用意见领袖、设置议程、制定引导策略提供了建议。谢新洲等[11]研究意见领袖的形成要素、存在问题和引导能力。进入21世纪,Web2.0的迅猛发展催生了大量网络社区,在互联网时代下,国内外学者对于意见领袖的研究主要转移到对“网络意见领袖”识别和筛选方面。如Matsumura等[12]基于网民间的关注与被关注关系和评论内容进行定量研究,运用数据挖掘技术构建“意见领袖影响力扩散模型”(IDM),但实际可操性不强。高俊波等[13]采用离散数学中的图论原理,以网络平均路径长度作为识别网络论坛意见领袖的依据,但仅适合最大连通图情况,不具通用性。Yu[14]等在图论的基础上对网民情感进行分析,提出利用LeaderRank算法筛选意见领袖,从而提升了意见领袖识别的准确性。与Yu[14]等人提出的LeaderRank算法相类似,Weng[15]等基于Twitter上网民的关注、评论和转发行为,利用PageRank提出的TwitterRank算法,区分意见领袖和普通大众。但是LeaderRank算法和TwitterRank算法实现难度较大,难以解决实际问题。另外,采用社会网络分析原理和方法挖掘和识别意见领袖应用广泛 [1618],这种方法的优点是指标较少、可操行较强,缺点是识别准确率较低。
1.2意见领袖识别指标体系
基于社会网络方法的静态指标(度中心度、接近中心度、特征向量中心度)和基于影响力以及活跃度的动态交互指标(粉丝数量、原创帖量、被转发情况、活跃天数、用户积分、关注量等)是较为常见的筛选意见领袖指标,如表1所示。
基于社会网络分析原理和方法建立意见领袖识别指标是最常用的方法,从社交网络关系结构中发现占据重要位置的节点及节点群,并将其视为有重要影响力的意见领袖[19]。常用指标包括度中心度、接近中心度和特征向量中心度。运用社会网络分析方法识别意见领袖的优点是指标较少、计算简便,但缺点也相对明显,即识别准确度较低。马宁、田雅儒[20]在社会网络分析方法的基础上将动态网络分析方法(DNA)运用到意见领袖识别中,提出约50个测度指标,既包括传统的度中心度、接近中心度等指标,也包括实际工作负载、交流/知识/资源一致度等动态网络专有指标。王佳敏、吴鹏[21]认为意见领袖可以通过影响力和活跃度两项指标来衡量。用户的影响力越大,发布的信息就越能得到回应,便越有可能对其他用户造成影响;活跃度指用户参与特定主题讨论的积极性,活跃度越高,与其他用户形成互动越强烈,越利于观点的传递。影响力通过粉丝量、被转发量、被评论数及是否经过认证4项指标表示。活跃度通过发帖量和关注人数两项指标表示。刘志明、刘鲁[22]基于用户影响力和用户活跃度识别网络中的意见领袖,和王佳敏等人的區别在于影响力和活跃度指标的选择上。方兴东等[23]在影响力和关注度基础上,增加思想力指标来构建识别网络意见领袖的二级模型,增加“原创比例”和“思想力”判断指标,认为意见领袖具有独特的思维方式和情感倾向,这是与普通大众区别的关键要素。还有学者基于意见领袖的特征构建识别指标,如Shoemaker等[24]从社会背景、人口特征、个性等方面研究了意见领袖的上百个特征。Rhee等[25]采用关注度和回复量研究意见领袖特征,将网络用户划分为意见领袖、注意力收集者、安静说服者及普通大众4类。endprint
2意见领袖识别模型
本文在综合前人构建网络意见领袖识别模型基础上,将社会网络分析(SNA)方法中的中心性指标与用户影响力、活跃度的动态指标相结合,不仅避免了繁琐的计算过程,而且能较为准确地反映意见领袖特征,从而提高了判断的精确性。
2.1指标选取与模型设计
2.1.1基于社会网络分析的指标选取
在社会网络分析的中心性指标中,点度中心度指某一节点在其与之直接相连的邻居节点中的中心程度,用与其相连的节点数量衡量,反映该节点在一定范围内的中心程度[26]。推广到社交网络,如果博主有众多相邻用户,则其具有较高的点度中心度,反之,点度中心度就低。接近中心性以距离为指标衡量某一节点与其它节点联系的程度[26]。该节点与其它节点距离越近,就表示此节点视野更好,更了解网络信息的产生和流向。反之,如果距离较大,则接近中心性值越低,表示该节点与其它节点的联系越稀疏。与点度中心度和接近中心度相比,中介中心度指节点对资源的控制程度[26],反映整个社会网络的集中程度,或者说整个网络围绕一个点或一组点运行的程度。在微博、天涯论坛等在线社交网络中,如果某一用户有较高的中介中心度,则其发布的观点更容易影响其他网民,也较容易形成整个网络的舆论和情感倾向。除点度中心度、接近中心度、中介中心度等指标外,社会网络分析还包括特征向量中心度等指标,笔者认为这些指标与意见领袖关系不大,所以不选取。
2.1.2基于影响力和活跃度的指标选取
影響力反映某一用户对其他用户产生影响的可能性[21]。在微博、天涯论坛等平台,体现意见领袖影响力的指标分别是粉丝数量和点击次数。其中,粉丝数量是判断用户影响力最直接的依据,用户拥有的粉丝数量和用户被关注的程度成正比,即粉丝数量越多代表用户有更高的关注度,发布的消息也就越有可能被更多的用户接收到,从而能够潜在影响消息发布后的评论、讨论等行为。点击次数也能反映影响力,点击次数越高,用户对发布消息的关注和认可度越高,这种认可会激发后续的转发行为。微博、天涯论坛等社区的转发行为以“信息级联”方式进行传播,能快速产生连锁式影响[22]。
活跃度表示某一用户参与特定事件的积极性[21]。如用户仅具备高影响力而不积极参与热点事件的发言、讨论,则不会成为意见领袖。所以,笔者将原创帖数量、回复帖数量作为直接反映意见领袖活跃度指标。如果粉丝数量是形成意见领袖的基础,那么原创帖则可称之为意见领袖形成的必要条件。原创帖数量的高低不仅代表意见领袖参与热点事件的积极程度,也是其思考力和价值观的体现。意见领袖通过原创帖传达自己的思想和观点,进而改变大众对某一事件的认知,最终形成倾向于意见领袖态度的舆论。而回复帖则反映意见领袖同大众沟通的积极性,通过积极的回复,意见领袖所表达的具有倾向性的观点会得到强化,巩固其意见领袖地位。网络意见领袖识别模型见图1。
3实证分析与检验
2017年6月9日,一则“中国访美女硕士章莹颖失联数十天的消息”被披露,随后各大媒体对此进行了报道。一时间,大量网民就“章莹颖失联遭绑架”的消息表达了自己的看法,网民之间展开了激烈讨论,直到一个月后的7月12日,该事件仍在不断发酵。
3.1实验数据获取与处理
本实验以“章莹颖、女硕士、访美学者、失联、遭绑架”为关键词,以全球最大的华人论坛“天涯社区”为数据抓取平台,通过爬虫软件SoukeyNetget获取自事件发生后所有的相关数据。截止到7月12日,共采集10 686条原创帖,包括230位天涯社区用户和10万余条回复信息,获取每位用户的粉丝数量、主帖数量、点击次数、积分、登录次数、最新登录时间、发帖时间等数据。为便于后续实验,按照表2的格式对数据进一步处理。
3.2实验结果
3.2.1关联系数计算
基于SNA计算用户的点度中心度、接近中心度和中介中心度,同时根据抓取到的数据计算用户影响力和活跃度对应的指标值。根据灰色关联分析法(定义一)设定理想化意见领袖序列作为本实验的参考序列。设定理想意见领袖的参考序列标准值为:x0={1.000,1.000,1.000,1.000,1.000,1.000,1.000}。根据关联系数计算公式得到各指标间的关联系数值。部分数据见表3。
3.2.2关联度计算
根据关联度计算公式测算关联度,即γi=17[εi(1)+εi(2)+…+εi(7)],其中i的取值对应用户数量。在本实验中,i为1~230中所有的正整数。根据计算结果,选取关联度值较高的10位用户,如表4所示。
3.2.3社会网络可视化展现
将用户间的互动关系数据导入Ucinet软件,经NetDraw可视化工具处理后得到网络结构图,对中心性值较高的节点进行筛选,得到图2所示结果。
图2社会网络层意见领袖识别结果
3.3实验结果分析
从天涯社区获取本文实验中关联度值排前10名的节点数据,整理如表5所示。
(1)对表5数据进行分析,得到以下两点信息:①关联度排名靠前的用户一般拥有规模庞大的粉丝群体,说明粉丝数量是形成网络意见领袖的前提条件,但并非充要条件。因为排名第一的X36粉丝数量并不是最多,同样,排名末位的X85粉丝数量也不是最少;②相对于粉丝数量,原创帖量和回复帖量是形成意见领袖更为关键的因素。从表5很容易发现原创帖量的排序恰好对应用户关联度值的排序,虽然回复帖量的排序未显示出与原创帖量一样的整齐状态,却仅是少数节点出现偏差。鉴于上述两点,笔者认为,意见领袖的形成更多地依赖自身素质,即意见领袖通常有着丰富的经历、专攻的术业、热衷于时事,并且对事物的发展规律有深刻认知。意见领袖的言论和态度往往能够获得人们的认同,并依靠规模庞大的粉丝群体在短时间内形成倾向性舆论。endprint
(2)图2所示的社会网络结构直观展现了中心性较高的节点。从图中不难发现本文实验有7个节点处于各个集群的中央,分别是X9、X11、X16、X19、X27、X36和X168,而其中的5个节点(X9、X11、X27、X36、X168)同时以高关联度出现在表4中,这一现象说明以关联度值来识别意见领袖的可取性,同时也表明本模型的7个指标对于识别意见领袖的准确性,说明灰色关联分析法在筛选意见领袖领域的适用性。本文实验共有研究对象230个,最终确定5名意见领袖,占比为2.17%,这一结果显示出意见领袖的稀缺性,与“意见领袖”的内涵一致,从侧面反映出本模型对意见领袖识别的准确性。此外,表5中的“登录次数”指标未纳入意见领袖识别模型,但可将其列为验证性变量,即通过观察登录次数检验意见领袖在一段时间的活跃程度,该指标可作为一个重要信息。本文实验中意见领袖的登录次数均在500次以上,处于较高水平。
4结语
网络意见领袖作为影响网络态势发展的关键节点,在传播信息和引导舆情方面起着越来越重要的作用。因此,准确识别网络意见领袖并加以引导,对净化网络环境、辅助政府决策具有重大意义。
本文通过3个方面、7项指标构建出网络意见领袖识别模型,创新性地将灰色关联分析作为计算意见领袖指标值的方法,结合网络结构可视化研究,进一步提升了意见领袖识别的准确性。本模型在设计时遵循以下3大原则:①继承性。通过系统的文献梳理与深入分析,本文选取之前研究中使用率最高的识别指标,保证了指标的可靠性和公認性;②科学性。借助灰色关联分析的计算方法和社会网络分析的基本原理测算指标值,并通过NetDraw可视化网络分析软件绘制社交网络图,使判断结果更加直观;③可操作性。本模型的3个中心性指标值(点度中心度、接近中心度、中介中心度)均通过公式计算得到,4个交互性指标值(粉丝数量、点击数量、原创帖量、回复帖量)均通过爬虫程序直接采集。
运用上述模型实证分析“章莹颖事件”,发现意见领袖均具有相当规模的粉丝,但粉丝数量仅是形成网络意见领袖的必要非充分条件,重要的是网络意见领袖要具有一定的知识背景,经常更新原创性文章,喜欢与网民进行互动且具批判性思维,能在突发事件中对公众的观点和态度进行干涉,形成具有倾向性的舆论。今后的研究主要考虑能否在本识别模型基础上增加情感分析算法,按照“正面”、“中性”、“负面”或更多的情感,对意见领袖进行分类,研究携带哪种情感的意见领袖会达成信息传播的最大化。
参考文献参考文献:
[1]ANDREASSEN C S. Online social network site addiction: a comprehensive review[J]. Current Addiction Reports,2015,2(2):175184.
[2]ZHANG W, LI X, HE H, et al. Identifying network public opinion leaders based on Markov logic networks[J]. The Scientific World Journal,2014(4):18.
[3]BURT R S. The social capital of opinion leaders[J]. Annals of the American Academy of Political & Social Science,1999,566(1):3754.
[4]COULTER R A, FEICK L F, PRICE L L. Changing faces: cosmetics opinion leadership among women in the new Hungary[J]. European Journal of Marketing,2002,36(11/12):12871308.
[5]MYERS J H, ROBERTSON T S. Dimensions of opinion leadership[J]. Journal of Marketing Research,1972,9(1):4146.
[6]RIC VERNETTE. Targeting women's clothing fashion opinion leaders in media, planning: an application for magazines[J]. Journal of Advertising Research,2004,44(1):90107.
[7]ROGERS E M. Diffusion of innovations[J]. Journal of Continuing Education in the Health Professions,2010,17(1):6264.
[8]GREENHALGH, TRISHA, ROBERT, et al. Diffusion of innovations in service organizations: systematic review and recommendations[J]. Milbank Quarterly,2004,82(4):581629.
[9]VALENTE T W. Network models of the diffusion of innovations[J]. Computational & Mathematical Organization Theory,1996,2(2):163164.
[10]顾品浩,蒋冠.突发性公共事件中的网络意见领袖分析——以“杨达才事件”为例[J].情报杂志,2013,32(5):2024.endprint
[11]谢新洲,杜智涛.网络意见领袖舆论引导能力的评判体系研究——基于灰色统计与层次分析法的模型构建[J].图书情报工作,2013,57(15):2026.
[12]MATSUMURA N, OHSAWA Y, ISHIZUKA M. Influence diffusion model in textbased communication[J]. Transactions of the Japanese Society for Artificial Intelligence,2002,17(3):259267.
[13]高俊波,杨静.在线论坛中的意见领袖分析[J].电子科技大学学报,2007,36(6):12491252.
[14]YU X, WEI X, LIN X. Algorithms of BBS opinion leader mining based on sentiment analysis[C].International Conference on Web Information Systems and Mining. SpringerVerlag,2010:360369.
[15]WENG J, LIM E P, JIANG J, et al. TwitterRank: finding topicsensitive influential twitterers[C].ACM International Conference on Web Search and Data Mining. ACM,2010:261270.
[16]陳远,刘欣宇.基于社会网络分析的意见领袖识别研究[J].情报科学,2015(4):1319.
[17]王红瑞.基于社会网络分析法的微博空间意见领袖识别模型[J].新闻世界,2013(4):219221.
[18]王迪,何跃.基于社会网络分析的意见领袖网结构[J].统计与信息论坛,2013,28(10):8489.
[19]Z G ZHU. Discovering the influential users oriented to viral marketing based on online social networks [J]. Physica A:Statistical Mechanics and its Applications,2013(392):34593469.
[20]马宁,田儒雅,刘怡君,等.基于动态网络分析(DNA)的意见领袖识别研究[J].科研管理,2014,35(8):8392.
[21]王佳敏,吴鹏,陈芬,等.突发事件中意见领袖的识别和影响力实证研究[J].情报学报,2016,35(2):169176.
[22]刘志明,刘鲁.微博网络舆情中的意见领袖识别及分析[J].系统工程,2011(6):816.
[23]方兴东,叶秀敏.微博意见领袖的评价研究[J].新闻界,2014(5):5660.
[24]SHOEMAKER, FLOYD F. Communication of innovations[M]. Free Press, 1971.
[25]RHEE JW,EM KIM,H KIM.Exploring online opinion leadership: a validity test of the concept in the digital age[J]. Physica A:Statistical Mechanics and its Applications,2007(392):34503461.
[26]约翰·斯科特.社会网络分析法[M].重庆:重庆大学出版社,2016.
[27]曹明霞.灰色关联分析模型及其应用的研究[D].南京:南京航空航天大学,2007.
[28]LOMAS J. Opinion leaders vs audit feedback to implement practice guidelinesreply[J]. Jama the Journal of the American Medical Association,1991,266(9):12171218.
责任编辑(责任编辑:杜能钢)endprint