基于SNA的微博舆情传播核心节点分析研究

2016-09-26 02:16王小红陕西省委党校陕西西安710061
电子设计工程 2016年11期
关键词:网络分析舆情节点

王小红(陕西省委党校 陕西 西安 710061)

基于SNA的微博舆情传播核心节点分析研究

王小红
(陕西省委党校 陕西 西安710061)

负面网络舆情对社会稳定具有危害性,因此为了引导舆情良性发展,快速找到网络舆情传播中的核心节点是非常重要的。文中以社会网络分析为基础,通过对微博信息和微博用户网络结构进行分析,提出一种新颖的网络成员重要度评价算法。给出了节点粉丝影响度的概念,并对节点粉丝影响度中心度算法进行了改进。实验分析显示,文中算法排序精度在整体上高于SNA算法,因而对准确预测微博舆情传播中的核心节点具有很好的参考价值。

社会网络分析;微博;舆情;核心节点

网络舆情(Network Public opinion)是指在互联网上流行的对社会问题不同看法的网络舆论,是社会舆论的一种表现形式,是通过互联网传播的公众对现实生活中某些热点、焦点问题所持有的较强影响力、倾向性的言论和观点[1]。网络开放、便捷、交互为网民营造了良好的交流模式,但负面舆情如洪水,严重影响居民生活和社会稳定。为了减少危害信息对社会稳定的影响,舆情研究、特别是对舆情传播中核心主体的研究迫在眉睫。

网络舆情一般发源于博客、BBS论坛、新闻跟帖、转贴、新闻论坛、微博等。微博即时、简洁且可通过多种途径登陆,深得大众喜爱。各社会团体、地方政府、企业、名人都在微博上有自己的阵地,且粉丝众多,其舆情传播影响力巨大。因此,对其舆情传播主体研究具有很重要的现实意义[2]。

为了很快找到微博舆情传播主体中的核心节点。传统社会网络分析方法,它根据某节点的链入节点数来判断该节点的重要程度。然而粉丝数可以通过金钱买卖圈到,水军和僵尸粉的存在使得分析得到的重要节点往往和真实情况有很大偏差。要克服这一缺陷,更加高效找出微博中的核心节点,进而找到重要网络成员,就必须对原有算法进行改进。

1 社会网络分析概述

社会网络分析[3](Social Network Analysis,SNA)是20世纪30年代由英国著名人类学家布朗在对物理学适应性网络结构进行研究时提出的。它对心理学,情报学,信息检索,社会学等多个领域的发展研究都起着举足轻重的作用。现实中个体与个体之间的关系强弱不一,这种关系映射在网络中,会产生不同的影响。

社会网络分析融合了图论、数学、统计等多学科,已经发展成综合性结构化方法。利用社会网络分析法可以从多个角度对个体网络行为分析,比如网络位置、角色、结构参数、凝聚子群等进行分析。目前,社会网络分析法已被多行业采纳。

2 社会网络分析基本模型

社会网络主要由行动者 (Actor),关系纽带(Relational Tie),二人组(Dyad),3人组(Triad),子群(Subgroup),群体(Group)这些元素构成[3]。行动者指社会个体,可以是一个人、一个团体、一个组织、或是一个国家,在网络中用节点(Node)表示 ;关系纽带指社会个体之间的关系,在网络中用节点之间的连线表示,是多种多样的,如血缘关系、工作关系、竞争关系等;二人组是仅由两个节点组成,是社会网络分析的基础;3人组由3个节点组成;子群是社会个体之间某些相互关联节点的子集;群体是整个社会网络中社会个体的集合。

社会网络分析(Social Network Analysis)是一种独立、结构化的研究方法,主要研究社会网络中个体及个体的关系、网络结构、连接模式,以此来反应某个节点在整个网络中的作用或是整个社会网络之间的关系。

文中主要分析节点的重要度,点度中心度指某节点和其他节点直接关联越多代表其重要度越高,其在网络中处于核心地位的机率就越大。在无向图中,点度中心度由节点的度决定,在有向图中,点度中心度又被分为外向点度中心度和内向点度中心度,分别由节点的入度和出度决定[4]。

3 微博核心节点的发现与研究

网络的核心成员一般来自网络中的意见领袖或者网络大V,他们的言论风向作用明显,极易影响网络团体中其它成员的思想,并对言论传播速度影响极大[5-6]。因此,可以通过意见领袖的言论,使网络舆情向积极的方向发展,所以准确的找到网络核心成员也变得非常重要。

3.1系统总体流程

该系统总体框架如图1所示。

图1 系统总体流程图

网络构建部分完成样本选取,基础图构建(节点代表用户,节点间的关系表示用户之间关注与被关注),扩展图构建(为了更精确研究基础图中的主体,引入其它用户节点后构建的图)。基础图和扩展图的构建好之后,将表结构存入关系数据库中,为数据采集部分将采集数据存入数据库中做好准备。

数据采集部分:首先由爬虫获取页面,包括新浪微博登陆及其之后的数据访问;然后页面分析模块对爬取结果进行分析,提取出需要的数据并存入数据库。

网络核心成员的发现与研究部分:在点度中心度研究分析的基础上,提出基于粉丝影响度的网络成员重要度评价算法。该算法核心是对节点属性值,粉丝影响度值以及节点重要度的判定标准,最后根据节点重要度值来判定图中节点的重要程度,重要度越高,则越有可能为网络中的核心成员。

3.2基于粉丝影响度的微博成员重要度评价算法

点度中心度算法用节点的入度数表示该节点在网络中的重要程度[7]。但在微博实际使用中,节点入度数并不能真实反映此节点是否为真实的核心节点。因为虽然一个节点拥有很多粉丝,可它极有可能是花钱买来的僵尸粉,而另外一个节点可能只有一个粉丝,但这个粉丝节点是网络大V,拥有上千、上万个粉丝[8-10]。所以,一个影响力高的粉丝的节点,一定比拥有许多僵尸粉的节点的重要度高更多。通过分析微博特性可以看出只是用节点的入度来决定一个节点重要度的高低,很不合理,文中提出的节点的重要度,不仅仅由指向它的节点的数量来决定,而是由指向它的节点的粉丝影响度来决定,此法更适合于从微博中寻找网络核心成员[11-12]。

3.2.1节点属性值

1)节点绝对属性值

节点自身的绝对属性值是由转发,评论和点赞3个属性共同决定的[13]:

代表平均转发量,数值越高表明此微博被扩散机率大,节点重要度高。

代表平均被评论量,数值越高表明此微博成为舆论焦点的几率越大,博主地位更核心。

代表平均被点赞数,数值越大表明该微博成为正面舆论焦点的机率越大,博主地位越核心。

w1代表节点i平均被转发量的权重,w2代表节点i平均被评论量的权重,w3代表节点i平均被点赞量的权重(w1>w2>w3)。

2)节点相对属性值

对节点的绝对属性值进行归一化,得到节点相对属性值:

其中,Attr(ni)′为节点i的相对属性值,p为扩展图中所有节点的个数。

3.2.2节点的粉丝影响度

通过前面研究发现,一个节点是否为核心节点,不仅由粉丝数量决定,而是由粉丝的属性值确定。节点的粉丝影响度由自己所有粉丝节点的相对属性值决定:

其中,Imp(ni)为节点i的粉丝影响度值,Attr(nj)′为节点i的第j个粉丝节点的相对属性值,|fansi|为节点i的全部粉丝数。

3.2.3节点的重要度

基础图中,节点的重要度由关注自己的节点的粉丝影响度决定。

1)节点的绝对重要度:

其中,Sig(ni)为节点的绝对重要度,|focusi|为基础图中指向(关注)节点i的节点数,Imp(nj)为节点i在基础图中第j个关注者(粉丝)的粉丝影响度。

2)节点的相对重要度:

其中,Sig(ni)′为节点i的相对重要度,Sig(ni)为节点i的绝对重要度,Imp(nj)为节点j的粉丝影响度,j∈[1,m],m为基础图节点的个数。

4 实验比较

文中实验样本为某大学计算机技术工硕40位同学在两天内的新浪微博作为研究对象。分别用基于粉丝影响度的网络成员重要度评价算法和社会网络分析的点度中心度算法对实验数据进行排序,结果发现:社会网络分析算法进行的排序结果,40位员工并列到24名便结束,很不合实际情况。而本文算法排序结果比较有序,并列的名次只有4个,这种情况也更加的符合实际情况。每次选取排名前n的用户节点进行比较,n∈(3,25)。排序精度比较结果如图2所示。可以看出本文算法排序精度在整体上高于SNA算法。两种算法时间排序复杂度实验结果表明,文中方法时间消耗只有0.5 s。综合来看,文中方法在整体排序效果上有着比较明显的优势,具有很高的实用价值。

图2 两种算法排序精度对比

5 结 论

网络时代,为引导舆情良性发展,需要快速准确找到微博舆情传播主体中的核心节点,文中算法克服了点度中心度算法缺陷,从更高的信息层面来分析节点的重要度,使分析结果更加准确且符合实际情况。实验结果显示,文中方法在一定程度上使节点的重要度值更加精确。目前,该方法对简单的微博团体中核心用户预测具有很好的实用价值,对网络舆论良性化有一定的现实意义。

[1]网络舆情定义[EB/OL].http://baike.baidu.com/view/2143779. htm.

[2]袁园,孙霄凌,朱庆华.微博用户关注兴趣的社会网络分析[J].现代图书情报技术,2012,28(2):60-75.

[3]社会网络分析定义 [EB/OL].https://en.wikipedia.org/wiki/ Social_network_analysis.

[4]平亮,宗利永.基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J].图书情报知识,2010(6):90-95.

[5]王晓光.博客社区内的互动交流结构:基于评论行为的实证研究[J].新闻与传播研究,2010(4):45-58.

[6]袁园,孙霄凌,朱庆华.微博用户关注兴趣的社会网络分析[J].现代图书情报技术,2012,28(2):66-73.

[7]麦艺华.面向中文微博的社会网络分析及应用[D].广东:华南理工大学,2012.

[8]宋恩梅,左慧慧.新浪微博中的 “权威”与 “人气”:以社会网络分析为方法[J].图书情报知识,2012(3):40-55.

[9]刘志明,刘鲁.微博网络舆情中的意见领袖识别及分析[J].系统工程,2011,29(6):6-17.

[10]夏雨禾.微博互动的结构与机制——基于对新浪微博的实证研究[J].新闻与传播研究,2010(4):55-67.

[11]杨小朋,何跃.腾讯微博用户的特征分析[J].情报杂志,2012(3):80-87.

[12]陆毅.微博社会网络构造与分析技术研究[D].上海:复旦大学,2011.

[13]康书龙.基于用户行为及关系的社交网络节点影响力评价[D].北京:北京邮电大学,2011.

Based on SNA microblogging public opinion transmission core node analysis

WANG Xiao-hong
(Shaanxi Provincial Party School of the CPC,Xi’an 710061,China)

Negative public sentiment is harmful to social stability,so it is important to quickly find core nodes in public sentiment communication network for guiding the benign development of public sentiment.In this paper,a novel algorithm for evaluating the significance of network members is proposed by analyzing micro-blogs and the user structure residing in them based on social network analysis(SNA).The concept of fans'influence of a node is defined,and the node centrality algorithm is also improved for fans'influence.The experiments show that the algorithm proposed in this paper overall has more precise sorting than the traditional SNA algorithm,and therefore has a promising potential for predicting core members in public sentiment communication network.

SNA;micro-blog;public sentiment;central node

TN302

A

1674-6236(2016)11-0001-03

2016-01-27稿件编号:201601247

国家自然科学基金项目(61372184)

王小红(1975—),女,陕西宝鸡人,讲师。研究方向:数据挖掘与知识工程。

猜你喜欢
网络分析舆情节点
CM节点控制在船舶上的应用
基于ISM模型的EPC项目风险网络分析
低轨卫星互联网融合5G信息网络分析与应用
基于AutoCAD的门窗节点图快速构建
概念格的一种并行构造算法
铁路有线调度通信的网络分析
消费舆情
舆情
2016年社交网络分析
舆情