基于大数据的社交网络分析主题演化及热点的可视化研究

2017-09-06 01:59常慧敏郑明春乔鸿
新世纪图书馆 2017年8期
关键词:社交网络知识图谱

常慧敏+郑明春+乔鸿

摘 要 论文以中国知网(CNKI)为数据源,收集了2006—2016年有关社交网络分析方面相关的文献,采用Cite Space III可视化的方法,发现国内学者逐渐以社会计算为核心并融合心理学、传播学、管理学、经济学等交叉学科开展各方面的研究。

关键词 社交网络 文献计量法 知识图谱

分类号 G250.252

DOI 10.16810/j.cnki.1672-514X.2017.08.017

Visualization Research on the Theme Evolution and Hot Domains of Social Network Analysis Based on Big Data

Chang Huimin, Zheng Mingchun, Qiao Hong

Abstract This paper uses CNKI as the data source to collect nearly ten years literature (2006-2016) on the social network analysis. It uses the Cite space III software, and finds that the domestic scholars gradually study this area by using the social computing as the core and integrating psychology, communication, management and economics .

Keywords Social network. Bibliometrics. Knowledge map.

社会网络分析(SNA) 是近几十年来才发展起来的社会学学科,其既可以作为一种分析方法,又可以作为一种研究视角。相较于对研究实体本身的性质,社会网络分析理论主要更倾向于研究社会实体之间的关系,这也是与多数其他社会学科之间的一大区别。由于其独特的视角,该理论在社会和行为科学中应用甚广, 如在社会学、经济学、市场营销等[1]学科中。虽然各学者对社交网络分析方面的研究热度不减,但是面对众多方向想要把握其研究态势并迅速投入研究会有一定的难度。因此,本文拟通过采用文献计量的方法,用可视化图谱探究社交网络分析方面的热点领域、领军人物以及高产机构,对近十年社交网络分析研究主题演化及热点加以系统梳理与分析,为研究学者提供进一步的参考。

1 研究方法

本文采用文献计量法对国内社交网络分析领域的研究现状进行分析,借助了文献的外部特征,采用数学与统计的方法对数据进行定量统计,对社交网络分析研究基础以及研究前沿预测提供了有力的依据。为更清楚、客观地反映国内热点及近些年演化趋势,本文应用了可视化的方法对此领域近十年的文献绘制了科学知识图谱。

1.1 数据来源

本文选择中国知网(CNKI) 作为数据库,为了提高论文的靠参考性,选择SCI来源期刊、EI来源期刊、北大核心期刊以及CSSCI来源期刊作为数据源,确定主题词为“社交网络分析”“社交网络”“社会网络分析”“SNA”,检索时间段为2006—2016年。为了保证有关文献的查全率和查准率,采用模糊检索的方式,共检索得到28 663条结果,经过手动排除、去重及整理,共得到8605条有效数据。

1.2 数据处理

本文采用了Excel软件,将获得的近十年有关社交网络分析的文献按照时间顺序进行统计定量分析,呈现出了从2006—2016年相关文献发表的数量变化趋势。基于文献计量学的理论与方法,采用陈超美教授开发的可视化软件Cite Space III,分别对该领域内的领军人物、最新研究热点以及高产机构分布等文献外部特征方面进行可视化分析[2]。

2 国内社交网络分析的时空知识图谱及其分析

2.1 国内社交网络分析研究的时间分布

从图1中可以定量看出在近十年各年份社交网络分析领域载文数量,进而判断出近十年该领域学者们对其研究的冷热程度。

科学文献增长的逻辑曲线如图2所示,图中横坐标t代表时间,纵坐标F(t)代表第t年文献的累积量。而逻辑增长曲线大致可以划分为以下四个阶段:t1以前为缓慢发展阶段;t1-t2时间段为快速发展阶段;t2-t3时间段为减速发展阶段;t3以后则为饱和发展阶段[3]。

从图1和图2对比看出:2006—2009年中,各年度发表文章大致在100~200篇,说明了国内在研究社交网络分析方面还处在缓慢发展阶段。2009—2016年,国内社交网络研究领域呈现爆炸性的增长态势,发文量也从之前的100多篇迅速增长到2015年的2032篇,而在2016年半年载文量就已达到了1458篇,根据笔者预测,2016年总载文量将会超过往年年度载文量。通过对图1和图2进行对比分析知:当前我国在研究社交网络分析方面总体正处于文献逻輯增长曲线的第二阶段即快速发展阶段,并且在这一阶段将会有大量的成果涌现。由于社交网络的盛行,将会吸引着大批其他领域学者涉足,如著名科学家方滨兴,他对互联网方面的研究作出了突出的贡献。

2.2 国内社交网络分析研究领域高产作者知识图谱

通过Cite Space III软件将数据中所有文献的作者进行统计,我们设置每年在CNKI中发表论文数量最多的15位作者为运行阈值,见图3可视化结果所示,可以清晰发现社会网络分析领域的高产作者。与此同时,为了增加高产作者数量的可靠性,本文尝试用德里克·普莱斯所提出的计算公式M=0.749(Nmax)1/2来验证[3]。

公式中M为论文篇数,Nmax为统计的所有年限中发文数量最多的作者即最高产的作者,公式规定将发表论文数量在M篇以上的称为高产作者[4]。以8605条数据中的作者为操作对象,发文量最多的作者是方滨兴,发文篇数为62篇,即Nmax取值为62,经计算得M的值为7.9篇。按照取整的原则,将发表论文篇数在8篇以上的作者记为高产作者。通过统计,在社交网络分析领域发文量最高的是方滨兴,其次为张敏、彭华涛、邱均平以及汪小帆等。经寻径网络算法修剪处理后,用Cite Space III软件处理分析(这里包括了第一作者和第二作者),方滨兴、张敏、彭华涛、邱均平出现频次最高,其次是汪小帆、杨静、朱庆华等。从选取的8605篇文献可以看出:国内对于社交网络分析的研究及应用已经分布到计算机、心理学、经济等各个学科,受到了各领域学者的重视;单独的节点比较多,节点之间链接较少,分布比较离散,基本都处于独自研究的状态,通常也就是由老师与所指导的学生组成的研究团体,学术核心团体还未形成[4]。

2.3 国内社交网络分析研究机构知识图谱

采用Cite Space III软件,以研究机构(Institution)作为关键词,时间选择为2006—2016年,时间分段单位(Slice Length) 为一年,采用寻径网络算法,在一定的阈值下得到了社交网络分析领域高产的研究机构知识图谱(见图4)。图4的网络密度仅为0.0019,表明国内从事社交网络分析研究的机构间往往倾向于机构内合作,而跨机构合作的力度还较弱,且合作的机构彼此发文量并不均衡,通常以一方为主[5]。另外,从知识图谱中也可以看出,对于社交网络分析领域高产机构通常集中在信息管理学院,例如武汉大学信息管理学院、南京大学信息管理学院等,而其他学院的研究发文量明显较少。

为了更加清晰地了解国内社交网络分析领域重要的机构分布情况,通过Excel软件统计了发文量大于17篇的机构,其中,武汉大学信息管理学院、西安交通管理学院、南京大学信息管理学院、中国人民大学新闻学院、中国科学院大学发文量都在40篇以上,吉林大学管理学院、武汉理工大学管理学院、上海理工大学管理学院发文量都在30篇以上,综合可以看出这些机构为主要研究阵地,而且与其他机构相比有明显的研究优势。

2.4 国内社交网络分析领域的关键词热点分析

为了更好地展示近几年社交网络分析领域研究热点,采用Cite Space III软件,在2011—2016年的时间跨度内,以1年为时间段,网络节点选择关键词和主题词(Keyword&term),设置每个时间段前五十名的词汇生成关键词时序科学知识图谱,在不同的时间序列内呈现出了各年度热点关键词的变化态势[6]。从图5中可以看出,社交网络分析领域大致可以归为以下三类。

(1) 网络结构与演化,包括对结构特征的分析以及虚拟社区的发现及其演化。图5中关键词“社会网络结构”“结构洞”“中心性”“强—弱连接”“小世界”“虚拟社区发现”等是针对此方面做出的相关性研究。社会网络结构方面的分析是其他研究的基础,随着移动社交网络时代的到来,我们从图5中也可以看出研究学者在2011年开始对于移动社交网络的研究已经广泛开展,并初步得到了一些成果。另外,从图5中可以看出,近几年研究学者在网络结构及演化方面的研究主要集中在虚拟社区发现以及演化机制,而随着大数据时代的到来,目前的研究已经不足以支撑研究者对事物状态的探究,因此,学者逐渐将重点从对社区的静态网络的研究转向了动态网络的演化。对于如何准确发现不同规模社区的算法研究,就目前来看,绝大部分还是针对静态的社交网络,在动态社交网络发现算法研究上还有很大的欠缺[7]。

(2) 群体与互动,包括对用户行为和情感的分析、个体影响力的分析及其群体聚集及影响机制的研究。图5中关键词“意见领袖”“网络群体事件”“个体行为”“用户行为”“情感分析”“互动相似度”“人格分析”“人格预测”等是群体与互动方面的具体研究。随着Web 2.0时代的深入,在线社交网络逐渐成为了人们生活中不可分割的一部分,而用户作为行为主体,在网络所表现的信息发布、搜索、浏览、分享等行为特征和规律成为研究学者关注的内容。另外,如何完善社交网络方面的服务使得用户的忠诚度提高也在不断探究中。从图5中可以看出,由于高影响力的意见领袖在事件的传播中往往能够起到至关重要的作用,因此,学者近几年也在倾向于对意见领袖的挖掘及其影响力的分析[8]。面对用户情感分析应用价值逐渐提升,研究学者也增大了研究力度,但在情感分析方面的技术发展研究却在起步阶段,需要加大此方面的探讨。由于情感的多元化特征使得研究难度增加,加上用户与用户之间的互动增强,因此在研究方面逐渐融合了心理学、管理学、社会学等理论基础,为社交网络的进一步深入研究提供了依据[9]。

(3) 信息与传播,包括对社交网络中信息的检索、信息的传播规律及其话题的发现与演化等方面的研究。图5中关键词“传播模型” (传染病动力模型、Seir模型、Sir模型等)、“传播效果”“传播主体”(个人、群体)、“信息管理”(信息风险感知、信息保护、信息安全)、“传播特征”“传播控制”“信息分享”(内容推荐、个性化推荐)、“主题发现”等是信息与传播方面的研究。从2011年到2016年,学者在对信息与传播方面的研究一直热度不减,如传播模型中的传染病模型也在研究中的不断演化、舆情传播与控制以及个人隐私信息安全与保护等[10]。大数据时代到来之际,当我们在不断索取网络中的海量数据时,我们各种具有身份性信息也会暴露,因此,如何把握个人数据开放与隐私保护的平衡性研究迫在眉睫。比如,相较于社交软件QQ来说,腾讯后来开发的微信朋友圈更能保护我们的隐私。近些年,学者在对个人信息安全与保护方面的研究开始逐渐发展,尤其在移动社交网络方面。此外,网络信息检索的准确性也一直是学者们关注的热点,从开始简单的依靠推荐来获得网站的发展到现在个性化的推荐技术,使得用户的依赖性和忠诚度不断提高,给商家带来利益的同时也给用戶带来了极大的方便。

随着Web 2.0的加速发展,社交软件也逐渐开始社交媒体演变,如社交网站、微博、Facebook、论坛、博客等,从面向技术的交互模式的研究逐渐向面向人的交互模式转变,并强调了用户之间交互的动态性和社会实践的影响;从社交网络学术理论方面的探究逐渐转向社交网络商业应用的开发,如用于用户购物推荐技术的研发;从PC端社交网络的研究开始逐渐向移动社交网络的理论与应用的研究转变,加上目前各种社交APP(Facebook、人人网、微信等)、娱乐APP(在线游戏、社会新闻类等) 的开发使得移动端用户数据呈爆炸式的增长。从图5可以看出,当前移动端研究方向多是以某一应用为载体(人人网、新浪微博、Facebook等),获得相应数据进行处理分析,包括对营销模式的探究(B2B、O2O、P2P等)、用户位置预测并进行个性化推荐(比如搜索附近的人、附近的店铺) 等;从之前单纯的以计算机技术为基础的工具性网络研究到现在逐渐以社会计算为核心并融入心理学、传播学、管理学、物理学等交叉学科的探究;从之前只能依靠获得有限数据进行研究到现在大数据时代,再到来后通过海量数据的挖掘来进行多元化的探究。从图5还可以看出,人们大致在2013年开始广泛展开对大数据挖掘的研究,包括对社区意见领袖的挖掘、社区话题的发现与演化、如何利用用户浏览信息进行个性化推荐、如何对用户的隐私进行保护等;从之前大数据的开放性研究到现在逐渐寻求数据开放与个人信息保护的平衡点,各类社交网站的出现在给我们带来方便的同时个人的信息安全却得不到保护,使得一些不法分子有机可乘,这就需要研究人员在创新的同时也需要将用户信息进行有效保护[11]。

3 结语

通过对2006—2016年有关社交网络分析研究文献的剖析,笔者认为国内社交网络分析研究热点将呈现以下趋势。(1) 网络的结构与演化。目前,学者对虚拟社区发现以及演化机制的研究是关注的热点,并从对社区的静态网络研究逐渐转向了动态网络的演化研究,而如何对不同规模的社区进行高准确发现也是近几年的研究重点。(2) 群体与互动。学者更倾向于对意见领袖的挖掘及其影響力的分析、用户个体互动行为及其情感分析的探究。由于在线社交网络使得人群的思想更容易聚集,而群体智慧和极端效应也会使得某些事件发展更不易控制,因此,如何趋利避害地利用互联网并引导其良好发展一直以来是研究学者想要突破的难题。(3) 信息与传播。由于当今社交网络的开放性,使得信息传播规律呈现出多样化的特点,而学者在对信息与传播方面的研究关注度一直很高,例如传播模型中的传染病模型、垃圾信息的筛选、舆情传播与控制以及个人隐私信息安全与保护等方面,尤其是在面对着信息技术的迅速发展,个人信息时常泄露使得国家和人们面临政治、经济、文化安全的威胁。网络信息检索的准确性、个性化推荐也是大数据时代后应用领域内最广泛的热点研究,像身边的各种购物推荐和相关领域的文献推荐等[12]。

综合近几年的社交网络分析可视化知识图谱,本文进一步发现学者逐渐从单纯面向技术的互动模式转向了面向人机交互模式的研究,并从先前的工具主义思想为主到现在以社会计算为核心加以融合心理学、传播学、管理学等交叉学科进行社交网络的研究。另外,对于大数据、移动互联网相连接的研究也正在不断涌现,在面对海量的数据与不断发展的移动社交软件所带来的研究机遇的同时,也面临着数据的开放性与个人信息保护的必要性等一系列需要解决的问题[13]。

最后,通过知识图谱分析得知,虽然近些年对于社交网络分析的研究热度逐年上升,受到了各领域学者的重视,但是彼此之间在对研究此领域的合作度上还有所欠缺,存在孤立的态势。因此,笔者建议对于社交网络分析相关领域的学者应该积极合作、共同探讨,核心团队以及领军人物也应该制定清晰的规划,为后续的研究提供有潜力的发展方向;同时,各机构也应该避免课题的重复研究,有效利用有限的时间与经费。

参考文献:

{1]刘军.社会网络分析导论[M].北京:社会科学文献出版社,2004:34-56.

{2]陈悦,陈超美,胡志刚,等.引文空间分析原理与应用:Cite Space 实用指南[M].北京: 科学出版社,2014: 69-73.

{3]邱均平,王曰芬.文献计量内容分析法[M].北京:国家图书馆出版社,2008:167-188.

{4]邱均平,董克.作者共现网络的科学研究结构揭示能力比较研究[J].中国图书馆学报,2014,40(1):15-24.

{5]邱均平.信息计量学[M].武汉: 武汉大学出版社,2007:52-58.

{6]许智.图书情报学知识服务的知识图谱分析[J].现代情报,2013(2):166-170.

{7]张子石,吴涛,金义富.基于Cite Space的网络学习知识图谱分析[J].中国电化教育,2015(8):77-84.

{8]约翰·斯科特.社会网络分析法[M].刘军,译.重庆:重庆大学出版社,2007:77-86.

{9]黎耀奇,谢礼珊.社会网络分析在组织管理研究中的应用与展望 [J].管理学报,2013,10(1):146-154.

{10]斯坦利·沃瑟曼,凯瑟琳·福斯特.社会网络分析:方法与应用[M].陈禹,译.北京:中国人民大学出版社,2012:4.

{11]邱均平,王菲菲.基于文献计量的国内外社会网络分析研究比较[J].情报资料工作,2011(1):33-37.

{12]方滨兴.在线社交网络分析[M].北京:电子工业出版社,2014:99-109.

{13]孟小峰,李勇,祝建华.社会计算:大数据时代的机遇与挑战[J].计算机研究与发展,2013,50(12):2483-2491.

猜你喜欢
社交网络知识图谱
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
大数据时代社交网络个人信息安全问题研究
社交网络中的隐私关注及隐私保护研究综述
社交网络自拍文化的心理解读
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展