张涛 李凤轩
摘要:基于公共文化领域CNKI历年数据库的期刊论文数据,构建作者外在合作网络矩阵与潜在合作网络矩阵,以社会网络分析法为主,结合文献计量、作者关键词耦合分析、因子分析等方法,从合作度、合作率、子网络、网络密度、中心性、小团体等方面进行深入研究,并进一步对作者潜在合作网络中的小团体研究内容进行聚类。
关键词:公共文化;社会网络分析;潜在合作网络;作者关键词耦合分析
中图分类号:G353.1 文献标识码:A
DOI:10.13897/j.cnki.hbkjty.2020.0105
科学研究的成果通常以学术论文的方式呈现,科研人员之间的合作往往体现在学术论文的署名上,因此,学术论文的署名是科研人员合作关系的重要表现。从类型上来看,合作可以分为外在合作和潜在合作,若合作者均直接在文章中署名,他们的合作关系称为外在合作网络;若不同作者均拥有相同的文章关键词,则表示他们有合作的可能,这种隐藏在背后的合作关系称为潜在合作网络[1]。通过潜在合作网络的研究,一方面我们能够基于研究内容对作者进行聚类,另一方面我们能发现潜在的合作者,为该领域的合作方向提供参考意见。
作者关键词耦合分析法是指利用作者文献中关键词耦合强度分析作者之间关系的一种方法[2],它能够更加客观、直接地了解科研人员研究内容和学术关系,更适合揭示同一领域内作者之间隐含的学术关系。目前,大多数研究集中于外在合作网络,仅有部分学者在知识管理[3]、数字图书馆[4]、计算机科学[5]、图数情报学[6]等领域,运用作者关键词耦合分析法研究作者潜在合作网络。近年来,公共文化领域一直是研究热点,作者众多,发文量逐年攀升,但是对该领域作者潜在合作网络的研究还未涉及,因此,本研究基于公共文化领域CNKI数据库的期刊论文数据,构建作者外在合作网络矩阵,利用社会网络分析法对子网络、网络密度、中心性、小团体等进行分析;通过作者关键词耦合分析法构建作者潜在合作网络矩阵,并利用因子分析法,结合社会网络分析,研究潜在合作网络学术小团体,有利于加强公共文化领域的学术沟通与知识共享。
1 数据来源与研究方法
数据样本来自CNKI中国知网期刊数据库,在2020年3月初以“公共文化”为主题词进行检索,且限定在CSSCI、核心期刊范围内,共检索到3 878篇文章。其中去除缺少作者、关键词的232篇论文,去除作者为本刊编辑部、本报记者以及评论、报道等非学术文献9篇,最后得到3 637篇期刊论文。它们分属于322个学术期刊,收录时间从1994年到2020年,已有26年的学术积累。
本研究主要采用社会网络分析法及共词法对我国公共文化领域进行分析,具体方法如下:首先利用EXCEL对数据进行预处理,得到作者合作的基本情况,然后根据普赖斯定律确定核心作者条件及人数,最后以作者关键词耦合分析、因子分析為依据,制作作者外在合作网络矩阵、作者潜在合作网络矩阵,并导入UCINET中进行社会网络分析。
2 数据分析
2.1 作者总体情况分析
在3 637篇论文中合著论文有1 390篇,约占论文总数的38%,其中合著人数最多的是10人;所有文献共涉及2 907位作者,其中合著的639位作者,约占作者总数的22%。对作者合作分析指标主要以合作度和合作率为主,本研究采用刘志辉的研究方法进行测算[7],国内公共文化领域合作度约为1.53,合作率约为0.38,整体合作程度较低。论文合作情况如下:独著论文占比62%,2人合著论文占比28%,3人合著论文占比7%,4人合著论文占比2%,5人及以上合著论文占比1%。
2.2 核心作者群选取
关于共线网络中的作者阙值选取,目前常见的做法是依据普赖斯定律,在1969年发表的《小科学,大科学》一书中,普赖斯指出:撰写全部论文一般的高产作者的数量等于全部科学作者总数的平方根。根据普赖斯定律,在公共文化领域现有2 907位作者,前54位应为高产作者,约为发文量7篇的作者[8]。核心作者是在该领域获得较多学术成果的人,普赖斯定律也有另一种计算方式,公式为,M为该领域核心作者中最低产作者的发文数,N为所统计年限最高产作者的论文数,发文数达到M值可确定为核心作者[9]。柯平为公共文化领域最高产作者,发文量达到54篇,因此高于5.5篇的为核心作者。综上所述,选定发文量大于或等于6篇的作者进入核心作者群,共有77位。
2.3 核心作者群外在网络分析
首先,依据社会网络分析法,在EXCEL中编制VBA程序,构建77×77的矩阵,然后导入Netdraw进行可视化分析,绘制作者外在合作关系网络图,如图1所示。该合作网络由45位作者组成14个具有合作关系的子网,缺乏大型互通网络。进一步分析子网类型,可以发现四种典型的合作类型,即单点型、双核型、中心型、桥梁型。单点型是指独立发表文章,未与他人合作的核心作者,在77×77的矩阵中有32个为孤立点,表明32位作者与其他核心作者群的作者并无合作关系;双核型是指仅两人共同合作发表论文而形成的子网络,共有6个;核心型是指网络中有一个最大顶点,呈中心向外扩散,并与其他顶点相连,其中以柯平为核心的网络最为典型;桥梁型是指某一个或几个顶点为子网中的连接点,其中以郑建明、傅才武为连接点的子网最为典型。此外,作者外在合作网络图中,每一个顶点代表一位研究者,顶点越大代表该核心作者发文量越高;顶点之间的连线越粗,表明作者之间的合作程度越深,共同发表文章的数量越多;其中叶南客与颜玉凡线条最粗,合作次数达到12次。
其次,将作者外在合作网络矩阵导入UCINET,进行中心性分析(点度中心度、接近中心度、中间中心度)、网络密度分析以及凝聚子群分析。
(1)网络密度分析。网络密度反映了不同作者关联关系的疏密程度,网络密度过低则表示该领域作者间的科研合作较少。经测算,核心作者群网络密度为0.0126,整体网络密度较低,结构相对松散,不同作者间的合作强度较弱,而且发文量高的作者相对合作伙伴较为固定,这可能与作者间的地理位置差异以及工作单位不同,导致无法有效扩展新的合作伙伴有关。
(2)中心性分析包含度数中心度、接近中心度、中间中心度。度数中心度越高,说明该核心作者越接近网络的中心位置;接近中心度是以距离为判断标准,与其他作者越接近则中心度越高,反之越低。中间中心度反映的是网络的集权程度[10]。通过对核心作者群中心性的测算,得到结果如表1所示,因篇幅有限,故选取前10位作者的结果进行展示。
在核心作者外在网络中心性测度中,柯平教授与20人有合作关系,在全部作者网络中,与68人有合作关系,发文集中在图书情报领域,因此,柯平教授度数中心性最大。同时,他又是接近中心度最大的作者,往往接近中心度数大的作者具有较高的学术地位,与其他学者的连通距离越近。郑建明、傅才武等人拥有较高的中间中心度,在合作网络中具有较大的控制能力,经过他们可以与更多的作者连通,这也与图1的分析结果相一致。
(3)凝聚子群分析。在小团体分析中,常常用n-clique分析对小团体进行聚类,将在距离为n以内可以达到的节点视为一个小团体[11]。当n值为2,最小节点数为3时,在网络中可发现10个小团体,将重复出现在多个团体的作者进行合并,进一步得到8个小团体,如表2所示。
2.4 核心作者群潜在网络关系挖掘
外在合作网络分析是基于核心作者已发表的
论文而建立的合作关系,是实际已经发生合作关系的网络。但是,在现实中有很多作者有着相似的研究领域或者研究内容,由于受限于时间、地理位置等因素无法合作,他们之间存在着潜在的合作网络,需要进一步挖掘。本研究借鉴作者关键词耦合分析法[5],制作潜在合作网络矩阵,将矩阵导入UCINET,绘制作者潜在合作关系网络图。首先,分析不同作者的潜在合作关系,包括合作强度、合作领域等;其次,进行网络密度及中心性分析;最后,利用SPSS提取公因子,将因子分析后的矩阵进行可视化,并分析其中的小团体构成。
(1)根据作者关键词分析法制作潜在合作网络矩阵。过多的关键词并不利于潜在关系的挖掘,再结合前文对核心作者认定的限定条件,本研究按照以下标准构造公共文化领域作者关键词耦合矩阵:关键词词频要大于或等于10次;发文量大于或等于6篇的核心作者。根据以上标准,共有68位作者符合要求,因此,构建68×68的潜在合作网络矩阵。
(2)将矩阵导入Netdraw,绘制作者潜在合作关系网络图,如图2所示。通过关键词的关联,合作网络将具有相同研究方向的作者联系在一起,作者间的连线从合作发表的关系变成相同研究方向的关系,连线越粗代表潜在合作关系越强。
通过选取关键词关联次数最多的7位作者,总结得到高强度潜在合作关系表,如表3所示。其中柯平与李国新之间的潜在合作度最强,达到15次;柯平与傅才武、李国新、王世伟、金武刚、吴建中,傅才武与陈波,李国新与金武刚研究方向存在相似性,潜在合作网络可以进一步挖掘,合作领域集中在图书馆、公共文化服务、文化建设等相关方面;李国新与金武刚在现实中有合作关系,已发文2篇,其余作者可能由于信息的不畅通、缺乏交流机会等原因,外在合作网络关系还未建立。
潜在合作网络密度及中心性分析。潜在合作网络密度为0.6932,相比于作者外在合作网络密度有大幅度提升,是外在合作网络的55倍,表明核心作者现有合作并不充分,仍有广泛的合作潜力。进一步对潜在合作网络测算度数中心度、接近中心度、中间中心度,前10名作者如表4所示。从度数中心度来看,柯平位列第一,与外在合作网络一致,表明他的外在和潜在合作网络都很广泛,合作领域与更多人有交集;从接近中心度来看,李国新位列第一,李国新在外在合作网络中的接近中心度并不在前10名,表明在潜在合作网络中,他与其他作者距离最近,更容易与其他作者产生便捷的沟通交流;从中间中心度来看,同样是李国新的潜在中介性最强,说明他在公共文化领域有控制能力。
小团体分析。通过用n-clique分析对小团体进行聚类,发现分布过于分散,这表明涉及到潜在合作网络时,团体集聚程度不明显。在n- clique分析中,n值越小,最小团体数量越大,则条件越严格,将会分成众多的小团体,不利于深入分析[12]。所以,进一步借鉴D.Z.Zhao的方法[13],对潜在合作网络采用因子分析聚类,然后对其结果进行可视化处理。通过SPSS处理,共提取11个公因子,累计贡献率为75.887%,将成分矩阵导入UCINET,设定载荷阈值为0.2以上,继而用Netdraw制作作者潜在合作关系因子分析图,如图3所示。
在图3中,圆形节点表示作者,方形节点表示因子,方形节点大小表示所有作者对该因子载荷值的大小。进一步对12个公因子汇总得到4个研究主题,第一类以陈波、柯平、李国新、陈立旭等人为代表,这一类群体人数最多,研究最为密切,主要以文化事业、公共图书馆、公共文化服务体系为主;第二类主题主要以数字文化服务、图书馆建设为主,主要代表是肖希明、张靖、完颜邓邓、杨玉麟等;第三类小团体以魏大威、王锰、戴艳清、韦楠华等人为主,主要研究领域为用户需求、用户服务等;第四类以文化体制改革、文化产业为研究对象,代表学者有郑晓幸、张良、胡惠林等。虽然按照研究方向区分了4类作者,但各类之间并不是孤立的,一些作者涉及较多的细分領域,表明他们在学术界有着重要地位和影响力。在公共文化领域,图书馆是重要的组成部分,数字文化服务是最新的发展趋势,文化产业可有效助力公共文化的传播与发展,因此以上分类基本符合对公共文化领域的认知,这也再次证明了作者关键词耦合分析法在挖掘潜在合作关系和分析学术共同体中的应用价值。
3 结语
通过对自1994年以来,我国公共文化领域的3 637篇论文数据,构建外在合作网络矩阵和潜在合作网络矩阵,结合社会网络分析法,从子网络、网络密度、中心性、小团体等方面进行分析,主要得出以下结论:
(1)在核心作者外在合作网络中,由45位作者组成14个具有合作关系的子网,子网包含四种典型类型,即单点型、双核型、中心型、桥梁型;外在合作网络整体网络密度较低,结构相对松散,不同作者间的合作强度较弱;柯平度数中心性与接近中心度最大,合作关系最为广泛,郑建明、傅才武中间中心度较高,在合作网络中具有较大的控制能力;小团体可分为8个,各团体间合作较少,合作关系主要以工作单位为主。
(2)在公共文化领域,很多作者间存在研究的相似性,但是受限于一些因素,并未建立现实中的合作关系,因此,通过作者关键词耦合分析,进而挖掘作者间潜在合作关系。在潜在合作网络中,柯平与李国新之间的潜在合作度最强,李国新与金武刚不仅具有潜在合作关系,而且在现实中已经建立合作关系,其余作者可能由于信息的不畅通、缺乏交流机会等原因,外在合作网络关系还未建立;潜在合作网络密度相比于作者外在合作网络密度有大幅度提升,是外在合作网络的55倍;从度数中心度来看,柯平在外在与潜在合作网络均位列第一,李国新是接近中心度与中间中心度的第一,表明他中介性最强,与其他作者连通距离较近;通过对SPSS提取的公因子聚类,将潜在合作网络的小团体分为四大类主题,分别是公共图书馆、数字文化服务、用户文化需求、文化产业等。
从作者的外在合作关系来看,师生之间的合作关系较为普遍,高水平学者间的合作关系反而较弱,这样会缺乏研究的持续性,作者潜在合作网络也恰恰体现了这点。本研究将具有相似研究内容的作者假定为合作关系,但是,他们之间可能还存在着竞争关系。另外,部分核心作者在网络中为孤立点,但不代表它们与非核心作者没有合作关系,这些都是今后研究要进一步考虑的因素。
参考文献
[1]邱均平,王菲菲.基于SNA的国内竞争情报领域作者合作关系研究[J].图书馆论坛,2010,30(6):34-40,134.
[2]刘 蓓,袁 毅,Boutin E.社会网络分析法在论文合作网中的应用研究[J].情报学报,2008,27(3):407-417.
[3]邱均平,刘国徽.基于社会网络和关键词分析的作者合作研究——以国内知识管理领域为例[J].情报科学,2014,32(6):3-7,13.
[4]李爱明,社会网络视角下的国内数字图书馆领域作者合作关系研究[J].情报科学,2013,31(11):57-63.
[5]刘小慧,李长玲,刘运梅,等.基于作者—核心关键词2-模网络的潜在跨学科合作组合识别——以图书情报学与计算机科学为例[J].情报理论与实践,2018,41(2):105-110.
[6]李长玲,冯志刚,刘运梅,等.基于引文网络的潜在跨学科合作者识别——以图书情报学为例[J].情报资料工作, 2018(3):93-98.
[7]刘志辉,张志强.作者关键词耦合分析方法及实证研究[J].情报学报,2010,29(2):268-275.
[8]娄燕.我国竞争情报研究的统计与分析[J].情报杂志,2001(10):15-16.
[9]李小霞.近年来国内洛特卡定律研究综述[J].科技情报开发与经济,2005(13):27-28.
[10]付允.牛文元,汪云林,等.科学学领域作者合作网络分析——以《科研管理》(2004-2008)为例[J].科研管理,2009,30(3):41- 46.
[11]邱均平,王菲菲.基于CSSCI的国内情报学领域作者共被引分析[J].情报学报,2012(1):104-112.
[12]罗家德.社会网分析讲义[M].北京:社会科学文献出版社,2005:150-161.
[13]Dangzhi Zhao,Andreas Strotmann.Evolution of Research Activities and Intellectual Influences in Information Science 1996-2005:Introducing Author Bibliographic-Coupling Analysis[J].Journal of the American Society for Information Science and Technology,2008,59(13):2070-2086.
作者簡介:张涛(1993-),男,中国海洋大学管理学院博士研究生。研究方向:文化产业。
李凤轩(1990-),男,硕士,山东大学人文社会科学青岛研究院科员。研究方向:旅游产业。
(收稿日期:2020-07-22 责任编辑:孙 炜)