z指数用于中文社科学术期刊评价的实证研究
——基于3个学科CSSCI来源期刊的样本分析

2019-11-19 07:39沈军威郑德俊张正慧朱宇飞奎苹倩
中国科技期刊研究 2019年10期
关键词:学术期刊期刊数据库

■沈军威 郑德俊 张正慧 朱宇飞 奎苹倩

1)南京农业大学信息科技学院,江苏省南京市卫岗1号 2100952)南京农业大学经济管理学院(农林经济管理)博士后流动站,江苏省南京市卫岗1号 2100953)南京农业大学图书馆,江苏省南京市卫岗1号 2100954)香港中文大学工程学院,香港新界沙田马料水1号 999077

学术期刊作为科学研究成果展示和观点交流的重要载体,对其质量或影响力的评价一直是信息计量领域备受关注的课题[1]。赵丹群[2]总结了学术期刊评价的理念发展,依据其发文数量、引文数量、引文质量的发展路径进行了深入探讨[3]。研究人员围绕着发文量和被引量这两个基本的期刊量化维度[4],提出了h指数[5]、g指数[6]、p指数[7]等指标,Prathap[8]指出这些指标是综合考虑了数量与质量关系的二阶指标。

以被引频次为基础的质量指标,在现实中存在期刊被引量呈现明显的偏态分布趋势[9],即少部分核心论文贡献了大部分的被引量[10]。关于引文分布离散程度与期刊质量的关系,Egghe[11]认为引文分布越不平衡的期刊影响力应该越高,但多数研究人员认为引文分布越均衡的期刊应该获得更好的评价结果[12-13]。因此考虑期刊的引文分布状况[14]以准确合理地进行学术期刊评价,成为当前学术期刊评价的新方向。许海云等[15-16]结合引文分布提出p指数的改进指标。Prathap[17]提出引文分布一致性系数,并构建出z指数这一学术期刊评价的三维指标[18-19],实证分析了其在学者、期刊、科研机构和国家科研表现中的适用性[20-21],研究发现:无论是对完美的一致性分布情况,还是对高度集中的引文分布情况,z指数都表现出了稳健的评价效果[22]。

目前国内关于应用z指数对学者[23]、学术期刊[24]和科研机构[25]进行评价的研究刚刚起步,与z指数评价学术期刊相关的国内研究,通常以图书馆情报与文献学这一学科为分析对象,分别计算Web of Science(WoS)和中国知网(China National Knowledge Infrastructure,CNKI)数据库中该学科中、英文期刊的z指数和其他计量指标[24,26],不同的研究结果显示z指数评价期刊的适用性不同。已有研究所使用的分析样本既有统计周期上的差异,也有期刊所属学科和语种的差异。本研究拟以多个学科的中文社科学术期刊为分析样本,采用相对更长的统计周期,探索z指数评价学术期刊的适用性。

1 z指数的原理与计算方法

期刊发文量和被引量是期刊评价的两个基础量化指标,其中期刊发文量代表了期刊的数量属性,可以用N来表示。N篇论文的被引频次之和就是被引量(即总被引频次),用C来表示。两者之比i=C/N则表示期刊发文的平均被引率,表明了期刊的质量属性。然而在特定统计周期内,A、B两种期刊无论是发文量还是被引量都可能相同,此时对这两种期刊单篇论文被引频次进行降序排列,就会发现A期刊只有少数论文具有较高的被引频次,其他论文的被引频次较低或零被引;而B期刊绝大多数论文都有相近的被引频次,极少较低被引或零被引论文。那么A、B两种期刊的引文分布一致性系数η就会有差异,即B期刊的引文分布一致性系数η会大于A期刊,因此能够得出B期刊的影响力更高一些的结论。

Prathap[17]提出引文分布一致性系数η的计算可以通过引入学术势能(Exergy)求解,即学术势能为被引量与平均被引率的乘积,用公式可表示为X=i×C=C2×N。从被引视角则可以使用学术能量(Energy)来表示某一期刊每篇论文的被引频次分布,公式为E=∑Ck2(k=1,2,…,N)。最后引入熵(Entroty)来反映引文分布的混乱程度,即S=∑(Ck-i)2=E-X。理想状态下学术期刊的X值和E值相同,而事实上学术期刊论文的被引分布存在不均衡状况,这种不均衡状况则可以使用引文分布一致性系数η来测度,其计算公式为:η=X/E。融入η之后的z指数计算公式为:z=Z1/3,其中,Z=η×X=η2×E。

通过分析z指数的计算思路,可以看出,从最初提出的Energy-Exergy-Entropy[27]和Volume-Velocity-Variety[28]的表述,到最近使用的Quality-Quantity-Consistency[29]的表述,z指数引入引文分布一致性系数,将学术期刊评价指标拓展到三维视角,既考虑了期刊的数量和质量,也能够促进期刊更好地平衡发展。

2 中文社科类学术期刊的z指数实证分析

2.1 数据来源及z指数计算结果

为了能够与已有研究的结论进行对比分析,本研究在确定中文社科类学术期刊的分析样本时,既选择俞立平等[26]所分析的图书馆情报与文献学期刊,也选择张正慧等[30]应用p指数评价中文学术期刊时所选择的法学和教育学这2个学科的期刊。

确定3个分析样本学科后,选择南京大学《中文社会科学引文索引》(Chinese Social Sciences Citation Index,CSSCI)来源期刊作为各个学科的分析对象。已有研究使用z指数进行学术期刊评价时,发现使用5年周期[24]的分析结果优于2年周期[26],结合中文社科期刊被引半衰期较长的特点[30-31],本研究将期刊发文年代跨度确定为2008—2012年,以CSSCI数据库在此期间连续收录的法学、教育学、图书馆情报与文献学3个学科的期刊作为数据统计样本。同时为获取完整的被引信息,以2017年作为被引统计的截止年份。即以2008—2012年3个学科的CSSCI来源期刊为分析对象,从CNKI数据库中获取这些期刊在2008—2012年的发文数据,并从CNKI引文数据库中获取这些文献累积到2017年的被引数据。

表1~3分别列出法学、教育学、图书馆情报与文献学这3个学科期刊的相关指标统计结果,包括发文量(N)、被引篇数(Nc)、总被引频次(C)、篇均被引频次(i)、最高被引频次(CMax)、标准偏差(RSD)、h指数、g指数、p指数、引文分布一致性系数η以及z指数这11项指标。表1~3均按照z指数降序排列。

2008—2012年一直被CSSCI收录的法学期刊共有20种,相比于文献[30]对2003—2007年21种法学CSSCI来源期刊的p指数计算排列结果,表1的数据显示《中国法学》从第2位上升到第1位,《法学研究》则从第1位降至第3位。

从z指数结果来看,《中国法学》的z指数最高,这也与其总被引频次(C)、篇均被引频次(i)、h指数、g指数、p指数都最高的结果一致。同时依据z指数识别出的法学领域排名前5和后5的10种期刊,与按照h指数、g指数和p指数的排序结果基本保持一致。

表2列出的2008—2012年一直被CSSCI收录的33种教育学期刊中,《思想理论教育导刊》和《远程教育杂志》分别代替了《中国远程教育》和《教育理论与实践》这2种之前被收录的期刊。相比于文献[30]对2003—2007年33种教育学期刊的p指数计算排列结果,表2中p指数最高的依旧是《教育研究》,《高等教育研究》则从之前的第3位提升至第2位。

表1 20种法学期刊2008—2012年数据汇总

表2 33种教育学期刊2008—2012年数据汇总结果

依据z指数识别出的教育学期刊前两名,与p指数结果保持一致。《教育研究》的z指数、总被引频次(C)、篇均被引频次(i)、h指数、g指数、p指数均最高。相较于法学CSSCI来源期刊z指数结果,依据z指数识别出的教育学排名最后的期刊,并未与其他指标的结果呈现出一致性,其主要原因是《远程教育杂志》和《电化教育研究》的单篇最高被引频次高达4843次和3455次,这一数据是最高被引频次排名第3期刊的4~5倍,被引极端值的出现造成这2种期刊的引文分布一致性系数η明显低于其他期刊,进而对z指数的结果产生影响。

表3 19种图书馆情报与文献学期刊2008—2012年数据汇总结果

由于文献[26]使用除了《情报学报》之外的其他19种图书馆情报与文献学CSSCI来源期刊,选取它们2014年和2015年的两年发文数据,以及在CNKI引文数据库中的2016年被引数据,计算了z指数,根据其排序结果发现《情报杂志》位居第1位。对比这一排序结果,本研究使用2008—2012年的发文数据和截至2017年的CNKI引文数据库的被引数据所计算得出的z指数结果,准确识别出《中国图书馆学报》这一业内认可的期刊。《情报杂志》排在第2位,主要是因为该刊的发文量和总被引频次均排在第2位。需要指出的是,由于《图书馆学研究》2010—2012年未进入CSSCI来源期刊,而《情报学报》虽然未被CNKI收录全文,但其被引数据是完整的,因此本研究将《情报学报》纳入分析,其发文量从万方数据库中检索获取。

《中国图书馆学报》的z指数最高,这一结果仅与篇均被引频次(i)排序一致,与总被引频次(C)、h指数、g指数、p指数的排序结果都不一致。只有《国家图书馆学刊》的z指数排序与h指数、g指数、p指数的排序结果保持一致。

2.2 不同学科CSSCI来源期刊z指数与其他评价指标的相关性分析

在对3个学科CSSCI来源期刊z指数计算结果进行分析时,发现不同学科在z指数和其他指标的结果既有一致性,也有差异性。为了进一步了解z指数与其他指标之间的关系,本研究参照已有期刊评价指标研究中经常使用的相关性分析[14,26],使用SPSS 23.0统计软件对所计算的中文社科CSSCI来源期刊的10个指标进行Spearman相关性分析。

表4列出了2008—2012年CSSCI收录的法学、教育学、图书馆情报与文献学3个学科期刊各个评价指标之间的相关性分析结果,将h指数、g指数和p指数划分为已有指标,η系数和z指数则属于引文分布指标。

表4 不同学科期刊评价指标的相关性分析结果

注:**代表在0.01水平(双侧)上显著相关,*代表在0.05水平(双侧)上显著相关;#表示已有指标,##表示引文分布指标。

从表4可以看出,20种法学期刊的发文量与已有指标和引文分布指标的相关性未通过显著性检验,而在剔除2种明显极端值期刊后的31种教育学期刊中,发文量与已有指标和引文分布指标都显著相关,其中发文量和引文分布一致性系数呈现出负相关的关系。19种图书馆情报与文献学期刊中只有发文量与h指数、p指数和z指数3个指标呈正相关关系。

3个学科的总被引频次和引文分布一致性系数的相关性分析结果有明显差异,即这两个指标在教育学期刊上呈现显著负相关的关系,在其它2个学科上则未能通过显著性检验。除此之外,总被引频次和其他指标都呈现显著正相关的关系。

从z指数与其他指标的关系来看,3个学科的z指数和引文分布一致性系数的相关性都未通过显著性检验。不过在z指数和h指数、g指数、p指数的相关性上,3个学科都呈现出显著正相关的关系,其中3个学科期刊的各项指标中z指数与p指数的相关性最高,这与文献[26]发现的z指数与总被引频次相关性最高的结果不一致。

2.3 不同统计周期的z指数结果分析

包括z指数在内的多种计量指标,计算所依赖的发文量和被引数据在不同统计周期上会有差异,这种差异会影响各个计量指标的结果,导致同一数据库获取的数据也会有不同的计算结果。如文献[26]和本研究均以同一学科CSSCI来源期刊为分析对象,都使用CNKI引文数据库中的被引数据为计算依据,所得出的z指数计算结果不同,便是由不同的发文和被引统计周期造成的。

考虑到文献[26]的统计周期是2年的短期时间轴,而本研究z指数的统计周期是发表后累积6~10年被引数据的长期时间轴,因此补充5年的中期时间轴,从而对比z指数在不同统计周期上的结果异同。以文献[26]和本研究都计算过的图书馆情报与文献学18种CSSCI来源期刊为分析对象,获取其2012—2016年的发文在CNKI引文数据库中2017年的被引数据。根据图书馆情报与文献学18种CSSCI来源期刊短期、中期、长期的z指数排序结果,绘制出18种CSSCI来源期刊在3个统计周期内的相对位置分布(图1)。

从图1可以看出,随着统计周期从短到长的变化,《中国图书馆学报》z指数的排序位置从短期的第8位逐步提升到长期的第1位,《图书馆论坛》的排序位置也有所提升。《图书情报知识》的排序位置则有明显的下降,《图书情报工作》《情报理论与实践》《图书与情报》《情报科学》等期刊在3个统计周期内z指数的排序结果变化幅度很小。

图1 图书馆情报与文献学18种CSSCI来源期刊z指数在不同统计周期内的排序结果

2.4 不同被引数据来源的z指数结果分析

不同数据库在被引来源统计上的差异,会导致同一文献在不同数据库中的被引数据有明显不同。具体而言,以CNKI引文数据库为数据来源计算教育学33种CSSCI来源期刊的z指数时,发现《远程教育杂志》和《电化教育研究》的单篇文献最高被引频次多达三四千次,而在CSSCI数据库中则骤降至一百余次,这种被引数据的巨大差异,势必会对包括z指数在内的各个计量指标造成影响。因此,本研究选取教育学、图书馆情报与文献学的几种代表性期刊,在同一统计周期内获取CNKI和CSSCI两个数据库的被引数据,对比分析其z指数的结果差异。需要指出的是,CSSCI的被引数据存在因为作者、题名和期刊信息的书写错误等现实引用不规范造成同一文献不同被引记录的情况,本研究在依据CSSCI被引数据计算期刊z指数之前,人工对其进行核对整理。不同被引数据来源的期刊z指数最终计算结果见表5。

表5 不同被引数据来源的期刊z指数计算结果

从表5可以看出,CSSCI的被引数据明显低于CNKI引文数据库的数据,这是因为CNKI引文数据库的来源文献不仅有期刊论文,也有学位论文和会议论文,而CSSCI数据库的来源文献则只有期刊论文,并且是CSSCI来源期刊的论文。

在z指数排序上,使用CSSCI被引数据不仅能准确识别出《教育研究》和《中国图书馆学报》这2种在各自学科领域广为认同的权威期刊,同时《电化教育研究》排在《教育发展研究》前面,《情报杂志》的z指数也明显下降到《图书情报工作》之后,这与现实相符。

3 分析与讨论

3.1 z指数提升了中文社科学术期刊评价的科学性

从表1~3可以看出,根据法学、教育学、图书馆情报与文献学这3个学科的z指数结果,都能准确识别出3个学科中各自排名靠前、业内公认的高质量期刊。考虑了引文分布一致性的z指数能够有效区分具有相近h指数、g指数、p指数的学术期刊排序,比如《当代法学》和《政法论坛(中国政法大学学报)》的h指数相同,但前者的g指数和p指数低于后者,而依据z指数结果,前者要高于后者,这符合现实情况。

表4的相关性分析结果显示,z指数与总被引频次、h指数、g指数和p指数呈显著正相关,表明z指数这一新指标是在继承已有优秀评价指标的基础上进行的创新,该指标在与其他优秀指标良好相容的基础上,考虑了引文分布,这将提升学术期刊评价的科学指导作用。

3.2 z指数在不同统计周期和不同学科学术期刊评价上的差异性

包括z指数在内的各个计量指标,都是建立在发文量和被引频次这两个基本数据基础上的,但不同统计周期所带来的数据差异会影响各个计量指标的计算结果。本研究从CNKI引文数据库中获取图书馆情报与文献学18种期刊在短期、中期和长期3个统计时间轴上的发文和被引数据,发现更长统计周期的z指数识别结果更符合现实。

虽然3个学科期刊都呈现出z指数与总被引频次、h指数、g指数、p指数等指标显著正相关的一致性,但在z指数和其他计量指标的相关性上,不同学科之间仍存在差异。如在教育学和图书馆情报与文献学期刊中,z指数与发文量、被引篇数均呈现出显著的正相关关系,法学期刊则不同。3个学科期刊中z指数与其他计量指标的一致性和差异性表明,在中文社科期刊评价中z指数具有适用性,但其价值还需要在更多学科领域的中文学术期刊中进行验证。

3.3 z指数使用不同被引数据来源进行评价时具有不同的用途

对比CNKI和CSSCI这两个被引数据来源的z指数结果可以看出,不同数据库来源文献统计范围上的差异带来不同的z指数排序结果。这种差异表明即使使用同一计量指标,依据不同数据库的数据所得出的结果也具有不同的分析评价用途。

CNKI引文数据库的被引数据比较全面,所计算出的z指数结果适用于分析具体期刊在科研学术交流传播中的贡献力,即某一学科内既存在“载文量少但篇篇皆精品”的期刊,也存在“被引频次分布不均但载文量多”的期刊。倘若一味追求期刊的影响因子,造成载文规模一再压缩,必然不利于科学研究的健康发展。从这个角度来看,使用CNKI相对全面的被引数据所计算出的z指数排序结果,既能识别出《中国图书馆学报》这样的“领头羊”,也能给予《图书情报工作》这样载文量多,但篇均被引频次较低的期刊一定的认同。CSSCI的被引数据代表了高质量的引用,因此使用CSSCI被引数据所计算出的z指数结果,可以用于判断某一学科期刊的具体质量情况。

与其他指标相比,z指数作为一个新兴的计量指标,较为突出的特点是考虑了引用分布。罗纳德·鲁索等[32]提出了指标利用能力(Metric-Wiseness),即知道如何正确地使用各种计量指标。因此,在使用z指数进行计算分析时,应明确其数据来源、统计周期以及分析用途,从而得出更加科学严谨的分析结论。

3.4 z指数在中文学术期刊评价上的丰富拓展

通过对3个学科CSSCI来源期刊的实证分析,发现使用z指数对中文学术期刊的评价具有一定的适用性。然而作为一个新兴的指标,z指数也面临着质疑[33],如未考虑引文偏态分布[34]、被引频次随时间发展的问题[24]是其主要不足。表4的相关性分析结果显示,引文分布一致性系数η与z指数在3个学科上都没有显著的相关关系。今后需要与同样考虑引文分布的集成影响指标(I3)[35]进行对比研究,从而探索z指数、I3指标等考虑引用分布的新型计量指标在中文学术期刊评价上的效果。为了提高计算结果的准确性,需要对CSSCI被引数据进行规范化处理,本研究只选择2个学科的几种代表性期刊进行了计算结果对比,后续还有必要进一步对不同数据库的结果进行全面比较。此外,在被引数据分布上,本研究未考虑期刊自引的情况,这也需要在今后研究中加以考虑。

4 结语

在期刊发文量所代表的数量属性和总被引频次所体现的质量属性这两个基础维度上,z指数通过构建引文分布一致性系数η,将学术期刊影响力评价拓展到三维视角。本研究计算分析了国内3个学科CSSCI来源期刊的z指数及其他评价指标,借助相关性分析,并对比为数不多的已有研究结论,验证了z指数在中文社科学术期刊评价上的适用性,也发现了不同学科期刊评价结果之间的差异性。

本研究只选取中文社科学术期刊作为分析样本,后续研究可以选取中文自科期刊进行对比分析,从而对z指数的适用性进行更为广泛的验证,得出公正合理的结论。无论是h指数还是z指数,这些计量指标的提出和验证,都是在WoS数据库收录的英文期刊、会议论文、丛书等文献的基础上,因而除了进一步探究不同学科在不同统计周期、不同被引数据来源上z指数结果差异性的深层次原因,未来还需要围绕CNKI引文数据库更为全面的被引数据,深入分析引文分布的时间变化、文献类型等内容,从而提出更加符合中文学术期刊实际情况的计量评价指标。

致谢感谢南京农业大学信息科技学院2018届本科生郑梦之在采集基础数据时提供的帮助。

猜你喜欢
学术期刊期刊数据库
期刊更名启事
期刊简介
2020年百种中国杰出学术期刊获奖证明
我刊获评四川省社会科学优秀学术期刊
我刊获评四川省社会科学优秀学术期刊
期刊问答
数据库
数据库
数据库
数据库