科技期刊引文评价核心指标的对比研究

2014-04-13 08:09史纪元孙金立

中国科技期刊研究 2014年8期

■吴涛史纪元杨筠陈晨孙金立*

科技期刊评价理论经历了近一个世纪的漫长发展过程，其脉络大致为:发文量分析—引文数量分析—引文数量与质量结合分析—引文网络分析。贯穿科技期刊评价理论的发展，期刊评价指标层出不穷。其中引文评价指标最具代表性的有总被引频次、篇均被引频次、影响因子（impact factor，IF）、h指数、即年指标、SCImago Journal Rank（SJR）、Eigenfactor score（ES）等等。围绕这些核心指标还出现了很多衍生指标，如由IF改进的5年IF（IF5）、剔除自引的IF等；基于h指数形成的类h指数[1]，如ha指数、g指数、A指数、R指数、AR指数、f指数、e指数等[2，3]；由ES推出的论文影响分值（Article influence score，AIS），以及其他一些引文评价指标:期刊引用认同[4]、期刊引用速率、期刊扩散因子[5]等等。虽然科技期刊评价已经开发出了众多评价指标，但每一种指标都只能从期刊的某个角度评价其水平，不能满足期刊评价的综合、动态、直观的要求。因此，必须科学选择多个指标，构建综合评价指标体系，才能从多个角度全面评价科技期刊，最大程度地实现科技期刊评价的公正与合理。

本文以IF、h指数、SJR、ES、SNIP（全称source normalized impact per paper，2010年出现的新指标[6]，但因基于全球最大的文摘和引文数据库Scopus和其独特的评价优势而被笔者视为核心指标）为科技期刊引文评价的五大核心指标，通过对比分析它们的原理、特点及潜在的相关性，寻找它们的异同点、优缺点以及互补的可能性，试图为构建科技期刊引文评价综合指标体系提供参考。

1 计算原理

1.1 “发文量”与“被引频次”的组合

IF的计算公式:某刊前两年发表所有类型文献在该年的被引证次数/该刊前两年发表可被引文献数，IF5只是将引文区间从两年延长至五年，其原理都是在一定的时间内某刊发表论文的平均被引率，即篇均影响。h指数是指某刊所发表的全部论文中最多有h篇论文至少被引用了h次（h这个自然数最大）。相比IF，h指数更巧妙地将期刊的载文量与引文数结合起来反映期刊论文的影响力。

1.2 类PageRank算法

SJR和ES都是参考了衡量网页重要性的PageRank算法，将期刊之间的引用关系视为以期刊为节点、以引用关系为链接的引文网络，通过期刊的引用关系评价期刊的重要性。但两者的具体算法不同。SJR的计算过程[7]是:先给每本期刊设定同一个SJR初值，通过多次的迭代计算直至两次迭代计算之间SJR的差值小于事先设定的阈值时，所得的最终结果为目标期刊的SJR值。一本期刊的SJR值取决于该刊三年内获得的声望，而这种声望来自于期刊引用网络中其他期刊的声望。ES的计算过程是:先构造以期刊为节点的五年期互引矩阵，然后通过剔除自引、标准化处理、替换无引用悬点、加入阻尼系数α后得到随机矩阵P，再通过迭代计算主特征向量π，最后带入公式计算ES[8]。研究者随机选取一本期刊，通过阅读其中的任一参考文献链接到下一本期刊，以此类推，ES就是计算研究者在这个引文网络中进入某个期刊的几率百分值，也就是计算该网络中期刊被引用的可能性。

1.3 基于Garfield的“引用潜力”修正不同主题领域的差异性

SNIP=篇均粗影响/该学科领域的相对“引用潜力”，其中篇均粗影响即3年IF，“引用潜力”指一篇文献在特定的学科领域里估计能达到的平均被引用次数[9]，而相对“引用潜力”是各主题领域相对于“引用潜力”中间值的标准化值[6]。

2 特点对比

由于计算原理和数据来源的不同，每个指标的优缺点也不同，掌握其特点是合理应用及科学搭配这些指标的前提。

2.1 来源数据库

IF最初是美国ISI的期刊引证报告（JCR）中的一项数据，由于其计算原理简单，现已在国内外各领域广泛使用。h指数只需通过简单排序计算，已应用于各大数据库。SJR、ES和SNIP由于计算过程复杂，在国内还未被数据库广泛应用于期刊评价，但在国外，这三个指标已被广泛应用。SJR和SNIP基于Scopus数据库的数据，而ES基于WoS数据库。Scopus数据库每日更新，目前共有5000万条记录，其中1996年后有2900万条记录，1995年前的记录可追溯到1823年[10]。WoS数据库每周更新，收录了12 000多种期刊，基本囊括了世界范围内有重要影响力的刊物[11]。WoS数据库注重精品期刊，而Scopus数据库收录的期刊更全面。

2.2 数据库覆盖面的影响

数据库不同，同一本期刊IF和h指数的结果会有差异。Gorraiz J等人研究表明，Scopus数据库中大部分药理学和药剂学期刊的IF高于JCR中的IF[12]。分析原因，Scopus数据库收录期刊的覆盖面比WoS要广，更新要快。理论上分析，h指数与SJR也受数据库覆盖面的影响，数据库覆盖面越广，引文数量、类型增多，时间跨度扩大，且越可能被更多高声望的期刊引用，h指数与SJR会相应偏高。但ES和SNIP受数据库覆盖面的影响较小，两者在计算中通过不同的方法对数据进行了标准化处理，排除了数据库对不同主题领域或同一主题领域不同方向的期刊覆盖面不同而导致的评价上的不公平[6，13]。

2.3 引文区间

IF的引文区间是两年，但随着IF的广泛使用，人们逐渐认识到两年的时间跨度太短[13，14]，很多学科的引证高峰都超过两年，于是出现了5年IF。但出于方便或者习惯，两年IF使用的范围仍然最广，尤其在国内，各个领域的学术或期刊评价仍然坚持使用两年IF，需尽快改革这一现状。h指数没有固定的引文区间，即可以作为即时指标，也可以反映论文发表后多年的长期效应，可灵活使用。SJR和SNIP都是基于3年的引文数据，ES是5年。理论上，时间跨度选择在各学科文献开始老化前最好，但现实中很难根据各个学科选择不同时间跨度进行比较，普遍认为，5年的时间跨度比较适合大部分科技期刊评价[13，14]。

2.4 自引处理

根据以上计算原理介绍可知，IF、h指数和SNIP计算中不排除自引。由于自引可以通过增加被引频次而相应提高评价结果，近些年，期刊为了提高IF，研究者为了利于稿件接受，导致引证行为复杂化，不正当自引越来越多。针对这一现象，期刊评价机构主张评价期刊时排除自引。SJR和ES则在自引处理上做了改进，但由于研究的连续性而导致的正当自引也被一概排除在外，评价时正当自引的期刊在指标计算中则会失分。因此，期刊评价指标需要更精细化，更综合化。

2.5 引文权重

众所周知，引证期刊的重要性与引文的重要性成正比。在引文权重方面，“基于引文网络的指标”SJR和ES会做得更好，同时考虑了引用期刊的数量和质量。IF和h指数是将所有引文的重要性等价，不考虑引证期刊间质量差异，但h指数测量了期刊的高被引论文数量及其被引强度，某种程度上比IF更能反映期刊论文的质量。SNIP是一个均值，采用标准化方法处理数据使得引文的重要性也得不到区分体现[15]。

2.6 论文类型和期刊类型倾向

IF的分子是所有类型的文献被引频次，分母仅包括论著和综述。ES仅统计论著、简讯、综述类文献。h指数、SJR和SNIP统计所有类型的文献。由于综述类期刊被引用的几率高，而IF和SNIP计算过程中都没有校正期刊所刊载的综述性文章的差异，在统计综述类期刊时偏高。如综述类、年鉴类期刊IF排名一般比其h指数高[16]。h指数因不易受到低被引（如通讯、读者来信、新闻）或者高被引论文（如综述）的影响，也就避免了对某类期刊的“过高评价”。SJR统计所有类型的文献，因此对于发表通讯、读者来信、新闻的期刊，其SJR会相对偏低。ES不利于新刊评价，新期刊由于上游链接少，在评价中处于相对劣势[17]。论文或期刊类型对于指标的具体影响，还有待进一步实证。

2.7 跨学科比较

IF、h指数和SJR皆不适合跨学科领域期刊之间的比较，因不同主题领域引用行为、引证峰值、引用周期都不同，而ES通过标准化互引矩阵，使得不同学科差异造成的引文密度差别在一定程度上得到弥补[17]。SNIP采用全新的主题领域界定法，并使用标准化方法对不同主题领域的期刊指标进行了相对值处理，有利于跨学科期刊和综合性期刊的评价[6]。

2.8 离散程度

离散程度低，数据更集中，有利于区分好刊，如h指数、ES和SNIP，但由于差距微小，不便于区分排名较后的期刊。

2.9 可验证性和数据获取

IF和h指数计算相对简便，只要给出所需数据即可验证；但另外三个指标计算复杂，SJR和SNIP虽然在网站上能免费查询，但数据封闭，不易验证，而且期刊局限于Scopus数据库的收录范围，这一点限制了指标的推广应用。若国内能开发相应的计算软件，将有利于我国期刊评价的多维化。

2.10 其他影响因素

（1）极端数值:IF对高被引或低被引数值的变化非常敏感，而其他指标则相对稳定，尤其是h指数不易受到低被引或者高被引论文的影响。（2）载文量:从IF的计算公式判断，若期刊的载文量偏高，IF相对偏低。如期刊发表的论文数量较多，其h指数排名比IF排名靠前[16]。期刊载文量越大，理论上被阅读的几率越高。ES衡量的是读者在期刊中停留的时间，因此ES偏爱载文量大的期刊，若论文质量相当，发文量大的期刊必然ES偏高。（3）时间:从h指数的定义看，h指数随时间的变化是只增不减的。

现将以上特点总结在表1中。

表1 科技期刊引文评价核心指标特点对比

3 各指标间的相关性

大量的研究证实，这些指标之间的确存在相关性，但究竟哪些指标之间相关性更强、能互为补充，众说纷纭，莫衷一是。

Bador P等[18]和郑德俊[8]认为h指数相对于其他指标与IF相关度更高，能更好地替代IF；但宋丽萍、王建芳[19]以刊载了1980篇免疫学与生物信息学论文的期刊为研究对象，进行相关性分析、聚类分析和因子分析发现，IF与IF5、AIS、SJR、SNIP均高度正相关，与ES及h指数相关度均较低；马丽[20]等对国外37种图书馆学情报学期刊的实证研究结果也表明:ES与h指数高度相关，但与IF、SJR相关强度相对较弱；王琳[21]以JCR中排名前10的期刊为样本，得出的结论是ES与IF相关性很差，而与总被引频次相关性较好，认为ES在跨学科评价方面优势更突出；Yin CY[22]和JacsóP[23]也认为ES与IF/IF5在期刊排名上存在很多差异，与h指数结合使用评价期刊更有效合理。

Falagas ME等[24]和Leydesdorff L[25]研究认为基于Scopus的SJR值以免费查询、更庞大的来源数据库、排除自引、包括的文献类型更全、3年的引用窗等方面优于IF，成为IF的重要补充甚至替代；赵星[26]等使用因子分析、回归及相关分析等方法实证研究了SJR与IF、h指数的关系，结果表明SJR与IF、h指数均有较强正相关性，SJR与IF联合判断可区别出期刊在流行与声望两个维度的特点；而田质兵[27]发现SJR与IF、IF5以及ES之间并没有发现显著相关性，认为导致不相关的原因是来源数据库不一致和计算方法不同。

由于SNIP出现的时间短，有关SNIP的研究比较少。Leydesdorff L[15]等认为SNIP能很好地弥补IF和SJR的不足，有效地反映期刊影响力；杨晶晶[28]等对Scopus数据库中24种外文期刊和CSSCI来源的国内6种图书情报学期刊的SNIP与SJR、h指数以及IF进行对比分析，结果证明SNIP相对IF更集中，与其他三个指标之间存在较强的相关性。

有关各评价指标与同行评议结果的对比报道较少，王一华[29]以48种图书情报期刊为研究对象，将期刊评价指标与专家评价值的相关性从强到弱排序得出:SJR＞IF（JCR）＞IF（Scopus）＞SNIP＞h指数，即SJR最接近专家评价结果。另外，他还做了38种国际图书情报期刊的SJR、IF和h指数的相关性研究，发现SJR、IF和h指数三者呈线性关系，SJR相比更优[30]。

4 总结

科技期刊评价的现状是:IF因其计算简便、理论成熟，一直在国内外科技期刊评价方面占据着核心地位，但IF的不足早已成为共识，如计算过程中只统计了引文数量，默认所有的引文具有同样的权重；未能排除自引行为；两年IF对于那些科研周期较长的学科和发表周期偏长的期刊不公平；对于极端数值的变化非常敏感；对于英语类和综述类期刊的偏爱等等。针对IF的不足，不断有新的指标出现，但还没有哪一种引文评价指标是完美的:h指数灵活、简单、稳定，可改进空间大，但未考虑被引证论文期刊的权重，不适合不同学科领域的期刊对比评价；SJR和ES考虑了引文权重，但SJR与刊载论文的平均水平关系较强，不适合用于跨学科领域期刊比较，相比之下，ES是对期刊整体影响力的度量，可用于不同学科期刊的对比分析；SNIP采用全新主题领域界定法，最适合不同主题领域期刊之间的评价，但SNIP未考虑引文权重。而且，SJR、ES和SNIP因计算复杂、数据封闭，推广较难，但其引文网络的思想和“引用潜力”的概念、全新的主题界定法是可以被国内期刊评价借鉴和应用的。

这五个核心指标都是从期刊引文的角度评价期刊，经研究证实彼此之间的确存在相关性，但相关性存在强弱之别:（1）IF与IF5、AIS、SJR、SNIP相关度高于与ES和h指数的相关度[19]，而ES与h指数更高度相关[20]；（2）SJR与IF、h指数均有较强的相关性，且SJR在很多方面优于IF，与IF合作可区别出期刊在流行和声望两个维度的特点[24-26]；（3）SNIP比IF数据分布更集中，与SJR、h指数和IF的相关性都很强[28，30]。（4）相比IF、SNIP和h指数，SJR更接近专家评价的结果[29]。但除了这些结论，科技期刊引文评价指标间的相关性研究还存在着不同的声音，如有研究证实h指数相对于其他指标与IF相关度更高[8，18]；SJR与IF、IF5和ES之间并不存在显著相关性[21-23，27]。导致结论不同的原因可能与研究的样本和方法有关，目前对期刊引文评价指标的实证研究大多基于图书情报类期刊，或基于医学某方向，如眼科[31]、心脏与心血管系统[32]、免疫[19]等，偶见以教育学[33]、海洋科学类期刊[34]为对象，存在样本量小、比较的指标类型少、国别语种单一、学科领域跨度小等缺点。因此，有待大样本的实证研究，更全面客观地呈现期刊引文评价指标间的关系，优势互补，构建综合评价指标体系。

科技期刊评价是多维的、复杂的，统计时段、学科领域、来源数据库的不同都会影响评价结果。因此，评价工作必须根据具体的评价对象、条件、要求和目的选择最合适的评价指标，赋予不同权重，建立综合评价指标函数，做到更微观化评价，同时、同类、同级、同源相比，既要不断开发新的评价指标，最大化利用其优点，又不局限于某一指标，不局限于某一方法。

1 宋振世，周健.类h指数研究综述及其实证对比分析.情报科学，2012，30（11）:1652-1657

2 王梅英，刘雪立，王璞.h-指数及其扩展指标在期刊评价中的应用.情报杂志，2012，31（3）:60-64，59

3 黄崇亚.我国医学类学报q2指数与h指数、m指数、影响因子、总被引频次的相关性研究.中国科技期刊研究，2012，23（6）:979-981

4 苏芳荔.期刊引用认同和期刊引证形象实证.情报理论与实践，2013，36（5）:93-97

5 郑德俊.期刊评价中的关键指标评析及相关性研究.图书情报工作，2011，55（4）:143-147

6 程小娟，杨晶晶.Scopus数据库引文评价新指标SNIP原理及可行性探讨.图书情报工作，2012，56（10）:6-9，34

7 SCImago Research Group.Description of SCImago Journal Rank Indicator.（2007）[2014-02-28].http://www.scimagojr.com/SCImagoJournalRank.pdf

8 德俊.期刊评价中的关键指标评析及相关性研究.图书情报工作，2011，55（4）:143-147

9 Ggett S.New perspectives on journal performance.（2010-01）[2014-03-02].http://www.researchtrends.com/issue15-january-2010/behind-the-data-2/

10 Elsevier BV.Scopus:facts and figures.（2013-08）[2013-11-12]http://cdn.elsevier.com/assets/pdf_file/0007/148714/scopus_facts_and_figures.pdf

11 Thomson Reuters:ISIWeb of Knowledge.Web of Science.[2013-11-12]http://thomsonreuters.com/products/ip-science/04_064/web-of-science-fs-en.pdf

12 Gorraiz J，Schloegl C.A bibliometric analysis of pharmacology and pharmacy journals:Scopus versus Web of Science.JInformSci，2008，34（5）:715-725

13 金友忠.学术期刊质量评价指标透视.农业图书情报学刊，2011，23（5）:59-62

14 邹新贝，程小娟.引文评价新指标SNIP与IF、h指数和SJR的理论比较研究.图书情报工作，2012，56（10）:14-16，13

15 Leydesdorff L，Opthof T.Scopus’s source normalized impact per paper（SNIP）versus a journal impact factor based on fractional counting of citations.JAmSocInfSciTechnol，2010，61（11）:2365-2369

16 朱蓓，赵会懂.H指数与影响因子评价科技期刊的比较.中华医学图书情报杂志，2010，19（9）:1-3，24

17 窦曦骞，祁延莉.特征因子与论文影响力指标初探.大学图书馆学报，2009（6）:57-62

18 Bador P，Lafouge T.Comparative analysis of impact factor and h-index for pharmacology journals.Therapie，2010，65（2）:129-137

19 宋丽萍，王建芳.期刊评价指标实证研究.图书情报知识，2013（3）:74-80

20 马丽，赵星，彭晓东.新型期刊引文评价方法比较研究.情报理论与实践，2010，33（5）:71-75

21 王琳.特征因子与影响因子及总被引频次的指标特性比较——基于“TOP期刊群”样本的实例分析.编辑学报，2013，25（2）:200-204

22 Yin CY，Aris MJ，Chen X.Combination of EigenfactorTMand hindex to evaluate scientific journals.Scientometrics，2010，84（3）:639-648

23 JacsóP.Differences in the rank position of journals by Eigenfactor metrics and the five-year impact factor in the Journal Citation Reports and the Eigenfactor Projectweb site.OnlineInfRev，2010，34（3）:496-508

24 Falagas ME，Kouranos VD，Arencibia-Jorge R，et al.Comparison of SCImago journal rank indicatorwith journal impact factor.FASEB J，2008，22（8）:2623-2628

25 Leydesdorff L.How are new citation-based journal indicators adding to the bibliometric toolbox？JAmSocInfSciTechnol，2009，60（7）:1327-1336

26 赵星，高小强，唐宇.SJR与影响因子、h指数的比较及SJR的扩展设想.大学图书馆学报，2009，（2）:80-84

27 田质兵.评价期刊影响力的三项指标比较研究.现代情报，2010，30（9）:141-146

28 杨晶晶，邹新贝.引文评价新指标SNIP在国内外期刊中的实证研究.图书情报工作，2012，56（10）:10-13

29 王一华.基于IF（JCR）、IF（Scopus）、H指数、SJR值、SNIP值的期刊评价研究.图书情报工作，2011，55（16）:144-148

30 王一华.期刊评价指标SJR、JIF和H指数的关系研究.图书情报工作，2010，54（6）:145-147

31 盖双双，张诗乐，刘雪立等.论文被引率在科技期刊评价中的地位和作用—基于36种SCI眼科学期刊问卷调查的实证研究.中国科技期刊研究，2014，25（1）:39-43

32 杜建，张玢，刘晓婷.期刊影响因子、h指数、相对h指数及特征因子的相关性分析.情报杂志，2011，30（2）:23-28

33 张琳.CSSCI教育学期刊特征因子与影响因子比较分析.情报杂志，2011，30（7）:34-37，25

34 李雪，张潇娴，邱文静等.我国海洋科学类期刊评价中的SJR指数应用研究.编辑学报，2012，24（5）:506-510