自引率与其派生指标的历年变化及其在识别期刊过度自引中的应用与比较

2019-11-19 07:39温芳芳

中国科技期刊研究 2019年10期

■温芳芳

河南科技大学管理学院，河南省洛阳市开元大道263号 471023

影响因子原本只是评价期刊影响力的指标，后被广泛应用于论文评价和人才评价，甚至科研奖励、职称晋升等都与影响因子挂钩，“唯影响因子是从”之风愈演愈烈。当一个科学指标积蓄了如此大的能量，不免背离其科学初衷，受到功利主义的操控。Wilhite等[1]的研究表明，约有20%的受调查期刊曾不同程度地卷入不当引用风波，在面对编辑提出的强制自引要求时只有不到7%的作者会拒绝。自引相较于他引更易于受到人为操控，影响因子的公信力也因自引而饱受质疑。关于是否剔除自引的争论持续多年，至今仍无定论，当自引动机的合理性无法准确判定时，彻底剔除太过武断，而完全放任又有损期刊评价的公允性。当务之急是找到一种方法把那些存在过度自引嫌疑的期刊识别出来，使其进入公众视野，让评价机构可以对其提高警惕，广大读者能够对其给予监督。

从理论上分析，自引能够提高被引频次从而导致影响因子膨胀，现实情况是否如此？学者们进行了大量的实证研究，并且得出了不同的研究结论。例如，自引会对期刊影响因子产生正向影响[2]、负向影响[3]、无影响[4]、有条件的影响[5]等。Yu等[6]指出通过自引操纵影响因子的做法只对部分期刊可行，自引对于高影响因子、低自被引率期刊的影响程度很弱。Andrade等[7]发现大部分期刊影响因子的增长并不依赖于自引。与此同时，一些学者的研究证实强制自引或过度自引的现象屡有发生：Yu等[8]通过调查获得了48种存在强制自引的期刊；Krauss[9]列举了6种存在强制自引的期刊，发现引文统计结果因人为操纵而失真，虽然全部期刊的自被引率没有普遍增长，但是这6种期刊的自被引率确实显著增长。《期刊引证报告》(JournalCitationReports，JCR)在2007—2014年以“过高的自引率已经影响到期刊影响因子(Journal Impact Factor，JIF)有效性，导致其无法真实反映期刊的影响力”为由先后剔除了250多种期刊[10]。

由于过度自引对期刊评价存在潜在威胁，学者们试图从不同的角度寻找甄别方案：(1)设置自被引率上限，例如JCR提出20%的自被引率为合理自引的标准[11]。显然这种“一刀切”的方案并未考虑学科领域的差别性以及某些期刊的特殊性。徐自超等[12-13]建议为不同学科、不同年份的期刊设置自被引率正常参考值，为界定过度自引提供参考依据。金铁成[14]提出了两年自被引率识别办法，认为与自被引率相比，两年自被引率的离散程度更大，对过度自引更加敏感，反映速度更快，在检测期刊过度自引时具有明显的优势。(2)根据自被引率的历时波动情况判别，理由是正常的自被引率应保持一定的稳定性，若自被引率在某个年度急剧增长或者连续多年持续增长，这样的期刊多有过度自引的嫌疑[15]。(3)借助专家经验判断，建议由编辑和审稿人在审稿过程中识别和纠正不当自引[16]。

自引动机的复杂性、自引模式的多样性以及不当自引行为的隐蔽性，导致关于自引对影响因子的影响的讨论仍存在较大争议，国内外学者先后提出了自被引率、两年自被引率等指标，并通过设置指标上限和监测指标异常值的方式，对期刊过度自引行为进行甄别。但是，这些指标的应用范围有限，指标设计亟待完善，其有效性也需要做进一步检验。此外，国内外已有成果主要从自被引角度切入，多采用自被引率或两年自被引率指标识别过度自引，至于自引证率和两年被引证率能否用于识别过度自引仍未可知。鉴于以上情况，笔者分别从期刊的自引证(Self-Citing)和自被引(Self-Cited)两个角度进行计算，对自引率(含自引证率和自被引率)、两年自引率(含两年自引证率和两年自被引率)指标进行历时的比较和分析，并在上述4种指标基础上，提出相对两年自引率指标(含相对两年自引证率和相对两年自被引率)。考察自引率及其派生指标与影响因子之间的关联性，依据同组样本数据对各个自引率及其派生指标在识别过度自引时的有效性和灵敏性进行检验。

1 数据和方法

1.1 样本数据

本文以JCR(2017年版)收录的图书情报学期刊为例，时间区间设定为最近10年(2009—2018年)，按照如下步骤获取样本数据：第一步，逐个核查期刊名称的变化，了解期刊自创刊以来的更名情况以及在Web of Science(WoS)中的各种缩写形式；第二步，采用刊名进行检索，下载10年间各期刊所刊登论文的全记录信息(含参考文献)；第三步，对施引和被引文献的来源(刊名)进行匹配以识别自引关系对，匹配过程中考虑了期刊更名及不同形式的刊名缩写，统计每种期刊每年度的自引频次和两年自引频次，及其包含的参考文献和两年参考文献的数量；第四步，从JCR中获取每种期刊在每年度获得的被引频次和两年被引频次数据。检索时间为2019年2月14日。据统计，2009—2018年该学科88种期刊共刊载文献53860篇(全部文献类型都计算在内)，包含参考文献1674548条，总被引频次为1014920次。经核查WoS未能提供Econtent一刊最近10年的参考文献，无法参与计算，只能将其剔除，因此，本研究实际上以87种期刊作为样本进行计量分析。

1.2 指标及计算方法

计算各个样本期刊上述指标的年度值，获得结果为面板数据。此外，本研究还提出了相对两年自引证率(Relative 2-Year Self-Citing Rate，R-SRR2)和相对两年自被引率(Relative 2-Year Self-Cited Rate，R-SCR2)两个指标，其中R-SRR2为SRR2与SRR之比，R-SCR2为SCR2与SCR之比。基本原理是：在影响因子计算过程中真正起决定性作用的是两年被引频次，显然两年自引对影响影子的作用更为直接和显著，若想人为操纵影响因子，便会刻意提升两年自引量，导致两年自引率(SRR2和SCR2)明显大于自引率(SRR和SCR)，正常情况下R-SRR2和R-SCR2应该等于1或接近1，若指标值远大于1，则表明期刊有过度自引的嫌疑。

2 研究结果

2.1 自引率及其派生指标与影响因子指标的历时比较

根据87种样本期刊的6种自引率指标和2种影响因子指标的年度指标值，首先绘制全部样本期刊影响因子的年度分布图(图1)，以考察剔除自引前后期刊影响因子的分布及变化，然后绘制各类自引率指标的年度平均值曲线以展示其10年间的整体变化情况(图2)。

图1 剔除自引前后期刊影响因子指标年度分布图

图2 自引率及其派生指标与影响因子指标平均值的历时变化

图1所示小提琴形状的左右两侧分别显示样本期刊JIF1和JIF2的总体分布状况。剔除自引后影响因子的指标值确实有所下降，但不同期刊的下降幅度不同。就历时变化情况来看，上四分位数和中位数逐年上升，上四分位数的增速明显大于中位数，而下四分位数却逐年下降。整体而言，87种样本期刊的影响因子呈离散化的分布状态，且出现“强者愈强、弱者愈弱”的两极化发展趋向。

由图2可知：(1)全部样本期刊的SRR和SRR2平均值在10年间基本保持不变(分别保持在5%和8%左右)，而SCR和SCR2则呈明显的下降趋势，SCR从24%下降到12%，SCR2从26%下降到16%。SRR和SRR2稳定表明这些期刊没有刻意地增加或者回避自引，由此推断SCR和SCR2降低主要是由他引频次增加引起的，这在一定程度上说明样本期刊的外部影响力整体有所提升。(2)R-SRR2和R-SCR2明显大于1，说明自引较之他引更具时效性，R-SRR2的年度指标值虽有波动但10年间基本稳定在2左右，而R-SCR2有增长之势(由1.3增至1.6)，该现象可以解释为自引在知识交流和传播中的时效性进一步增强。(3)10年间JIF1和JIF2的平均值有所增长，两者分别由1.3增至1.7、由1.0增至1.5，但是参照图1可知，影响因子平均值和中位数的增长主要是由部分高影响力期刊的影响因子上升导致的，并不能代表全部样本期刊的影响力都在增强，下四分位数降低说明那些低影响力期刊的影响因子值不仅没有增加反而有所下降。

综合8种指标的历时变化情况可知，影响因子平均值的增长并非通过增加自引实现，主要理由包括：(1)SCR和SCR2平均值分别为18%和20%，自引在全部被引频次中占据一定的比例，所以JIF2明显小于JIF1，但是自引在总被引频次中所占比例有限，影响因子指标主要取决于他引而非自引。(2)两条影响因子曲线的变化趋向和幅度高度一致，假设自引是导致影响因子增加的主要因素，则会出现JIF1曲线增长而JIF2不增长，或者JIF1曲线的增速和增幅明显大于JIF2的情况，而现实情况是两条曲线的变化趋向高度一致，这在一定程度上推翻了上述假设，说明影响因子提升并非依靠增加自引实现的。(3)SRR和SRR2稳定而SCR和SCR2下降的客观事实，再次证明自引并非导致影响因子增长的原因，否则这4种自引率曲线必然与影响因子曲线保持同向变化。

2.2 自引率及其派生指标与影响因子指标的相关分析

为理清自引率及其派生指标与影响因子之间的关系，笔者将全部指标的面板数据及其10年间的平均值导入SPSS软件中进行Spearman相关性分析，各年度相关系数如表1所示。

自引证率(SRR)和两年自引证率(SRR2)与两类影响因子之间存在显著的正相关关系；自被引率(SCR)在部分年份与JIF1负相关，在大部分年份与JIF2负相关；两年自被引率(SCR2)与两类影响因子在个别年份负相关，2012年以后再无相关性呈现；相对两年自引率(R-SCR2和R-SRR2)与两类影响因子在有些年份正相关、有些年份不相关。从10年间平均值的分析结果来看，SRR和SRR2与两类影响因子正相关；SCR与两类影响因子负相关，SCR2与JIF1不相关、与JIF2弱负相关；R-SRR2和R-SCR2与两类影响因子正相关。从历时变化趋势来看，SCR2与期刊影响力之间的相关性已经被淡化，在观察周期的中后期SCR2与两类影响因子之间的负相关关系已经不复存在。

表1 自引率及其派生指标与影响因子指标的相关性分析结果(Spearman ρ)

注：**在置信度(双侧)为0.01时，相关性显著；*在置信度(双侧)为0.05时，相关性显著。

相关性分析结果带来以下几点启示：(1)上述几类自引率同为测度期刊自引程度的指标，但是分别从不同的角度揭示期刊的自引属性特征，与两类影响因子之间表现出不同类型及不同程度的相关关系，自引证类指标和自被引类指标应该被区别对待，前者反映期刊对内部和外部知识的利用程度(知识来源的广度)，而后者用于考察期刊的内部和外部影响力(科学影响的广度)。尽管二者分子相同，但是由于分母的差异，它们与影响因子指标分别存在着正向和负向的相关关系。(2)从理论上推导，过度自引能够增加总被引频次，继而导致影响因子的非正常膨胀——JIF1增加而JIF2不变，相对而言，低影响力期刊更有可能采用这种伎俩，一方面它们的生存压力更大，另一方面它们的被引频次基数小，易于操纵[17]。不少人对期刊自引持有偏见，认为期刊自引率越高则其影响力越低，或者认为影响力低的期刊其自引率必然更高，本研究关于各类自引率和影响因子的相关性分析结果有助于澄清人们对自引的一些误解。(3)自引率与影响因子之间的相关关系，并不能解释为“高引证率和低被引率期刊必然是好期刊”或者“好的期刊一定具有高引证率和低被引率”，无论自引率还是影响因子都同时受到多种因素的影响和制约，任何一种自引率指标都不能作为评价期刊质量和影响力的标准。

2.3 自引率及其派生指标识别疑似过度自引期刊的结果比较

通过自引率识别过度自引的方法中，尽管具体指标多变，但其原理相似：正当自引应该保持在合理稳定的范围之内，自引率指标的异常值在一定程度说明期刊有过度自引之嫌。本研究的统计数据显示，SRR和SRR2的分布相对集中，87种样本期刊仅有1种期刊的SRR高于20%，SRR2超过20%的期刊也是少数，大部分期刊的SRR和SRR2都在20%以下。SCR和SCR2的分布较为分散，存在极值的期刊不在少数，个别期刊的指标值甚至高达80%～100%。Garfield曾提出将自被引率上限设为20%，JCR也以自被引率低于20%作为合理自引的标准。针对本研究的计算结果，若以20%自被引率为上限，约有1/3的期刊有过度自引之嫌。依据各年度自引率及其派生指标的极端值识别疑似过度自引期刊，结果如表2所示。此外，本研究还通过计算剔除自引前后两类影响因子的比较值(JIF1JIF2)来识别影响因子数值受自引影响较大的期刊以作参照。

由表2可知，借助不同的自引率指标识别出的结果存在显著的差别，只有个别期刊会被两个及以上的指标同时判定为疑似过度自引。此外，若根据剔除自引前后影响因子的变化幅度判断，SCR2在识别疑似过度自引时更具灵敏性，其次是SCR。SRR和SRR2对过度自引并不敏感。本研究提出的两个相对指标R-SRR2和R-SCR2识别出的结果明显不同于其他自引率指标的识别结果。表2中结果的差异性再次说明了不同自引率指标分别从不同角度揭示了期刊的自引状况，但是任何单一的自引率指标都无法作为判定过度自引的唯一有效依据。表2中列举的疑似期刊来自JCR各个分区，以Q3区和Q4区的期刊居多，它们的影响因子指标值只是相对较低，但并非最低，也有少数来自Q1区和Q2区的期刊。再次证实了类似于“影响因子低的期刊必然自引率高”或者“自引率高的期刊一定影响因子低”的说法并不成立。

表2 不同指标识别出的疑似过度自引期刊列表

注：因页面限制，期刊名称无法在表中显示，表中带#后的数字对应JCR(2017年版)图书情报学科相应排名的期刊。

3 结论与讨论

(1) 图书情报学期刊影响力整体有所提升，但是影响因子的增长并非通过增加自引实现。影响因子(JIF1和JIF2)的中值和平均值逐年提升，但这种增长主要由高影响力期刊拉动，低影响力期刊的状况并未显著改善，全部期刊的影响因子呈现两极化的分布格局，并且从发展趋向来看“贫富差距”正在进一步拉大。本研究并未发现关于过度自引普遍性的有力证据，至少对于图书情报学来说，大部分期刊的自引率仍处在合理和有效的范围之内，10年间自引程度并未增强，自引证率和两年自引证率保持稳定，自被引率和两年自被引率不增反降。尽管如此，这些研究发现只能从整体上否定通过过度自引操纵影响因子行为的普遍性，并不能排除单个期刊过度自引的嫌疑。我们注意到，每种自引率指标都或多或少地存在异常值，尤其自被引率和两年自被引率指标的异常值更为常见。综上所述，尽管整个学科的整体自引状况良好，但是仍不能忽略过度自引对于影响因子的潜在威胁。

(2) 任何一种自引率指标都不能单独作为过度自引的有效判定依据。各类自引率及其派生指标与影响因子之间的关联性复杂多变，本研究分别借助6种指标的极端值识别出的疑似过度自引期刊存在显著差别，彼此之间少有交叉。不同的自引率指标分别从不同角度反映期刊的自引属性，例如，SRR用于衡量期刊知识来源的广度，SCR表征期刊的影响力范围，SRR2和SCR2兼顾引文时效性，R-SRR2和R-SCR2用于考察自引和两年自引两种自引模式的差异性。每种自引率指标都只能从某个角度反映自引模式的某些特征，但在识别过度自引时又都具有一定的局限性，并不能获得让人完全信服的结果。引用动机具有复杂性和隐蔽性，自引受制于多种因素，自引率不能当成评判期刊质量的标准，在识别过度自引时也只是作为参考，识别出的期刊只能称为疑似过度自引期刊，能否坐实其过度自引行为，还需要结合每种期刊的状况进行具体分析。

(3) 自被引率类指标比自引证率类指标更适合于识别过度自引，其中两年自被引率更为敏感。自引证率类指标(含自引证率和两年自引证率)确实不太适合用来识别过度自引，具体原因如下：首先，从计算公式分析，自引证率类指标比自被引率类指标更易于伪装，例如，为降低自引证率而人为增加参考文献总量(分子不变，分母增加)，参考文献的数量和结构完全由作者自主设定，但是自被引率被人为操纵的难度相对较大，作为分母的总被引频次主要依赖于他引而非自引。其次，两种自引证率指标与影响因子之间存在着显著的正相关关系，说明自引证率是表征期刊影响力的正向指标，若出于合理引用的动机，许多期刊，尤其是高影响力期刊完全具备合理且充分的理由拥有较高的自引证率。此外，自被引率与两年自被引率的识别结果重合度较大，而本研究提出的相对两年自引率作为复合指标，综合了自引率和两年自引率两个方面的信息，识别出的疑似期刊与其他方法的识别结果鲜有交叉，该派生指标能够与原有的自引率指标实现互补。

4 结束语

如何识别以操纵影响因子为目的的过度自引行为，一直是文献计量和期刊评价领域关注的重要问题，但是期刊过度自引很难通过直接调查发现，以自引率指标为代表的异常自引模式监测和识别法提供了一种简单可行的方案。本研究分别从自引证和自被引两个角度进行历时分析，验证和比较了各类自引率指标在识别过度自引期刊时的应用效果，并证实两类派生的相对自引率指标能够实现对原有自引率指标的互补。任何单一的自引率指标都不足以作为识别过度自引的唯一依据，笔者建议同时采用多个指标和多种方案进行综合评判和交叉检验。本研究仅以图书情报学的国际期刊为例，样本量有限，研究发现和结论还有待进一步检验和完善。后续研究中，将对来自更多学科领域更大规模的样本期刊开展实证分析，重点考察自引率和影响因子指标之间的关联性，剖析两者之间的影响程度和作用机理，构建复合指标或方法体系对过度自引进行监测和识别。