■金铁成
河南工业大学学报编辑部,郑州市高新技术产业开发区莲花街100号 450001
由于通过期刊自引可以操纵期刊的影响因子[1_2],所以期刊出版部门和文献情报部门对期刊自引一直非常关注[3_8]。期刊自引率(self-citation rate)是评价期刊自引的定量指标,具体包括自引证率(self-citing rate)与自被引率(self-cited rate)两个定量指标[9_10]。由于自引率是舶来品,国内研究人员对于期刊自引率的翻译与使用比较混乱,有的作者将自引证率认为是自引率,有的作者将自被引率认为是自引率,因而常常出现此自引率非彼自引率的现象[11]。同样地,国内研究人员对于加菲尔德的期刊自引率论断“专业期刊的自引率应在20%左右”的引用也相当混乱,有37.1%的论文作者认为加菲尔德所说的自引率是期刊的自引证率,有62.9%的论文作者则认为加菲尔德所说的自引率是期刊的自被引率[12]。国内出现上述自引率使用的混乱现象,原因是多方面的。笔者认为,国内研究人员不能正确区分两种不同形式的期刊自引率,是导致其使用混乱的主要原因。为了帮助国内研究人员正确地区分期刊的自引证率与自被引率,笔者以2014年JCR收录的119种食品科技类SCI来源期刊为例,分别计算其自引证率与自被引率,并进行了比较。对自引证率与自被引率的相关性进行了分析,从统计学的角度探讨两种不同形式的自引率能否相互替代。考察了自引证率、自被引率与影响因子的相关性,分析了不同自引证率、自被引率的期刊的特征。
数据来自汤森路透集团的2014年的Journal Citation Reports Science Edition[13]。
首先,进入Journal Citation Reports数据库,分别选择JCR Science Edition 2014和学科类目进行检索;然后,选择具体学科类目 FOOD SCIENCE&TECHNOLOGY进行检索;最后,分别打开每种期刊进行相关数据采集。采集的数据包括:影响因子(Impact factor)、总被引频次(Total cites)、自引频次(Self cites)、参考文献量(Number of references)。
根据 Eugene Garfield[9]对自引率(self-citation rate)的相关描述,自引证率(self-citing rate)和自被引率(self-cited rate)的定义分别为:自引证率=自引频次/参考文献量,即某期刊出版的全部文献在统计年被该期刊引用的频次/该期刊在统计年出版的全部文献的参考文献总量;自被引率=自引频次/总被引频次,即某期刊出版的全部文献在统计年被该期刊引用的频次/该期刊在统计年被所有来源期刊引用的总频次。
将采集到的数据录入到Excel表格中,分别按各自的定义用Excel自动计算出自引证率与自被引率,然后用SPSS16.0进行自引证率与自被引率的数据特征分析和相关性分析,考察自引证率、自被引率与影响因子的相关性。
共选取2014年JCR收录的食品科技类SCI来源期刊119种,这119种来源期刊的自引证率与自被引率的部分数据特征如表1所示。119种食品科技类SCI来源期刊的自引证率最大值是0.270,平均值是0.049,有31.9% (38种)期刊的自引证率大于或等于平均值,只有1.7%(2种)的自引证率大于0.20;自被引率的最大值是0.629,平均值是0.119,有31.9% (38种)期刊的自被引率大于平均值,有16.0%(19种)的期刊的自被引率大于0.20。自引证率的中位数是0.031,自被引率的中位数是0.083。
表1 自引证率与自被引率的部分数据特征
在119种食品科技类SCI来源期刊中,自引证率排名靠前的5种期刊分别是J DAIRY SCI(0.270)、 MEAT SCI(0.214)、 FOOD QUAL PREFER(0.192 )、POSTHARVEST BIOL TEC(0.158 )、JSENS STUD(0.157),自被引率排名靠前的5种期刊分别是 LISTY CUKROV REPAR(0.629)、KOREAN J FOOD SCI AN(0.470)、SUGAR IND(0.449)、J FOOD SCI TECH MYS(0.440)、FOOD SCITECH-BRAZIL(0.438)。 两者的前5名没有重复的期刊,两者的前10名也没有重复的期刊。
对2014年JCR收录的119种食品科技类SCI来源期刊的自引证率与自被引率进行相关性分析,结果表明,相关系数为0.362,P=0.000,两者具有较弱的正相关性。自引证率与自被引率的散点图如图1所示。
图1 自引证率与自被引率的散点图
考察2014年JCR收录的119种食品科技类SCI来源期刊的自引证率、自被引率与期刊影响因子的相关性,结果表明:自引证率与影响因子的相关系数为0.202,P=0.027,两者具有非常弱的正相关性;自被引率与影响因子的相关系数为_0.183,P=0.046,两者具有极弱的负相关性。
本研究所得自被引率与影响因子的相关系数(_0.183)与文献[8]报道的2002年JCR的5876种自然科学期刊的自被引率与影响因子的相关系数(_0.192)十分接近,且均为负值。文献[14]表明,2006—2010年48种我国外科学类期刊的自引证率与影响因子呈正相关性,文献[15]也表明,高自引证率对影响因子有正向影响,本研究也表明自引证率与影响因子具有正相关性。由此可见,自引证率是影响因子的正向指标,自被引率是影响因子的反向指标。
从定义上看,学术期刊的自引证率与自被引率虽然分子同为自引频次,但分母不同,前者为参考文献量,后者为总被引频次,显然两者的含义不同。因此,从理论上讲,两者应予以区别,分开使用。
从2014年JCR收录的食品科技类SCI来源期刊的自引证率与自被引率的实际数据来看,在119种来源期刊中,83.2%(99种)的期刊的自被引率大于自引证率,16.0%(19种)的期刊的自被引率小于自引证率,0.8%(1种)的期刊的自被引率等于自引证率。期刊FOOD SCI TECH-BRAZIL的自被引率(0.438)是其自引证率(0.009)的 48.6 倍,期刊FOOD TECHNOL-CHICAGO的自引证率(0.014)是其自被引率(0.003)的4.7倍。因此,从单个期刊实例来看,期刊的自引证率与自被引率相差甚远,两者也应加以区分。
从自引证率与自被引率的散点图(图1)可以看出,119种食品科技类SCI来源期刊在散点图上分布较为零乱,自引证率与自被引率的相关性较弱,相关系数仅为0.362。因此,从统计学上讲,自引证率与自被引率的相关性不强,两者不能相互替代,也应加以区分。
一般来说,自引证率表征期刊的开放性与稳定性,自引证率高,说明期刊开放性弱、稳定性好;自被引率表征期刊的显示度与影响力,自被引率高,表明期刊的显示度低、影响力弱。
不同自引证率、自被引率的期刊具有不同的特征[16],具体有以下4 种情况。
(1)自引证率高、自被引率高的期刊。这类期刊主要是自己引用自己的文献,其他期刊引用的较少,表明期刊报道方向、选材范围比较稳定,期刊与其他刊物学术交流不够,开放性不够,自我封闭性较强,或者期刊自身专业性太强,报道范围较窄。如期刊JDAIRY SCI,它的自引证率为0.270,是119种食品科技类SCI来源期刊中最高的,它的自被引率为0.240,在119种期刊中排第17位,它的影响因子为2.573,在119种期刊中排第22位,位于Q1区间。该期刊是自引证率与自被引率均高的典型期刊,属于专业面较窄的专业期刊,在SCI来源期刊中只有5种同类期刊。
(2)自引证率高、自被引率低的期刊。这类期刊主要是引用其自身的文献,同时也被其他期刊广泛引用,表明期刊选材范围稳定,常被其他刊物所引证,与其他刊物学术交流充分,期刊的学术地位较高,是同行中的优秀期刊。如期刊J AGR FOOD CHEM,它的自引证率为0.119,在119种期刊中排第11位,它的自被引率为0.084,在119种期刊中排第56位,它的影响因子为2.912,在119种期刊中排第13位,位于Q1区间。该期刊是食品科技类SCI来源期刊中的佼佼者,该刊的Eigenfactor score排名第一,是行业类公认的优秀期刊。
(3)自引证率低、自被引率高的期刊。这类期刊主要是引用其他刊物的文献,自身的文献被其他刊物引用的较少,表明期刊用稿的连续性较差,与其他刊物的学术交流不充分,期刊的学术水平非常一般。这类期刊数量较多,这里不一一列举。
(4)自引证率低、自被引率低的期刊。这类期刊主要是引用其他刊物的文献,同时也被其他刊物广泛引用,表明期刊的报道范围广,内容丰富,期刊面对众多的水平相当的竞争对手,或者期刊是以总结评论其他文献为已任的综述评论性期刊。如期刊INT J FOOD SCINUTR,它的自引证率为 0.007,自被引率为0.025,影响因子为1.206,在119种期刊中排第63位,居于中间位置,该期刊学术交流充分,具有较强的竞争力。另外,综述类期刊如 FOOD REV INT、CRIT REV FOOD SCI、FOOD ENG REV等都是典型的自引证率低、自被引率低的期刊。
由此可见,高自引证率、低自被引率是优秀期刊具有的特征,这类期刊是办刊人心目中的好期刊。需要说明的是,本文仅就某一具体学科的自引证率与自被引率进行了实证研究,其他学科是否具有相同的情况,有待于进一步的研究。提醒读者注意的是,只有期刊自引在未被人为操纵的情况下,有关文献计量学指标才有参考意义。
[1]王凌峰,叶涯剑.期刊影响因子操纵行为及抑制策略[J].编辑学报,2012,24(6):567_570.
[2]Yu Guang,Wang Liang.The self-cited rate of scientific journals and the manipulation of their impact factors[J].Scientometrics,2007,73(3):321_330.
[3]李建辉,王志魁,徐宏,等.自引对科技期刊影响因子作用的量化研究[J].编辑学报,2007,19(2):154_157.
[4]郭建顺,张学东,李文红,等.我国科技期刊的高自引率及其不合理自引的甄别[J].中国科技期刊研究,2010,21(4):455_458.
[5]莫京,任胜利.国内外科技期刊的期刊自引对比分析[J].中国科技期刊研究,2005,16(5):655_657.
[6]张玉华,潘云涛,马峥.科技期刊自引情况的国际对比研究[J].编辑学报,2005,17(1):74_78.
[7]刘雪立,周志新,方红玲,等.2005—2007年我国医学期刊自引率与过度自引的界定[J].中国科技期刊研究,2009,20(4):624_626.
[8]McVeigh ME.Journal self-citation in the journal citation reports:science edition (2002)[R/OL].[2016_04_10].http://wokinfo.com/essays/journal-self-citation-jcr/
[9]Garfield E.Journal citation reports[R/OL].[2016_04_10].http://citeseerx.ist.psu.edu/viewdoc/download? doi=10.1.1.294.7109&rep=rep1&type=pdf.
[10]Garfield E.Journal citation studies.XVII.Journal self-citation rates—there's difference[J/OL].Current Contents,1974(52):5_7[2016_04_10].http://www.garfield.library.upenn.edu/essays/v2p192y1974_76.pdf.
[11]金铁成.此自引率,非彼自引率——学术期刊的自引证率与自被引率错引举隅[J].编辑学报,2016,28(3):251_252.
[12]金铁成.是自引证率,还是自被引率?——对加菲尔德的期刊自引率论断的考证[J].中国科技期刊研究,2016,27(7):704_707.
[13]Thomson Reuters.Journal Citation Reports[R/OL].[2016_04_10].http://admin-apps.webofknow ledge.com/JCR/JCR?RQ=HOME.
[14]李贺琼,邵晓明,杨玉英,等.2006—2010年我国48种外科类期刊自引率及其与影响因子和总被引频次的关系[J].中国科技期刊研究,2013,24(5):876_884.
[15]Fassoulaki A,Paraskeva A,Papilas K,et al.Self-citations in six anaesthesia journals and their significance in determining the impact factor[J].British Journal of Anaesthesia,2000,84(2):266_269.
[16]罗式胜.文献计量学概论[M].广州:中山大学出版社,1994:190_195.