20种图书情报期刊g、h指数的回归分析

2021-09-08 03:37周裕华
科学咨询 2021年26期
关键词:科研人员次数影响力

周裕华

[中共陕西省委党校(陕西行政学院)图书和文化馆 陕西西安 710068]

一、研究背景和现状

随着科技的发展,期刊数量随之爆炸性增长,为了更好更快更省的阅读到某一学科或专业领域期刊,核心期刊的概念被提了出来。英国文献学家布拉德福在 1948 年提出了“布拉德福定律(Law of Bradford),亦称“文献分散规律”;即将科技期刊杂志按其刊登的某种或者某类学科主题中论文的数量多少,以递减顺序排列,那么就可以在这些期刊杂志中区分出载文率最高的核心区、载文率相对较高的相关区和载文率很低的非相关区和接下来几区。若各个区的文章数量相等,则此时核心区、相关区、非相关区和接下来几区期刊杂志数量呈现1:a:a2:……的关系且(a>1)。国内的研究者邱均平在其2007年主编的《信息计量学》一书中认为,某领域(学科)的核心期刊是指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊或专业期刊[1]。核心期刊可以指导各单位进行高质量期刊的购买,科研工作者也可以通过核心期刊,更快更有效的找到自身所需要的信息,从而更有目的地阅读本专业影响力高的新颖文献,最后这些因素也可以反过来,促进核心期刊质量的提高。因此最近这些年各地都将在核心期刊发表论文,作为评价科研人员学术能力和科研水平的重要指标。正是因为这样,对核心期刊的测定方法和指标种类越来越多,传统的评价指标有期刊的总被引次数,载文量,影响因子等等。这些传统的评价指标,在衡量某一指标或者多个指标时,都倾向于关注科研人员其发表论文所刊登的期刊。因为在这个假设中,它们都假定这些科研工作者对期刊的贡献不低于期刊的平均值。为了改变这一现状2005年美国物理学家乔治·赫希提出h指数,h指数是一个混合量化指标,其目的在于具体量化个人科研工作者的研究成果。2006年,比利时著名科学计量学家埃格赫为了弥补指数不能很好反映高被引论文的缺陷提出了评价科学家学术成就的新指标g指数。本论文选取了《JCR 2018年版》图书情报领域前20种期刊,对g、h指标进行回归分析,为核心期刊的评定提供补充和参考依据。

二、相关概念

(一)h指数

2005年美国物理学家乔治·赫希提出h指数,h指数是一个混合量化指标,期初被用于评价个人科研工作能力上,指该科研人员在某个确定的时间范围之内所发表的论文中至少有h篇被引频次大于或等于h次的论文[2]。在评价期刊时,h指数在界定过程中需要满足一下三个条件:一是在期刊发表的论文中,有h篇被引用的论文;二是这h篇论文每一篇都必须至少被引用h次;三是除了这h篇之外的论文每一篇的被引数均需小于h[3],h指数可以从数量和质量两方面对期刊进行评价,此指数很难被突发性事件影响,此处的突发性事件是指增加自引、有少数几篇无引用或是引用次数极高的文章[4]。叶鹰也在书中认为,h指数将有可能发展成为下一代评价核心期刊的核心参数[5]。

(二)g指数

上文提到的h指数虽然能够体现出期刊较为稳定的影响力及参数值,但是却有一个较大的漏洞——忽视了期刊中高被引论文的作用。基于这一评价缺陷,比利时计量学家Egghe结合日常工作需要,于2006年提出了g指数。与h指数不同,要得出g指数,首先需要将论文按照被引次数降序排列,同时按照序列对被引次数进行累加运算得出数值α;接着对所得序号进行平方运算得出数值β;当运算到某一序号,其平方值βg等于该序号所对应论文的被引次数累加值αg时,此序号即为g指数。如果演算完成之后,最后一个位次的平方值βn依然小于其所对应的被引次数累加值αn,此时就将两者差额最小的序号定义为g指数。g指数能够较为客观地反映出高被引论文的作用,弥补了h指数稳定有余但精度不够的缺陷。

三、数据来源

普赖斯曾指出,期刊在发表1~2年后才被人们所认知和接受,故加菲得(Eugene Garfield)在1960年提出了影响因子这一个概念,影响因子(impact factor,IF)即指某一种期刊在其前两年发表论文,在其发表报告的年份(JCR year)中被引用总次数除以该期刊在这两年内发表的所有论文之和[6]。因此本文选用2018版的JCR中限定学科为INFORMATION SCIENCE &LIBRARY SCIENCE选取其中前20种。

相对于h指数,g指数更关注科学家的高影响力论文,同时兼顾了高被引论文的频次。因此g指数在对期刊评价中取得了成功的推广和相当范围内的运用,更具有很高的实证基础[7]。因此本文以g指数为因变量,通过散点图和一次,二次,三次,对数进行回归拟合分析,其与h指数的相关关系。

四、g指数与h指数的相关回归分析

以g指数为因变量,h指数为自变量画散点图,然后分别以h指数的二次,三次,对数为自变量作散点图,见图1。建立g指数与h指数之间的一元,二元,三元,对数方程,模型检测报告和拟合效果见表1。

图1 g指数与h指数的回归曲线

表1 g指数与h指数的回归分析结果

由表1可看出,四个模型的P值均为0.00,小于0.05,通过了显著性检验,从拟合优度的优劣来看,一次拟合效果最好,为0.98,回归方程为y=1.73x-5.34。从散点图可看出,h指数和g指数的线性关系特别明显,各点几乎连接成了一条直线,解释出现的这一现象时,是因为h指数在评价科研人员之时,较好地综合了科研人员发表文章的数量和影响力;而g指数则是在h因素的基础上更加优化的评价指标,使其更加合理和科学化[7]。通常情况下我们可以认为某种期刊杂志的h指数越高,其相对应的g指数也应该越大越高。同时由于考虑到层层累加这一效应,g指数一般都高于h指数。此外,随着时间的增长,引用数据的量也随着在累积,某种期刊中g指数应该变大或者不变,但是不可能变小,这是由其定义所决定的。正如上文所述的那样,我们也有充分的理由相信,h指数和g指数将会使得传统的引文评价系统更加科学,从而更加有效的评价科研人员的科学活动[8]。

五、结论

(一)g指数可以弥补影响因子的缺陷,衡量一种期刊的长期的学术影响力,某期刊可能由于“睡美人”效应在测评的两年内被引次数较少,但是随着时间发展可能被引次数累积较多;

(二)h指数,g指数都体现了高被引文献对期刊的影响力,g指数可以更加完美的体现出期刊影响力高低的指标即被引次数;而h指数可以更加完美的反映出期刊的数量次数即论文数量[9]。故h指数对于单篇被引频次很高的一篇或几篇论文不敏感,但是在期刊h指数相同的情况下,g指数越大的期刊就是被引频次越高的期刊;当期刊h指数处于同一水平时,可以使用g指数进一步区分期刊学术影响力的大小。

猜你喜欢
科研人员次数影响力
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
最后才吃梨
俄罗斯是全球阅兵次数最多的国家吗?
天才影响力
企业科研人员激励问题及对策研究
黄艳:最深远的影响力
3.15消协三十年十大影响力事件