第一作者和合著者的生产力、影响力与论文被引频次的相关性对比研究

2024-03-19 00:36方红玲张亚杰徐自超
中国科技期刊研究 2024年2期
关键词:生产力影响力数量

■方红玲 张亚杰 徐自超

1) 新乡医学院河南省科技期刊研究中心,河南省新乡市金穗大道601号 453003

2) 新乡医学院期刊社,河南省新乡市金穗大道601号 453003

论文是科研工作者学术研究成果的重要表现方式,也是推动学术研究创新、评价学者学术水平、促进学术交流合作和学科建设发展的重要载体。对论文进行评价不仅关系着论文本身的价值界定和学术环境的健康发展,也关系着学者的评价晋升和期刊的排名升级。随着我国科技水平的提高和学术研究的深入,一些国际上通用的论文评价标准也逐渐被采用。目前,论文的评价方法主要包括同行评议法、同级别期刊论文数量分析法、影响因子分析法和被引频次分析法[1]。其中,同行评议是科学发展的基石,指某一或若干领域的专家采用具有普遍性的、客观的评价标准,共同对涉及相关领域的一项事物进行评价,从而考察研究的可靠性,评估研究的创新性和重要性[2]。秦成磊等[3]认为同行评议报告中正面评价、负面评价的分布情况与其对应论文的被引频次存在相关性,被引频次一定程度上能够反映论文的学术质量。同级别期刊论文数量分析法通过分析作者在某级别期刊上的发文量来评价科研人员的科研能力和学术水平,该方法虽然操作简便、分析客观,但也容易引起较大争议。影响因子则是指某刊前两年所发表的论文在统计当年的平均被引频次,被广泛应用于期刊评价。一般来说,某期刊的影响因子越高,期刊影响力越大,论文的质量也就越高。影响因子分析法相对于主观评价更加公平和客观,但也存在明显缺陷,经常被滥用和误用[4-5]。首先,引证窗口期仅为两年,许多期刊论文很难达到引用峰值;其次,没有统一文献类型,也没有考虑论文的偏态分布和过度自引[6]。尽管影响因子并不完美,但是许多学者仍认为其无法替代[7-8]。

随着科学计量学的发展和进步,论文被引频次已成为相对客观的学术价值参考指标[9]。被引频次的确可以衡量一篇学术论文在学术界得到的关注度和认可度,也就是说,受到更多关注和认可的论文质量也相对较好。然而,论文被引频次受到学科领域、发表时间、栏目类型等影响而存在着较大的动态差异,这使得论文引用差异的成因成为学术界关注的热点。俞立平等[10]综合采用多个预测模型来研究期刊论文下载量与被引频次之间的关系,发现论文被引频次主要受滞后2期的下载量影响;不同期刊下载量对被引频次的影响呈现趋同趋势,且下载量对被引频次的影响呈现非线性门槛特征。郭进京等[11]认为即时开放获取(Open Access,OA)能促进论文被引频次和下载量的提高,并建议通过基金资助、期刊向即时OA转变等方式推动论文即时OA发展。以往研究大多从期刊或论文等角度出发来探求论文被引频次的影响因素,很少探究作者对论文被引频次的影响。但实际上,作者作为论文的产出者,其研究思路和偏好直观反映在学术论文中,继而影响论文的被引频次。另外,随着学术研究的深入和学科的融合,多数论文不再是单一作者的产出,而是多个作者的共同成果。因此,有必要探究论文作者的生产力、影响力及作者数量对论文发表后被引频次的影响。基于这样的思考,本研究利用《编辑学报》和《中国科技期刊研究》2017年发表的484篇论文作为基础数据,比较学术论文第一作者和合著者的生产力、影响力与论文发表后被引频次的相关性差异,从而为期刊编辑初审时筛选高被引论文提供一定的参考。

1 研究对象与方法

1.1 研究对象选取

《编辑学报》和《中国科技期刊研究》是我国期刊编辑非常关注和熟知的编辑出版类期刊,在国内学术影响力较高,发表了我国编辑出版知名学者的学术成果。因此,选择《编辑学报》和《中国科技期刊研究》发表的论文作为研究对象。论文的被引频次峰值一般出现在发表后5~6年[12],因此选取2017年为论文的发表年份。经过进一步筛选,共选取《编辑学报》和《中国科技期刊研究》2017年发表的484篇论文作为研究对象,其中合著论文342篇、独著论文142篇。

1.2 研究方法

1.2.1 数据获取

登录中国知网,选择高级检索,以“文献来源”为检索项、“中国科技期刊研究”和“编辑学报”为检索词、OR为关联词进行检索,并将论文发表时间限定为2017年,收集484篇论文的标题、所有作者、来源出版物、发表时间、被引频次等信息,导入Excel工作表。数据收集时间为2023年5月22—26日。

1.2.2 作者相关数据获取

为观察作者生产力、作者影响力与论文被引频次的相关关系,对484篇论文的作者进行拆分,并将每一位作者视为第一作者,计算其在2014—2020年的生产力和影响力。具体数据获取方法如下:首先登录中国知网,选择高级检索中的作者发文检索,以“第一作者”和“作者单位”为检索项、AND为关联词进行检索,并将论文发表时间限定为“2014-01-01至2020-12-31”,最终获取该时段作者的发文量和h指数,以发文量和h指数分别代表作者的生产力和影响力。

1.2.3 相关指标选取

学术论文的内容体现作者的核心思想和兴趣偏好,学术论文的数量则反映作者的研究程度和能力水平。一般来说,作者发文量越多,其研究越深入,研究能力越高,故用发文量来表征作者的学术生产力。h指数是一种评价作者学术成就的新方法,其内涵是:一位作者发表的所有论文中有h篇至少被引h次,其余论文每篇被引小于h次。作者的h指数越高,论文影响力越大,因而用h指数来表征作者的学术影响力。

1.3 统计学处理

采用 SPSS 26.0软件进行统计学处理。数据的正态性分析采用Kolmogorov-Smirnov(K-S)检验方法,作者生产力、影响力与论文被引频次的相关性分析采用Spearman相关分析法。采用线性回归分析法验证作者生产力、影响力对论文被引频次的影响效果,并参考方差膨胀因子(Variance Inflation Factor,VIF)检查自变量的共线性效果。一般情况下VIF低于5说明自变量之间不具有共线性,可以进行回归分析。

2 结果与分析

2.1 独著论文作者生产力、影响力与论文被引频次的关系

对142篇独著论文,在中国知网中以第一作者的身份检索每一位作者在2014—2020年的发文量和h指数,视为其生产力和影响力。由于文章篇幅所限,表1仅列出了被引频次排名前5和后5的论文的被引频次及作者的生产力、影响力。从表1可以看出,论文被引频次最大值为92,最小值为0;作者生产力最大值为31,最小值为1;作者影响力最大值为10,最小值为0。Kolmogorov-Smirnov 检验结果显示,独著论文的被引频次与作者生产力、影响力均不呈正态分布(P<0.001)。因此,对数据进行Spearman检验,相关系数为r。结果显示:独著论文作者生产力与论文的被引频次之间无相关性(r=0.163,P=0.053);独著论文作者影响力与论文被引频次呈正相关(r=0.287,P<0.001)。为了进一步解释独著论文作者的生产力、影响力对论文被引频次的影响效果,以被引频次为因变量进行线性回归分析,如表2所示。独著论文作者的生产力、影响力的VIF均小于5,说明其与被引频次之间不存在共线性,同时独著论文作者的生产力与影响力的标准化系数分别为-0.051和0.290。

表1 独著论文被引频次及作者生产力、影响力的分布情况

表2 独著论文被引频次及作者生产力、影响力的回归分析结果

2.2 合著论文的作者生产力、影响力与论文被引频次的相关性

由于篇幅限制,表3 仅列出了342 篇合著论文中被引频次排名前5 和后5 的论文的被引频次及作者的生产力、影响力。从表3可以看出,合著论文被引频次最大值为78,最小值为0;合著论文中第一作者生产力最大值为14,最小值为1;第一作者影响力最大值为7,最小值为0。合著论文中合著者生产力最大值为35,最小值为0;合著者影响力最大值为10,最小值为0。Kolmogorov-Smirnov 检验结果显示,合著论文的被引频次,第一作者生产力、影响力及合著者生产力、影响力均不呈正态分布(P<0.001)。因此,对相关数据进行Spearman 检验,结果(表4)显示合著论文的第一作者生产力(r=0.195)、影响力(r=0.320),合著者生产力(r=0.115)、影响力(r=0.134)与合著论文的被引频次均有相关性(P<0.001)。其中,合著论文的第一作者影响力与论文的被引频次的相关性最高(r=0.320)。进一步进行回归分析发现,VIF均小于5,说明第一作者生产力、影响力,合著者生产力、影响力之间不具有共线性,且第一作者生产力与论文被引频次明显负相关,第一作者影响力与论文被引频次显著正相关,而合著者生产力与影响力对论文被引频次的影响效果均较小,如表5所示。

表3 合著论文被引频次及作者生产力、影响力分布情况

表4 合著论文被引频次与作者生产力、影响力的相关性检验结果

表5 合著论文被引频次及作者生产力、影响力的回归分析结果

2.3 论文作者数量与论文被引频次的关系

484 篇样本论文中包含142 篇独著论文和342篇合著论文,从上文可知合著论文的被引频次受第一作者影响力影响较大,与合著者生产力、影响力均呈弱正相关,因此怀疑论文作者数量对论文被引频次存在某种程度的影响。为了验证这个假设,对484篇论文的作者数量进行统计。因篇幅所限,表6仅列出了被引频次排名前10 的论文的被引频次及作者数量。从表6 可以看出,论文被引频次最大值为92,作者数量最大值为5。Kolmogorov-Smirnov检验结果显示,论文被引频次与作者数量均不呈正态分布(P<0.001)。Spearman 检验显示,论文被引频次与作者数量之间无显著相关性(r=0.021,P=0.645)。回归分析显示论文作者数量对被引频次无提升作用。

表6 论文的被引频次及作者数量分布情况

3 结论与讨论

论文被引频次直观反映了论文的关注度和影响力,但其不是单一因素作用的结果,而是多因素共同作用的产物。论文被引频次的影响因素主要涉及论文、作者、期刊等方面,例如论文本身的热度[13]和新颖度[14]、参考文献的数量[15]和多样性[16]、作者数量[17]和影响力[18]、期刊的影响因子[19]和生产力[20]等。通过对论文被引频次的影响因素进行相关性分析,能够有效探究各因素对论文被引频次的影响效果,从而进一步寻求提升论文质量和影响力的方法。国内有研究提出,同一年不同月份发表的学术论文6年后被引频次的差异无统计学意义,不同发表月份对论文被引频次的影响可以忽略[21]。因此,选取2017年《中国科技期刊研究》《编辑学报》发表的484篇论文作为研究对象,探讨第一作者和合著者的生产力、影响力与论文发表后被引频次的相关性差异。

3.1 独著论文作者生产力、影响力与论文被引频次的相关性分析

作者作为学术论文的产出者,其生产力和影响力在一定程度上影响论文的被引频次。刘顺等[22]在探究2005—2014年中国马克思主义的研究动向时发现高产作者与高被引作者并不完全吻合,高生产力作者的论文并不必然有较高的被引频次,较少的发文量也并不一定导致较低的被引频次。Bornmann等[23]发现具有相同内在价值的论文因作者身份不同而有不同水平的被引频次,高影响力作者能够获得更多引用。Thelwall[24]认为高影响力作者比高生产力作者更能带来团队合作的成功,作者影响力对论文被引频次有更好的提升作用。本研究则表明独著论文作者的生产力对论文的被引频次无显著影响,较高发文量并不等同于较高的论文质量和被引频次;而作者影响力对论文被引具有正向影响,作者的影响力越高,论文越容易得到同行认可,从而获得较高的被引频次。以上研究均证实了作者生产力与论文被引频次之间并无显著相关关系,而作者的高影响力则会促进论文被引频次的提升。

3.2 合著论文作者的生产力、影响力与论文被引频次的相关性分析

科学研究的深入和学科的交叉融合使得学术论文凝聚了更多学者的智慧与思考,也不再仅是单一作者的产出,而是团队合作的成果。Yu等[25]基于逐步回归分析对科技论文的引文影响力进行预测,结果表明第一作者的生产力和影响力对论文被引频次的影响较小。魏开洋等[26]借助合著网络,将h指数排名靠前的高学术影响力作者视为明星作者,发现明星作者对合著论文的被引频次具有显著正向影响,对创新力具有较轻微的负向影响。本研究主要探究合著论文第一作者与合著者对论文频次的影响效果。研究表明:第一作者的高发文量并不能带来更多的被引频次,相反还会影响论文被引频次的增加;而第一作者的高影响力能够推动论文获得更高的被引频次;合著论文被引频次受合著者生产力、合著者影响力的影响不大。因此,合著论文中,作者的署名位置和合著网络不同,作者对论文被引频次的影响效果也不同,且相对于作者生产力而言,作者影响力对论文被引频次的影响更大。

3.3 论文作者数量与论文被引频次的相关性分析

近年来,学者就作者数量与论文被引频次之间是否具有相关关系开展了大量研究。大多数研究人员认为二者之间存在正相关关系,作者数量的增加能够提高论文的影响力和被引频次[27-30]。黄雪梅[31]在探究科研合作对高等教育领域产出论文被引频次的影响时发现,合著论文被引频次随作者数量的增多而提高,且作者地理邻近与社会邻近对合著论文被引频次有显著正向影响。部分学者则持反对意见,认为作者数量与论文被引频次无关[32-33]。科研合作虽然有助于高质量合著论文产出,但作者数量多不意味着论文被引频次高。王黎明等[34]基于《图书情报工作》2015年发表的论文探究作者数量与被引频次的关系,发现作者数量与被引频次之间不存在线性关系,作者数量对被引频次几乎无影响。陈悦等[35]认为作者数量和论文被引频次之间呈现“倒U”关系,也就是说存在最佳的合著规模。本研究通过相关性检验表明作者数量和论文被引频次之间不存在显著相关关系,论文被引频次并不受作者数量的影响。由此可见,对于作者数量与论文被引频次是否具有相关关系尚未有统一答案,相关程度的界定可能受到论文所属学科领域、年份、类型等诸多因素的影响。

4 结语

本研究以484篇论文为样本数据,探求学术论文的作者生产力、影响力与论文被引频次之间的相关关系。结果显示:在独著论文中,论文的被引频次与作者生产力无关,与作者影响力呈正相关;在合著论文中,第一作者生产力、影响力与论文被引频次均呈正相关,论文被引频次与合著者生产力、影响力也均呈正相关。结果提示,期刊编辑初审稿件时可以利用数据库查询作者的h指数,h指数高的作者撰写的论文在发表后可能获得较高的被引频次,而若合著者发文量较高,论文发表后被引频次也可能较高。但由于样本数据量较少,还需进一步验证研究结果的适用性。希望本研究结果能够为国内期刊编辑在初审稿件时筛选可能的高被引论文提供一定的参考依据。

猜你喜欢
生产力影响力数量
统一数量再比较
天才影响力
黄艳:最深远的影响力
把“风景”转化成“生产力
头发的数量
3.15消协三十年十大影响力事件
传媒不可估量的影响力
我国博物馆数量达4510家
人口红利与提高生产力
展望2014:推动科技创新转化为第一生产力