载文量下降下单篇论文长度与被引次数关系研究

2021-01-15 13:17俞立平
现代情报 2021年1期
关键词:影响因子

收稿日期:2020-01-23

基金项目:浙江省自然科学基金重点项目“制造业从数量型创新向质量型创新转型机制研究”(项目编号:Z21G030004);浙江省一流学科A类项目(浙江工商大学统计学,管理科学与工程)。

作者简介:俞立平(1967-),男,教授,博士,博士生导师,研究方向:技术经济、科技评价。

摘 要:[目的/意义]学科核心期刊载文量下降现象需要引起重视,有必要在此背景下分析论文篇幅与被引之间的关系。[方法/过程]本文提出篇幅影响因子的概念,采用普通回归与分位数回归,基于CNKI引文数据库,对CSSCI数据库收录的17 275篇经济学期刊进行了系统分析。[结果/结论]研究结果表明:学科期刊载文量下降现象需要引起足够的重视;篇幅影响因子与论文篇幅无关;论文篇幅与被引无关;关于论文篇幅与被引关系的研究方法有待改善;建议将载文量作为CSSCI评价指标。

关键词:载文量;论文篇幅;影响因子;被引频次

DOI:10.3969/j.issn.1008-0821.2021.01.016

〔中图分类号〕G302 〔文献标识码〕A 〔文章编号〕1008-0821(2021)01-0137-07

Research on the Relationship Between Paper Length and

Citation in the Background of the Volume of Publication Paper

Yu Liping

(School of Statistics and Mathematics,Zhejiang Gongshang University,Hangzhou 310018,China)

Abstract:[Purpose/Significance]It is necessary to pay attention to the phenomenon of the decline of the volume of publication paper of academic core journals,and it is necessary to analyze the relationship between the length of the paper and the citation in this context.[Method/Process]This paper put forward the concept of length impact factor,adopted general regression and quantile regression,and systematically analyzes 17275 economic journals included in CSSCI database based on CNKI citation database.[Result/Conclusion]The results showed:The phenomenon of the decline of the volume of publication paper of academic journals should be paid enough attention;The length impact factor had nothing to do with the length of the paper;The length of the paper has nothing to do with citations;The research method of the relation between the length of the paper and citation needed to be improved;It is suggested that the volume of publication paper should be taken as the evaluation index of CSSCI.

Key words:the volume of publication paper;paper length;impact factor;citation frequency

學术论文是知识和信息的重要载体,论文篇幅长短与知识信息量密切相关。然而不能简单用论文篇幅长短来表征知识和信息含量,这是个非常复杂的问题。进一步地,知识和信息量是难以计量的,所以人们往往通过论文的被引频次来间接评估论文的知识信息量,但这种研究只具有宏观意义,更适合用来评价期刊,即对单独的一篇论文而言,根本无法用被引频次来衡量其知识和信息量。在这种情况下,同行评议是一种相对有效的方法,但由于论文数量庞大,除了在期刊审稿中广泛应用外,同行评议不能用来从宏观角度评价论文的知识和信息量。

论文篇幅与期刊载文量密切相关,潜在影响期刊影响因子。在期刊版面相对固定的情况下,载文量增加意味着论文篇幅的减少。根据影响因子的计算公式,影响因子是期刊过去两年发表的论文在统计当年的平均被引频次,如果载文量增加,势必增加分母,从而降低影响因子。当然这个判断的前提条件是载文量增加时,作为分子的被引频次不变或增加较慢,当优秀论文载文量增加后,影响因子反而可能会提高。论文篇幅与被引频次的关系问题必然会涉及到载文量与影响因子的关系问题,本文将两者放在同一框架下进行分析,如图1所示。论文篇幅与被引频次的关系属于局部或微观问题,以论文为对象,而载文量与影响因子关系属于整体行为,一般以学术期刊为对象。

近年来,一些学科载文量出现了大面积下降现象。以中国知网收录的经济管理类论文为例,1998—2018年载文量变化情况如图2所示。大致可以分为3个时期,第一个时期是1998—2002年,处于起步阶段,载文量大致不变;第二个时期是2003—2009年,处于快速增长期,载文量从21 689篇快速增加到43 341篇,平均每年增加12.23%;第三个时期是2010—2018年,载文量开始直线下降,2018年载文量为30 913篇,相比2009年的极大值下降了28.67%。除非某种特殊情况,或者是经济管理类学科发展本身出现了问题,这种长时间载文量持续下降的现象可能是有问题的。

研究论文篇幅与被引频次、载文量与影响因子的关系具有重要意义。第一,有利于发现现实背景下论文篇幅与被引频次的关系,分析其中的特征,发现可能潜在的问题。第二,进一步研究载文量与影响因子的关系,分析其中的内在特征,从而对载文量下降的原因做进一步思考。第三,在以上基础上提出相关政策建议,为合理控制载文量,保证学术期刊的知识和信息量、规范学术期刊行为提供参考。本研究也进一步深化了文献计量学的理论与应用,因而具有十分重要的价值。

关于论文篇幅的长短问题,李睿[1]认为,论文的核心在论证,所以应该关注论证质量,而不是刻意增大篇幅。肖地生等[2]指出,优秀论文的产出基本是一个常数,但不平均分配,需要各期刊竞争争取,不可盲目通过压缩载文量来提高影响因子,也不可盲目扩大载文量。韦青侠[3]研究了前几年载文量增加问题,认为其原因有3个,一是国家对各类课题的资助力度;二是科研院所评价机制和论文数量挂钩;三是部分期刊为了弥补办刊经费不足和提高编辑人员待遇。许力琴等[4]对71所高校2010—2017年自然科学学报的研究发现,16种期刊的载文量变化幅度较小,55种期刊的载文量明显减少,说明高校中文科技期刊的载文量“瘦身”现象比较普遍。赵均[5]则从信息密度角度讨论了期刊载文量问题,提出可以通过防止同水平内容重复,减少冗余信息,提高版式编排水平,精炼文字、图表,适当选择行距、字距和字号等方法来提高学术刊物的信息密度。

关于论文篇幅或载文量与论文被引之间的关系,Haslam N等[6]对社会与人格心理学37种期刊1 580篇论文的研究,发现较长论文被引用较多,但其优势与其篇幅不成比例。Robson B J等[7]研究发现,论文篇幅是被引频次重要的影响因素之一。Vieira E S等[8]也发现,论文篇幅会直接影响论文的引用。盛丽娜等[9]对4个医学学科论文研究发现,当论文长度小于25页时,论文篇幅与被引频次显著正相关,随着论文长度增加,出现高被引论文的比率开始降低。

关于载文量与影响因子的关系,黄明睿[10]基于2014年版《中国科技期刊引证报告(核心版)》收录的1 989种期刊研究发现,载文量与期刊的学科影响指标及学科扩散指标正相关。张文娟对《中文核心期刊要目总览》(第5版)19种图书馆情报学期刊2003—2009年的论文研究发现,统计范围内的期刊学术影响力与期刊载文量呈负相关。刘晨霞等[11]对农业类18种期刊研究发现,当载文量在300~700篇时,影响因子与载文量呈反向关系,其他情况下呈正向关系。

还有一些研究认为,载文量与影响因子无关,俞立平等[12]对改革开放以来情报学期刊影响因子与载文量的关系研究发现,两者发展周期基本同步,分为同步上升、波动发展、调整提升3个阶段;情报学期刊载文量与影响因子无关。简琳等[13]对6个学科455篇论文的研究发现,在多学科背景下,论文长度对文献被引沒有显著影响。贾志云[14]对19个领域期刊分析发现,综述性期刊的影响因子不受载文量的影响,在研究性期刊中,当影响因子小于1时,影响因子与载文量无关;当影响因子大于1时,42%领域期刊影响因子与载文量正相关,58%领域期刊影响因子与载文量无关。

从现有的研究看,关于论文篇幅问题,学术界普遍认为论文应以学术质量为第一要务,重在创新,篇幅长度不应该作为论文的一个重要表征指标。任意人为缩短或延长论文篇幅均是值得商榷的,论文应该以知识和信息量作为主要标准。关于论文篇幅与被引频次的关系,学术界倾向认为呈正相关关系。关于载文量与影响因子的关系研究,学术界研究结论并不一致,大致分为两种观点,一种观点认为载文量与影响因子负相关,这可能是近年来许多期刊降低载文量的重要原因。另一种观点认为载文量与影响因子无关。总体上,在以下几个方面有待深入。

第一,从论文篇幅角度,现有研究倾向于认为长篇论文拥有较高的被引频次,而一些研究认为影响因子与论文篇幅负相关,这两个结论是互相呼应的,本质上是一致的。但是,由于研究对象国别不同、学科不同、时间跨度不同、方法不同,不能简单加以归纳并得出结论。

第二,从研究方法角度,在分析论文篇幅与被引频次、载文量与影响因子关系时,有的采用简单统计比较,有的采用相关分析,有的采用回归分析,一些研究的样本量偏小,一些研究并没有进行统计检验,或者并不关注拟合优度,因此研究结论不够稳健,需要采用大样本进行深入的全方位研究。

第三,关于论文篇幅或载文量与被引之间关系的研究,缺乏进一步细致的分析,比如,对于不同水平被引频次或影响因子的论文或期刊,论文篇幅、载文量对其影响的弹性及其规律,鲜有这方面的研究。

本文以2019—2020年版经济学CSSCI期刊论文为例,提出篇幅影响因子,对论文篇幅与被引频次的关系、载文量与影响因子的关系进行全方位分析,在此基础上,对经济学学科CSSCI论文数量下降现象进行深入分析,并进行总结,提出相关政策建议。

1 研究方法与框架

1.1 篇幅影响因子

所谓篇幅影响因子,就是学科过去两年一定篇幅论文在统计当年的平均被引频次。用IFn表示,表示学科过去两年篇幅为n页的论文在统计当年的平均被引频次,其计算公式如下:

IFn=统计年度学科过去两年发表的长度为n页论文的被引次数学科过去两年发表长度为n页论文篇数(1)

比如经济学学科2018年IF15就表示经济学2016—2017年发表的所有长度为15页的论文,在2018年的平均被引频次。

需要说明的是,为了研究方便,暂不考虑论文的版心尺寸、字体大小、排版行距字距等因素的影响,如果相差较大,可以设置一定的转换系数。此外暂不考虑论文是否满页或者半页的影响,将其全部视同1页。这些问题当然会带来一定的误差,但在大样本情况下总体上是可控的。

需要说明的是,篇幅影响因子是学科宏观概念,一般不适用于期刊,这是因为期刊载文量有限,对于一般载文量200篇左右的期刊而言,计算篇幅影响因子意义不大,因此主要从学科角度进行分析。

2.2 研究方法

本文重点深入分析论文篇幅与被引频次、载文量与影响因子的关系。研究方法主要采用回归分析与分位数回归。分位数回归是Koenker Roger等[15]提出的,是一种根据因变量的条件分布来拟合自变量的特殊模型,是在传统平均值回归基础上的拓展。它根据因变量大小将其分为不同的分位,至于分位的方法,可以根据数据量的大小灵活掌握,然后研究自变量对不同分位因变量的影响,这样可以总结自变量弹性变化规律。

2.3 研究框架

本文从以下3个视角展开研究:第一,关于经济学论文篇幅与被引频次的关系,采用普通回归、分位数回归进行研究。第二,从学科层面,采用普通回归研究论文篇幅与篇幅影响因子之间的关系。第三,从期刊层面,研究载文量与影响因子的关系。

2 研究数据

本文的研究对象为2019—2020年版70种CSSCI核心期刊,之所以采用经济学期刊作为研究对象,是因为经济学是人文社科“皇冠上的一颗明珠”,经济学是一门科学,尽管目前经济学论文中有相当一部分并不涉及定量研究,与人文社科领域的其他学科类似。此外,经济学期刊是CSSCI核心期刊中学科期刊数量最多的,从而保证了研究的最大样本量。

本文被引数据来源于中国知网的引文数据库。为了能从影响因子角度做进一步的分析,本文论文数据为经济学期刊2016—2017年数据,统计年度为2018年。

对经济学期刊的论文需要进行清洗,删除了其中的会议通知、征稿启示、会议述评、名家介绍、书评等非学术论文,最终论文数量为17 275篇。

3 实证结果

3.1 数据分布及论文篇幅影响因子

经过统计计算和整理,论文篇数、被引频次、篇幅影响因子如表1所示。当论文篇幅大于36页时,每种篇幅论文数量已经不多,基本为1篇,计算篇幅影响因子没有意义,因此对论文篇幅大于36页的论文,采用平均页数计算篇幅影响因子。

从论文篇幅的频数看,基本上以6~12页的论文为主,当论文篇幅大于20页时,论文数量急剧下降。从篇幅影响因子看,当论文篇幅从2~5页变化时,篇幅影响因子有所提高,随后稳定,当论文篇幅大于16页时,篇幅影响因子处于急剧波动状态,其平均水平变化不大。

3.2 论文篇幅与被引频次的关系

图4为全部17 275篇论文的论文篇幅与被引频次的散点图,总体上两者相关度不大。论文篇幅在18页左右时,其被引频次最高。由于一些论文被引频次为0,无法取对数,因此全部加上1进行回归,结果如下:

从回归结果看,论文篇幅在1%的水平上通过了统计检验,其弹性系数为0.314,也就是说,论文篇幅每增加1%,其被引频次增加0.314%。然而这种结论是片面的,从模型的拟合优度看,R2仅为0.023,处于极低水平,由于被引频次的影响因素比较复杂,取决于研究热点、论文质量、学科差别等多种因素,论文篇幅仅仅揭示了被引频次的2.3%,几乎可以忽略不计。所以不能仅仅根据回归系数大小以及是否通过统计检验来分析变量之间的关系,拟合优度也是非常重要的因素。综合以上结果,可以发现论文篇幅与被引频次无关。

论文篇幅与被引频次的分位数回归结果如表2所示。当被引频次较低时(τ=0.1~0.2),即对于被引频次最低的20%论文,论文篇幅没有通过统计检验,说明论文篇幅与被引频次不相关。随着被引频次的升高,两者关系波动调整,而当被引频次从0.5分位开始,论文篇幅对被引频次的回归系数稳步提高,并且回归系数均通过了统计检验,如图5所示。但是这个结论也是片面的,从拟R2看,最高的也只有0.016,同样处于较低水平,说明即使采用分位数回归,也不能说明论文篇幅对被引频次具有多大的影响,两者几乎无关。

3.3 论文篇幅与篇幅影响因子的关系

根据表1计算得到的篇幅影响因子,可以分析论文篇幅与篇幅影响因子之间的关系,其散点图如图6所示,总体上两者有一定的正相关关系。其回归结果如下:

log(篇幅影响因子)=1.037+0.325log(论文篇幅)

(4.737***)(4.160***)(3)

n=36  R2=0.337

论文篇幅的回归系数为0.325,并且在1%的水平上通过了统计检验,模型的拟合优度为0.337,虽然偏低,但相对式(2)而言有明显改善。然而这种回归是不能说明问题的,从论文篇幅微观层面分析其与被引频次的关系,不能仅仅基于二次加工数据,尤其是经过适当归并后的数据。

3.4 期刊论文平均篇幅与影响因子的关系

期刊论文平均篇幅与影响因子的散点图如图7所示,总体上两者呈現弱正相关关系,其回归结果如下:

虽然期刊论文平均篇幅通过了统计检验,其弹性系数为0.372,但模型的拟合优度R2较低,只有0.092,也就是说,期刊论文平均篇幅与影响因子之间关系不大。

4 结论与讨论

4.1 学科期刊载文量下降现象需要引起足够的重视

改革开放以来,中国的经济发展取得了重要的成绩,尽管近年来增速放缓,但中国经济学总体上属于稳步发展阶段。在这样的背景下,经济学期刊载文量下降不是正常现象,尤其是在最近10年许多期刊还在扩版的情况下。一方面,刊发长篇论文做好精品是其中一个重要的原因,但另一方面,片面追求影响因子提高才是期刊载文量下降的主要原因。任由这个问题发展下去,必然会导致经济学期刊的知识和信息量下降,长期下去甚至会影响学科发展。

4.2 篇幅影响因子与论文篇幅无关

本文提出学科篇幅影响因子的概念,就是学科所有期刊一定篇幅论文的平均影响因子。实证研究结果表明,论文篇幅对篇幅影响因子的弹性虽然通过了统计检验,但拟合优度较低,此外还有一个重要原因是这是二次归并数据的回归结果,本身意义不大。本质上说明论文篇幅与篇幅影响因子无关。即长篇论文不一定拥有较高的影响因子,短篇论文也不一定拥有较低的影响因子,试图通过增加论文篇幅来提高影响因子是无效的。

4.3 论文篇幅与被引无关

基于经济学期刊17 275篇论文大样本数据,采用普通回归和分位数回归的研究结果表明,论文篇幅对被引频次的弹性尽管通过了统计检验,但是拟合优度极低。基于经济学70种期刊的研究结果表明,论文平均篇幅对影响因子的弹性虽然通过了统计检验,但同样拟合优度极低。以上充分说明,论文篇幅与被引无关,试图通过增加论文篇幅来提高影响力是无效的。

4.4 关于论文篇幅与被引关系的研究方法有待改善

之所以存在提高论文篇幅可以提高被引频次的错误认识,主要源于现有研究中一些错误的统计分析:分析论文篇幅与被引的关系,不能局限于小樣本,应该尽量采用大样本;不能采用简单的比较分析,应该进行更为全面的统计分析;不能仅仅看回归系数是否通过统计检验,还应该看拟合优度的高低;不能仅仅采用二手加工数据,应该结合一手数据进行分析。

4.5 建议将载文量作为CSSCI评价指标

本文从3个角度得到的研究结论趋于一致,即论文篇幅与被引无关,现有的试图通过增加论文篇幅来提高影响因子的做法是没有意义的。这种错误认识的纠正一方面需要主管部门加强管理,另一方面需要学术期刊自律,更需要调整核心期刊的评价手段,因为评价机制是指挥棒。目前的CSSCI核心期刊评价,采用总被引频次和影响因子两个指标进行评价,这难以有效防止期刊降低载文量。因此,建议增加载文量指标,并且赋予合适权重,从而从评价机制的角度对学术期刊载文量降低现象加以制约,以促进学术期刊健康发展。

本文的研究是基于经济学期刊得出的结论,由于样本量较大,应该说具有较好的代表性。至于其他学科期刊论文篇幅与被引的关系,或许呈现其他特点,因此有必要进行进一步研究。

参考文献

[1]李睿.大脑容量与论文篇幅[J].体育与科学,2014,35(6):28-32.

[2]肖地生,顾冠华.正确处理学术期刊中的两对关系[J].编辑之友,2017,(1):50-54.

[3]韦青侠.10年来我国科学、科学研究类核心期刊载文量与学术影响力评价分析[J].中国科技期刊研究,2014,25(1):35-38.

[4]许力琴,顾黎,周英智,等.中文科技期刊载文量“瘦身”现象的调查与建议——基于71种高校自然科学学报的统计分析[J].中国科技期刊研究,2019,30(5):443-450.

[5]赵均.载文量、信息密度作为期刊评价指标刍议[J].中国编辑,2013,(2):33-36.

[6]Haslam N,Koval P.Predicting Long-term Citation Impact of Articles in Social and Personality Psychology[J].Psychological Reports,2010,106(3):891-900.

[7]Robson B J,Mousques A.Predicting Citation Counts of Environmental Modeling Papers[C]//Proceedings of 7th International Environmental Modeling and Soft Ware Society,2014,San Diego,USA.

[8]Vieira E S,Gomes J.Citations to Scientific Articles:Its Distribution and Dependence on the Article Features[J].Journal of Informetrics,2010,4(1):1-13.

[9]盛丽娜,顾欢.基于学科角度的论文长度与被引频次关系研究[J].情报杂志,2019,38(4):111-118,110.

[10]黄明睿.载文量对科技期刊影响力评价的影响[J].中国科技期刊研究,2015,26(7):749-757.

[11]刘晨霞,魏秀菊,王柳,等.学术期刊影响力影响因素实证研究[J].农业图书情报,2019,31(7):66-73.

[12]张文娟.图书馆学、情报学核心期刊载文量与学术影响力关系分析[J].图书与情报,2012,(3):113-116.

[13]俞立平,宋夏云,王作功.基于时间序列数据的期刊影响因子与载文量关系研究——以情报学期刊为例[J].图书馆工作与研究,2018,(10):81-87.

[14]简琳,何静,周剑.论文被引的文本因素分析:多学科视角[J].图书情报工作,2011,(20):32-35.

[15]Koenker Roger,Gilbert Bassett.Regression Quantiles[J].Econometrica,1978,46(1):33-50.

(责任编辑:郭沫含)

猜你喜欢
影响因子
云雾物理生长过程及其影响因子的虚拟仿真实验
多元线性回归方程预测农村人均生活垃圾产量
“影响因子”是用来赚大钱的