基于期刊使命的国际英文掠夺性期刊量化定义

2023-10-08 01:35王凌峰石维洁
中国科技期刊研究 2023年9期
关键词:英文阈值论文

■王凌峰 石维洁

桂林电子科技大学商学院,广西壮族自治区桂林市七星区金鸡路1号 541004

掠夺性期刊(Predatory Journal)一词最早由美国科罗拉多大学丹佛分校前图书馆员Jeffrey Beall 于2008年提出,Jeffrey Beall认为利用作者付费模式过度追求利润的期刊为掠夺性期刊。掠夺性期刊已成为一种全球现象,2022年3月Nature发表由Inter Academy Partnership(IAP)组织撰写的调查报告《打击掠夺性期刊和会议》(Combatting Predatory Academic Journals and Conferences),该报告引用Cabells公司数据,认为目前全球掠夺性期刊数量超过15500种,且从2010年开始,掠夺性期刊数量增速远快于正常期刊[1]。

掠夺性期刊在学术领域产生多方面危害:(1)污染学术文献,传播错误知识,主流期刊论文会引用在掠夺性期刊上发表的论文[2]。著名学术文献数据库 Scopus 收录了300多种疑似掠夺性期刊的论文,3年发表论文数量为16万余篇[3]。(2)浪费科研资源,很多发表在掠夺性期刊上的论文获得国家或地方政府基金资助。我国每年向国外支付的数十亿元发表费用中有一部分支付给掠夺性英文期刊[4]。(3)损害研究者、研究机构乃至国家的学术声誉。我国国际英文论文发表数量仅次于美国,其中部分论文在国际英文掠夺性期刊上发表,损害我国学术界国际声誉[5]。

为打击掠夺性期刊,需要具体定义掠夺性期刊[6]。作为掠夺性期刊研究的开创者,Jeffrey Beall使用特征归纳方法具体定义掠夺性期刊[7],提出向研究者发送投稿邀请邮件、发表论文之前不明确告知发表费用、期刊网站设计质量差等37个特征。Shamseer等[8]归纳了生物医学领域掠夺性期刊的13个特征。Eriksson等[9]归纳了部分学科掠夺性期刊的20个特征。Think.Check.Submit 网站的在线检查表(Online Checklist) 归纳了掠夺性期刊的14个特征。反掠夺性期刊网站predatoryjournals.com归纳了掠夺性期刊的10个特征。美国Loyola Mary Mound University发布The Journal Evaluation Tool网页,设置了用于评价一种期刊是否属于掠夺性期刊的16 个问题。

通过特征归纳定义掠夺性期刊的方法至少有4个缺点:(1)特征归纳分歧大。Cobey等[10]分析38个研究提出的109个掠夺性期刊特征,发现约60%的特征有所不同。(2)一些特征需要使用者自行判断,可能不同的人对同一期刊的判断结果不一致。(3)一些特征为掠夺性与非掠夺性期刊共有特征,如向作者发送投稿邀请邮件、快速发表等,没有区分价值。(4)面对数量巨大的国际英文期刊,逐一核实众多特征需要耗费很多人力与时间。

本文提出采用指标量化定义掠夺性期刊,指标、数据、步骤公开,不需要人工逐一对期刊进行判定,判定过程可以使用计算机程序快速完成,从而消除采用特征归纳定义掠夺性期刊的4个缺点。英文是最有代表性的国际通行语言,故国际掠夺性期刊多为英文期刊。本文讨论国际英文掠夺性期刊,其余语言期刊可类推。

1 研究设计

1.1 理论依据

著名科学社会学学者默顿(Robert K. Merton)视学术期刊为制度。期刊通过稿件登记、同行评议、编委会审读等机制,在研究者之间传播、分享有一定质量保障的研究信息。期刊不仅是传播知识的渠道,也是鉴定知识合法性的平台[11]。学术期刊至少有4个核心功能[12]:(1)注册,宣示研究优先权;(2)质量认证,通过同行评议对研究可靠性进行检验与评价,稿件通过同行评议则发表出版;(3)传播,让其他研究者知道新的研究发现;(4)存档,保存研究成果。其中,最重要的功能是通过同行评议完成对论文的质量认证。

在学术研究职业化、建制化的今天,期刊与作者之间的核心关系是:期刊为作者提供获得学术界普遍认可的同行评议、编辑和出版服务,作者为上述服务向期刊支付费用。当然一部分期刊有作者付费之外的其他经费来源而放弃收费,但这属于少数情况。因此,期刊缺乏保障论文质量的流程或者有论文质量保障流程但发表费用过高均妨碍其践行服务学术交流的使命。

基于上述讨论,可以考虑从两个方面量化定义掠夺性期刊,即期刊论文质量、发表费。

1.2 期刊论文质量与发表费的量化指标

1.2.1 期刊论文质量的3个量化指标

从3个方面量化期刊论文质量。

(1)设定影响因子下限。国内一项研究[13]对不同学科的332名博士研究生对掠夺性期刊特征的看法展开调查,发现被调查者提及次数较多的特征有10个,包括:发表文章速度非常快(80.33%)、发表文章门槛低(77.05%)、发表费用高(59.02%)、同行评议质量不高(50.82%)、期刊发文量过大(49.18%)、虚假影响因子(31.15%)、国际代表性期刊索引数据库未收录(31.15%)、没有官方网站(27.87%)、伪造编辑信息(26.23%)、伪造ISSN(21.31%)。上述10个特征分属期刊论文质量、发表费两个维度。若一种期刊影响因子高(除去过度自引的情况),则通常不具备发表文章速度非常快、发表文章门槛低、同行评议质量不高、发文量过大、虚假影响因子、国际代表性期刊索引数据库未收录、没有官方网站、伪造编辑信息、伪造ISSN等特征,此处采用期刊影响因子来代表上述特征。

(2)设定年发文量上限。一种期刊年发文量越大,则单篇论文之间的被引频次方差越大,因此论文质量波动大,期刊论文平均质量不容易保证。

(3)设定作者国别比例上限。多数情况下,有一定办刊质量的国际英文期刊的发文呈现多元化特征,某国主办的国际英文期刊中不应出现其他国家作者占比过高的情况。此处的作者国别比例指标为中国作者比例(不纳入港澳台地区作者)。当然,对我国主办的英文期刊不设定作者国别比例指标上限要求。

1.2.2 发表费量化指标

定义掠夺性期刊时是否应该考虑发表费指标?笔者在2020—2022年与一些欧美评议人出现观点分歧,评议人有3个典型观点:(1)商业出版社发行的期刊追求利润无可指摘。(2)高质量期刊收取高额发表费是合理的。一些评议人认为,Nature或NatureCommunications等知名期刊有权收取比其他期刊更高的发表费。(3)同意在定义掠夺性期刊时考虑发表费指标,但是认为不同期刊成本不同,因此难以确定合理的发表费水平。

观点1混淆了合理利润和过高利润。多数学术期刊销量少,为实现收支平衡收取必要费用,这是合理的,但收取过高费用则违背学术期刊的使命。学术界抵制期刊出版机构收取过高费用的事件频出,如2006年爱思唯尔(Elsevier)出版集团所属期刊《拓扑学》编委会抗议该刊收费过高,集体辞职创办新刊。爱思唯尔旗下另外一种期刊JournalofInformetrics篇均发表费为2400美元,该刊编委会辞职后创办新刊QuantitativeScienceStudies,发表费仅为JournalofInformetrics的1/3。

观点2不符合我国相关政策。根据NatureCommunications官网,该刊对中国作者收取与发达国家(地区)作者等同的发表费:目前中国作者的篇均发表费约为6300美元,合人民币4万多元,这远高于2020年科技部《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》的上限要求——一篇论文的发表费原则上不超过2万元人民币。但是,由于NatureCommunications影响因子高,目前大部分中国高校与科研机构均将其视为高级别期刊,同时由于该刊发文量大,很多受经费支持的中国作者仍然愿意在该刊上发表论文,但这并不意味着该刊收取的高达4万多元人民币的发表费合理。

笔者对观点3的回应是,由于期刊的真实收支数据属于期刊主办机构内部敏感数据,外部研究者难以取得,但可以进行间接推断。间接推断的基本思路是通过一个学科领域多数期刊公开的发表费与其年发文量乘积的某个阈值来设定该学科领域期刊发表费的合理水平[14]。当然,除了发表费收入外,期刊可能还有其他收入,但多数期刊在上述发表费阈值之下正常运行,则使用该阈值来设定该学科多数期刊发表费的合理水平是成立的。

1.3 具体判定步骤

以学科为单位,通过3个步骤量化定义国际英文掠夺性期刊。

第一步:采集研究时间段内该学科期刊的影响因子、年发文量、作者国别比例、篇均发表费与年发文量乘积4个指标数据。

第二步:根据各指标数据分布形态,选择拟合度较高的分布函数拟合每个指标数据。计算各指标某个分位数对应的上下限阈值,确定阈值下限为5%、上限为95%。选择上述比例的理由是大多数人对“很低”“绝大部分”的量化心理锚点在5%、95%左右。若实际应用中学术共同体有其他共识意见,调整比例即可。具体指标与上下限阈值如表1所示。

表1 4个指标与上下限阈值

第三步:掠夺程度分级。对比期刊的各指标实际值与各指标上下限阈值,具体分级规则为:4个指标均符合阈值者为黑色掠夺性期刊,3个指标符合者为红色掠夺性期刊,2个指标符合者为黄色掠夺性期刊。其中,不考虑中国主办英文期刊作者国别比例高于阈值的情况。

2 应用实例

近年来医学领域掠夺性期刊数量较多,因此选择医学类期刊为讨论对象。

期刊影响因子、年发文量、作者国别比例3个指标的数据来源于Web of Science(WoS)官网。选择WoS官网中与中国科学院文献情报中心《国际期刊预警名单》医学类预警期刊细分学科一致的Clinical Medicine学科期刊进行分析。篇均发表费数据来源于美国SinoScript期刊查询系统(http://www.sinoscript.com/search.html)、MedSci期刊智能查询系统(https://www.medsci.cn/sci/index.do)。按本文撰写时汇率将发表费都换算成美元。若对同一期刊查询到两个发表费数据,则取高者。剔除不收取发表费期刊、任意一个指标数据缺失期刊和中国机构主办英文期刊(Asia-PacificJournalofClinicalOncology、ChineseMedicalJournal、ChineseMedicine),最终得到410种期刊。其指标的描述性统计结果如表2所示。

表2 410种期刊4个指标的描述性统计结果

表2的偏度、峰值表明,4个指标数据不符合正态分布。为4个指标数据制作散点图,发现数据分布形态与对数正态分布高度符合。采用R语言统计分布拟合函数包fitdistrplus中的对数正态函数lnorm对期刊各指标数据分布进行拟合。当然,对于所提指标之外的其他指标需要根据实际情况采用其他分布函数拟合,方法与此相同。

按照前文1.3节给出的国际英文掠夺性期刊量化定义步骤处理,用分位数函数quantile求得4个指标的阈值:影响因子的判断阈值为0.013,年发文量的判断阈值为869.000,作者国别比例的判断阈值为0.769,篇均发表费与年发文量乘积的判断阈值为3438130。

将依据所提方法判定的掠夺性期刊结果与中国科学院文献情报中心《国际期刊预警名单》进行对比。

3 讨论

中国科学院文献情报中心《国际期刊预警名单》编制早,编制机构具有国家级研究机构平台优势,因此其已成为国内英文掠夺性期刊目录事实标准,被国内很多高校在科研人事管理中采用。将依据所提方法判定的英文掠夺性期刊结果与中国科学院文献情报中心《国际期刊预警名单》进行对比,再在指标选择理由、数据与步骤公开两方面予以比较。

3.1 结果比较

在纳入最终讨论的410种期刊中,依据所提方法判断出36种掠夺性期刊,占410种期刊的8.78%;中国科学院文献情报中心《国际期刊预警名单》判断出20种掠夺性期刊,占410种期刊的4.88%。依据所提方法判定的掠夺性期刊中,有13种与《国际期刊预警名单》判定结果重合,占《国际期刊预警名单》判定结果的65%。

在期刊掠夺程度方面,中国科学院文献情报中心《国际期刊预警名单》分高、中、低三级,对应所提方法界定的黑色、红色、黄色级。对比结果如表3所示。

表3 所提方法与《国际期刊预警名单》判定结果对比

3.2 方法比较

掠夺性期刊定义本质上不是科学问题,而更多是共识问题。目前国内外多个机构编制掠夺性期刊名单,采用的指标、方法不同,各有理由,很难通过某种客观无异议的命题、定理或者实验证明掠夺性期刊名单A采用的指标、方法比名单B更合理。

要推进掠夺性期刊定义共识的形成,至少需要做到两点:指标应说明、数据应公开。作为掠夺性期刊研究先驱,Jeffrey Beall在上述两个方面被批评。批评声音指出,Jeffrey Beall 没有说明采用期刊筛选指标的理由,也不公开数据,一些期刊与 Jeffrey Beall沟通后被移出Jeffrey Beall 掠夺性期刊名单,但移出理由同样没有公开说明[15]。

中国科学院文献情报中心《国际期刊预警名单》作为目前国内掠夺性期刊的事实标准,在指标、数据公开两个方面均可改进。指标公开方面,中国科学院文献情报中心《国际期刊预警名单》官网没有明确其指标选择理由。按常理推测,中国科学院文献情报中心期刊分区表团队在一定范围访谈、征求学术界意见的基础上议定指标。数据公开方面,中国科学院文献情报中心《国际期刊预警名单》官网的“常见问题”栏目(https://earlywarning.fenqubiao.com/#/zh-cn/QA)包含“为什么不公布指标得分?”这一问题,官网回复为:期刊分区表团队向期刊出版机构提供期刊指标得分并解释入选原因,但指标得分暂不向社会公开。此外,《国际期刊预警名单》也没有公开对最终结果影响巨大的指标权重。

相比之下,本文所提指标、数据完全公开,读者可以联系笔者取得相关数据。

4 政策建议

目前中国科学院文献情报中心发布的《国际期刊预警名单》在国内被广泛采用,同时也有一些高校或科研院所发布由本单位制订的英文期刊黑名单,如复旦大学附属妇产科医院、吉林大学第一医院、合肥工业大学、华东政法大学、昆明学院等,黑名单通过互联网可检。高校与科研院所、期刊评价机构各自发布的国际英文掠夺性期刊名单并不统一[16]。若无统一掠夺性期刊定义,会出现某期刊在A机构属于预警期刊,但B机构认可该期刊的矛盾局面。此外,容易出现一些科研管理乱象甚至作弊腐败行为。笔者了解到,国内某高校的二级学院在讨论科研奖励办法时,部分教师出于个人利益极力要求将其经常发表论文的个别掠夺性期刊列入奖励名单。此类作弊行为在国外同样存在:印度政府大学拨款委员会(India University Grants Commission)发布的掠夺性期刊名单中,一部分期刊属于Jeffery Beall定义的掠夺性期刊[17]。

研究人员自主打击掠夺性期刊难度较大,因为在考核压力以及奖励刺激下,部分研究人员仍然会选择在掠夺性期刊上发表论文。此外,我国应自主定义国际英文掠夺性期刊,而非依赖欧美标准,特别是不能依赖由欧美商业公司或个人提出的标准。

2018年中共中央办公厅、国务院办公厅印发《关于进一步加强科研诚信建设的若干意见》,提出支持相关机构发布国内和国际学术期刊预警名单,将罔顾学术质量、管理混乱、商业利益至上,以及造成恶劣影响的学术期刊列入黑名单。但是,“罔顾学术质量、管理混乱、商业利益至上,以及造成恶劣影响”属于定性判断,不同研究者对同一期刊的判断未必相同,特别是当涉及研究者利益时,意见更容易出现分歧。为此,提出以下建议。

(1)国家政策部门协调、明确掠夺性国际英文期刊的量化定义。Harvey等[18]指出,权威机构诸如国家级研究机构等应牵头拟定策略,以遏制掠夺性期刊的进一步蔓延。国际英文掠夺性期刊目录编制涉及利益面广,代表性利益主体应合作。结合我国国情,教育部、科技部、人力资源和社会保障部、国家卫生健康委员会、国家新闻出版署等部门宜协调组织国家自然科学基金委员会、全国哲学社会科学工作办公室以及国内若干代表性期刊评价机构(如中国科学技术信息研究所、中国科学院文献情报中心)编制国际英文掠夺性期刊目录。

(2)国家推动在典型利益场合统一使用国家编制的国际英文掠夺性期刊目录。国内多数研究者及高校、科研院所主要关心8个典型利益场合:职称评定、聘岗考核、课题结题、研究生毕业答辩、学位点申报、学科以及实验室评估、成果统计、查重查新。在上述8个典型利益场合中,若教育部、科技部、人力资源和社会保障部、国家卫生健康委员会、国家新闻出版署等部门不认可在掠夺性期刊目录收录期刊上发表的论文,则国家统一编制的掠夺性期刊目录将得到快速、大面积的推广。

(3)论文质量较高、发文量较大、版面费较高的个别期刊按照本文定义可能被判定为掠夺性期刊,从而引发学术界的反对声音,如NatureCommunications。此类期刊数量少,且现阶段确实有一定学术交流价值,因此可将此类期刊移出由所提方法确定的掠夺性期刊名单。为防止个别研究者投机,国家可以直接限定一名作者每年在此类期刊上的发文数量。

5 结语

本文基于默顿等人提出的学术期刊使命观点,提出一种量化定义国际英文掠夺性期刊的方法,优点在于可以消除通过特征归纳定义掠夺性期刊的4个缺点,且指标、数据完全公开和透明。与国内外一些指标、数据透明度不高的掠夺性期刊定义相比,更有利于在学术共同体内加速形成掠夺性期刊定义共识,进而辅助政策部门更有效地打击掠夺性期刊。

本研究有以下不足之处:(1)4个指标中,影响因子、年发文量、作者国别比例3个指标的数据来源均为权威的WoS数据库,但撰文时暂时未找到权威的期刊发表费数据集,采用期刊编辑与论文发表公司数据。如有其他更权威的发表费数据,则结果更可靠。(2)可以在更多、更细化的学科层面进行讨论,编制全学科的国际英文掠夺性期刊名单。

猜你喜欢
英文阈值论文
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于自适应阈值和连通域的隧道裂缝提取
比值遥感蚀变信息提取及阈值确定(插图)
英文摘要
英文摘要
英文摘要
室内表面平均氡析出率阈值探讨
英文摘要
下期论文摘要预登
下期论文摘要预登