张 希 孙雪原 张 昱
(1.中国科学技术信息研究所,北京 100038;2.首都经济贸易大学,北京 100070)
近年来,国际期刊批量撤稿事件成为国内外学术界热议的话题,引起社会的广泛关注。2017年,施普林格集团旗下期刊《肿瘤生物学》集中撤销了中国107 篇论文,撤销原因有虚假同行评议、内容造假、向第三方机构购买等。2021 年,《欧洲医学药理学评论》因作者涉嫌学术不端批量撤销了199 篇中国学者的论文。同年,英国皇家化学学会撤销了70 篇可能出自“论文工厂”的论文,所有论文均出自中国的医院[1]。论文撤销事件反映了涉事人员对科学研究不严肃、不严谨、不规范的态度,对中国科研人员和学术机构的国际声誉产生极大的负面影响。此外,日本、德国和伊朗等国家也发生过几次大规模论文被撤销事件[2]。论文被撤销数量的增长已成为全球性的学术问题。
目前,国内外学者已开展了对论文撤销现象的研究,大多围绕撤销论文计量研究[3]、撤稿原因分析[4]、论文被引情况[5]、撤稿治理对策[6]、出版伦理[7]、科研诚信建设[8]等主题。撤销论文数据主要来源于国内外多个数据库,包括Web of Science[9]、Retraction Watch[10]、PubMed[11]、SCOPUS[12]、Science Direct[13]、中国知网[14]等。国内研究对象大多为中国作者发表的国际科技论文,而基于全球撤稿视角对撤稿论文特征研究较少。因此,本文以撤稿观察网站Retraction Watch数据库收录的全球撤稿论文作为数据基础,对国际科技论文撤稿现状进行分析,为我国科研诚信体系建设提供依据和建议。
基于Retraction Watch数据库,选择“撤稿日期”为“收录起始年至2021 年12 月31 日”,检索日期为2022 年1 月7 日,共检索出撤销论文34 693 篇。经过数据清洗析出论文标题、学科、期刊、出版商、机构、作者、撤稿原因、出版日期、撤稿日期等字段,采用数理统计与文献计量等方法对全球科技撤稿现状进行多角度分析。
全球撤稿论文分别发表在3 692 种期刊、326种会议上。其中,期刊论文为24 757 篇,占比71.36%;会议论文为9 936 篇,占比28.64%。如图1 所示,全球期刊撤稿数量呈现持续上升的趋势,而会议撤稿数量仅在2009—2011 年间较为集中,主要缘于电气和电子工程师协会(IEEE)的几次大规模集中撤稿事件,且撤销论文大多来自中国;中国期刊撤稿数量占全球撤稿的比重在逐年增加,尤其是2021 年中国期刊撤稿数量超过全球期刊撤稿数量的60%。
如表1 所示,本文选取撤稿数量排名前10位的期刊。根据期刊2020 年的影响因子和JCR分区可知,其中部分期刊的影响因子较高,分区较为靠前,生物医药、化学领域居多。一是由于高影响因子期刊受到的关注度较高,读者对于论文的内容较为严格,易发生撤稿现象;二是生物医药领域的作者大多为医务工作者,医生需要通过发表研究论文来获得职称的晋升,但医院业务工作繁忙,而医生的职称晋升又影响着医生薪资,甚至影响某些从业资格,因此有的医生就选择从第三方公司购买论文,以帮助他们的职业晋升[1],而这些论文因图片造假等问题被大量撤稿。目前,撤稿数量最多的学术期刊为《Arabian Journal of Geosciences》。在此期刊撤稿论文中有98.42%的论文来自中国,撤稿原因是这些文章存在操纵同行评议的不端行为。
表1 期刊撤稿统计
全球9 936 篇会议撤销论文中有9 177 篇论文是中国作者,占比92.36%。本文选取会议撤稿数量排名前5 位的会议,如表2 所示。这些会议收录的论文数量较多,撤稿数量的占比较大,最高达到89.96%,且全部在中国的城市举办。撤稿数量最多的会议为2011 年在上海举办的电子商务与电子政务国际会议,共撤稿1 279 篇。会议论文的主要撤稿原因是对同行评议和技术质量审核方面存在疑虑,不符合出版标准。
表2 会议撤稿统计
全球撤销论文共涉8 个领域130 个学科,撤稿数量前4 位的学科领域为基础生命科学(BLS)、健康科学(HSC)、商业与技术(B/T)和自然科学(PHY)。其中,基础生命科学和健康科学的撤稿总量占比高达90%,是论文撤稿的重灾区。对各级学科内撤稿数量进行统计,统计结果如表3 所示,撤稿数量前3 位的学科领域为(BLS) Biology - Cellular、(BLS) Biochemistry、(BLS) Genetics。中国科技论文在生物细胞、数学、技术、遗传学、生物癌症等学科的撤稿数量较多。
表3 不同学科撤稿统计
2.1.1 发表时间特征分析
由图2 可知,在Retraction Watch数据库中,国际撤稿论文最早发表在1753 年,从1989 年开始发表的撤稿论文数量均超过40 篇,其中数量最多的是2010 年,达到5 319 篇。中国撤稿论文最早发表在1992 年,2002 年后撤稿数量开始呈现持续增长的态势,尤其是2010 年和2011 年的撤稿数量分别达到4 155 篇和4 074 篇,主要缘于电气和电子工程师协会(IEEE)的会议论文集中撤稿事件。中国与全球进行对比,2006 年之后中国每年发表的撤稿论文数量占全球发表撤稿论文数量的比重均大于10%,尤其是2021 年突破80%。从趋势上看,近几年全球撤稿论文发表数量呈减少的趋势,而中国撤稿论文发表数量呈上升的态势。
图2 中国与全球撤稿论文发表时间分布
2.1.2 撤稿时间特征分析
如图3 所示,中国最早的撤稿时间是1995年,是由中国矿业大学作者于1992 年发表在《Journal of Algebra》期刊的论文。2008 年后中国每年撤稿数量均超过100 篇,2010—2011 年撤稿数量激增。全球最早被撤稿的论文是多伦多大学作者于1973 年发表在《The New England Journal of Medicine》期刊的论文,撤稿时间为1975 年。在2002 年以前,全球每年撤稿数量较少,2002年后突破100 篇,2010 年达到4 993 篇。从趋势上看,中国与全球撤稿数量均呈现持续上升的态势,但近3 年中国撤稿的增速高于全球。
图3 中国与全球撤稿时间分布
2.1.3 撤稿时滞分析
撤稿时滞是论文撤销时间与发表时间之差,在一定程度上反映了科学界的净化时效[15]。计算可知,在15 923 篇中国撤稿论文中,有196 篇的发表时间与撤稿时间相同,对余下的15 727 篇论文计算撤稿时滞,时滞最长的为7 783 天,最短的为1 天,平均时滞为354 天。其中,期刊撤稿论文平均时滞为766 天,会议撤稿论文平均时滞为60 天。在34 693 篇全球撤稿论文中,有969篇的发表时间与撤稿时间相同,对余下的33 724篇论文计算撤稿时滞,时滞最长的为29 622 天,最短的为1 天,平均时滞为915 天。其中,期刊撤稿论文平均时滞为1 215 天,会议撤稿论文平均时滞为76 天。
由上所述可知,中国作者在国际期刊上发表论文的平均撤稿时滞小于全球平均时滞,可见与其他国家相比,国际期刊对中国学者论文的撤稿力度较大。此外,会议撤稿论文平均时滞要小于期刊撤稿论文,主要由于会议论文的发表时间和撤稿时间相对比较集中,这也说明期刊的自我净化周期较长,学术会议的自我净化效率更高。
2.2.1 国家及地区分布情况
全球撤稿论文来自154 个国家及地区。本文选取撤稿数量排名前10 位的国家,统计结果如表4 所示。中国的撤稿论文数量最多,占全球撤稿数量的45.90%,其次是美国、俄罗斯、印度、英国、日本、伊朗等国家。前10 位中发达国家较多,仅有中国、印度和伊朗为发展中国家。主要原因:一是由于科研成果产出较多,科技论文基数较大;二是发展中国家在大力发展科技的同时,科研诚信监管体制建设不够完善,对于科研产出成果的审查力度不够。
全球撤稿论文中有4 083 篇(占总撤稿论文量的11.77%)的文章是由多个国家共同完成的。本文将这4 083 篇多国合著论文进行国家合作分析,如图4 所示。图4 中节点越大代表这个国家合作的次数越多,连线越粗代表两国之前的合作越紧密。从图4 可以看出,美国为最大的节点,并与中国、英国、德国、加拿大等国家有着密切的合作关系。
2.2.2 机构分布情况
本文选取撤稿数量排名前14 位的科研机构进行分析,主要来自于中国(10 个)、日本(2个)、伊朗(1 个)、美国(1 个),以高等院校居多(表5)。撤稿数量排在第一位的是伊朗伊斯兰阿扎德大学,其次是中国科学院、哈佛大学医学院。中国的10 家科研机构基本为国内知名科研机构和双一流大学。近年来,“非升即走”制度改革在国内高校逐渐铺开,营造出高竞争、低稳定、不安全的学术场域,导致科研人员急于完成考核任务,更加重视科研成果发表数量而忽略成果质量和创新价值。
表5 机构撤稿统计
2.2.3 作者特征分析
全球撤稿论文中有83.75%是由多位作者合作完成的。本文选取撤稿数量排名前10 位的作者进行分析(表6)。从表6 可以看出,日本作者数量最多,日本筑波大学作者Yoshitaka Fujii的撤稿数量位列第1,共被撤稿219 篇。本文选取了撤稿数量排名前30 位的作者进行合著分析,以发现相互之间的合作特点。从图5 可以看到,最大的合作网络是以Yoshitaka Fujii为中心的日本合作网络,其次是德国路德维希港医院的Joachim Boldt、日本庆应义塾大学的Jun Iwamoto和美国布莱根妇女医院的AnnarosaLeri合作网络等。说明同一国家或同一机构的作者合作最为密切,可以通过对这个机构或研究团队人员进行重点监测,或及时发现其在科学研究中出现的其他科研不端行为。
表6 撤稿量为前10 位的作者
图5 30 位作者合作网络
全球撤稿论文共涉及105 种撤稿原因,每篇论文的撤稿原因有1 ~13 种。去除无效的原因后得到85 种撤稿原因。撤稿原因可分为以下12类(表7):伪造,包括伪造或操纵数据、图像、结果等5 种;剽窃,剽窃他人数据、图像、文本等5 种;重复发表,包括重复发表数据、图像、文本等6 种;一稿多投,在不同期刊发表同一文章;伪造身份信息,作者信息存在造假;委托第三方机构代投代写论文;虚假的同行评议;作者、机构、第三方存在违反政策、法律、道德及其他不当行为等17 种;科学性错误,包括科学研究中存在方法、数据、图像、文字的误差和错误等12 种;作者、机构、出版商、第三方造成的错误等6 种;对研究数据、图像、结果的有效性存在争议,以及对作者、机构、第三方权利的争议等17 种;对作者、机构、第三方的投诉和调查等12 种。
表7 撤稿原因与撤稿统计
以上撤稿原因中可以明确定义为不端行为的是前8 类。全球撤稿论文中存在不端行为的共有18 858 篇,占比54.36%;中国撤销论文存在不端行为的共有7 322 篇,占45.98%。从全球来看,因违反政策、法律、道德等不当行为,以及重复发表、嫖窃、伪造而撤稿的比重较大;除以上几类之外中国较为突出的问题为虚假的同行评议。除科研不端行为之外,论文存在科学性错误、争议,以及被投诉调查的撤稿数量较大。
对以上问题类别进行时间序列分析发现,2017 年以前,撤稿原因的种类和数量相对较少,而2017 年后统计量急剧上升,显著增加的是科学性错误,而伪造、嫖窃、一稿多投、重复发表等问题也较为凸显。
本文基于Retraction Watch数据库中34 693篇全球撤稿论文数据,对学科、期刊、机构、作者、撤稿原因、出版日期、撤销日期等字段进行比较分析,得出以下结论。
(1)全球撤稿论文的数量呈现上升的趋势,发表数量呈下降的趋势;中国撤稿论文数量和发表数量均呈现上升的趋势,且撤稿数量位列全球第一,增速高于全球水平。然而近年来,中国撤销论文的平均撤稿时滞却低于全球水平,并呈现逐年减小的趋势,表明国际期刊对中国学者论文的撤稿力度在逐渐加大,国际期刊对于中国作者论文发表程序的审查愈发严格。
(2)全球和中国均有大约50%的撤稿原因是存在学术不端行为,主要包括伪造、剽窃、重复发表、一稿多投、伪造身份信息、代投代写论文、虚假的同行评议,以及违反政策、法律、道德等不当行为。此外,还有科学性错误或争议,涉及投诉、调查等撤稿原因。
(3)全球会议撤稿中有92.36%来自中国,并且这些会议大多于2009—2011 年在中国的城市举办,主要的撤稿原因为操纵同行评议。全球期刊撤稿数量占比71.36%,仍呈现持续上升的趋势,中国期刊撤稿数量占全球撤稿比例超过60%。
(4)基础生命科学、健康科学领域的论文撤稿问题较为严重,撤稿总量占比超过90%,是中国乃至全球的共性问题,其中细胞科学是全球撤稿数量最多的学科。此外,中国在数学、技术、遗传学、癌症等学科领域的撤稿情况也不容乐观。
(5)从研究机构的角度来看,中国多所知名研究机构和双一流高等院校所产出的撤稿论文数量较高,相关机构存在制度建设、科研管理、科研诚信建设方面的问题;从研究人员的角度来看,存在同一作者被多次撤稿的现象,并且形成撤稿论文作者关系网络,可能存在团体科研不端行为。
(1)加强科研机构与学术出版商的合作交流,共同履行监督职责。科研机构是学术活动的基本依托单位,对本机构的科研诚信应承担主要责任;学术期刊是科研成果发表的载体,要对成果的科学性、准确性、有效性负责。科研机构与学术出版商对科研成果发表的生命周期起到至关重要的作用。但目前,科研机构对论文投稿前的审查工作并不重视,对论文的科研诚信情况也无法主动获知,因此实现科研机构与学术出版商间的合作对于遏制学术不端行为有着重要的作用。一是科研机构应对论文的数据、图表和伦理道德等方面进行初步审查,并与期刊建立共同审查联系;二是学术出版商应执行严格规范的组稿、编辑、审稿和同行评议制度,从出版和发表的环节上,堵塞低水平、粗制滥造和抄袭剽窃的漏洞,切实把好学术成果的出口关,期刊应及时将审查结果告知所在机构,联合预防、惩治学术不端行为。
(2)追究学术不端法律责任,建立科研诚信预警机制。目前,科技部、教育部、中国科学院等部门针对科研不端行为出台了有关科研诚信的规范、准则、管理办法等,但威慑作用有限,近几年“论文工厂”“图片造假”等事件时有发生。因此,建议加强科研诚信规范和法律法规之间的衔接,明确监管和执法主体,依法依规对违背科研诚信的行为给予相应的制裁,追究法律责任。对于有过学术不端行为的人员、科研机构,以及不能严格履行职责的期刊,应持续地进行重点监督监测,将科研不端行为扼杀在摇篮里。
(3)建立科学的职称聘评制度,为科研人员创造安全、稳定、自由的学术环境。当前,能否发顶刊论文、能否被评为人才称号,已经成为人才评价的指挥棒。这可能导致擅长发文、握有“各类人才称号”的青年学者迅速取得成功,进而反向强化上述成功逻辑,进一步固化了“五唯”导向。因此,科研机构应构建多元化评价、多样化成才的学术人才评价体系,更好地营造良性竞争与合作的学术氛围,为科研人员提供安全、稳定、自由、公平的学术环境,采取举措降低科研焦虑,进一步提升科研人员学术职业稳定性、安全感、幸福感。
(4)引导科研人员自觉抵制学术不端行为,提升科研创新能力。当前,通过学术不端行为获取声望、职位和资源等方面的问题日趋严重,因此要加强科学道德规范建设,保证科学的学术信誉,维护科学的社会声誉。党的二十大报告中提出“培育创新文化,弘扬科学家精神,涵养优良学风,营造创新氛围”。广大科技工作者是科研活动的关键主体,应自觉遵守科研诚信规范,自觉抵制不良学术风气,努力作学术道德和良好学风的维护者、践行者和弘扬者[16]。面向科技前沿进行原创性、引领性科技攻关,进一步增强自主创新能力。
科研诚信是科技创新的基石,是保障我国科技事业健康发展的紧迫任务。遏制科研不端行为、防止不良学风的滋长是一项复杂而艰巨的系统工程,需要广大科研人员把好源头关,政府、协会、出版等多部门共同履行主体责任。