基于撤稿观察数据库的论文撤稿国际比较研究

2021-07-07 04:35施筱勇
科技管理研究 2021年10期
关键词:不端五国检索

杨 耀,施筱勇

(国家科技评估中心,北京 100081)

1 研究背景

科研诚信是科技创新的基石。近年来,中国科技快速发展,取得世界瞩目的成就,为建设创新型国家奠定坚实基础,然而科研不端行为却时有发生,给国内科技界形象造成了恶劣影响。党中央、国务院高度重视科研诚信建设,先后出台了《关于进一步加强科研诚信建设的若干意见》《关于进一步弘扬科学家精神加强作风建设和学风建设的意见》等重要文件进行规范和引导;科技部等科研诚信建设联席会议成员单位也出台《科研诚信案件调查处理规则(试行)》等文件,加强对科研不端案件的查处。

在科研诚信热点事件中,涉及科研论文的不端行为无疑是一个焦点。媒体陆续曝光的《肿瘤生物学》杂志“107 篇论文撤稿事件”、南京大学“梁莹事件”等引发社会广泛关注。撤稿是保障科研论文真实可信的重要手段,国际出版伦理委员会(COPE)发布的撤稿指南中提出,只有在由伪造、篡改等不端行为以及一些诚实的错误等引起的数据不可信、重复发表并且没有交叉引用、剽窃、存在伦理问题时才建议编辑考虑撤稿[1]。根据《医学期刊编辑出版伦理规范》,所谓撤销论文是指已经发表的,经作者申请或科学共同体成员举报,在调查后发现存在错误或学术不端行为的,对科学发展具有不良影响的,同时载文期刊针对该文发布正式撤销声明以告知公众的论文[2]。捏造(fabrication)、篡改(falsification)、剽窃(plagiarism)是不同国家公认的科研不端行为[3]。包靖玲等[4]对医学学术期刊撤稿原因的研究表明,科研不端是撤稿的主要原因。因此,研究撤稿论文的相关情况,对把握科研诚信状况、分析科研不端行为趋势具有重要意义,基于论文撤稿的科研诚信研究已成为国内外开展科研诚信状况研究、科研不端行为分析等的重要手段。

科研不端并非中国独有的问题,而是世界上各个国家都面临的挑战。2018 年,前哈佛医学院教授Piero Anversa 博士因涉嫌伪造和篡改实验数据,被要求撤回30 余篇关于心脏干细胞的研究论文,给整个领域带来严重影响[5];德国的Fundamental and Applied Limnology(《基础科学与应用科学杂志》)一次性撤稿高达434 篇文章,其中包括2018 年世界应用研究学会会议论文,创下一年撤稿之最[6]。这些撤稿数字的背后是科研诚信状况的一个反映,也是当前科研环境的一个缩影。分析中国和主要发达国家的论文撤稿情况,有利于认清国内科研诚信建设状况、科研不端行为的主要形式、科研不端行为发生的重点领域等,为下一步加强科研诚信建设提供参考。

2 数据来源和分析方法

本研究以撤稿观察数据库(Retraction Watch Database)1)为基础,分别于2019 年1 月27—29 日和2 月12 日检索中国、美国、英国、德国、日本五国在2014—2018 年间发表的论文撤稿数据作为样本进行分析。以2014 年中国撤稿论文为例,具体检索方法如下:首先在Country(s)下拉菜单选择China,然后在Original Paper 栏下From date 输入框中输入01/01/2014、在To 输入框中输入12/31/2014,在Retraction or Other Notices 栏 的Nature of Notice 下 拉菜单中选择Retraction,其他以默认值进行搜索,将检索得到的数据保存用于后续分析。各国每年撤稿数据的检索方式均采用上述方式,共得到撤稿数量为2 208 篇。

依据撤稿观察2)网站中标注的撤稿原因,本研究将撤稿类型划分为因科研不端行为撤稿和因其他原因撤稿两大类,并将科研不端行为归类为剽窃(duplication)、不当行为(misconduct)、篡改或捏造(falsification/fabrication)、伪造欺骗(fraud)、违反伦理道德(ethical violation)等5 种类型(见表1),其中不当行为分类中明确使用misconduct 和objections by author(s)标注的不端和论文作者反对行为,其他原因包括数据错误、信息不足等,不属于科研不端行为。

表1 科研不端行为类别划分

2014—2018 年度发表论文总数从Web of Science检索获得。具体方法如下:以中国为例,在Web of Science 网站搜索框输入“China”,选择为“地址”,时间分别选定2014—2014 年、2015—2015年、2016—2016 年、2017—2017 年、2018—2018年,数据库选择核心合集,检索所得结果即为每年度中国学者参与发表论文数量。上述所得2014、2015、2016、2017、2018 年度发表论文数量之和即为2014—2018 年度中国学者参与发表论文总数。样本其他国家发表的论文数量采用上述相同的检索方法,美国检索地址输入“USA or (United-States)or America”,英国检索地址输入“UK or England or Scotland or (Northern-Ireland) or (United-Kingdom)”,德国检索地址输入“Germany”,日本检索地址输入“Japan”,其他设置同中国检索过程中设置。

基于撤稿观察数据库中对论文所属领域的划分,本研究对各领域因科研不端行为的撤稿进行了统计,原始数据划分为七大领域,包括商业/技术(B/T)、基础生命科学(BLS)、环境科学(ENV)、健康科学(HSC)、人文科学(HUM)、物理科学(PHY)和社会科学(SOC)。七大领域的每一领域下又有细分类别,如基础生命科学具体分为生物化学、细胞生物学、分子生物学等,但本研究只统计七大领域,未统计细分类别,每1 篇论文只划归入1 个领域。由于学科交叉,部分论文具有多个标签,若标签都指向同一领域,则将论文划分至该领域;若标签指向不同领域,则划入标签出现次数最多的领域,如1 篇论文具有生物化学(BLS)、医学-肿瘤学(HSC)、医学-疗法(HSC)和心理学(SOC)4 个标签,则划入标签HSC 出现最多的领域;若指向不同领域的标签个数相当(此为极少数情况),则根据论文标题和作者单位判断划入其中一个领域,如1 篇论文具有细胞生物学(BLS)、分子生物学(BLS)、医学-神经学(HSC)、医学-肿瘤学(HSC)4 个标签,2 个领域的标签数量相同,而作者单位为医院和医学院,则划入健康科学(HSC)领域。

3 分析结果

3.1 国际论文撤稿数量统计

2014—2018 年间,样本五国发表的国际论文被撤稿总数为2 208 篇,包括中国1 179 篇、美国638篇、英国162 篇、德国117 篇、日本112 篇(见图1)。其中,因科研不端行为撤稿的论文共计1 198 篇,占撤稿总数的54.2%,包括中国760 篇、美国281 篇、英国61 篇、德国50 篇、日本46 篇,分别占本国撤稿总数的64.4%、44.0%、37.7%、42.7%、41.1%。可见,研究期间中国撤稿的论文数、因科研不端行为撤稿的论文数均高于其他四国的总和。

图1 2014—2018 年样本五国论文撤稿数量的分类统计

3.2 撤稿数量变化趋势分析

2014—2018 年间,样本五国每年撤稿数及其中因科研不端行为撤稿数均呈现出下降趋势(见图2)。其中,因科研不端行为撤稿数量中国下降趋势最为明显,从2014 年的283 篇下降至2018 年的42 篇,降幅达85%;其次为美国,从2014 年的76 篇下降至2018 年的15 篇,降幅达80%;德国、日本近年来也大幅降低,降幅分别达73%和82%,目前已连续两年降低到5 篇以下;而英国虽然有下降,但近3 年每年基本稳定在9 篇左右,降幅为47%。

图2 样本五国因科研不端行为撤稿数量的年度变化趋势

3.3 撤稿涉及科研不端行为类型分析

按表1 中科研不端行为的一级分类统计,样本五国的撤稿中剽窃类位居科研不端行为的首位,属于各国面临的共同问题;伪造欺骗类在中国排第2位,而不当行为类在美国、英国、德国、日本等国均排在第二位;违反伦理道德类在各国科研不端行为统计中占比均较低(见图3)。其中,一些因科研不端行为撤稿中出现的科研不端行为往往不止1种,例如有的论文同时出现抄袭和数据造假等不端等行为。根据表1,本研究在进行科研不端行为的二级分类统计中将科研不端行为各二级分类累加计算,结果显示中国因科研不端行为撤稿的篇均科研不端行为次数最低,为1.38 次,低于美国1.53 次、英国1.43 次、德国1.58 次和日本1.41 次。

图3 2014—2018 年样本五国撤稿中科研不端行为类型统计

3.4 因科研不端行为撤稿数占年度论文总数比例分析

不同国家的科研人员数量、科研论文发表数量存在很大差异,单以撤稿总数、因科研不端行为撤稿数量来衡量一国科研人员整体的研究行为较为片面,因此,本研究引入每万篇年度发表国际论文中因科研不端行为撤稿数这一指标Pm/t来反映各国因科研不端行为撤稿的整体情况,Pm/t=当年因科研不端行为撤稿数/年度国际论文发表总数×10 000,其中m为当年因科研不端行为撤稿数,t为年度国际论文发表总数。统计结果显示,样本五国在2014—2018 年间的Pm/t值均呈现出明显的下降趋势(见图4),其斜率大小分别为:k英国(-0.146 3)> k美国(-0.212 2)>k德国(-0.221 6)>k日本(-0.276 5)>k中国(-1.733 3),不难看出中国在5 年中的Pm/t值下降速率最快,从2014 年的7.377 下降到2018 年的0.840,其他四国的Pm/t值下降速率较为相似。2018 年,中国的Pm/t值已降至0.840,但与其他四国相比,每万篇因科研不端行为撤稿数依旧是其2~5 倍,其中德国的Pm/t值最低,仅为0.174 (见表2)。

表2 2014—2018 年样本五国的Pm/t 值

图4 样本五国的Pm/t 值变化趋势

3.5 因科研不端行为撤稿所属领域分析

按五国全样本统计,2014—2018 年因科研不端行为撤稿涉及撤稿观察数据库划分的全部7 个领域(见图5),其中基础生命科学领域的撤稿数量位列第一,共435 篇,人文科学最少,共8 篇。

图5 2014—2018 年不同领域因科研不端行为撤稿的样本数量分布

3.6 中国因科研不端行为撤稿所属领域及趋势分析

研究期间,中国在基础生命科学、健康科学和物理科学领域因科研不端行为撤稿数量位居7 个领域的前3 位,分别为271 篇、267 篇和148 篇,但如图6 所示,基础生命科学和健康科学领域因科研不端行为撤稿数量占比在不断降低,分别从2014 年的39.1%和43.3%下降至2018 年的23.8%和16.7%,而物理科学领域的撤稿数量占比上升,从2014 年的12.3%上升至2018 年的35.7%,超过其他6 个领域,商业和技术、环境科学、社会科学、人文科学领域因科研不端行为撤稿数量占比也有增加趋势,但占比依旧较小。

图6 中国在不同领域因科研不端行为撤稿数量占比的年度分布

4 研究结论

本研究对撤稿观察数据库中2014—2018 年间中国、美国、英国、德国和日本的论文撤稿情况进行了细致分析,结果显示:

第一,五国的论文撤稿数量呈下降趋势,该结果与任艳青等[7]基于撤稿观察数据库全样本分析的结果一致;其中因科研不端行为引起的撤稿数量占总撤稿量的54.2%,该比例小于基于PubMad 数据库内生物医学领域因科研不端行为撤稿数量的占比(65.3%),这可能与本研究的样本来源数据库有关,撤稿观察数据库综合了多个领域的数据,不限于生物医学领域[8]。中国在撤稿总数和因科研不端行为撤稿数量上均明显降低,反映出国内科研诚信建设的总体趋势向好,但与美国、英国、德国和日本这4 个发达国家相比仍然差距明显。

第二,每万篇论文中因科研不端行为撤稿数量的统计结果更是凸显了中国与发达国家的差距。2014 年,中国的每万篇论文中因科研不端行为撤稿数量为7.38 篇,而美国、英国、德国、日本均在1篇左右,这或许反映出国内科技界整体的诚信环境与发达国家仍存在较大差距,其中德国的每万篇论文中因科研不端行为撤稿数量为0.68 篇,明显低于其他国家。尽管在这5 年中,中国的每万篇论文因科研不端行为撤稿数降低至0.84 篇,但仍然为样本其他四国的2~5 倍。因此,中国应加强对发达国家的科研诚信建设经验研究,尤其是对德国的科研诚信建设管理进行学习借鉴,促进国内科研诚信和科技界的作风学风建设。

第三,在科研不端行为类型统计中,剽窃类占各国科研不端行为的首位。在有关撤稿中不端行为的多项分析中,例如Campos-Varela 等[8]和周立秋等[9]的研究都发现剽窃为最常见的科研行为不端手段。因此,各国应加大对科研活动中剽窃行为的打击力度,尤其是学术期刊在接到稿件后应运用相应的软件系统进行筛查,这有利于对其中剽窃行为的发现和对此类不端行为的预防[10]。

第四,研究期间基础生命科学领域是因科研不端行为撤稿的“重灾区”,在本研究分析的7 个领域中最为严重。然而对中国的论文因科研不端行为撤稿所属领域分析显示,因科研不端行为撤稿数量的占比,传统科研行为不端的“重灾区”——基础生命科学和健康科学领域正在呈现下降趋势,物理科学领域正在逐年上升并在2018 年已位列各领域之首,其中很多撤稿源自物理和生物等学科的交叉研究。当前,新一轮科技革命加速演进,随着新兴技术的不断出现,学科交叉融合必将日益深入,新兴学科也将不断涌现,科研诚信建设工作的风险领域可能正在发生变迁,各国应提前开展针对新兴领域的科研不端潜在行为研究,为科研诚信建设、科研不端预防和监测提供方法与工具。

注释:

1)网站地址:http://retractiondatabase.org/RetractionSearch.aspx?。

2)网站地址:https://retractionwatch.com/the-retraction-watchleaderboard/。

猜你喜欢
不端五国检索
关于采用《科技期刊学术不端文献检测系统(AMLC)》的声明
论文作者学术不端行为类型
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究