数据库中关于撤销论文处理的实证分析
——PubMed数据库与国内数据库的对比

2014-04-17 08:24姜天华滕洪松杨凝清
中国科技期刊研究 2014年5期
关键词:标引不端声明

■姜天华 陈 静 耿 波 滕洪松 杨凝清

青岛大学医学院图书馆,山东省青岛市登州路38号 266021,E-mail:jiangtianhua1@126.com

早在1987年,针对当时涉及学术不端论文数量的不断增加,国际医学期刊编辑委员会(ICMJE)就明确提出:对不宜在文献资源中继续保存的有错误的学术论文,应该通过撤稿的方式对其进行处理[1]。近几年随着我国“反学术不端”呼声的日益强烈,以及多种论文检测系统的相继出现,国内被撤销论文的数量也在逐年增加,以致其在各数据库中逐渐占有了一定的比例。但问题是,笔者在对国内几个主要数据库的使用中发现,这些被撤销的论文仍然在被许多新发表的论文继续引用,且引用率和引用次数并没有受到被撤销的影响,这可能是因为引用人并不知道其引用的是一篇有问题的、已被撤销的论文,其后果必然会导致由于原来的错误没得到纠正而使后续的科研工作又产生新的错误。

这种情况显然跟国内各数据库对撤销文献的处理现状密切相关。鉴于此,本文试图通过对PubMed数据库中被撤销论文的统计分析,对比国内几个数据库对撤销论文的处理现状,以期能够发现国内各数据库在撤销论文的处理方面存在的问题,以引起各相关方的重视并采取适当的措施,从而杜绝被撤销论文继续被引用而造成的负面影响。

1 材料和方法

首先检索PubMed数据库中所有被撤销论文,按发表时间、国别及被引用情况分别统计;从中抽取第一作者为中国籍的被撤销论文(以下简称中国被撤销论文),统计发表时间和被引用情况;再针对发表在国内(不包括台湾和香港,下同)期刊上的被撤销论文,逐一查看国内几个数据库所做的处理标记及被引用情况。

l.l PubMed数据库中被撤销论文统计

在PubMed数据中按 “Retracted Publication[Publication Type]”检索式,检索其所有被撤销论文,截止时间2013年6月22日,对这些论文的发表时间、国家分布及被PMC(PubMed Central)引用情况进行统计。

l.2 PubMed数据库中中国被撤销论文统计

在PubMed数据库中检索出中国被撤销论文,检索式:“Retracted Publication[Publication Type]AND(Chinese[Affiliation]OR China[Affiliation])”,分析论文发表时间及被PMC引用的情况。

l.3 发表在中国期刊的被撤销论文统计

在PubMed数据库里中国被撤销的论文中,再抽取出发表在国内期刊上的论文,逐一核实这些论文在中国生物医学文献数据库(CBM)、中国知网(CNKI)、万方数据知识服务平台(万方)和维普期刊资源整合服务平台(维普)中的处理标记情况,国内论文的被引用次数是指在CNKI、Google学术搜索和在PMC中的被引次数去重后的综合结果。

2 结果

2.l PubMed数据库中撤销论文统计

在PubMed数据库中共检索到撤销论文2703篇,时间跨度从1973年到2013年,除1974年没有撤销论文外,共涉及40年,具体每年被撤销论文数量见图1。

在PubMed数据库中,共有1686篇论文被PMC引用至少1次,占全部被撤销论文的62.38%,对这部分论文按照被引次数进行排序,整理的结果详见表1。

2.2 PubMed数据库中被撤销的中国论文统计

被撤销的中国论文(不包括香港和台湾)共有237篇,共分布在全世界178种期刊上,时间跨度从1990年到2012年,具体年代分布详见图2。

图l 撤销论文的时间分布

表l 撤销论文被PMC引用情况

图2 被撤销中国论文的时间分布

在237篇被撤销的中国论文中,共有112篇论文(47.25%)被PMC至少引用1次,最高的被引次数是67次,详见表2。

表2 被撤销的中国论文被PMC引用情况

2.3 发表在中国期刊上的撤销论文统计

在PubMed数据库中共有29篇发表在中国大陆(不包括香港和台湾)期刊上的论文被撤销,其中12篇发表在中文版期刊上,17篇发表在英文版期刊上。

本文分别核实这29篇论文在国内的CBM、CNKI、万方和维普4个数据库中实际被标记处理情况。这29篇论文都有不在其数据库收录范围内的情况,除去那些没有收录的论文,各数据库对撤销论文和撤销声明的处理方式共有4种,详见表3。

如果仅通过国内数据库统计撤销论文的被引情况,还不能揭示全部的被引用情况,所以借助了Google学术搜索的强大搜索能力,同时也综合了CNKI、万方和PMC中的结果,并去除重复的被引文献;另外CNKI还能统计出被学位论文引用的情况,也包括在被引次数内,没有另外单列。被引次数详见表4。

表4 国内期刊上撤销论文的被引统计

3 结论和讨论

3.l 撤销论文数量在逐年增长

图1和图2显示,在PubMed数据库,国际和国内生物医学方面的撤销论文均呈逐年增长的趋势。由于学术论文大致需要1-2年的时间才会被发现存在问题而被撤销,所以2012年的论文在未来的1-2年里仍有被撤销的可能;2013年也存在同样的情况。另外,对比中国和国际上第1篇被撤销论文出现的时间,国外是1973年,中国是1990年,从一个侧面表明国内对“反学术不端”的重视程度及措施落实方面都较国际上落后。

3.2 撤销论文仍然持续被引用,引用次数和引用率都很高

虽然表1和表2仅仅是统计了PubMed数据库中被撤销论文在PMC中的被引用情况,但仍然有62.38%(1686篇)的论文至少被引用了1次,甚至有7篇被撤销论文的引用次数超过100次。事实上PubMed数据库已经对被撤销论文做了很好的标记,特别是把被撤销论文和撤销声明相互做了链接。即便如此,62.38%的引用率仍然是个不低的数据。表明在对撤销论文的处理及宣传上还存在比较大的问题。另一方面,对比表4,显然中国撤销论文的被引用比率更高,达86.20%。这首先跟国内多数数据库普遍对撤销论文不做标记或标记不科学有关;另一方面也提示了无论是作者本人还是编辑部工作人员都应该在核实参考文献的真实性上持更加严谨的态度。

3.3 国内数据库和PubMed数据库对撤销论文的处理存在很大的差距

在PubMed数据库中,虽然从时间上讲,中国第一篇被撤销文献晚于国际上很多年,但中国被撤销的论文数量在短短20几年就达到237篇,低于美国的740篇和日本的253篇,位于第3位,如果包括香港的10篇和台湾的22篇,总计数量超过了日本。并且呈逐年上升的趋势(图2)。这一现象应引起广大科研工作者、学术期刊编辑部等方面的充分重视,并尽可能地采取更加科学严谨的措施尽量避免被撤销论文的被引用问题。

国内数据库的情况则更加糟糕,关于撤销论文的处理,国内数据库在自己的平台上都没有一个明确规定。笔者通过逐一分析国内期刊上被撤销的29篇论文,发现国内数据库对撤销论文几乎没做什么处理,即撤销论文仍然保留且无撤销声明的情况普遍存在(见表3);撤销论文在数据库中保留,同时也有撤销声明的处理方式在各数据库中所占比例都很少,即便这小部分“做得比较好的”,对撤销声明的处理也太过简单,不仅没有和原撤销论文做链接,而且大部分撤销声明无法通过检索的方式被发现。笔者通过PubMed数据库里的撤销时间,利用国内数据库的“期刊导航”查找到具体卷期,然后逐一核实目次页,发现很多期刊的目次中只显示“撤销声明”4个字,没有原撤销论文的题目;有的显示的是撤销论文的英文题目、英文作者;有些期刊在目次页中就根本没有显示,只能到正文中核实,等等形式,这样通过普通检索方式是不可能被检索到的。CBM数据库虽然在主题词表里存在“已撤销出版物”和“撤销出版声明”2种文献类型,但实际上“已撤销出版物”检索结果为0,“撤销出版声明”只有1篇;同时在实际统计中还发现有1篇撤销声明虽然标引了原撤销论文的3-4个主题词和关键词,但没有标引文献类型“撤销出版声明”,故在实际检索中很难被检出。

还有一种情况,笔者曾在《泸州医学院学报》上检索到CNKI的一个简单声明[2]:即把具有学术不端行为的论文从数据库中删除,笔者认为此法更为欠妥。论文被简单地删除会带来更大的隐患,首先读者通过数据库平台,并不知道论文存在问题并已经被撤销,更不知道被撤销的原因,可能通过其他途径检索到该论文并继续引用;另一方面,数据库作为记载科学发展历史的平台,应该客观全面地记录所有的科学文献及发展过程,并及时发现问题和纠正错误,促进科学研究的健康发展[3],因此,这样“错误”文献的存在还是很有其必要性的。

4 建议

4.l 数据库应该建立撤销论文的处理标准规范

数据库作为一个文献传播平台,不应该助长“错误”的传播,而应该及时发现错误、纠正错误。所以对撤销论文等一系列学术不端论文,应该在数据库中特别标识。其实PubMed数据库对撤销论文的处理起到了很好的示范和参考作用,首先,它对被撤销论文和撤销声明做了交互链接;其次,对撤销论文标引有“Retracted Publication(已撤销出版物)”文献类型,同时对撤销声明标引了“Retraction of Publication(撤销出版声明)”文献类型,二者相互对应;此外,PubMed数据中还根据学术不端论文的不同原因和情况,设有“Published Erratum(出版更正)”、 “Duplicate Publication ( 重复出版 )”、“Corrected and Republished Article(校正和再版论文)”等文献类型,标引的文献数量都多达几千篇。但即使如此,PubMed数据库中的撤销论文仍有很高的被引用次数和被引用率,可见不少科研工作者对这类文献还没有引起足够的重视。

针对目前数据库的建设,笔者建议:首先在数据库中一定要对被撤销论文和撤销声明做参照链接,使之互相关联;同时建立单独的索引(Retraction Index)[4]或 “系 统” (The System of Scientific Retractions)[5]统一管理这类文献,便于检索;对被撤销论文及其撤销声明的标引应该完全一致,从而保证二者能够同时被检索出来;被撤销论文的题目还可以再增加更醒目的标识[6],可以采用不同的颜色、字体等,让读者能够一目了然;另外,目前国内很多数据库同时也提供“学术不端”或“论文相似性检测”等软件,如果在此类软件中也把这部分文献特意标识出来,编辑部或者作者在检测文章内容的同时,也同时对参考文献进行检测,从而可以有效防止由于人为疏忽而造成的漏检。通过以上种种方法,力求做到无论编者或读者,在数据库使用中都能够很容易识别出这类文献,从而避免撤销论文的被参考和引用。

4.2 编辑部所刊发的撤销声明应该信息完整,格式统一

在国内数据库中,大部分撤销声明检索不到,究其原因主要是因为很多撤销声明提供的信息太过简单,如仅仅显示题目“附:撤稿作者给本刊的来信”。所以建议在撤销声明中,应包括被撤销论文的中英文题目、作者、作者单位,甚至被撤销论文标引的关键词、主题词等信息,从而可以使读者在检索到撤销论文的同时,也可以检索到撤销声明,从而防止被错误引用。此外,撤销声明中除了应该包含原撤销论文的上述基本信息外,还应该明确标明被撤销的理由[7],如剽窃、抄袭、数据作假,或是违背医学伦理等信息。期刊出版界也应该建立完善的学术论文撤销标准规范[8],使研究人员明了哪些论文因科研失范行为被撤销,并以此来约束研究人员的职业道德和科研行为,同时也能进一步完善同行评审制度。

4.3 编辑部应该严格核实参考文献,做好把关

即使在数据库中对这部分文献已经做了很好的标识,但如果引用者不认真的话,也有可能被再次参考,那就需要编辑部的工作人员逐条审核参考文献,杜绝此类“不真实”文献的被再次引用。

总之,目前被撤销论文的数量与日俱增,应该引起大家足够的重视,特别是数据库对撤销论文的处理是文献传递的第一步,也是一个艰难和长期的工作,同时需要作者、期刊编辑部、数据库的开发者等来共同努力协作完成。首先,编辑部在提供数据给数据库开发者时,要对撤销论文和撤销声明特别标识和特别交代,引起数据库开发者的注意;另外,数据库开发者接到编辑部的通知后,应该在数据库中立即处理,明确标识,以引起读者的注意。只有这样才能有效防止由于原先的错误论文而产生出新的错误论文。

1 National Institutes of Health.National Library of Medicine Fact Sheet.Errata, retractions, partial retractions, corrected and republished articles, duplicate publications, comments(including author replies), updates, patient summaries, and republished(reprinted) articles policy for MEDLINE(updated 04/06/2010).[2011-02-11].http://www.nlm.nih.gov/pubs/factsheets/errata.html

2 《中国学术期刊网络出版总库》删除学术不端文献暂行办法.泸州医学院学报,2009,(6):671

3 赵大良.刍议科技论文的更正,替换和撤销.编辑学报,2012,24(4): 393

4 Fang F C,Casadevall A.Retracted science and the retraction index.Infection and immunity, 2011, 79(10): 3855-3859

5 Furman J L, Jensen K, Murray F.Governing knowledge in the scientific community:Exploring the role of retractions in biomedicine.Research Policy, 2012, 41(2): 276-290

6 Wright K,McDaid C.Reporting of article retractions in bibliographic databases and online journals.Journal of the Medical Library Association, 2011, 99(2): 164

7 Resnik D B,Dinse G E.Scientific retractions and corrections related to misconduct findings.Journal of medical ethics, 2013, 39(1): 46-50

8 刘红,胡新和.国际学术期刊撤销已发表论文的实证分析——以Science Direct数据库为例.中国科技期刊研究,2011,22(6): 848-852

猜你喜欢
标引不端声明
本刊声明
本刊声明
中医古籍医案知识元标引方法的思考及对策
关于采用《科技期刊学术不端文献检测系统(AMLC)》的声明
论文作者学术不端行为类型
本刊声明
本刊声明
《中国粮油学报》关于学术不端稿件的认定和处理办法
档案主题标引与分类标引的比较分析
《中国医疗美容》学术不端检测方法