■尹淑苹 郝艳丽
中国地质科学院地质研究所《岩石矿物学杂志》编辑部,北京市百万庄26号 100037,E-mail:shupyin2008@sina.com
学术不端,一个敏感而又在学术界普遍存在、屡禁不止的现象,关于其定义、表现形式及危害已有很多文献进行了探讨[1-7],在此不再赘述。AMLC即“科技期刊学术不端文献检测系统”,是由清华大学中国学术期刊(光盘版)电子杂志社和同方知网公司共同研究开发的一个基于全文的数据库检索比对系统。它是以《中国学术文献网络出版总库》为数据库,对所提交的文章进行比对,从而定量地检测出待测文章与目前已有出版文献的重复率,包括重合字数、重合比例等,并可将重复的文献以及重复的文字标出供用户进一步的分析。该系统开辟了采用技术手段防范学术不端行为的新方法[8],它的出现对当今学术界的学术不端现象起到了强大的遏制作用,更成为编辑处理稿件过程中有效且必备的工具。目前,利用AMLC系统对稿件进行查重已经成为各大编辑部初审必经的环节。笔者发现,已有不少文献报道了该系统的应用,但是以医学编辑部居多[9-13],而地学类期刊却鲜有类似的文章报道。
科技期刊编辑对学术不端行为有着不可推卸的防范和查处的责任[13-15],但在不同的专业领域,学术不端的重点表现形式及界定条件不能一概而论,通过AMLC系统所表现出来的文字重复率及所反映的抄袭程度也不尽相同,不同专业期刊的编辑在处理文章、对待学术不端行为的判断上也应有所差别。同专业的期刊编辑应该加强交流,将各自防范和应对学术不端行为的经验分享出来,以便在实际工作中能够更好的处理和应对。因此,本文利用AMLC系统对《岩石矿物学杂志》2013年的连续90篇来稿进行了集中检索,根据编辑经验,对每篇文章中的重复语句、段落一一进行比对、定性分析,并结合系统提示的重复率对稿件进行了分类和评级,最后对每一类稿件给出编辑处理建议,供广大地学编辑交流参考。
地学类文章中学术不端的主要表现形式有:抄袭、剽窃、重复发表、一稿多投、篡改数据、不当署名等。
地质学类稿件一般篇幅较长,图表、数据、参考文献均较多。以《岩石矿物学杂志》刊登的稿件为例,一篇正常的稿件,文字一般在2万字以上,表格5个左右,图10个左右,且图表数据较复杂,参考文献则在50篇以上。
地质学类稿件的结构一般包括:中英文题目、中英文作者及单位、中英文摘要,引言、研究区概况、测试及结果、讨论、结论、参考文献。
正常情况下,引言、研究区背景介绍以及测试方法都会较多的涉及前人研究成果,引用是必不可少的,在讨论中也会有个别的观点或结论性的语句会引用前人成果,也是正常而可以接受的。
地学稿件中的表格数据基本都应该是自己未发表过的,不能直接用别人已发表的成果,即使要引用,也必须要注明源文件的出处。图一般都会用自己的数据来套用他人的底图,涉及照片应是自己未发表过的照片。
AMLC检测系统对待测文献的字数限制在15 000字,而地学类稿件大多篇幅较长,再加上图表,一般都会超过字数限制而上传失败,因此首先对原始稿件进行一次加工,即删除原始稿件中的英文题目、英文摘要、图、表及参考文献等信息,只保留正文文字部分。地学文章中的英文题目、摘要、参考文献与作者原创的内容无关,删除这些,对于原文检测结果没有太大影响。这样通过一次加工后基本都能达到字数的要求,个别仍然超过字数的要进行二次加工,即将单篇稿件分割成两篇(或以上)15 000字以内的文章。
然后将加工后的文献上传,检测。系统会给出检测数据,最后根据编辑经验人为地对每篇文章的重复部分进行定性分析,给出评级,得出初审结论。
表1为系统给出的检测数据。需要注意的是,表格第2列为重复的比例,该比例是在删除了原始稿件的英文题目、英文摘要、图、表以及后文所附参考文献后的重复比例;第3列为笔者对重复的地方一一进行比对给出的细节描述;第4列为根据编辑经验给出的稿件处理建议;第5列为便于分类讨论给出的评级。
表1 ALMC系统对90篇文献的检测结果
续表
由表1可见,可以将稿件分为三大类六小类。
第Ⅰ类,重复比例很低,直接通过型。此类稿件重复比率小,基本在10%以下。其中又包括3类:Ⅰ1、Ⅰ2和Ⅰ3类。
Ⅰ1类:重复率为0%,有21篇。此类稿件毫无疑问为通过,直接进入同行评议阶段。
Ⅰ2类:重复率基本都在10%以下,集中在5%以下,有9篇。此类稿件与他人稿件有所重复,需要进行人工比对,但所重复的内容基本为测试方法或是个别概念性的句子,这种重复是允许的,也是非常正常和必要的,因此也可以直接通过进入接下来的同行评议阶段。
Ⅰ3类:重复率20%以下,有19篇。经过人为比对,为个别综述性、讨论性句子重复,一般重复率达10%以上的都会夹杂大段的测试方法的重复,其中测试方法的重复是允许的,鉴于地质类文章多需要参考很多人的文献,因此在地质背景、某些已经过论证的结论上都需要引用他人的观点,所以这类重复也是正常的,不能算作学术不端,也可以直接进入同行评议阶段。
第Ⅱ类,重复比例稍高,不能直接进入同行评议阶段,必须人工比对根据具体情况来处理。其中又分为2种:Ⅱ1类和Ⅱ2类。
Ⅱ1类:重复率约10%~30%,集中在20%左右,有18篇。经过比对发现,多为大段落的重复,一般来说,测试方法的大段重复是正常而允许的,除此以外的大段重复则是不应该的。这类大段重复多为区域背景、地质特征等基础地质部分,已经成熟被研究的矿床在区域构造和地质特征上已经达成了一定程度的共识,对这些特征的描述不可避免的会与已发表的文献有所重复,但是一字不改、标点符号也完全一致的大段落重复就有抄袭之嫌了,可以认为是学术不端的一种表现形式了。这类稿件必须先退给作者加以修改,将重复部分换做自己的措辞重新述写后再送专家评审。
Ⅱ2类:重复率约20%~40%,15篇。经过比对,发现此类稿件多与他人文献在成果综述、测试方法、结果讨论中有着句子及段落的各种重复,且重复文字涉及文章的各个环节,可以认为从头到尾都是在按照他人的研究思路、测试方法以及讨论依据在进行,是在模仿他人的研究,笔者将此类稿件定义为“模仿研究”。科学研究的本质也就注定了模仿的存在,且不得不承认,在地学研究中,大多数学者都是沿用他人的研究思路、相同的测试方法,得出的数据在讨论中也有着很多相似之处,那么模仿他人的研究也就不可避免的存在。但是具体该模仿有无必要、研究的意义有多大、乃至模仿的正确与否都需要相关行业的专家来做判断,因此这类稿件已经涉及到了学术不端,但是其必要性以及恶劣性则需要行业内专家来确定,因此建议编辑在处理该类稿件的时候,将原始文件以及被模仿的文章一起交与专家审阅,参考专家的审稿结论对稿件进行处理和评价。需要注意的是,这类稿件或多或少的夹杂着段落的重复,即便是通过了专家评议,也要在退修的意见中做出提示,督促作者加以修改,尽量避免段落或者句子的照搬照抄。
第Ⅲ类,直接退稿型,这类稿件的重复率基本都在50%以上,有5篇。这类稿件属比较恶劣的学术不端的表现形式,大段落、多部分的抄袭他人文章,应直接做退稿处理,且要对作者提出严重的警告,甚至列入编辑部的黑名单,以后遇到该作者的文章要引起警觉。
另外,还有2篇系统提示重复率在50%以上,如稿件2013035和2013047,但是这类稿件也做出了通过的处理,直接进入专家审稿阶段,因为它们基本上是与本人的毕业论文或者本人在未公开发表的内部文献上的已有成果有所重复,若这些成果未在期刊上公开发表过,且不涉及侵占他人成果等问题,是完全可以通过的。不属于学术不端行为范畴。还有一篇2013024,系统提示重复率30.4%,经比对发现文章中较多段落与个人已发表文献重复,部分内容有重复发表之嫌,此种行为涉及到了学术不端,需要与作者沟通,将已发表过的内容剔除后再重新处理。
综上可以发现,在所调研的90篇稿件中,有51篇可以直接通过的稿子,占到所调查样本的57%。存在较严重学术不端直接退稿的有5篇,约占6%。其余多多少少涉及到学术不端,其中综述性内容大段抄袭,修改后可以通过的18篇,占20%;模仿研究的需根据专家的审稿意见判断的15篇,占约17%。
结合ALMC系统提示的重复率,可以直接通过或者稍作修改可以通过的重复率基本集中在20%以下,个别达30%;抄袭严重必须退稿的重复率一般都在50%以上;而重复率20%~50%之间的稿件多需要结合专家的审理意见再做决定。
AMLC系统在实际应用中有着自身的局限[16-18]:
(1)AMLC用以检索比对的数据库只局限于《中国学术文献网络出版总库》,即CNKI的数据库,因此对于未被CNKI数据库收录的文章则无法加以比对;
(2)只是机械的比对,最小检测单位是句子,如果作者有意回避,将原句稍作修改、增加删减几个词汇,则可能检测不到;
(3)对于图表、公式、数据的抄袭和篡改等行为无法检测出来;
(4)只对已发表的文献可以检测,对一稿多投、剽窃成果、篡改数据和不当署名等行为则无法检测。
本文所给出的评级只是基于AMLC系统提示的重复率,实际操作中,重复率0%的文章也未必就不存在抄袭现象,所以在编辑初审的时候,重复率可以作为一个重要依据,但并不能作为唯一的依据。利用ALMC系统检测的重复率可以使编辑对稿件的状态有一个初级的判断,但绝对不能仅靠数字来下结论,进一步的人工比对是非常必要的,同行评议的意见也非常的重要。
尽管存在诸多的局限,但AMLC检测系统确实可以有效的检测文字方面的抄袭现象,对重复发表也有一定的检测能力,对遏制学术不端起到了积极的作用,是编辑初审必备的工具。各编辑部应该加强交流,尤其是同专业的期刊编辑,应该将日常工作中所遇到的学术不端行为、应用AMLC系统的方法和经验以及对存在学术不端现象的稿件的处理方法等多渠道、多平台的分享出来,以强大业务能力、丰富编辑经验,为更好的遏制学术不端行为发挥期刊编辑的重要作用。
1 李刚,陈京香,王健梅等.学术不端行为分析及编辑部预防对策措施.编辑之友,2011,(8):77-78
2 学术不端-百度百科[EB/OL].http://baike.baidu.com/view/2282697.htm
3 王倩,林燕英,张艳艳等.科技论文学术不端现象分析与对策.编辑之友,2011,(11):84-86
4 杨进军.当前我国学术不端行为的成因及对策研究.成都:西南交通大学,2005
5 任艳青,陈培颖,欧彦等.《自动化学报》防范学术不端行为的策略.中国科技期刊研究,2012,23(3):373-376
6 谢燕,钱俊龙,潘小伦等.从防范学术不端论文中提升编辑职业素养.中国科技期刊研究,2011,22(4):522-524
7 马云会,刘苏君,王雅西等.抵制学术不端行为是学术期刊编辑的责任.中国科技期刊研究,2012,23(4):674-676
8 史成娣.论“学术不端文献检测系统”在编辑工作中的应用——以“科技期刊学术不端文献检测系统”为例.南昌教育学院学报, 2009, 24(4):82-84
9 杨晨晨.“科技期刊学术不端文献检测系统”在《新疆医学大学学报》审稿中的应用及判断.中国科技期刊研究,2012,23(6):1088-1090
10 董建军.《眼科新进展》应用“学术不端文献检索系统”评价抄袭现象情况分析和体会.中国科技期刊研究,2011,22(3):388-390
11 林加西,刘建滔,邓丽琼等.AMLC检测医学论文学术不端的功能评估及优势探索.韶关学院学报,自然科学,2012,33(12):73-76
12 关蕴良,罗萍.启用CNKI学术不端检测系统以来《重庆医科大学学报》来稿文字复制情况分析及原因探讨.重庆文理学院学报:自然科学版,2012,31(2):111-112
13 康银花.药学论文学术不端的表现及责任编辑的应对策略.中国科技期刊研究,2012,23(4):676-678
14 李殷,钱俊龙.刍议防范科技期刊学术不端中编辑的作为——增强编辑主观能动性,实行工作规范化.中国科技期刊研究,2011,22(6):853-859
15 吕小东,沈锡宾,李伟等.发挥编辑人员在防止学术不端正行为中的作用.中国科技期刊研究,2005,16(6):903-904
16 吴学军,赵卫星.在初审源头利用AMLC把住学术不端关.烟台职业学院学报,2011,17(2):10-20
17 谭华,崔洁.学术不端文献检测系统的使用建议.编辑学报,2012,22(2):153-155
18 吴均,江润林,张晓琴.利用学术不端检测系统研究科技论文中存在的问题.中国科技期刊研究,2010,21(4):471-472