修饰后文字复制比过低的论文成因分析与对策
——以硕士研究生论文为例

2022-10-14 08:19张益嘉徐哲
通化师范学院学报 2022年9期
关键词:不端稿件学术

张益嘉,徐哲

中国知网科研诚信管理系统研究中心研制的学术不端文献检测系统,自2008年投入使用以来,在一定程度上为学术不端中原始抄袭内容的检测提供了便利。科技期刊学术不端文献检测系统(AMLC)可以将6 000字左右的期刊论文平均耗时小于3s并且生成详细的检测报告。现在编辑部的学术不端检测软件主要是中国知网科技期刊学术不端文献检测系统,另外,还有万方文献相似性检测服务系统、大雅相似性分析系统、PaperPass检测系统、Gocheck论文引用检测系统等[1]。但是,不管编辑部选择哪种学术不端检测软件,都仅仅规避了稿件中表面的文字复制比问题,并不能彻底解决原创性学术不端的问题[2]。经过学术不端检测软件检测后的稿件,编辑部不能完全按照规定数值作简单的判断选择,如大于规定数值退稿了事,小于规定值的稿件立刻收稿进入外审程序,编辑要仔细甄别稿件的科学性和创新性再进入下一个程序,正确对待文字复制比结果,对稿件取舍要慎之又慎。本文将以本刊来稿中硕士研究生的投稿论文为例,探究经过大幅度修改后文字复制比过低的论文的产生背景和成因,并提出如何防范此类论文中可能存在学术不端的相关对策。

一、文字复制比过低的产生原因

研究生作者是高校学报作者群的重要力量,为高校学报的发展不断注入新的活力,研究生所撰写稿件能够关注学科前沿和社会热点话题。但是,研究生作为科研领域最年轻的力量,由于缺乏科研论文写作经验,在书写和表述方面往往存在诸多问题,使得其研究成果不能以优秀作品形式展现给读者,可谓事倍功半,实为可惜。大多数高校对研究生毕业标准均有明确规定:既对发表论文数量限制,又有发表期刊级别的要求,二者同时满足条件,不但可以拿到优厚的奖学金,还能顺利毕业。研究生在校学制为2~3年不等,他们面临时间紧、任务重、要求高的学业压力。研究生本身缺乏批判性思维以及导师的监管不严格,另外由于高校教育方式等问题,侧重在理论实践方面,轻视了学术道德教育,使得硕士研究生对学术不端的行为缺乏理解,从而滋生出新的学术不端行为。

随着学术不端事件的频频曝光以及学校各种学术诚信教育宣传活动的开展,研究生清楚地知道学术不端行为一旦被查实将对自身学业或学术生涯的发展造成不可挽回的损失,因此对抄袭剽窃、一稿多发等显性学术不端行为越来越重视并尽力避免,但这并不意味着学术不端行为从根本上杜绝了,有些只是采取了更加隐蔽的操作手段。俗话说:上有政策,下有对策。很多作者都认为论文检测结果“达标”就可以定稿。硕士研究生为了期刊论文能够顺利发表,就开始采取各种“有效修饰”措施,首先要符合期刊要求的硬性指标——文字复制比标准。运用技术手段规避复制比高部分连续相同的文字数量,把一句话拆分成不连续的句子进行表述,或者把句子杂糅表达,多次翻译转换复制文字,参考文献引用而不标注,这些做法降低了论文的学术性和完善性[3]。

二、修饰后文字复制比过低的几种情况

渤海大学学报(自然科学版)在2018.1.1—2020.12.31期间收到了第一作者为硕士研究生投到学报的期刊论文163篇,其中有20篇文字复制比为0(占比5.5%),有13篇文字复制比小于0.5%(占比3.6%),其中综述类有2篇,科研论文有31篇。文字复制比过低的论文最后有6篇作者主动撤稿,经过同行评审后编辑部退稿10篇,刊发15篇。笔者对文字复制比过低(0~0.5%)的论文进行统计、追踪分析、作者访谈、问卷调查等,总结出文字复制比过低主要有以下几个原因。

(一)“避重就轻”

对重要雷同内容进行隐藏,或者含糊其辞地表达。作者对论文前言中研究背景的陈述时,部分采取对相关论文内容进行高度凝练,部分是直接翻译英文期刊的内容,避开了文字复制比过高的情况。实验方法中采用前人已用过的经典方法,通过分析别人的实验方法来获取自己实验的“恰当”数据。作者在整个论文书写中遇到核心观点时改变表达方式,轻描淡写一带而过,或者引用与其相关度不大的文献,甚至引而不注,误导读者对文献的可追溯性。本来论文重复率很高,但是为了成功发表,在投稿前通过各种检测机构、各种渠道进行了文字复制比检测,然后成功“降重”,以防被直接拒稿。当编辑部收到稿件的时候,对所投稿件进行追溯会发现作者已经有多次检测记录,直到最后一次检测文字复制比为0的记录。

(二)“润色文字”

作者利用润色语言文字巧妙规避检测系统检测出的文字复制比问题。2005年美国麻省理工学院研究人员发现了SCIgen“神器”软件,它能结合字符串产生假文章[4]。另外,还有MATHgen软件可以产生数学类文章。检测系统默认的是连续相同的文字,连续的字数越多,检出文字复制比就越高。作者为了降低文字复制比而将文字拆分成互不相连的短语或句子,或者增加语气助词,或者用同义词替代原词,改主动句为被动句等各种方式进行文字“润色”,最后适当修改病句。另外一种情况是,作者为了防止文字复制比较高或超标时,就充分运用各种在线翻译软件,如有道、Google等在线翻译软件。作者把文字复制比高论文中的文字复制到在线翻译系统中翻译成外文甚至少数民族语言,然后再把外文用翻译软件翻译成中文。由于各种语言表达风格差异、语序不同等原因,用翻译软件翻译后的论文,文字复制比会大幅度降低。通过润色文字方法改变了原来的文字语序,不但没有改变论文要表达的主要意思,而且还成功地降低了文字复制比。

(三)“修饰图表”

中国知网的检测系统在对图、表进行比对时,由于对比数据库收录的图、表数量有限的原因,所以有一定的局限性。作者利用系统漏洞会在论文写作中对图、表及表中数字“做文章”,来规避文字复制比超标(图1、图2)。从图1和图2比对可以看出:作者通过调整中间值的方法,成功降低了检测软件的文字复制比。论文写作时能用图和表来表达清楚的问题,首先选择用图和表而不用语言文字来表述;有的作者“修饰”图、表中的文字,调整表格中原有的文字或者数字表达顺序;有的作者把文字复制比高的部分文字内容转换成图片插到文字中。比如,将已有的折线图改成柱状图,对图扭曲和反转,改变图的坐标涵义,缩放坐标轴比例尺、标值位数,改变图中的网格线形式等。这些都是“行之有效”且能降低文章总复制比的办法。

图1 截取作者投到编辑部的部分论文数据

图2 截取投稿前系统中追踪到论文部分数据

(四)“简单替换”

有些作者在投稿前已经在知网检测系统进行了多次查重,然后参照文字复制比报告对论文中的数值进行了微小调整,形成了复制比过低的论文。有些作者利用自然科学学科的特点,论文中含有大量的公式、定理、合成式、反应式等特殊性,在论文写作时使用大量的公式编辑器进行书写,或者将一部分内容用图片格式表述。实验学科的论文中实验仪器名称书写时用英文简称代替部分中文;为了规避以前学者的研究习惯和约定俗成的字母代表含义,作者进行更换字母,比如:在一类参数辨识优化模型中的限定条件μ(x’,p)≥0,qS(x’,p)≥0,qPD(x’,p)≥0,qEtOH(x’,p)≥0,作者改为μ(X,P)≥0,qS(X,P)≥0,qPD(X,P)≥0,qEtOH(X,P)≥0,这样在文字复制比结果中也减少了重复的部分,最终形成了过低的文字复制比结果。

(五)“一稿多投”

作者抓住期刊论文从录用到知网上网存在的时滞[5],在投稿时间上动脑筋。硕士研究生作者由于毕业时间紧、任务重,只有期刊论文发表才能如期毕业。此时,个别硕士研究生将一篇文字复制比过低的论文,简单修改题目,再稍微对实验分析方法和实验结论进行修改,同时投两篇文字复制比过低,但是相似度极高的论文到不同的期刊,以增加录用几率,如果一篇论文被录用则另外一篇主动申请撤稿。由于投稿时间基本相同,收稿的编辑部在处理稿件时间差异也很小,最后在检测系统中出现了文字复制比低的现象。

三、文字复制比过低的防范对策

作者应该正确看待文字复制比结果的参考作用,既要防止复制比过高,又要杜绝人为操作复制比过低,从而造成学术不端以及科研诚信问题。文字复制比过低的防范对策主要从以下几个方面进行阐述。

(一)导师监督把关

加强学术规范学习并严格遵从学术规范是学生顺利完成论文的重要保证,是学生必备的素养之一。撰写学术论文时,高校有关部门应该组织学生认真学习关于学术道德和学术规范的相关文献,并适当开展规范化训练,以便充分理解和掌握有关学术引证规范,确保论文写作安全有效[3]。

硕士研究生指导教师在指导研究生撰写科研论文过程中,导师不仅要传授科学知识,同时还肩负着学术道德规范的监审,要严格把关,成为学术把关人。在唯文字复制比检测“达标”的情况下,科研诚信常常被弱化甚至被忽视。不应该单凭检测报告单数字低于规定值就给予通过,应该通过现象看到本质。因此,研究生导师应该帮助学生认真分析检测报告结果,跳出“检测重复率合格即是论文合格的误区”。充分利用报告的指导作用,不能见到报告中的红色部分就改,应该及时查缺补漏、尊重事实结果进行修改。正确对待文字复制比数值,合理使用文字复制比,保证文章的完整性和科学性。

(二)人机结合检测

由于检测系统所收录的文献库内容有所差异,收录时间有延迟现象,检测内容的侧重点也有所不同,编辑部可以交叉使用万方文献相似性检测服务系统、PaperPass检测系统、超星大雅相似性分析系统等学术不端文献检测系统,从而弥补只用一个系统检测造成的短板。编辑部对收到的稿件进行检测后,不能完全依赖检测系统的报告结果而一锤定音,而是要依据报告的文字复制比高低来发现稿件中是否存在隐性学术不端问题,从而挖掘质量更好的稿件。但是检测系统毕竟是人工收录的,系统还存在着或多或少的缺陷,所以编辑部不能把各种检测系统检测结果直接作为稿件初审的唯一取舍标准。编辑应该在同行评审专家以及编委的共同把关下对稿件进行选择,对论文中有疑问的地方再人工局部查找相关文献进行核对处理。编辑应该在检测系统结果的辅助下不放过任何一个好稿件,也不能让任何一个漏网之鱼有可乘之机。

(三)编辑把关

基于各种算法的学术不端检测软件的出现,在一定程度上为学术不端中原始抄袭内容的检测提供了便利,但是检测系统毕竟是人工编写代码的识别程序,不具备对稿件内涵的辨别能力[6]。期刊编辑在处理稿件时,仍需要带着“怀疑”的眼光看待稿件,切实起到编辑作为稿件第一道关口“守门员”的重要作用。

由于文字复制比较低的稿件存在着隐蔽性和复杂性,提高编辑人员的辨伪能力尤为重要,编辑要积极发挥主观能动性和专业性。在利用各种平台审核稿件的同时,还应认真对文中参考文献进行“按图索骥”,从细节中查找可能存在的学术不端行为。对于存疑的稿件,与作者沟通,确认何种因素所致。视稿件复制比的具体情况,如涉嫌观点抄袭、关键实验数据篡改,虽然从表面来看复制比不高,但也是对源文献的严重侵犯,应坚决予以退稿[7]。

随着数据库新收录文章的不断更新,稿件复制比在收稿时和出版前还可能发生变化,不是一成不变的;即使通过了学术不端检测软件的检测,复制比较低的稿件中依然可能包含严重的学术不端行为,编辑应该判断论文是否具有原创性,是否与他人的研究或者作者前期研究有区别之处,从而作出客观的判断。处理稿件流程加速,发表快速,如果好的观点可以优先网上发表,避免后期重复率过高或者作者一稿多投。

(四)评审专家审查

同行评审是把研究成果交给专家作客观公正的审查,更是使所发表的研究具有可靠性必不可少的一个程序。通过同行评审的诚恳反馈以及可信赖的研究沟通意见,作者可以从不断修改中完善科研成果,提升论文质量。对于比较隐蔽的学术不端现象,找同行和审稿人从专业的角度进一步审视更容易发现。编辑如果对稿件文字复制比过低问题有疑义,而且经过相关方向的核对并且还持有异议的情况下,应该把检测报告一起送给审稿专家,请审稿人在有疑问的地方从专业角度在文章的创新点上进行仔细辨识。评审的作用和目的不单在于强化研发人员的责任感,更是基于对期刊稿件的“把关效应”。

(五)加大学术不端的处罚力度

2021年12月,中华人民共和国科技进步法规定学术不端行为构成犯罪的,依法追究刑事责任。2018年11月,国家发改委、人民银行、科技部等41个部门联合印发《关于对科研领域相关失信责任主体实施联合惩戒的合作备忘录》(发改财金〔2018〕1600号),旨在“加强科研诚信体系建设,建立健全科研领域失信联合惩戒机制,构筑诚实守信的科技创新环境”[8-9]。2019年《政府工作报告》提出“加强科研伦理和学风建设,惩戒学术不端,力戒浮躁之风”“营造良好的科研生态”[9]。加大对科研诚信的惩戒力度,对有据可查的学术不端问题,必须严格整饬,惩处科研不端要坚持“全覆盖”“零容忍”的态度。

编辑部收到硕士研究生作者稿件时,要与作者签署《学术诚信承诺书》,要求所有作者签字,让作者知晓并承诺文责自负,并在期刊网站的稿约上写明学术不端行为对侵犯他人著作权的危害性。研究生学院应该规定非涉密学位论文在规定上网期限内要采取积极主动公开措施,允许更多读者下载阅读,同时也是接受社会公众的监督和审查。学术论文和学位论文在检查时,一旦发现存在学术诚信问题,经过后期核验确实属实,应有相应的惩处措施,如采取限时返回修改、延期答辩、延期毕业甚至取消学位授予等不同程度的处罚[10]。

四、结语

学术不端检测系统为学术不端行为的甄别提供了数字依据,但是编辑不能过度依赖检测系统,不能完全按照文字复制比检测结果一锤定音,应该视稿件具体情况具体分析,审慎取舍。采用中国知网AMLC系统对学术不端行为起到了一定遏制作用,关键还是要加强对硕士研究生作者群体的学术道德诚信教育,营造良好的学术氛围。

猜你喜欢
不端稿件学术
录用稿件补充说明
征集汽车电子类稿件
整合品牌栏目 征集优秀稿件
关于采用《科技期刊学术不端文献检测系统(AMLC)》的声明
学术是公器,不是公地
学术动态
整合品牌栏目征集优秀稿件
学术动态
论文作者学术不端行为类型
对学术造假重拳出击