李佳蔚 周白瑜 刘谦
[作者简介]李佳蔚(1994—),女,山东济南人,北京医院期刊编辑部,国家老年医学中心,中国医学科学院老年医学研究院编辑;周白瑜(1979—),女,湖南衡阳人,北京医院期刊编辑部,国家老年医学中心,中国医学科学院老年医学研究院编辑;刘谦(1976—),男,山东青州人,中国医学科学院肿瘤医院编辑。
[摘要]文章旨在探讨科技期刊编辑出版人员审读论文查重结果的优化策略与实践,以解决日益增多的论文学术不端问题。文章选取Aging Medicine杂志作为案例,采用文献分析和案例研究方法,通过收集和分析相关文献以及科技期刊编辑出版的经验,总结有效的优化策略。结果表明:科技期刊编辑出版人员应认真审读查重结果及原文,并进行多重检查,在兼顾效率的同时审慎分析,做出正确判断;加强合作与交流,参加培训和研讨会;利用数字化和智能化技术,提高评价标准和防范能力。这些优化策略有助于提高论文质量,保护作者权益,并提升科技期刊的影响力。
[关键词]查重;优化策略;科技期刊
党的二十大指出:加强国际传播能力建设;不断提升国家文化软实力和中华文化影响力。这要求我国科技期刊应顺势“走出”国门,实现“造船出海”。科技期刊是新时代背景下优秀科技成果的高度凝结和集中体现,是学术交流的重要平台。在科技期刊上发表的论文应是某一学科领域的创新性成果,不能重复、模仿、抄袭他人的成果,但当前,科技期刊论文学术不端行为层出不穷。
根据国家新闻出版署2019年最新发布的行业标准《学术出版规范—期刊学术不端行为界定》(CY/T 174—2019),学术不端行为有多种不同的表现形式。目前,针对各种各样的学术不端行为,科技期刊编辑出版人员主要通过各种学术不端检测系统反馈的论文重复率及检测结果进行判断[1],这种方式极大地提高了编辑出版人员的工作效率,能够有效地阻止学术不端行为的发生。但各种学术不端检测系统也存在漏洞,对同一篇论文反馈的结果可能存在较大差异,这就要求编辑出版人员要认真阅读和分析检测结果,理性对待检测结果。
文章探讨科技期刊编辑出版人员审读论文查重结果的优化策略与实践,以期编辑出版人员能更好地把关科技期刊论文质量,防范学术不端行为。
一、科技期刊论文查重的机制和现状
(一)查重机制
目前,有效控制科技期刊论文重复率的主要手段是运用学术不端检测系统对论文进行重复率的检测。中文科技期刊常用的学术不端检测系统有中国知网、万方检测系统、维普检测系统、PaperPass论文检测系统等,不同检测系统对同一篇论文反馈的结果可能存在较大差异,究其原因可能是每个检测系统所比对的数据库及重复率计算的方法不同[2]。学术不端检测系统论文查重的核心机制是将被检测论文与查重系统所包含的数据库论文进行文字比对。比如:中国知网采用的是最先进的模糊算法,设置5%的查重阈值,论文中连续13个字相似或抄袭会被标记出来,提示该语句可能存在学术不端行为;万方检测系统采用的是基于滑动窗口的低频特征部分匹配算法,特点是检测速度快;PaperPass论文检测系统采用动态指纹越级扫描技术进行论文查重,论文中连续8个字相同则会被标记出来,提示有抄袭的可能[3]。英文科技期刊常用的学术不端检测系统是iThenticate/CrossCheck论文防剽窃系统。这是一个基于全球学术出版物所组成的庞大数据库和海量网页的检测比对工具。iThenticate/CrossCheck将编辑出版人员提交的论文与海量全球数据库和网页内容进行比对,得出相似度百分比和涵盖大量相关信息的原创性报告,以百分比表示,并将相似的部分标记出来,自动追踪抄袭论文来源,清晰标记相似语句。
(二)查重现状
為了遏制论文抄袭、剽窃等学术不端行为,科技期刊编辑出版人员在接收论文之后的第一步通常是通过各种学术不端检测系统对论文的重复率进行检测。一般来说,重复率30%以下的论文可以进入编校流程的下一环节;对重复率30%以上的论文,编辑出版人员在审读查重结果以后再做出判断。文章选取2021年5月1日—2022年2月28日Aging Medicine通过iThenticate/CrossCheck论文检测系统查重的61篇论文进行分析。在经过查重的61篇论文中,大部分论文的重复率小于30%,占比为83.5%。其中:重复率小于10%的论文有12篇,占比为19.7%;重复率为10%—20%的论文有26篇,占比为42.6%;重复率为20%—30%的论文13篇,占比为21.3%;重复率为30%—50%及>50%的论文占比分别为11.4%和4.9%,详见表1。
经过对重复内容进行整理分析,笔者发现论文容易出现内容重复的地方有以下几处。论著类论文重复的内容主要集中在:前言中的国内外研究进展综述;统计分析中的统计方法介绍、诊断标准、纳入/排除标准及伦理审查等。综述、述评类论文重复的内容主要集中在:前言中的国内外研究进展。病例报告类的论文重复率通常较低,这也与王丽等人[4]的研究结果相似。
二、过度依赖论文查重结果存在的问题
(一)非必要的论文降重时间过长
在一项调研中,70%的学生自述花在本科毕业论文降重上的时间占完成整篇论文总时长的一半[5]。由此可见,科技期刊如果过度依赖学术不端检测系统反馈的查重结果,要求作者注重降低论文重复率,则会在一定程度上使其把提高论文质量的时间用于降重,间接导致论文质量下降,这会与论文查重的初衷相违背。另外,由于各种学术不端检测系统主要是将被检测的论文与查重系统所包含的数据库论文进行对比,一些常识性、普遍性的内容也会被标记出来,如医学研究论文中的统计方法介绍、诊断标准、纳入/排除标准及伦理审查等。部分作者为了降低这一内容的重复率,会颠倒文字顺序或不规范表达,导致论文语言表达不规范、科学方法描述不严谨,从而降低论文的质量。
(二)过度依赖查重系统,难以判断论文学术性和科学性
科技期刊编辑出版人员是论文审读的第一人,其阅读一篇论文,根据自身掌握的知识往往无法完全判断论文的学术性和科学性,需要结合各种学术不端检测系统反馈的查重结果进行判断,但是不同检测系统对同一篇论文反馈的结果可能存在较大差异,这就要求编辑出版人员根据自身经验,发挥主观能动性进行鉴别和分析。然而,在实际工作中,面对海量论文和不同的查重结果,一些编辑出版人员过度依赖查重反馈的数据,逐渐形成对学术不端检测系统的依赖性,把论文的重复率作为其能否刊发的首要标准,在一定程度上忽略了对论文学术性和科学性的审查。
(三)降低作者积极性
现今,一些科技期刊将查重的标准定为30%的重复率,有些科技期刊则设定为20%,对这些标准的制定者及监管者来说,评价体系相对统一,可以省去一些烦琐的步骤,但对论文作者来说,未必是一件好事。
第一,某些学科如中文、历史、考古等,其论文往往包含大量古籍与文献,文字复制比自然相对要高,如果一味地以一般的标准要求这类论文降低重复率则过于严苛,会降低作者的写作积极性。第二,在查重要求的影响下,部分作者写论文的目的不再是进行学术研究,而是降低重复率、规避查重风险,不断通过各种方法降低文字复制比,导致发表论文的意义本末倒置。还有一些作者面对严苛的查重规则,可能会删除一些有价值、有意义的内容,使得论文的逻辑和整体架构产生较大变化,从而导致论文的学术价值大打折扣。这些无疑会降低作者的积极性,导致作者学术研究和发表论文的意愿降低。
三、科技期刊编辑出版人员审读查重结果的优化策略与实践
(一)多重检查,深入分析
科技期刊编辑出版人员作为论文出版过程中的第一主体责任人和质量把关人,应坚决抵制和防范学术不端行为,认真审读查重结果并做出判断。笔者在之前的分析中发现,论文统计分析中的统计方法介绍、诊断标准、纳入/排除标准及伦理审查等内容非常容易产生重复。笔者所在的Aging Medicine杂志曾接收一篇论文,经过学术不端检测系统检测重复率高达47%,但是笔者仔细审读查重结果后发现论文的重复率主要集中在研究人群选择和统计分析中,由于某些固定的研究方法和专有名词无法更改,这一部分都被计入重复率,导致重复率偏高,实际上这篇论文不存在学术不端问题。因此,笔者经过认真审读研究结果后,最终决定送审这篇论文。
面对海量的重复率结果,科技期刊编辑出版人员需要仔细阅读和分析查重报告,关注论文中的相似段落、引用部分和参考文献,以及与其他已发表论文的相似之处。只有这样,才能在面对大量论文和研究结果时,准确地把握论文的情况,做出正确的判断。此外,科技期刊编辑出版人员还需要关注论文的创新性和原创性。科技期刊的核心价值在于发表具有独特见解和创新思想的研究成果。因此,编辑出版人员在审读过程中应特别关注论文的研究设计、实验方法、结果解读和结论的新颖性与独创性。
(二)加强合作与交流,参加培训和研讨会
与同行合作是科技期刊编辑出版人员促进论文查重结果优化的重要方式之一[6]。科技期刊编辑出版人员通过与其他同行进行合作与交流,如参加编辑会议、研讨会等活动,了解他们在审读论文查重结果方面的实践和经验,分享彼此的经验和策略,由此提高自身审读能力和判断查重结果的准确性,共同促进学术出版的发展。
与作者和审稿专家的沟通也是科技期刊编辑出版人员促进论文查重结果优化的重要环节。科技期刊编辑出版人员积极与作者和审稿专家进行沟通和交流,就论文的查重结果进行讨论,有助于解决可能存在的误解或疑虑,通过交流,编辑出版人员可以为审稿专家提供更多的背景信息和解释,以更准确地评估论文的学术诚信性和原创性。
参加有关审读和查重的培训和研讨会也是科技期刊编辑出版人员促进论文查重结果优化的有效途径。Aging Medicine杂志与国际知名出版商wiley公司合作出版,wiley公司通过邮件等方式邀请编辑部人员参加最新的培训会、研讨会。通过参与这些活动,编辑出版人员可以学习如何更好地理解和分析查重报告,并与其他同行交流和学习,不断提升自身的专业能力和知识水平,以更好地应对学术不端行为的挑战,确保科技期刊的学术质量和声誉。
(三)充分利用人工智能工具
编辑出版人员在审读查重报告时可以利用多种人工智能工具来提高效率和增强准确性,包括以下具体的人工智能工具。第一,自动标注工具:Adobe Acrobat Pro、Microsoft Word、Google Docs等。这些工具能够自动识别和高亮显示可能重复的片段,帮助编辑出版人员更快速地定位和评估论文中的问题。第二,文本相似度分析工具:Word Embeddings、Doc2Ve等,可以通過比对论文和其他文本的相似度来评估论文的原创性和学术诚信性。这些工具使用先进的文本比对算法,能够检测论文中与其他文本相似的部分,帮助编辑出版人员判断论文是否存在抄袭行为。第三,语义分析工具:Natural Language Toolkit (NLTK)、Stanford CoreNLP、Google Cloud Natural Language API等,可以通过语义分析技术来理解和解释文本的含义。在审读查重报告时,这些工具可以帮助编辑出版人员更好地理解论文中的内容,并判断论文是否存在意义上的重复或抄袭。第四,数据库搜索工具:MySQL、PostgreSQL、Elasticsearch等,可以帮助编辑出版人员在多个数据库中搜索和比对论文的内容。这些工具能够快速搜索互联网上的文本和学术数据库,找到与论文相似的内容,帮助编辑出版人员评估论文的原创性和学术价值。
通过利用这些人工智能工具,科技期刊编辑出版人员可以高效地审读查重报告,并准确评估论文的学术诚信性和原创性。然而,科技期刊编辑出版人员仍需要结合自己的专业知识和判断力,对查重结果进行综合分析和评估,确保论文的质量和学术诚信。
四、结语
近年来,科技期刊论文学术不端行为层出不穷,为了有效防范各种学术不端行为,各种学术不端检测系统的应用也越来越广泛。科技期刊编辑出版人员有效利用学术不端检测系统可以发现学术不端行为,降低学术不端行为的发生概率,但是过度依赖论文查重结果也容易降低论文质量,难以判断论文的学术性和科学性,降低作者的积极性。鉴于此,笔者认为科技期刊编辑出版人员应认真审读查重结果及原文,并多重检查,在兼顾效率的同时审慎分析,做出正确的判断;加强合作与交流,参加培训和研讨会,与其他编辑人员面对面交流,互相借鉴和学习。同时,科技期刊应抓住数字化、智能化促进期刊出版变革的重大机遇[7],利用基于大数据分析的学术不端检测系统和同行评议功能[8],对论文学术不端行为形成科学合理的评价标准,提升我国在世界科技舞台的话语权[9]。
[参考文献]
[1]张和,张海燕,毛文明,等.科技期刊初审阶段隐性学术不端行为的挖掘和防范措施[J].编辑学报,2022(04):419-422.
[2]庞海波.“三核七查”法在生物医学论文初审阶段学术不端行为防范中的应用[J].编辑学报,2023(01):77-81.
[3]白云龙,蒋雅楠,张巍,等.医药专业研究生学术不端防范机制研究[J].药学教育,2021(01):42-44.
[4]王丽,张远明.科技期刊论文查重对学术不端的警示作用[J].传播与版权,2020(12):27-29.
[5]薛菁.本科生毕业论文重复率检测实践:问题与应对[J].高教论坛,2021(03):62-64.
[6]翁彦琴,靳炜,岳凌生,等.中国科学院科技期刊青年编辑队伍现状及发展对策[J].中国科技期刊研究,2019(03):280-285.
[7]游小菊,吳国云,李琳,等.数字化转型背景下数学类科技期刊的网络传播研究:困境与破局[J].中国科技期刊研究,2023(05):632-638.
[8]李庚.缩短科技期刊出版时滞策略及未来出版模式展望[J].中国科技期刊研究,2022(11):1546-1553.
[9]《关于深化改革 培育世界一流科技期刊的意见》内容摘编[J].编辑学报,2020(04):360.