科技论文隐性学术不端行为判别特征分析

2019-02-13 05:22张重毅

中国科技期刊研究 2019年1期

■张重毅方梅

中国科学院软件研究所期刊联合编辑部, 北京市海淀区中关村南四街4号 100190

随着互联网的普及以及数字化时代的到来, 人们可以采用更加方便快捷的方式从网络的海量信息中获取信息。在“互联网+”时代, 由于科研成果的传播速度极大加快，科研人员能快速及时地阅读国内外最新的研究成果，但这也给学术不端行为的防范带来了新难题。互联网上资源丰富，通过点击鼠标就能复制粘贴，稍加处理就有可能拼凑出一篇“看起来还不错”的论文。

学术不端行为已经引起了学术界、科技期刊界及相关行业同仁的重视,学术不端文献检测系统等的广泛使用就是证明。但多数检测系统是根据文字重复情况进行判断，目前还没有实现对图形、表格、公式、引文及多语言内容的检测，因此具有隐蔽性特征的学术不端(以下简称“隐性学术不端”)行为难以被检测系统识别，这在一定程度上阻碍了科技期刊编辑对学术诚信的判断。对于科技期刊编辑来说，在稿件编校过程中敏锐准确地判断出某篇文章是否存在隐性学术不端行为，具有较大的难度。

笔者在编辑实务中积累了一些隐性学术不端的实例，分析这些实例的特征，总结隐性学术不端行为的判别技巧和经验，为识别与防范学术不端行为提供参考。

1 隐性学术不端行为

1.1 何为隐性学术不端

目前，隐性学术不端行为还没有一个明确的定义，但已有研究多将不能通过计算机检测、只能通过通读文章而发现的学术不端行为归类为隐性学术不端[1-3]。隐性学术不端因具有不易被检测系统发现、需要花费大量精力比对等特点,成为学术不端的常见形式之一。

1.2 隐性学术不端类型

相关研究总结的典型隐性学术不端类型包括不当署名、图表及公式篡改与抄袭、跨语种抄袭、数据篡改、网页抄袭、逆反式抄袭等[3-4]。本研究将重点分析不当署名、公式或图表抄袭、跨语种翻译抄袭这3种隐性学术不端行为。

(1) 不当署名。2009年3月19日，教育部发布的《教育部关于严肃处理高等学校学术不端行为的通知》中，明确列举了7种必须严肃处理的学术不端行为，其中第(五)和第(六)条属于不当署名。可见不当署名是一种已有明确定义的常见学术不端行为。2018年4月24日，中国科学院科研道德委员会发布的《关于在学术论文署名中的常见问题或错误的诚信提醒》[5]中，更是详细列出10种在署名时需要特别注意的事项。但不当署名行为很难被学术不端文献检测软件发现。随着现在跨单位、跨部门合作的科研活动越来越多，不当署名的判断也越来越困难。

(2) 公式或图表抄袭。图表、公式是现有学术不端文献检测系统的检测盲区之一[4]，其篡改和抄袭表现形式多种多样，如将表格改为数据图[4],将图表数据改用文本表述[3]等。

(3) 跨语种抄袭。跨语种抄袭是最难被发现和判定的学术不端行为之一，需要经过详细阅读和分析才能发现。而更难以解决的问题是，很难找到可供对比的原文。所以这类文章基本都会被列为“存疑”状态，而不能做进一步的处理。

1.3 隐性学术不端行为的甄别

随着隐性学术不端行为越来越多，编辑行业对这类不端行为的重视度也在提高，已有一些同行在辨别隐性学术不端行为方面取得了一定成绩。

于海[3]认为人工比对是辨别隐性学术不端行为的重要方式，并给出了快速、准确、有效地找到相似文献的5个建议。但给出的建议较泛，实操性有待加强。

吴艳妮等[6]讨论了科技期刊编辑识别学术不端论文的若干技巧，其中包括“枪手”论文以及篡改和伪造数据论文的识别方法，但该方法对编辑的个人经验的依赖程度较高，可操作性不强。

陈姗姗等[7]以医学科研论文为例分析了学术不端论文的8个隐性特征，其中有部分涉及了不当署名、数据及图片篡改等隐性学术不端行为。但所总结的特征主要针对医学论文，形式比较单一，对于辨别其他领域科研论文的学术不端行为的参考作用不大。

徐咏军[8]针对医学科研论文隐性学术不端行为的特点，给出不当署名、思想抄袭、数据造假及待发表稿件与原稿学术检测不一致4种不端行为的判定和防范机制。整体判定机制比较简单，实操性略低。

此外，也有其他同行在工作中总结了辨别和防范隐性学术不端行为的方法[9-10]，篇幅关系，不做详细阐述。

2 隐性学术不端特征分析

笔者在编辑实务工作中，多次遇到隐性学术不端稿件，分析和比较其中实例数量较多的典型隐性学术不端实例后，总结出不当署名、公式或图表抄袭及跨语种抄袭3种隐性学术不端行为的若干特征(表1)。在编辑审稿过程中，适当利用这些特征来判定对应的隐性学术不端行为，可提高判定成功率，对防范学术不端行为有较大帮助。

表1中在总结3种隐性学术不端行为特征的同时，还补充了利用这些特征在判别不端行为时的注意事项。

表1 3种隐性学术不端行为特征

3 隐性学术不端特征应用案例

3.1 不当署名

笔者曾处理一篇文章，该文章有两位作者，但两位作者不在同一单位，单位性质和所在地也不同，而且不能提交由两位作者亲笔签名的投稿声明等材料。与正常文章最不相同的是，编辑在与其中一位作者商讨文章相关事宜时，该位作者表示不能与另一位作者联系。

这篇稿件在处理过程中表现出来的情况比较符合表1所归纳的不当署名特征A1～A3，因此可认为该稿件存在不当署名的可能。基于对不端行为严格把关的态度，笔者多次与该论文的作者进行沟通，陈述要害，作者最终承认另一位作者为人情关系户，并同意去掉“关系户”作者的署名。

3.2 公式或图表抄袭

公式或图表的抄袭一般夹杂在全文抄袭中，因此编辑发现有公式或图表抄袭时，还须判断是否还有文字内容的抄袭。

专家在审稿过程中发现一篇稿件的公式变量定义前后不一致，并且对于变量含义的描述含糊不清，告知编辑部需向作者询问，并提示编辑比对相关文献。责任编辑检查文章内容后发现，该稿件中的部分比较复杂的公式没有使用公式编辑器录入，而是直接插入的截图。而且，编辑与作者沟通公式中变量含义及相关内容时，作者的表述不准确、对内容不熟悉，这与表1中公式抄袭特征的B1、B2和B4吻合。于是责任编辑对该稿件做进一步筛查，发现部分公式确实使用了他人的研究成果。经主编与审稿专家商议，考虑到作者的确也有足够的工作量，故要求该作者对论文进行大修，全文统一变量名称及说明，在必要公式前明确标明参考文献以尊重他人的劳动成果。

3.3 跨语种抄袭

跨语种抄袭是一种隐蔽性极高的学术不端行为。目前笔者所在的编辑部发现并认定了一例跨语种抄袭实例。该文稿有5个章节，包括公式在内共有22个自然段与某英文文章内容雷同，且全文超过60%的内容与英文文章雷同，被判定为跨语种抄袭。这一跨语种抄袭实例具有典型性，现将其中某段内容截取出来，作为例子进行分析。

跨语种抄袭的内容对比见图1和图2。通过对比可以看到，疑似抄袭论文的公式中用W[k]、V[k]、D[k]、α[k]、ω[k]、S[k]、η[k]等，替换英文文章中的A[k]、B[k]、G[k]、u[k]、w[k]、C[k]、v[k]等，其后的公式说明与英文文章一样，即公式内容中除变量名称有变化外，包括公式内容说明在内的其他内容均与英文文章雷同。而文字部分更是具有典型的跨语种抄袭特征。因公式部分专业性较强，且主要为公式抄袭，因此，对该例的跨语种抄袭分析将以文字部分为主，具体文字对比见图2。

图1 跨语种公式抄袭实例。(a)抄袭公式及说明部分；(b)英文公式及说明部分

图2 跨语种文字抄袭实例。(a)跨语种文字抄袭部分；(b)英文文字部分

图2(a)所示的这段文字可以读通，但是却并不符合中文表达规则和习惯。也就是说，可以理解文字内容，但文字有很多语法错误。这比较符合跨语种抄袭特征的C1和C2。为进一步说明其他特征，笔者将分析各句的特点。

“卡尔曼滤波器算法(Kalman)在系统状态估计方面有悠久的经验。”这句话使用了不合适的形容词“悠久”；而说 “卡尔曼滤波器算法”在某方面有“经验”，也不符合中文语法。从学科角度来说，“卡尔曼滤波器算法”及“系统状态估计”这两个词的使用不准确，符合特征C5和C6。

“由于其最优性能，卡尔曼滤波器理论上是有吸引力并最容易实现，在许多实际系统里具有很好的结果。”这句话中出现了比较明显的副词后置,在中文表述中，“理论上”应放在句首，而在英文中，“in theory”可以放在句末。“是有吸引力并最容易实现”及“在许多实际系统里具有很好的结果”中缺少必要词汇。这句话的表述特点符合特征C3和C4。

“Fuzzy Kalman滤波(FKF)[9]是扩展卡尔曼滤波算法的一种方法，如线性系统的参数在区间是模糊变量。”这句话没有考虑上下文的连贯性，前后文间缺少必要的关系连词及说明文字。若想完整且准确地理解这句话的含义，读者必须进行深入的理解加工。同时，这句话符合英文从句结构的特点。“如线性系统的参数在区间是模糊变量”这部分文字如果被反向翻译为英文从句，则其符合地道的英文表述习惯，符合特征C1、C3和C4。

从上述分析可以看到，该稿件的文字内容符合跨语种抄袭的特征C1～C6，所以编辑部将该稿件标注为“待查”，经进行进一步筛查、检索及比对，向该文作者通报了抄袭认定，并做退稿处理。

4 防范隐性学术不端行为的建议

从3种隐性学术不端实例的分析可以看出，单纯依靠文献检测系统来发现和判定隐性学术不端是不够的。面对学术不端行为越来越隐蔽、种类越来越多样的情况，科技期刊编辑必须要增强辨识能力，提高对学术不端行为的敏感性。

4.1 编辑提高防范意识

编辑在实务工作中提高防范意识是提高辨识能力的基础，主要包括以下3个方面。

(1) 提高存疑意识。编辑在处理来稿时要保持存疑的态度，若某篇文章在正常处理流程中因各种原因不能完成编辑部或编辑的要求，那么编辑应对该文保持关注，不仅要关注稿件的与众不同，也要关注作者对细节的处理方式。任何与正常来稿不同的作者行为，后面都有可能是隐藏很深的、或严重、或轻微的学术不端行为。编辑只有保持敏锐的直觉，才能发现隐藏较深的学术不端行为。

(2) 提高甄别意识。在提高存疑意识的同时，编辑在实务工作中也要提高甄别意识。发现有疑问的稿件，要有深挖和调查的决心。隐性学术不端行为的“隐”不仅表现在难以被发现，也表现在难以被判定。当编辑对来稿存疑时，要有“打破砂锅问到底”的精神，深入调查，采用不同甄别方法来判断。这时，编辑要具有像侦探一样强烈的是非观，决不放过一篇可能存在学术不端的稿件。

(3) 提高审稿意识。随着国家科技实力的进步，学术活动也越来越活跃，因此学术编辑的工作也越来越繁忙。很多学术期刊的编辑忙于组稿、编稿及编务工作，忽视了审稿，这部分工作更多地依赖于同行专家评议。事实上，同行专家主要是对稿件学术水平进行把关，编辑工作在出版行业第一线，对学术不端行为的变化有直接感受，在同行专家评议的同时，编辑也应坚持评审、通读来稿，配合同行专家，共同对稿件质量进行把关。

4.2 编辑部加强管理

在防范和处理学术不端行为方面，学术期刊编辑部责无旁贷。为了对学术不端行为进行最大限度的防范和最有效的惩治，编辑部应在以下3个方面加强管理。

(1) 加强“名单”管理。很多编辑部都有自己的作者“黑名单”，这里说的“名单”，不仅是指有学术不端行为作者的“黑名单”，还应包含“灰名单”。“灰名单”用于记录有过学术不端行为的单位，如有此单位的其他作者投稿，编辑部应多加关注。

(2) 加强“签名”管理。在稿件处理过程中，编辑部应以严格谨慎的态度对待作者提交的签名材料。比如在必要的时候比对签名笔迹、作者姓名等。虽然这并不能在辨别学术不端行为方面起到实际作用，但通过这种措施，可以传递给作者严肃的出版态度。在防范学术不端行为方面，可以起到“敲山震虎”的作用，使作者明确编辑部对学术出版的严格要求，这样有学术不端行为的作者在投稿时也会三思而行。

(3) 加强沟通管理。学术期刊之间，尤其是相同领域内的学术期刊应建立必要的沟通和联动机制，主要是共享“黑名单”和“灰名单”。这样可以最大限度地发挥“名单”的作用，一旦作者意识到一次不良记录会导致整个领域内学术期刊的拒稿和学术质疑，那么，作者就会特别珍惜自己的学术信誉，对学术不端行为避而远之。

5 结语

随着学术不端检测系统的推广，文字抄袭的情况已经逐渐变少，但隐性学术不端行为因无法被系统检测而逐渐增多。本研究给出不当署名、公式或图表抄袭、跨语种抄袭这3类隐性学术不端行为的特征，并详细分析使用这些特征进行隐性学术不端判定的实例，与编辑同行共享，以提高对隐性学术不端行为的辨识能力。此外，还对学术期刊编辑提出了相应的建议，希望在信息高速传播的网络时代，与编辑同行共同以强烈的责任心、严谨的编校态度，当好学术诚信的“把关者”，为建设健康的学术环境贡献力量。