尤嘉琮,刘 玮,张丽仪,林志祥,吕 鹏,阮 继*
(1. 中华医学会杂志社《风湿病与自身免疫(英文)》编辑部医学期刊知识挖掘与服务重点实验室 北京100052;2. 中山大学肿瘤防治中心《Cancer Communications》编辑部 广东广州510060; 3. 中华医学会杂志社《癌症发生与治疗(英文)》编辑部医学期刊知识挖掘与服务重点实验室 北京100052)
近年来,随着图像处理软件和文献数据库的日益发展,论文中的学术不端问题逐渐暴露出来。国内外出现大批因实验数据造假、图片篡改和伪造、欺诈性署名、虚假同行评议等行为而撤稿的事件,这些学术不端行为造成的危害无疑是巨大的,极大地浪费了学术资源、败坏了学术环境、造成了严重的学术不公,导致了社会对学术界的信任危机[1]。在这些学术不端行为中,图片篡改和伪造等学术不端的问题较为突出。2016年微生物学家Sunnyvale图片分析顾问Elisabeth Bik带领团队,对1995—2014年发表在 40种期刊上的20621篇论文的图像进行了筛选和分析,发现3.8%的论文中的图片存在问题,其中至少1/2表现出故意操纵的特征[2]。2018年该团队再次发表了对细胞分子生物学领域期刊的研究结果,分析了2009—2016年发表在Molecular and Cellular Biology上的960篇论文,其中59篇(6.1%)论文中存在不当复制的图片,导致了41次更正、5次撤回和13次未处理[3]。这些数据一经发布,在学术界甚至社会中引发了巨大反响和讨论,让人们对论文中图片的真实性产生怀疑,严重影响了学术界的声誉。
但是,目前对于图片学术不端行为的甄别方法还十分稀少,大多依靠期刊编辑在收稿时对论文图片直接观察进行比对和鉴别,这种比对方式只能对图片的篡改或重复使用进行鉴别,采用的方法也大多是将图片放大,检查是否存在颜色过渡时模糊、扭曲等现象,对比各组间和不同时间点的图片特征结果确定是否存在混用[4]。也可使用Photoshop、JPEGsnoop等软件中的工具进行人工比对。这种方式固然有效,但只能发现一些使用较为低级的方法处理过的图片,且耗费大量的人力和时间,收效甚微。不仅如此,图片的篡改包括合成、变种、润饰、增强、计算机生成、绘制等[5]多种方式。随着图像处理软件的日益发展,图片处理越来越精细,上述方法已不能满足甄别图片学术不端的需要。
有研究者[6]提出使用开放科学计划OSID(open science identity)中的SAYS(scientist at your system)系统工具包对论文的图片进行鉴别。开放科学计划是一项面向学术期刊的开放科学公益计划,借助SAYS系统工具,为每篇论文标注唯一OSID标识码,构建供科研工作者互动交流的平台[7]。但是,该方法有一定的局限性,若已发表的论文所在期刊未加入OSID,则无法将论文中的图片加入数据库,不能用来鉴别待发表的论文。而且,部分学科因其特殊性,图片的重复性很低,可能少有自身图片重复使用的问题,较少涉及抄袭其他论文中的图片内容,如果出现这种情况,该方法则无法鉴别,所以不能解决所有问题。
Bik等[3]报道,Molecular and cellular biology杂志中因图片学术不端问题而撤稿的论文约占撤稿论文的10%,约占杂志发表论文总数的0.5%,若该比例具有代表性,将有大量论文在发表后撤稿。论文发表后,杂志编辑平均需要用6h解决论文中的图像问题;但在论文发表之前,编辑平均只需用30min对论文中的图片进行筛选与修改,既可减少论文发表后可能出现的问题,又可节省编辑在论文发表后因修改图像问题而耗费的大量时间。为了避免发生图片学术不端现象,国际上各大出版社都进行了许多努力和尝试。目前,Wiley出版社开发了一款AI图像处理软件(Image Checks),并宣布将推出“图像审查服务”[8]。Wiley出版社的一些期刊的编辑部应用该软件在投稿论文的初审阶段对图片进行检查,帮助编辑甄别图片是否存在学术不端现象;同时,要求作者在论文投稿时提交原始数据和图片,以便编辑检查。
本文对Wiley出版社的AI图像处理软件的工作原理及应用进行介绍,分析和讨论了该软件的优势与不足,为期刊编辑准确又高效地甄别图片学术不端提供参考。
该图像处理软件主要用于图像完整的科技论文中的图片检查,如生命科学和医学等,首先应用于Wiley出版社出版的Journal of Cellular Biochemistry和Journal of Cellular Physiology杂志[9]。该软件具有准确、集中、优化、可扩展和专业驱动的特点,可以在稿件的初审阶段帮助编辑对论文中的图片进行检查,以便及时发现和修正出现的问题。许多国际期刊,如Journal of Cell Biology及EMBO出版社旗下的The EMBO Journal、EMBO Reports、EMBO Molecular Medicine等,采用了一种新的图片深度查证流程,即图片数据完整性分析(data integrity analysis),由专业人员对图片进行系统性分析,结果发现有20%~30%的稿件的图片存在不同的问题[10],该软件的采用,提高了期刊编辑对图片数据的分析能力,更高效地检查出图片中可能存在的问题。
Wiley出版的一些期刊要求2020年7月以后投稿的作者在提交稿件时,需要提供未经处理的原始凝胶电泳图像,出版社将原始图像存档,如果后续需要参考原始数据,可能会使用这些原始图像,并写信向作者咨询。
Image Checks的工作原理与编辑收稿后对图像的分析和处理流程基本相同。作者投稿后,Image Checks对稿件中的图像进行干预,使用Visual Studio和Photoshop等专业图像处理软件检测图片是否存在剪切、拼接、翻转、移接、调整对比度等处理。为确保图像分析的专业性,由相关学科专家对图片进行分析,且参与度大于或等于专业软件Photoshop。Image Checks软件设计团队可根据使用者的需要,在检测前、检测中和检测后分别提供分析和技术支持服务。目前,主要对生命科学和医学领域的稿件进行验证,范围是接收初审或接收待修改的稿件中的图片、显微照片和凝胶印记图像。
编辑在接收到作者提交的稿件、原始记录和原始图片后,首先对稿件进行编号,然后使用Image Checks软件对稿件中的图片进行分析,最后出具分析报告供编辑、作者参考和对稿件进行修改。图片分析过程主要包括3个阶段。
①预检测和分析:对稿件进行预检测和分析,首先鉴定稿件内容,然后使用Image Checks分析稿件中的图像,最后通过目测或Photoshop对图像进行 检测。
②正式检测和分析:根据杂志社对稿件中图片的要求检查图片,如清晰度、格式等,再按照图像优化软件的参数检查图片,如常用的处理是对比度的调整等,以便于彻底检查图像是否存在人为处理等学术不端行为。
③检测和分析后:根据已有的标准创建分析报告,也可根据作者或编辑的要求定制分析报告。在报告中根据学术不端的类型对可能存在问题的图片进行分类,标注出可能存在问题的具体位置和对问题的详细描述,并且提出相应的修改建议。而且报告是可以分享的,编辑可通过电子邮件将审查报告分享给稿件的利益相关者,进一步沟通或跟进修改进度,以便于编辑跟踪和管理稿件数据,提高工作效率和工作 质量。
Image Checks软件工作流程示意图如图1所示。
图1 Image Checks软件工作流程示意图 Fig.1 Schematic diagram of Image Checks software workflow
较为常见的图片学术不端行为是一图多用或对原始图片稍加处理后重复使用。如图2所示,稿件中的图片描述为:橙皮素减少LPS诱导的小鼠股骨骨质流失,小鼠在第9天被安乐死,并使用显微CT和3D重建扫描它们的股骨远端。图像经检查发现“橙皮素(Hesperetin) ”和“脂多糖(LPS)+橙皮素”的图像相同,这是不可能的现象,因此判断存在图像重复使用的情况。
图2 稿件中出现的一图多用 Fig.2 Repeated use of one image in manuscript
免疫印迹和凝胶成像结果是生物学和医学稿件中最为常见的数据,也是出现图片学术问题最多的数据类型。最为常见的问题是作者有意或无意地通过有选择地剪切、翻转、重新排序和重用相同的源图像或不相关的图像来表示不同的结果。蛋白质免疫印迹结果的一图多用如图3所示,2张图片中GAPDH的条带相同,但分别标注的蛋白却是不同,因此判断存在图片学术不端行为。
图3 蛋白质免疫印迹结果的一图多用 Fig.3 Repeated use of one image of Western blot results
图像拼接是指通过不当的剪裁、抹除、复制、旋转、缩放、拼凑等方式,对图像进行篡改或者修改、重组图片的部分内容得到想要的、但并不存在的结果数据图像,属于图片学术不端行为[11]。图像检查软件通 过调整图片的亮度/对比度、级别和曲线的变化来分析图像,判断是否存在图像拼接行为。如图4所示,结果显示AFT4和MTHFD2图像中,2组条带之间有明显的直线(使用粗框和箭头突出显示),表明存在剪接。直接通过肉眼观察很难辨别出ATF4图像中条带间的拼接痕迹,但使用图像检查软件能够快速、准确地分析出拼接位置。
图4 图像拼接的鉴别结果 Fig.4 Identification result of image splicing
图像分辨率较低虽然不属于图片学术不端行为,但是对图像检查和论文的发表存在一定影响,因此也需要让作者进行修改或重新提交。如图5所示,图像检查软件通过调整图片的亮度、对比度和曲线来分析图像。然而,由于作者所提供数据图片的图像分辨率较低(用粗框突出显示),很难得出分析结果,无法鉴 别图片是否存在学术不端问题。因此,应要求作者提供更高分辨率的图像和原始数据(免疫印迹/凝胶图像)进行重新分析和验证。
图5 图片的图像分辨率较低而无法进行分析 Fig.5 Unable analysis due to low image resolution of picture
综上所述,图像分析软件能够对稿件中不同图片类型的常见错误很好地进行鉴别,可帮助编辑对稿件中的图片进行高效、准确地审查。
近年来,大量论文因存在学术不端行为而被撤稿,造成了非常恶劣的社会影响,引起了学术界和期刊界的广泛关注。Wiley、PLOS、Elsevier、Nature等多个国际期刊出版社旗下的期刊也增加了投稿同时提交数据原始图片的新要求。相关机构也推出各种防范措施,研发检测图片造假和篡改的系统,如美国科研诚信办公室(The Office of Research Integrity,ORI)开发的“Droplets”、艾普蕾(iPlagiarism)公司研发的猫图鹰图像造假检测系统、Mike Rossner创办的IDI(Image Data Integrity)系统。百度等科技公司还开放和提供图片剽窃检测系统[12]。
Wiley出版社也研发了AI图片分析系统并已投入使用,要求作者投稿时同时提交稿件及数据的原始图片,软件随即对稿件和数据图片进行分析并出具分析报告,编辑可以根据报告对稿件进行评估,联系作者对稿件进行修改,不但大幅减少了编辑或专业审核人员对论文中图片的审核时间,同时也提高了问题图像的检出率和准确性。
目前图像分析软件还存在一些不足之处。在一些学科中,虽然研究结果的可重复性比较小,但如果研究内容相似,数据结果也可能存在抄袭或一图多用现象。图像分析软件目前只能根据作者提供的原始图片进行分析,还无法将稿件中的图片与已发表或已经投稿过的其他稿件的图片进行比对分析。所以,需要建立一个相关的图片数据库,将不同期刊已出版的论文图片录入数据图,以供软件进行比对分析。Elsevier与柏林洪堡大学在2018年宣布根据被撤稿论文中的图片建立一个数据库[13]。Journal of Cell Biology鼓励作者共享数据,并于2008年发布了专为存储生命科学领域论文原始图片的在线存储系统JCB DataViewer,未来将与其他存储生命科学领域图片数据的公共存储系统合并[14]。随着AI图像识别技术的提升及论文数据库的完善,存在数据和图片学术不端的论文会逐渐被曝光,进而遏制学术不端行为的发生,营造和维护公平、公正、良好的学术环境。■