人工智能技术对科技期刊科研诚信的作用*

2019-08-06 08:12:56何小军

中国出版 2019年13期

□文│何小军梁俊

我国对科研诚信的重视已经上升到国家层面。国务院发布了《关于全面加强基础科学研究的若干意见》；中国科学技术协会印发了《科技工作者道德行为自律规范》。但目前我国在处理学术不端行为上名硬实软、缺少“牙齿”。中央全面深化改革委员会第五次会议审议通过的《关于深化改革培育世界一流科技期刊的意见》，强调了科技期刊传承人类文明，荟萃科学发现，引领科技发展，直接体现国家科技竞争力和文化软实力，要以建设世界一流科技期刊为目标，科学编制重点建设期刊目录，做精做强一批基础和传统优势领域期刊。净化学术环境是做大做强科技期刊的基础与保障。应对学术不端行为，我们不仅要有严厉的惩治政策，也应有高效的发现能力。如何高效运用人工智能（AI）技术尽早发现科研失信问题，提高对学术不端行为检测技术的威慑力，应当成为我国科研诚信建设的一项重要任务。

一、人工智能技术：整治科研失信的新工具

科研失信行为极大地破坏了当前我国的学术环境。由于种种原因，主动发现科研失信行为面临困难。

1.科研成果数量巨大，管理难度大

随着社会进步和科学技术迅猛发展，各类研究成果不断快速涌现并导致文献数量急剧增长。仅以中国为例，据中国科技论文与引文数据库（CSTPCD）统计，2017年CSTPCD收录自然科学领域期刊2029种，发表我国作者作为第一作者的论文47.23万篇；收录社会科学领域期刊394种，发表我国作者作为第一作者的论文5.95万篇。[1]除此之外，还有科技报告等大量特种文献。随着网络的发展，更是产生了海量的经过网络产生和传播的学术科研信息。随着网络和信息技术的发展，学术文献撰写、编撰、出版、存储、传播整个流程的电子化成为发展趋势，但也为各类造假提供了便捷的渠道。

2.人工智能技术对于科研诚信系统构建的优势

科技期刊作为学术成果的主流展示交流平台和科研知识文库，有责任也有义务对其内容的真实性进行判断和筛选。但目前，科技期刊对于各种学术失信行为的防范，主要依赖于评审专家的学术判断、读者或同行的举报、学术伦理规范的引导以及科研资源的知识工程和有效可信信息的知识导航的运用。

人工智能技术对于科研诚信系统的构建有着无以比拟的技术优势。基于人工智能的科研资源与可信度的知识图谱与知识导航和知识工程的研究密切相关。人工智能是知识工程和知识导航的原理和方法，对需要运用专家的智慧和知识才能解决的应用性难题提供了解决办法。20世纪90年代的大规模知识工程和目前的超大规模知识工程（以开放性知识库OpenKG和UMLS为代表[2]），侧重研究实体识别和表示、关系提取、知识融合和集成、知识推理等方面。现在，知识工程的“产品”在产业界也已经开始了大规模部署和应用，如百度大脑、知识图谱和学术导航等产品相继面世。但知识工程过分地依赖于知识库或知识本体的构建，是一种集中式的信息处理方法。

在“互联网+科研知识”结合后，一方面，将所有的信息进行集中获取和处理是不可能完成的任务；另一方面，科研文献大数据具有动态、连续性、碎片化等特征，如何有效融合静态和动态知识是迫切需要研究的问题，只有将AI技术与知识工程完美结合才可以解决这类问题，见图1。

图1 基于AI技术的科研诚信系统工作模型

此外，运用AI技术构建科研资源与学习行为的知识图谱与知识导航不仅在预防科研造假中有光明的前景，还可以挖掘科研大数据的价值，同时丰富目前大数据知识工程的理论和方法。

二、科研失信治理对检测技术的挑战

随着互联网、计算机、信息化技术的普及与提高，计算机和数据库系统在科研诚信系统建设中扮演了重要的角色，人工智能技术也开始在科研诚信系统建设中发挥作用。随着大数据时代的到来，伴随着海量的数据产生的科研失信，其防治难度将更大，科研失信行为隐藏得更深更难以发现；同时，基于人工智能而产生的隐私问题，因为缺少制度监管及人工智能技术本身仍不够完善，对AI在科研失信治理中的作用提出了一定的挑战。

当前，国际上对科研与出版的学术失信行为的认定主要包括伪造（fabrication）、篡改（falsification）和剽窃（plagiarism）等。[3]现有学术出版物的学术反剽窃主要采用针对文本比对检测的主流计算机辅助手段，[4]国内有中国知网学术失信文献检测系统（AMLC）和万方数据库以万方数据的学术文献资源为比对提供的论文相似性检测服务（PSDS）以及国外的查重系统（CrossCheck、Plagiarism、Mydropbox、WordCheck、Paperpass、Turnitin 等），已被大部分期刊编辑部所采用。[5]但这些反剽窃系统也具有如下不足：①目前的反剽窃系统多局限于同一语种内的不同文本间是否存在科研失信问题，但对不同语种间的科研失信行为却无从下手。因为这不仅仅涉及知识导航，还需要自然语言处理，尤其是机器翻译技术的支持。②在正式运行前，大部分会自动剔除上传文件中的图表和公式等信息，故对图片本身的剽窃问题显得束手无策，只能通过为数不多的图表题目、注解等进行判断。

然而，对剽窃、篡改和伪造等失信行为的判断，最有说服力的证据就是图表以及数据本身。斯坦福大学的5位研究人员从数据库（PMC）中随机选择了1364篇生物医学相关文献并从中抽取出4778张图片作为数据集。在此基础上通过有监督机器学习技术训练出一个生物医学图片查重和匹配模型（ImageCheck）。使用该模型对2009～2016年发表在分子与细胞生物学（MCB）上的960篇论文组成的测试集进行评估后发现，其中59篇（6.1%）含有“不适当的”重复图像，约有2%值得再去进行图像证伪；[6]但有监督学习需要大量各种不同类型的标注图片库，这仍将是一条漫长的建设道路。以被曝光的哈佛大学皮耶罗·安韦萨（Piero Anversa）长达17年的干细胞造假事件为例，其声称在所谓的心脏干细胞领域取得了令世人震惊的“重要发现”，有着最严谨、最苛刻的审稿团队的《新英格兰医学杂志》《柳叶刀》《循环》等全球著名的顶级医学学术期刊也未能发现相关研究中数据的篡改和大量的图片造假，刊发了他的所谓“研究成果”，使他成为美国乃至世界心脏病领域最著名的“大牛”和“绝对权威”，甚至开创了一个全新的心脏病研究和医疗产业——“干细胞疗法”。直到2018年10月15日，美国生命科学网站“STAT”发布报道称，哈佛大学医学院要求撤回前哈佛医学院教授皮耶罗·安佛萨（Piero Anversa）的31篇论文，谎言至此方被戳穿。

在科技快速发展的今天，传统的预防和检测方法工具在学术不端防治中的作用是有限的；即便是拥有较高学术水平的《新英格兰医学杂志》的评审专家也没有发现研究中存在的造假行为。就上例来看，其研究有着众多看似精美、客观的图片，图形比对检测系统应该有用武之地。现有的研究成果对于技术细节交待的都不是很清楚，如有的研究[7]重点放在了如何设计检测和预防学术论文中图像（image）抄袭的概念模型以及在此基础上的业务流程框架，但没有涉及如何实现查重、验真，如何标注、如何训练，具体的程度是多少，参数的调整都未交待，其检测结果的说服力仍然有待验证。因此，要应对科研成果里错综复杂的海量图片，做到去伪存真，这是对（所有阅读文献的）人的挑战，也只有通过人工智能不间断的学习能力，才有可能得以解决。

三、对策和建议

对于涉及人为造假的“假冒同行评审”（Fake Reviews）等行为，更是学术出版所不能容忍的。科研失信经历了从“负责任的研究行为”，经过“有问题的研究行为”，发展到“故意的不当行为”，是一个连续的恶化过程，这是对学术界的亵渎，也是对科技期刊界的挑衅。斯坦福大学的研究人员也发现学术文化、同行控制、发表奖金制度以及政策等因素与这些潜在不端行为高度相关，是影响科研诚信的要素。

虽然我国已经陆续出台了一系列政策法规，对学术失信行为进行整治，但是买卖论文、代发代写、大量撤稿等新闻依旧一次次冲击着我们的伦理底线。

人工智能技术在为科研失信的治理提供强大武器的同时，也对其合理使用提出了新要求，应当在科研失信治理中充分利用AI技术优势的同时对它的应用加以法律的制约，以充分保护相关人员的合法权益并有效阻遏科研失信行为的发生。AI背景下的科研失信治理需要以加强科研人员的诚信教育为基础，以有力的法律、法规制度为保障，辅以人工智能技术为强力防治手段，形成三位一体的综合治理模式。

1.设立科研人员个人诚信档案制度

个人诚信档案在欧美等发达国家已发展运用得较为成熟。[8]如美国是以商业公司服务为主的运作模式；欧洲则以政府为主导，以中央银行或金融监管部门管理个人诚信档案。在西方国家公民的诚信记录与社会生活各个方面关系密切，直接与教育、工作、收入、保险、金融服务等方面紧密相关。同他们相比，中国的诚信系统建设起步较晚，但国家非常重视。

建立科研管理制度。基于网络多维度和海量数据建立科研诚信档案库后，科研主管部门、评审专家、科研人员都可以实现资源共享。在人工智能技术的帮助下，实现对申报项目的选题、研究内容与方法、创新、社会和经济效益等方面进行分析，更方便、快捷地对研究数据、科研成果乃至出版载体的真实性和价值进行评估。

建立科研人员的监督、管理制度。基于AI技术、网络多维度和海量数据建立科研诚信档案库后，科研主管部门很方便地就能行使准入机制，有了人工智能技术的支撑，就能够对申请人及其科研团队的详细情况及既往诚信情况有全面的了解与评估；人工智能技术在项目申请、科学研究和学术评议中能对申报者的研究方向是否合适、是否有能力按项目要求完成科研、是否有可能取得创新性研究成果作出初步评估。

奖惩有力有据。基于机器学习技术、网络多维度和海量数据建立科研诚信档案库后，将会极大地增加科研人员及其诚信行为的综合影响力，为其今后的科研、晋升、评聘等产生影响。此外，准确、实时地记录、公开科研失信行为并及时地给予处罚，实现互联网内异构信息的交互，将减少科研主管部门和科研机构对科研失信行为等各类信息掌握不对称的情况，增加科研失信行为的违法、违规成本，进而对科研失信行为产生巨大的威慑力。

2.诚信教育防微杜渐

诚信教育是科研诚信防微杜渐、长治久安的最有效工具，是治理科研失信的基础。只有德治与法治两手并重才有可能真正完成我国诚信体系的构建并发挥其在我国科研进步中的重要作用。对于科研诚信建设而言，不仅要有严格的法律制度，更应有基于人工智能技术的科研失信检测手段加以防治，同时，对科研失信人员的惩治也不应浮于形式。但构建我国的科研诚信体系的目的并不单单是惩罚违规者，而是要通过科研诚信建设，打造我国良好的科研环境，为我国的科研创新提供保障，为中国创造、中国智造服务。在此意义上，通过科研诚信教育，提高科研人员的科研诚信素养，使其自觉遵守科研诚信规范和法律制度，从而避免科研失信行为，就显得更为重要。

针对科研诚信的教育，应该始于大学，从大学开始就对未来的科研人群进行教育，让他们掌握科研规范与要求，避免因不了解科研规范而陷入科研失信，同时也从一开始就培养科研诚信，使之成为陪伴终生的习惯；科研诚信也应融合到素养教育中去，可以针对科研人员进行针对性的专题教育，培养、规范正确的科学信念：诚信是保障科研创新的重要基础，面对海量的科研信息，科研人员应当在了解知识产权，了解科研诚信的基础上，充分利用国内外的科研成果，了解相关领域的最新进展，避免重复性、无用性研究，进而站在前人研究的基础上，实现自己的创新与突破。

四、结语

科研诚信问题是必须重视并加以解决的，我们不仅要有严格的惩治措施，同样需要有高效的发展手段，但我们同样不能忽略诚信的教育问题，只有综合运用多种措施，才能为我国的科技进步与发展，为建设科技强国提供有力保障。