■文/袁珩(中国科学技术信息研究所)
2020年10月,全球领先的专业信息服务提供商科睿唯安发布《科研诚信:理解我们对可持续学术生态系统的共同责任》报告,梳理了破坏科研诚信的诱因、主要环节和具体行为。为维护科研诚信,报告建议利用技术、数据和分析等方法来识别和减少科研不端行为。
报告认为,以下因素是各利益相关者破坏科研诚信的诱因。
(1)研究人员希望在高质量期刊上多发表研究文章,提高声望。这些文章有机会被多次引用,这将提高他们获得资助的机会,使他们能够担任更高职位,并确保职业生涯能够长久。
(2)期刊希望吸引领域内最优秀的研究文章,增加发行量,以确保其盈利能力、长期可持续性和读者数量增长。
(3)出版商希望建立成功的期刊组合,按照领域、访问模式、接受门槛或其他方式进行专业化整合。
(4)研究机构希望吸引、培养、提升和留住能够产生具有广泛社会经济效益的世界一流学者;研究水平提升也有助于提高研究机构声望。
(5)资助机构(科研基金)希望投资于能够产生高影响力成果的团队和项目。
(6)各国政府希望构建并投资于具有良好治理水平的科研体系,以带来政治、经济和文化优势。
(7)数据库和分析提供商希望提供有效的搜索和发现功能,提供分析工具,支持研究评估用例。
(1)研究问题、文献综述、假设和计划。这一环节可能存在:重复研究和重复发表问题。研究周期应包括进行全面的文献综述,避免上述问题,提高研究效率,并对前人的研究成果给予适当肯定。
(2)研究、实验和数据收集。这一环节可能存在:研究结果被他人攫取、粗略或草率记录的问题。为此,应当完整记录假设和实验计划。
(3)数据分析、假设验证与数据保存。这一环节可能存在:捏造、伪造、篡改和修饰数据;P值篡改(P-hacking);随意选取数据;在知晓结果后进行假设等问题。
(4)准备稿件的过程,包括数据、展品、参考文献、作者、机构、资助、致谢和利益冲突声明。这一环节可能存在:捏造、伪造、抄袭;为提升本人、其他作者、期刊或研究机构的影响力而采用特定参考文献;编造或捏造作者的隶属关系;缺少完整准确的支持声明和利益冲突声明等。
(5)投稿。这一环节可能存在:一稿多投;投稿的期刊与研究领域不符;将一项研究分成多篇论文发表等。
(6)编辑、修订及同行评议过程。这一环节可能存在:作者在推荐审稿人时,会推荐自己人或使用假电子邮件地址将审稿转发给自己;在收到审稿人意见后,做出为自己或他人谋取利益的修改,如应编辑要求增加引文,增加作者或出售作者身份;审稿人要求作者引用审稿人论文;审稿人试图打压竞争对手、窃取观点或成果,以争取研究成果优先权;编辑要求作者引用指定期刊,以提高期刊影响因子等。
(7)出版。这一环节可能存在:出版被用作获取个人利益的工具。出版是对研究人员和知识进步的贡献,应符合行业规范,符合诚实、开放和负责任的精神。
(8)使用出版物记录代表研究和研究人员水平或能力。这一环节可能存在:篡改出版物和引用数据,以谋取个人利益和商业利益的问题。涉及任命、晋升、资助等工作而进行的研究评估,通常依赖出版物、引用数据及其他定量数据。如果出版物和引用数据被篡改,就不能作为个人、期刊或研究机构活动和成就的可靠记录。
近年来,监测科研体系诚信情况的相关工作取得了较大进展。随着数据的可用性提升,新的分析技术和算法被开发和应用,利用技术、数据和分析监测科研不端行为成为可能。
(1)自引分析。引文指标是根据某篇研究论文被引频次来衡量其学术影响力的一种方法。一项研究累积的学术影响可以在期刊、机构或地区中衡量出来,并与同行进行基准比较,揭示相对差异和变化趋势。报告认为,当论文作者的自引率被广泛审查时,审稿人可以做出相关知情判断并提供建设性反馈。该技术也可用来跟踪期刊的自引率,并与其他期刊进行比较,避免潜在问题。
(2)识别期刊间协作引文操纵。期刊引用报告(JCR)提供了关于期刊自我引用和期刊间定向引用如何影响关键指标的数据。通过对期刊间被引频次数据及其对期刊影响因子(JIF)分类排名的影响进行分析,可检测出期刊影响因子虚高的期刊。
编辑和期刊通过相互交换引文来提高期刊影响力的行为被称为“引文联盟(citation cartel)”。这种行为很难从算法上发现,但由于网络科学快速发展,有望通过编程检测出这种不端行为。
(3)识别抄袭行为。检测抄袭的软件最初被用于作业抄袭检测。随着互联网的普及,潜在的可抄袭的材料呈爆炸式增长。为此,人们开发出许多计算密集型算法对大量文本进行比较。然而,这不仅需要查找文本之间的复制,还需解决一系列复杂问题,如对字面抄袭和智力抄袭加以区分,捕捉释义和抄袭之间的微妙区别,以及解决检测跨语言抄袭方面的障碍等。
抄袭检测软件应成为编辑全流程工作中的标准配置,以方便快速地检测可疑稿件。同时,随着抄袭行为越来越复杂,软件需要识别出更多更复杂的抄袭行为。
(4)识别图片操纵。由于论文中出现问题图片的案例显著增多,许多编辑已将图片纳入审查流程,出版社也计划就图片操纵问题制定明确政策。专家也将越来越重视在图片审查过程中寻找各类问题,如裁剪、亮度和对比度调整、选择性增强、颜色调整、克隆和伪造等。机器学习和其他技术进步也将提供更精准的工具解决这些问题。
(5)识别审稿人异常行为。使用软件(如ScholarOne™)可标记审稿人的异常行为,如个人设置假账户并试图审阅自己的文章或合作者的文章。这需要在投稿和同行评议期间收集和分析大量数据,以标记出应由同行评议和编辑团队进一步审查的行为,如作者和审稿人位于同一网络中或地理位置接近、审稿人审稿时间短、作者推荐的审稿人使用非机构电子邮件地址等。
(6)利用辅助工具避免学术不端行为。编写工具可以及时提供大量信息,供研究人员选择合适的参考文献。文献管理工具可以利用索引服务,确定文章的撤回状态,提供有关期刊质量的有用信息。利用个人或期刊索引服务,可以检查被引用的参考文献,标记出自引率异常的引用文章,并检查正在准备的稿件的自引率是否在该学科正常范围内。
(1)开放研究要求提高透明度。未来需要加强在研究实验、分析和出版阶段识别不端行为的能力。
(2)随着资助机构推行各种政策,要求研究人员公开研究成果,开放获取出版物数量的增加将改变:出版预算的来源,资助机构、执行机构和出版商间的收益流转等。
(3)许多不端行为的核心特征是虚报身份。除查阅公开资料和开展审查外,区块链技术能够帮助进一步核验,可以用来提供身份证明和出版物证明,并在各方之间建立信任。