同行评议中的学术失范及其区块链技术防范应对

2023-10-08 01:07王治钧

中国科技期刊研究 2023年9期

■王治钧贺颖

天津师范大学管理学院,天津市西青区宾水道393号 300387

中世纪科学探索时期,毕达哥拉斯将科学与伦理相融,二者在宗教规范下和谐共存。近代科学革命后,科学抹去了宗教色彩。在科学方法的形成过程中,科学家之间出现了科学规范,以此对科学行为进行约束。美国社会学家默顿在其《论科学与民主》一书中最早对科学规范进行了界定,认为这是一种科学的精神特质[1],随后在此基础上延伸出普遍主义、公有主义、无私利性以及有组织的怀疑,即默顿科学社会规范“四原则”。然而随着科学技术加速发展,技术与价值间出现裂痕,数据造假、评价指标滥用等问题因诸多案例进入公众视野。科研诚信、科研不端、学术不端、学术失范等名词被提出,学者们围绕其概念[2]、分类[3]、成因[4]等开展研究,但大多从对某一事件的分析[5]或某一领域的科学研究角度探讨,鲜少针对某一研究环节进行细致分析。金诚[6]、李新根[7]分别从书籍阅读和工作实践入手,对同行评议中的学术不端行为进行探讨,但仅从理论上提出防范对策,并未结合技术形成有效手段,同时未对学术不端与学术失范做出概念区分。

2021年国家新闻出版署印发的《出版业“十四五”时期发展规划》[8]指出,要大力推动将区块链技术应用于学术出版过程。当前区块链技术在出版领域的应用研究主要围绕著作权管理与保护、内容安全发行与传播。同行评议是学术出版的重要环节,区块链技术与同行评议结合研究主要涉及机制完善、应用可行性探讨两个角度,鲜少从利用区块链技术治理同行评议中的学术失范的角度出发。本研究旨在通过文献调研,更准确地理解学术失范在同行评议中的内涵和具体表现,在分析现有应对措施的基础上,结合区块链技术提出具有针对性和可操作性的应对方案。

1 同行评议中的学术失范内涵及表现形式

2002年教育部出台的《关于加强学术道德建设的若干意见》是第一份提出学术道德相关概念的我国政策文本,其中提及“学术风气不正、学术道德失范”[9]。后续的政策文本中陆续出现学术不端、学术失范等名词,但只对涉及的行为做出界定,尚未明晰其概念和边界。随着与学术道德相关的案例被公众广泛关注,学界开始探讨学术不端与学术失范的边界与关系,尚未有定论。但得到共识的是,学术不端相关行为均出于为自身谋取利益,具有从主观意愿出发的特质[10-11]。而根据默顿提出的社会失范理论,失范是指个人或群体无法通过规范化路径达到目标导致行为出现冲突的状态。失范可能由于规范化路径未形成、存在问题或群体对规范化路径不认同而产生,因此学术失范未必出于主观意愿[12]。由此可得出,学术失范的外延更为广泛,包含了主观违反学术规范的行为,即学术不端,以及客观因素导致的违反学术规范的行为,有学者将其定义为“技术性学术失范”[13]。因此,同行评议中的学术失范行为分为学术不端与技术性学术失范,如图1所示。

图1 同行评议中的学术失范的表现形式

1.1 同行评议中的学术不端表现形式

1.1.1 伪评审

目前,编辑初审、同行专家外审、主编终审的“三审制”是国内外学术出版活动普遍采用的质量控制方法[14]。其中同行专家外审是决定性环节,也更易被学术不端者利用,作者、评审专家、编辑三类主体均有可能参与其中。

(1)作者冒充评审专家或利用“学术小团体”。随着交叉学科研究数量逐渐增多,编辑迫切需要领域内“小同行”进行评审,因此会请作者推荐评审专家。一些作者借此机会伪造评审专家身份,提供虚假邮箱地址,自导自演评审过程[15];或推荐“学术小团体”中熟悉的学者,进行小团体内互评[16]。从这样的伪评审中得到的评审结果往往是直接接受或者一些无关痛痒的建议,作者操纵了评审过程。

(2)评审专家不当评审。在实行单盲式评审时,评审专家可能由于知晓作者身份信息而产生审稿偏向。即使实行双盲式评审,在当前研究领域细分的背景下,通过研究具体内容,评审专家也有极大可能识别出作者的身份。有学者认为无法完全掩盖作者信息[17]。同时,无论是单盲还是双盲式评审,评审专家的身份都得到了充分保护,而并未有可确保评审公正性、亲自评审[18]、按时评审[7]的制度。当前评审专家数量与指数型增长的论文数量不成正比,部分评审专家以大量占用个人时间为由消极评审,部分未经专业培训或对评审领域并不熟悉的专家被邀请参与评审,使得评审报告质量参差不齐。

(3)编辑违背职业道德。编辑作为作者与评审专家间的桥梁,可能出于人情关系和利益做出学术不端行为,例如将作者或评审专家身份透露给对方、有意识地挑选评审专家、直接无视评审专家意见[19]。科技的发展使得科学交流日益开放,开放获取(Open Access,OA)运动迅速发展,而掠夺性期刊随之出现。掠夺性期刊为在开放获取方式下,利用学术出版的作者付费模式快速、轻松获取利润的期刊[20]。掠夺性期刊的编辑出于经济目的,完全跳过同行评议过程,无视论文质量出版论文[21]。

1.1.2 不当引用

林松等[22]从自身编辑工作实践出发,针对部分科技期刊评审专家在审稿意见中推荐作者引用文献的这一现象进行了动因分析,发现部分评审专家的确基于提高稿件质量的考虑而推荐作者阅读文献,而一些只推荐引用自己课题组论文的评审专家的审稿动机可能不够端正。在当前的评价体系中,被引频次仍是评价科研人员的重要指标,这就导致评审专家利用自身身份,“推荐”作者引用特定的论文,以此提升学术影响力。在同行评议中,任何评审专家的意见都举足轻重,因此作者往往选择听从意见,引用评审专家“推荐”的文献。2019年国家新闻出版署发布的《学术出版规范期刊学术不端行为界定》明确写道:“利用评审的权利为自己谋利,应界定为谋取不正当利益。”[23]因此,由评审专家或编辑引导的不当引用也是同行评议中学术不端的表现形式之一。

1.1.3 窃取学术优先权

获得科学发现的优先权是学术交流的本源动机之一[24]。一篇论文要进入学术共同体参与学术交流,首先要经过同行评议,因此一般来说,编辑和评审专家是论文最早的读者。编辑和评审专家要对论文的保密性负责,而如果保密意识淡薄、缺乏职业道德,那么无论是出于好意分享给他人学习还是恶意传播,都会产生严重后果。2019年撤稿观察(Retraction Watch)报道了一个案例:评审专家在审稿过程中一直未给出评审意见,在9个月审稿期结束后,原作者发现论文已被偷偷投给其他期刊,原作者历经5个月维权才成功撤稿。在此期间,该论文已经被引用17次,包括8次自引[25]。这种行为不仅损害了被抢夺优先权的原作者的利益,也损害了整个学术共同体的声誉,使得研究人员对同行评议过程产生怀疑,从而影响学术共同体的交流发展。

1.2 同行评议中的技术性学术失范表现形式

1.2.1 必要知识缺失造成的失范

同行评议自产生发展至今,目的都是控制期刊论文质量。出版商作为同行评议的首要组织者,提出并更新针对评审专家的规范政策。一些知名期刊给评审专家固定的评议报告模板,以提升评议质量与效率[26],但不同的期刊对评议报告细节规范的界定有所不同,而评审专家可能不只负责一种期刊的评审工作。因此,评审专家在审稿时需要谨慎区分不同期刊的评议规则。同时期刊普遍根据学者的资历和科研成果选择评审专家,有时专家研究方向并不与被评议论文相符,小同行专家难寻,评审专家有时不得不对不熟悉领域的论文进行评审,从而产生技术性学术失范。

国内外学者均认为目前评审专家对同行评议培训的参与度低[27],部分评审专家缺乏对其需要遵守的道德规范或正确审稿方法的认知,非主观地导致同行评议质量低下。同时有学者提出,部分作者对于如何撰写学术论文、撰写规范及学术道德都没有明确认知[28],并且没有接受过培训,从而产生不当引用等技术性学术失范问题。

1.2.2 AIGC等技术不当使用

2022年以ChatGPT为代表的人工智能生成内容(Artificial Intelligence Generated Content,AIGC)技术进入公众视野,意味着人工智能可以和实体的人一样,甚至取代人成为创作者。不可否认,AIGC技术的应用可以为科研工作带来机遇,比如提升阅读和写作效率。在同行评议过程中,作者可以利用AIGC技术辅助写作,完善原稿;基于文本识别和深度学习模型,AIGC技术可以快速帮助编辑完成初审工作,甚至可以辅助遴选评审专家;AIGC技术也可以帮助评审专家寻找论文漏洞、补充例证。但在规范尚不明晰时,滥用AIGC技术就会造成技术性学术失范。

(1)数字版权问题。AIGC本质上是在广泛收集数据基础上不断调整,根据用户需求整合的产物。关于作者界定以及版权归属问题,目前尚未有统一规范。目前多家学术出版机构(如Nature、arXiv)已发出声明:任何由大型语言模型工具(如ChatGPT)单独或联合署名的文章都不会被接受,同时如果作者使用AIGC,应在方法或致谢等适当部分标记出来[29]。美国版权局(United States Copyright Office,USCO)提出:“由人工智能生成的内容是否能受到版权保护要取决于具体情况,尤其是需要了解生成式人工智能工具是如何运作的,以及作者是如何使用这些工具来创作作品的。”[30]

(2)内容真实性问题。人工智能模型在训练时可能会受到存在偏见的或虚假的数据影响,因此AIGC的真实性、准确性存疑,用户需要采取审慎态度。同时AIGC中的错误很难被发现,如果缺乏足够的检验依据,一些主观性问题就会导致研究者采纳错误的答案[31]。

2 当前同行评议中学术失范的防控手段

2.1 制度完善

评审专家消极评审、利用身份诱导作者不当引用、窃取作者的学术优先权等学术失范行为的原因仍是科研评价制度存在问题:评审报告无法成为评价材料,评审专家的付出无法得到回报;将被引频次作为评估学者科研能力的重要指标。因此,顶层制度的调整必不可少。2021年《国务院办公厅关于完善科技成果评价机制的指导意见》强调科研评价“破五唯”[32]。一些出版平台认可评审专家的贡献,如Publons与昆士兰大学进行互认,认为评审报告可以作为研究成果进行学术贡献认定[33]。但“破五唯”的推进仍需一定时间,且学界对学者贡献的量化指标尚未有共识,同行评议的评审报告也尚未纳入国内学者评价体系,认可度不高。

针对因缺乏必要知识而产生的技术性学术失范,出版商开始结合实际需求,对评审专家进行培训。Taylor & Francis联合中国高校科技期刊研究会、中国科学技术信息研究所等机构在中国举办了一系列同行评议培训[27],采用线上线下结合形式,让评审专家能够便捷、及时、全面补充有关同行评议的必要知识。对于作者的规范,国际医学期刊编辑委员会(International Committee of Medical Journal Editors,ICMJE)多次修订《学术研究实施与报告和医学期刊编辑与发表的推荐规范》[34],其成员期刊鼓励作者在投稿时采用统一格式。国内期刊也有自身的标准格式,但不同期刊格式不同,无法统一,这为作者投稿和专家评审增加了一定的难度。同时同行评议以及科研伦理培训普及度不高,没有形成规模和协同效应[35],仍有许多评审专家靠个人经验做出评审。

2.2 模式创新

在传统的同行评议中,编辑作为中心将评审专家和作者联系起来,在大部分学术失范行为中都有着主体作用,因此出版商与学界都在探索新的同行评议模式。

(1)评审专家自由选择是否公开身份的透明式同行评议、评审专家身份完全公开的开放式同行评议。二者都具备公开评审报告、公众开放参与、作者与评审专家公开交互的特点,整个同行评议过程中产生的信息最大限度地向公众开放。公众监督编辑、评审专家、作者三类主体的行为,以加强其责任心。弱化编辑的作用,让作者与评审专家直接沟通,削弱了二者间隐形的等级关系。

(2)协作式同行评议(Collaborative Peer Review)与众包式同行评议(Select Crowd Review)都是团体式的同行评议模式。在匿名环境下,作者、评审专家及编辑都参与意见交流过程,评审专家进行合作互评,作者根据提出的问题进行回复,在充分讨论后得出一致结果。采用集体讨论模式,使评审专家间形成群体监督。

(3)“预印本+自组织”评议和发表后同行评议(Post-Publication Peer Review) 旨在“先发表、后评审”,以保证作者学术优先权。发表前,编辑承担对论文进行初审的重要职责,论文发表后评审专家进行评议,评审报告会与论文一同出版。同时自论文初次发表,公众对评审过程、作者回复进行评论。

以上不同的同行评议模式在一定程度上可解决学术失范问题,但又增添一些新问题,比如:透明式同行评议中专家隐私性低,参与度不高;协作式同行评议中专家易受到群体思维的影响,产生从众行为;发表后同行评议过分关注论文负面信息。目前各模式均被出版商投入使用且在不断完善。

2.3 技术引进

技术的不断发展为学术失范的防控提供了有力的支持,出版商针对不同的学术失范行为,通过增加功能或搭建平台进行检测和防范。

(1)身份识别。目前很多投审稿系统都与Web of Science ResearcherID 或ORCID数据库进行整合,将作者和评审专家的系统账号与数据库中的数据进行关联,以保证其身份真实,了解、记录学者的研究领域与过往研究,为学者增加了身份背书。但是刚踏入学术领域的学者并未有过往研究经历,身份背书用处不大,同时ORCID数据库的身份造假成本也极低。

(2)监督评审。ScholarOne Manuscripts系统与Editorial Manager系统都记录“评审专家表现报告”(Reviewer Performance Reports),对评审专家的审稿时间和审稿数量进行统计。可根据该报告发现可能存在的虚假评审、不负责评审等问题并核查,但这在无形中增加了编辑的审查负担。

(3)内容完整性核查。由荷兰学者开发的Stat Reviewer算法、由Frontiers出版社推出的AIRA算法等都通过整合自然语言处理、机器学习技术,根据特定的质量标准,分析接收的各领域不同格式和不同风格的论文。可检查论文中是否存在语言表述以及内容完整性问题,提炼论文的观点,形成初步评议报告[36]。但自主开发算法、搭建数据库成本过高,且算法的针对性不强。

(4)搭建第三方同行评议平台。将同行评议平台与论文发表平台划分开来,切断二者间利益关系,让同行评议目的更为单纯。Review Commons作为第三方同行评议平台公开评审过程,让评审专家更专注于学术性评审,通过进行深入分析帮助作者改进论文,而不是从期刊角度做出判断。但搭建第三方同行评议平台的成本过高,不适用于广泛的学术共同体。

3 基于区块链技术的防范应对

信息与通信技术的飞速进步使得当前学术交流情境变得复杂,仅从制度、模式、技术角度已难以完全避免同行评议中的学术失范行为,而经济与金融领域的实践证明,只有建立一套由技术支撑的机制才能使制度和模式落到实处。区块链技术是被经济与金融领域广泛应用的技术,其涉及的分布式存储、共识机制、智能合约、哈希加密等技术可以将制度与模式融合,从而防范同行评议中的学术失范。

3.1 非对称加密技术保护用户身份

加密算法是区块链必不可少的保障之一。同行评议中,评审专家信息选择性公开是评审专家参与度的重要影响因素之一。作者与评审专家的信息都分为基本信息和学术信息:基本信息包括其真实姓名、联系方式;学术信息包含此前的评审记录、上传的稿件以及个人领域专长信息。区块链通过加密算法将基本信息与学术信息隔离。当作者和评审专家首次使用区块链时,加密算法对基本信息进行哈希计算,得到的哈希值就是该使用者的唯一身份标识,使用者在日后使用中产生的学术信息与该哈希值绑定。要访问使用者的基本信息就要提供私钥,而私钥仅由使用者个人掌握,同时哈希值不可逆运算,因此私钥无法被暴力破解。在进行评审的过程中,应用零知识证明进行身份匹配确认,即在评审专家提供评审报告及作者上传稿件时,可以在不向其他使用者提供任何基本信息的情况下,让其他使用者相信该评审报告或稿件归此评审专家或作者所有。在零知识传递中将基本信息和学术信息关联,这既保障了数据隐私,又实现了数据共享,也可防范他人冒用身份做出伪评审等行为。

利用使用者产生的学术信息,可以不断更新使用者此前上传的信息,逐步完善学者信息库。同时区块链上的信息无法篡改,任何使用者的记录都会如实呈现,学者的学术道德、科研能力以及责任心都将真实地展现出来。因此,可以在不知晓使用者出身的前提下实现评审专家遴选,有效防范伪评审。

3.2 时间戳追溯评审过程

信息不对称是同行评议中产生失范行为的重要原因,去中心化是区块链技术的根本特征。在区块链中,任何节点都是平等独立的,都可以产生新区块,新区块在被认证后加入区块链,区块链扁平而又开放。作者、评审专家、编辑、公众作为使用者,其权利和义务都是相同的,任何使用者在认证后都可以上传自己的学术成果、浏览任何一篇论文或评审报告,或成为评价主体,检验其他节点的学术成果。同时使用者在上传学术成果时知晓区块链的不可篡改和公开透明性,因此区块链从心理角度对使用者进行了潜在监督。作者的研究数据与研究过程要准确、真实、可复现。评审专家的评审要及时、专业、高质量。编辑的身份得到弱化:不再是作者与评审专家间的桥梁,而是信息整合者和问题发现者,帮助作者集思广益。

区块链技术会为任何上传的数据赋予唯一的时间序列,即时间戳,随后以区块形式存放在链上,任何使用者都可以了解其中的信息,因此数据均可追溯。当前时间戳技术已被应用于农产品、药品溯源系统,用来赋予产品“数字身份证”,解决产品流通供应链不透明问题。通过应用时间戳技术,可为论文、评审报告标记“数字身份证”,学术优先权可被保护,作者、评审专家学术声誉和学术影响力也会得到提升,其他使用者也会在分享交流中获得新的思路,比如:在构思阶段,可查找是否存在与他人观点重复的情况,避免在写作阶段出现抄袭、剽窃等行为;也可查找已有的相关信息,了解研究现状和研究进展,以便后续研究。此外,作者在根据评审报告修改稿件时,修改或增添的内容都会自动转化为记录,在标记时间戳后在区块链中呈现。如果评审专家或编辑在评审过程中利用权力诱导作者不当引用,该行为就会被其他节点及时发现。

3.3 智能合约保证规范落实

当前同行评议中存在的技术性学术失范的部分原因是标准不一,可以应用区块链的智能合约解决该问题。智能合约以数字形式将需要严格执行的协议放入系统作为预置的规则程序,用于保护计算机的数据,在减少第三方参与的基础上实现数据的安全交换。在区块链技术下,学术共同体可以经过探讨,根据实际需要对同行评议规范做出规定、形成合约。规范可以包含形式规范和道德规范:形式规范规定论文撰写格式、评审报告必备要素以及相应的排版方式,以减轻作者与评审专家负担;道德规范用于规范学术共同体的学术行为,明确列举涉及学术失范的行为。智能合约在预置于区块链后便无法更改,任何节点、任何区块都将自动执行智能合约,由此从技术角度实现数据自治。数字人民币就处于智能合约生态之中:在安全与合规的前提下,数字人民币可以根据交易各方商定的条件、规则进行自动交易,应用场景多样[37]。数字人民币智能合约在预付费消费情况下,可以有效防范资金挪用;在财政补贴、科研经费等定向支付情况下,能够监测支付用途;在资金结算时,提高资金处理的准确性与自动化水平,减少人工处理差错、降低风险。

在同行评议中,经过作者、评审专家、编辑、公众共同协调,可将形式规范和道德规范以数字化形式整合为智能合约,在区块链系统中投入使用。数据在上传至区块链前,系统自动判断该数据是否符合智能合约的要求。一般而言,形式规范判定可以在数据上传阶段通过技术直接实现,而道德规范判定需要人工介入,其主要实现形式为:基于区块链的去中心化特性,学术共同体共同对论文或评审报告的价值做出评判,无需借助第三方信任中介,从而减少成本、提高效率。结合技术与人工完善规范,防止了规范缺失造成的学术失范。

3.4 代币机制形成激励循环

作者可以通过同行评议获得公正评审,让自己的学术成果进入学术共同体进行交流,但评审专家作为评审活动的主要贡献主体,承担为作者的学术成果背书的责任,目前只能获取学术声望,因此可能通过诱导作者进行不当引用、窃取作者学术优先权等为自己谋求利益。要防控同行评议中的学术失范,固然要有规范上的约束,而奖励也必不可少。因此,可应用区块链的代币机制,用物质奖励与学术声望奖励来替代目前尚不明晰的学术贡献认证奖励。

成熟的区块链系统架构中都会存在激励层。在区块链技术支持下,可以将同行评议看作一个微观经济体,通过代币这种加密货币的流转形成激励循环。流转机制也可写入智能合约,得到背书,让代币成为一种衡量微观经济体参与者信用的公允尺度,从而增加参与者之间的信任感与道德约束。在同行评议过程中,代币可以对评审专家的学术贡献予以奖励,也可以成为学术共同体内部的支付手段,同时代币作为虚拟货币不与真实货币流通,在一定程度上避免学术的功利化。

作者上传论文即可获得奖励代币,评审专家需要在规定时间内做出公正评价以获得奖励代币。有奖励制度就要有惩戒制度:当参与者违反智能合约并被证实时,会被扣除相应数额的代币。

3.5 与AIGC技术共同营造同行评议良好环境

AIGC技术应用于同行评议不可避免,区块链技术可以最大限度修复AIGC技术的版权漏洞,二者优势互补,打造良好同行评议生态网络。AIGC技术可以为创造过程助力,但也一直存在版权问题。在传统的论文与评审报告撰写过程中,理解他人创作的成果是必经之路,而AIGC技术可以辅助这一步骤,减轻作者及评审专家等的负担。AIGC技术的本质是机器学习,但作者及评审专家等的思路也至关重要,因此二者都应该享有最后生成内容的权益。目前关于AIGC技术版权问题的争议主要在于被AIGC技术学习的作品的原创者没有获得权益。在绘画领域,有学者提出让全体创作者自主选择是否将自己的作品放入AIGC技术训练库。当后续有创作者使用相似风格时,数据库量化原创者对最终作品的影响程度,收取相应费用,原创者按贡献比例获得相应收益,即形成“正版图库”。在区块链支撑下的同行评议可以将这种方式与激励机制结合,从物质和声誉两个角度激励原创者创新。

区块链中的每一次信息记录和交互都要经过验证,因此需要大量的运算。人工智能可以通过优化运算流程提高运算效率,保证信息交换的速度。当评审专家询问评审建议时,区块链会完全展示AIGC技术回答时引用的内容等,便于评审专家更好地理解评审建议以及判断回答质量。

4 结语

2013年,欧盟宣布启动“地平线2020”(Horizon 2020)计划,提出“负责任研究与创新”概念[38]。负责任的同行评议有助于作者的学术成果得到学界认可,有助于期刊保持良好口碑,有助于评审专家获得学术声望。因此,只有从根源上解决同行评议中的学术失范问题,同行评议中每个主体都尽到自身责任,才能做到负责任同行评议、实现负责任研究与创新,提升民众对科研结果的信任感,推动科学进步。

同行评议的作用是筛选而不是挑选,其只能过滤存在问题的研究或者帮助作者提升研究质量。同行评议体系也只具备预防性功能,其不是专门为检测和解决学术失范问题设计的。因而,本研究仅从防范角度探讨同行评议中存在的学术失范行为及当前的应对策略,并在此基础上提出利用区块链技术完善同行评议制度的构想。当前在出版领域,已落地的区块链技术应用并不多,该技术还存在认可度不足等问题,因此提出的构想仍待实证层面及顶层制度层面的进一步研究。