学术交流应用区块链技术的场景与案例剖析

2019-06-03 05:26孟美任
中国科技期刊研究 2019年5期
关键词:学术交流出版商生命周期

■张 恬 孟美任

1)中国科学院文献情报中心,北京市海淀区中关村北四环西路33号 1001902)中国科学院大学经济与管理学院图书情报与档案管理系,北京市海淀区中关村北四环西路33号 100190

科学研究已经步入数据密集型科学发现的第四范式[1],研究过程更加复杂精细,学界对实验结果可重复性验证的要求日益严格[2]。然而,“可重复性危机”却日益凸显,Nature对化学、物理、地球和环境科学、生物学和医学等领域的1576名科研人员进行调查,发现超过70%的科研人员曾经尝试但未能重复他人实验[3],已发表成果的不可重复已经带来了科研资源的浪费且影响严重[4-5]。评判科研成果能否发表的最重要机制——同行评议,存在过程不透明,人情评审、虚假评审泛滥等局限,是造成这一危机的重要原因之一[6-7]。同时,传统、封闭的学术交流体系——科学研究只有出版后才能开放共享,且很多论文背后的数据无法获得发表,很多作者的无法被认可,这与科研人员日益增长的知识获取需求之间的严重矛盾,使作为学术交流重要载体和媒介的学术出版也面临着前所未有的挑战。尽管学术界、出版界、公共/私人机构合力推进开放科学运动,探索开放数据、开放同行评议等机制及相关实现技术,以保证科学研究成果能够开放、客观、可靠[8-9],然而在现行的技术条件下,开放数据的安全性、完整性,以及知识产权等关键问题均未能得到有效的保障。因此,可重复性危机、科研数据不够开放等学术交流面临的难题仍无法得到有效解决。

区块链最早被作为比特币的应用技术出现在Nakamoto[10]2008年发表的论文《比特币:一种点对点的电子现金系统》中,从本质上来说,区块链是利用分布式技术和共识算法重新构造的一种信任机制[11]。作为一种分布式交易和数据管理技术,区块链具有开放性、去中心化、可追溯性、不可篡改性、匿名性等特点,可以应用到解决学术交流面临的难题之中。近年来,国外学者已经尝试将区块链技术应用于科研数据管理和学术出版中[12-14],但是国内学者关于区块链的相关应用研究尚局限于学术出版领域的展望性综述[15-17],鲜有关于区块链技术在学术交流体系应用场景中的系统梳理研究。传统的学术出版模式使得学术交流的重心只局限于科学研究生命周期的后端。本研究将从学术交流中难以解决的问题出发,通过归纳总结区块链技术的优势特点,调研分析该技术在科研生命周期中的应用场景,系统探讨区块链技术如何帮助学术交流/学术出版服务于整个科研生命周期,解决学术交流/学术出版面临的难题。

1 区块链技术应对学术交流难题

区块链可以被看作是一个分布式数据库,其数据不是存储在某个中央服务器上,而是在其网络中的每个参与节点(计算机或服务器)上都存储了副本,即所有节点可以共享区块链中曾经完成的每条交易信息,该数据库利用加密技术(如哈希和数字签名)以安全、线性和时序的方式实现新条目的添加,任何单个节点都不能随意地进行更改,而只能通过平台的一致性算法进行更改,因此保证了区块链系统比其他涉及第三方的集中性交易系统更加透明、安全和不可篡改(保证了数据完整性)。以上特点使得科研数据在管理、评价、发表、获取、确权等方面面临的一系列难题都能从技术层面得以解决。

笔者借鉴区块链技术的相关优势指出其能够应对的学术交流难题(表1),具体的应对方案将通过后文的案例分析进行归纳和总结。

表1 区块链技术应对学术交流难题总结

2 案例研究

自2017年开始,已有一些国际出版商陆续与技术公司合作,启动了将区块链技术应用于学术交流体系尤其是学术出版项目,包括Peer Review Blockchain、Artifacts.ai、Scienceroot.com、 Pluto.network、OrviuM.IO等,国内尚未出现较为典型的案例。笔者对上述案例进行了调研,限于篇幅,仅对3个典型案例进行分析,重点剖析区块链技术基于科学研究生命周期的应用场景。

2.1 Peer Review Blockchain——提高同行评议的透明度

致力于支撑科学研究全生命周期的Digital Science和开发智能合约区块链技术的软件公司Katalysis,联合Springer Nature和Open Researcher and Contributor ID(ORCID)于2017年3月联合启动Peer Review Blockchain项目,旨在利用分布式注册表和区块链技术,重点关注研究可重复性低、评审过程缺乏完整可靠数据的验证、审稿人贡献难以获得认可和日益增加的投稿数量给同行评议带来负担等问题。四方共同分工:Digital Science负责项目管理;Katalysis负责实现测试平台;Springer Nature资助参与出版和同行评议工作流部分;ORCID提供个人标识符、身份验证相关支持。2018年4月,Taylor & Francis和剑桥大学出版社加入该项目。第三批加入的出版商是Karger Publishers。2018年9月,全球慈善基金会、科研资助者Wellcome Trust作为顾问身份加入,共同研究如何利用区块链技术认可和奖励审稿人的工作质量,以及如何利用奖励与评审相结合的方式扩充审稿人库。

Peer Review Blockchain通过将关于同行评议过程的关键数据存储和发布在一个共享平台上,从而提高同行评议过程的透明度、认可度和效率,同时又能保证隐私需求[符合《通用数据保护条例》(General Data Protection Regulation,GDPR)][23],数据流示意图见图1。稿件、作者、审稿人的不同信息片段并没有链接到区块链本身,而是作为随机数字串来处理,只有具备适当权限的用户才能以搜索特定信息的方式将其聚合在一起。对于个人隐私而言,这意味着避免了信息拼凑在一起可以推断个人身份的风险。Peer Review Blockchain不会存储明确的个人识别信息,而是将个人信息的处理外包给ORCID。在知识产权方面,存储在区块链中的同行评议数据不属于任何实体或组织,项目中的所有参与者都可以访问这些数据,因此,只有参与者同意免费共享的数据,才会明确地存储在区块链中。

图1 Peer Review Blockchain数据流示意图[24]

2.2 ARTiFACTS’Blockchain——创建分类账记录科研

ARTiFACTS是一个由学术出版商、媒体、软件和金融技术团队合作创建的利用区块链技术促进科研的平台,其核心是维护一个分布式分类账和交易引擎,科研人员可以实时地发布永久、有效、不可变和不可篡改的记录链,从科研生命周期的最早期阶段开始,记录包括归属/贡献、引用在内的所有科研“交易”行为,所有形式的内容在所有阶段中的共享和可发现性都更加安全,降低了失去知识产权控制的风险,目前该平台正在申请专利。借助ARTiFACTS平台,无缝部署到科研工作流中的区块链技术可以创建一个更有效且不可变的存在性证明(Proof-of-Existence)和数据归属/贡献的证明,以展示和记录研究人员的学术贡献。

默顿普通科学描述(The Mertonian Description of Normal Science)把引文描述为科学货币。现代文献计量学教父加菲尔德认为,科学家应该以引文的形式向他们的信息来源者(Preceptors)支付报酬[25],而直到目前,引用仅仅发生在学术出版以后——科研生命周期的后期,并且只涵盖具有商业索引期刊所发表的成果(仅占科研产出的一小部分),即围绕引文这种研究货币的“交易”只有一小部分被捕获,通常还是在交易发生很久之后。由于当前引文解决方案的局限性,很多科研产出的重要归属/贡献和相互连接将永远丢失或永远不会发生。因此,学术界需要采用新技术为科研增加价值[26]。ARTiFACTS的创立初衷是通过独特的区块链引擎,为科研提供一个透明的分类账记录,在这里每个人都能看到并同意“交易余额”,使加菲尔德和默顿的引文效用愿景成为可能。ARTiFACTS使整个科研生命周期中的所有科研产出都能够被证明存在、被发现和被引用,这些科研产出包括数据集、研究设计、资助申请、海报、演讲稿、会议记录、调查、手稿以及一篇已经发表的论文,并为科研人员、机构、资助者、出版商提供各式服务(表2)。

表2 ARTiFACTS针对不同身份用户的服务内容

2.3 Scienceroot——建立新的学术交流生态系统

Scienceroot是一个基于区块链技术建立的更有效、更透明、更开放的科研生态系统,让全球科学界的任何人都能够通过这个系统募集资金、互动、讨论研究思路、合作,并最终发表他们的工作成果。

立足于学术交流中的两大难题:知识被大型机构、公司控制,科学发现被关闭在付费墙之外;错误的评价和激励机制——发布的内容变得比实际发布本身更重要。Scienceroot致力于利用区块链技术解决上述问题,为科研社区打造全新的生态系统,特点如下:(1)创建独特货币——Science Token。这种加密货币可以随时随地交换,使得全球科学界和非科学界通过投资一项有价值的事业直接参与促进科学的发展。(2)独特身份认证。通过将ORCID和ResearchID等项目集成到自己的平台中,确保一个不可变/不可篡改的持久数字标识符,该标识符可以集成在研究工作流程中,如授权提交、研究漫游、手稿提交等。(3)不变档案。提交的每篇文章都将在区块链上生成时间戳,以创建所有科学文章的不可变的开放访问档案。单独的个人或团体不会拥有对系统的控制权,每位用户都可以清晰地访问所有信息。(4)奖励制度。建立同行评议激励机制和论文作者奖励制度,每半年对被引用的文章进行排序,作者将得到相应的奖励,如读者发现文章有价值也可以奖励作者。Scienceroot的三大功能如表3所示。

表3 Scienceroot的三大功能

2.4 基于科研生命周期的区块链服务场景分析

根据上述案例的分析结果可以发现,区块链技术能够在科学研究、学术交流中发挥重要作用。笔者基于科研生命周期对以上案例进行分析和总结,结果如表4所示。

3 讨论

3.1 区块链技术有望开启学术交流体系的新时代

尽管学术交流尤其是学术出版面临众所周知的挑战,但几十年甚至几百年来,学术交流模式仍然保持惊人的不变:(1)传统的数据库收录政策导致学术交流只局限于已发表的论文,而科研生命周期中的其他重要成果产出被完全阻挡在外;(2)数据收录时部分研究成果已经严重过时,大量最新研究的价值无法得到及时评价;(3)研究成果发表很久后才可能发现已发表数据的不可重复性和一些学术不端行为;(4)评价指标体系设计的不全面导致研究人员越来越以追求高排名为首要目标,忽视了纯粹的科研[27];(5)引入社交网络并借助科研社区力量促进了共享、合作和快速采用,但并没有很好地解决上述问题,并且还出现了额外的问题:无效/不完全的引用;研究人员失去知识产权的风险;侵犯版权的可能性(从无意到明显的盗版,如Sci-Hub);一些“游戏系统”的行为利用替代计量获得了高影响力。这些阻碍科学开放的因素在一定程度上也许需要新一代变革性技术来解决。

科学研究与学术交流在先后经历了数据库时代和社交网络时代之后,有望进入区块链时代[28]。区块链时代将覆盖到科研生命周期的所有阶段和所有科研产出;支持与已经使用的各种数据存储库、学术和研究机构使用的各种认证和授权系统的集成,能为所有科研产出提供高度完整、全面的实时引用和互链,同时确认归属/贡献和提供知识产权保护;通过权衡来解决作者需求(例如共享与知识产权保护、公开透明与隐私);建立实验数据和同行评议行为的可追溯、不可撤销的记录,以规避学术不端行为,避免可重复性危机。因此,越来越多的研究者相信区块链技术是一种可以从根本上改变学术交流的技术,可以促进开放科学、开放研究和数据共享。

表4 三大区块链平台应用场景总结

3.2 区块链技术可能打破出版商/期刊对内容的垄断

如果区块链技术是一项革命性的新技术,那么广泛采用它将触及包括科学家、资助者、机构和出版商在内的所有层面,势必影响一些学术资源垄断者的既得利益。出版商通过收取订阅费或开放获取费等模式将内容分发给学术界,如果数据的收集和分析、同行评议、内容的传播都在区块链上进行,那么出版商/期刊在学术交流体系中的重要性有可能被削弱。已经出现一些应用区块链技术的平台,如DECENT和LYBR,允许作者自己上传内容,并根据读者数量自主设置价格和获得收入(可设置每次观看或下载需要支付的价格,并在结束时直接获得足额付款,无任何差价),如果内容贡献者不止一个,那么这类平台作为内容分发系统将自动进行付款拆分,并且付款比例可以随时调整。

另外有一些科学家开始使用神秘的笔名来发表文章,这些笔名其实是基于公钥密码签名的加密代码,以后可以用来证明作者身份,但是仅从已发布的代码中无法获知作者的真实姓名。有趣的是,他们发表文章的观点是:如果正确使用区块链技术,可能会使当前大部分学术交流和出版体系过时,减少科学共同体对出版业的依赖,释放科研经费[29]。

虽然出版商和期刊面临上述挑战,但技术变革带来的更多是机遇。如前文分析,国际各大出版商已经积极参与到探索学术出版创新模式的项目中,基于区块链技术,出版商可以实现从只发表传统论文到发表各种类型的科研产出数据,从只服务于科研的后端拓展到将服务贯穿于整个科研生命周期的各个环节,从而使学术出版的价值得以延伸。

3.3 区块链技术将为学术交流带来新的模式

区块链在科研生命周期各个阶段中的应用实践已经展开,与现有技术相比,能够更好地解决科学研究与学术交流面临的问题。学术交流还有望拓展出一些新的模式,并在区块链技术的支撑下得以实现,例如出版商可以使用区块链技术集成小额支付功能,在订阅模式或开放获取作者付费模式以外,开辟新的付费模式——按单个内容项(内容可划分为的最小单元)的使用情况支付[11]。区块链技术可以更精准地统计科研“交易”情况,比引文计量积累所需要的时间更短,从而可能对研究人员建立声誉和信用积累的方式产生巨大的影响。基于区块链的智能合同将使整个研究过程向外界展示,实现标准的科学后处理算法和决策程序,可以用于研究预注册,并自动做出科研假设是否被接受或被拒绝的决定[30]。由于智能合同可以自动募集和发放资金,因此科研项目经费的申请模式也可以改变——从研究人员提出研究方案、资助方评审后考虑是否予以资助的传统模式,转变为资助方提出需求,由研究人员进行竞标,中标后自动获得资金的模式。

4 结语

区块链技术具有保障数据的安全性、完整性和知识产权等优势,可以应用于建立科研生命周期各个阶段可追溯、不可变的“交易”记录,有助于促进整个科研过程和数据的开放共享,帮助已发表论文之外的其他各类科研产出获得归属/贡献认可,消除学术交流面临的可重复性危机、科研数据不够开放等难题,同时作为学术交流的重要媒介,学术出版的模式(从出版类型到出版时机)也得以创新和拓展,价值得以延伸。尽管区块链技术存在局限性,但仍然可以预见,区块链技术将为开放科学带来新的推动力。

猜你喜欢
学术交流出版商生命周期
全生命周期下呼吸机质量控制
学术交流及演出活动
学术交流活动
校近期学术交流活动及获奖与出版
我校近期学术交流活动及获奖
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
企业生命周期及其管理
各行各业
2006年国际消费类杂志调查