基于区块链技术的《科学数据管理办法》落实路径探析

2021-08-06 20:52温亮明李洋余波
现代情报 2021年8期
关键词:全生命周期区块链技术激励机制

温亮明 李洋 余波

摘 要:[目的/意義]探讨区块链技术在《科学数据管理办法》落实过程中的实践应用,对于拓展区块链的应用场景和推动《科学数据管理办法》有效落实具有重要意义。[方法/过程]首先分析了《科学数据管理办法》的落实困境,然后结合区块链的核心技术分析了区块链与《科学数据管理办法》的耦合性,最后提出了基于区块链技术的《科学数据管理办法》落实路径。[结果/结论]研究发现,《科学数据管理办法》的落实困境主要表现在数据管理规划制定、数据汇交与保存、数据共享与利用、数据保密与安全、数据管理绩效考评等方面,可以基于区块链技术打造科学数据管理生态体系、构建科学数据管理联盟链、管控科学数据全生命周期并引入相应激励机制。

关键词:区块链技术;《科学数据管理办法》;生态体系;联盟链;全生命周期;激励机制

DOI:10.3969/j.issn.1008-0821.2021.08.014

〔中图分类号〕G250.73 〔文献标识码〕A 〔文章编号〕1008-0821(2021)08-0136-11

The Implementation Path of the“Scientific Data

Management Rule” Based on Blockchain

Wen Liangming1,2 Li Yang3* Yu Bo4

(1.Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China;

2.School of Computer Science and Technology,University of Chinese Academy of Sciences,

Beijing 100049,China;

3.Library,Chengdu Sport University,Chengdu 610041,China;

4.School of Management and Economics,Southwest University of Science and Technology,

Mianyang 621010,China)

Abstract:[Purpose/Significance]Exploring the application of blockchain technology in“Scientific Data Management Rule”is of great significance to expand the application of the blockchain and promote the effective implementation of the“Scientific Data Management Rule”.[Method/Process]Firstly,this article summarized the real dilemma faced by“Scientific Data Management Rule”implementation.Then,combined with the core technology of the blockchain,and analyzed the coupling between the blockchain and the“Scientific Data Management Rule”.Finally,the implementation path of the“Scientific Data Management Rule”based on blockchain is proposed.[Result/Conclusion]We found that,the implementation dilemmas of the“Scientific Data Management Rule”included the formulation of data management planning,data collection and storage,data sharing and utilization,data confidentiality and security,data management performance evaluation,etc.It is possible to build a scientific data management ecosystem and alliance chain,control the full life cycle of scientific data,and introduce corresponding incentive systems based on blockchain.

Key words:blockchain;Scientific Data Management Rule;ecosystem;alliance chain;full life circle;incentive mechanism

科学数据是指通过人类社会活动积累的反映客观事物本质特征和变化规律的原始基础数据,以及根据使用需求进行系统加工整理的各类数据集合[1]。科学数据管理是指科学数据利益相关者,通过政策规章和技术手段对科学数据的收集、存储、加工、处理、共享、利用等流程进行协调,共同实现科学数据价值最大化的活动过程[2]。为了加强科学数据的规范管理,国务院办公厅于2018年3月印发《科学数据管理办法》(以下简称《办法》),这是我国首次从国家层面针对科学数据管理工作制定政策制度[3]。《办法》从纵横两条主线构织起我国科学数据管理网格[4]:纵向层面从利益相关者视角明确了国务院科学技术行政部门、国务院及省级人民政府相关部门、科研院所及高校、科学数据中心、科学数据生产者、科学数据使用者、科学数据服务商等责任主体的职责与分工;横向层面从总体原则、生产与采集、汇交与保存、共享与利用、保密与安全等方面明确了科学数据管理的工作内容。《办法》出台后,国务院科学技术行政部门[5]、省级人民政府[6]、科研院所[7]、高等院校[8]、科学数据中心[9]、社会团体[10]等利益相关者积极宣传,认真贯彻落实。政策制度的生命力在于落地实践[11],但从《办法》各条款内容的性质来看,多为表明立法者态度的宣示性条文,告诉公众“应该做什么”,而具有明确内容、告诉公众“具体如何做”的授权性条文较少。《办法》的有效落实不仅需要合理平衡各利益相关者的权责利益[12],还需要技术方法支持不同科学数据生命周期阶段的具体事务,这将是一项复杂的社会化活动,可能面临诸多现实困境。因此,寻求一种能够调动多种因素的手段积极推进《办法》落实具有重要的战略意义。

近年来,起源于比特币的区块链技术为相关行业领域业务流程优化[13]、学术交流互通[14]、数据资产管理[15]、数据安全共享[16]等提供了良好的解决方案。从应用角度来看,区块链是一种利用分布式节点共识算法来生成和更新数据、利用加密的链式区块结构来验证和存储数据、利用智能合约编辑和操作数据的一种去中心化基础架构和分布式计算范式[17],其具备了集体维护、去中心化、去信任、不可篡改、安全可靠等特点[18],已经在数字货币、数据存储、数据鉴证、金融交易、资产管理、选举投票等领域广泛应用[19]。技术的作用在于推动社会发展,区块链技术的发展也给科学数据管理提供了新的路径选择,2019年10月24日,中共中央政治局就区块链技术进行集体学习,习近平总书记指出“要发挥区块链技术在促进数据共享、优化业务流程、提升协同效率、构建可信体系等方面的作用,探索利用区块链技术的数据共享模式,实现数据跨部门、跨区域共同维护和利用[20]”。已有学者开始探索区块链技术在科学数据获取[21]、科学数据标识[22]、科学数据存储[23-24]、科学数据共享[25-26]、科学数据监护[27]、科学数据溯源[28]等方面的应用。本文以现有区块链与科学数据管理相关研究成果为基础,拟分析《办法》的落实困境,阐述区块链与《办法》落实的耦合性,据此提出基于区块链理念的《办法》落实方案,期望为《办法》更好发挥国家级规章制度的效用提供参考借鉴。

1 《办法》学术价值评析

以“科学数据管理办法”为检索词,在中國知网上进行主题检索(检索日期:2020年11月6日),发现国内学者以《办法》为研究对象,展开了多层次讨论。表1展示了部分核心研究成果。

从形式上来看,目前形成了以图书馆学领域期刊为主、以邢文明为核心作者的《办法》研究态势。从内容上来看,目前《办法》相关研究主要从宏观和微观两个层次展开,宏观层次主要阐释《办法》的重要意义,微观层次主要解读《办法》的内容细节。但总体而言,针对《办法》研究尚存在如下问题:一是文献总量偏少,仅有不足10篇,这与如火如荼的落实态势形成鲜明对比;二是研究内容单一,仅探讨了《办法》是什么和为什么重要这两个问题。因此,有必要对《办法》如何有效落地实施进行深入思考。

2 《办法》落实困境分析

2.1 科学数据管理规划制定面临的困境

《办法》第七条第一款指出国务院科学技术行政部门(以下统称牵头单位)的职责之一是“组织研究制定国家科学数据管理政策和标准规范”;第八条第一款指出国务院相关部门、省级人民政府相关部门(以下统称主管部门)的职责之一是“负责建立健全本部门(本地区)科学数据管理政策和规章制度”;第九条第一款指出科研院所、高等院校和企业(以下统称法人单位)的职责之一是“建立健全本单位科学数据相关管理制度”。国家层面科学数据管理政策规章的制定不仅需要综合考虑权衡不同利益相关者的权责关系[38],而且相关标准规范必须需要得到行业领域的广泛共识[39]。地方或行业部门层面科学数据相关管理制度制定过程中需要考虑如何在传承《办法》精神的基础上突出行业部门特色,但调研结果发现各省市区出台的本地区科学数据管理实施细则/方案雷同性较大。

2.2 科学数据汇交与保存面临的困境

《办法》第十一条要求“法人单位应建立科学数据质量控制体系,保证数据的准确性和可用性”;第十三条要求“各级科技计划管理部门应建立先汇交科学数据、再验收科技计划项目的机制”;第十四条要求“在国外学术期刊发表论文时需对外提供相应科学数据的,论文作者应在论文发表前将科学数据上交至所在单位统一管理”。在科学数据质量控制方面,体系构建需要以前期已存储的大量优质科学数据资源为基础,抽象刻画优质科学数据特征,结合行业领域数据质量标准构建相应质量控制体系,数据质量标准需要随科学数据存量增加而不断更新。在科学数据汇交方面,数据生产者往往出于应付制度要求而为,为了汇交而汇交,即使已汇交的数据往往无序杂乱、错误残缺,甚至部分数据中被掺入大量无关数据,低效的数据汇交使得“先汇交、再验收”“先汇交、再发表”制度成为空口号。

2.3 科学数据共享与利用面临的困境

《办法》第二十条要求“法人单位要对科学数据进行分级分类,明确科学数据的密级和保密期限、开放条件、开放对象和审核程序等”;第二十二条要求“主管部门和法人单位应积极推动科学数据出版和传播工作”;《办法》第二十三条要求“科学数据使用者应遵循知识产权相关规定,在论文发表、专利申请、专著出版等工作中注明所使用和参考引用的科学数据”。在数据分类方面,秘密等级、保密期限、开放条件、开放对象、审核程序等的确定需要综合考虑多种因素,不同数据内容、不同数据格式、不同使用群体的开放范围差异巨大。在科学数据出版与传播方面,首先需要解决数据版权问题,已加工整理完成的数据集或数据产品中原始数据生产者与后续数据加工者之间、个人与单位之间的数据权益分配等问题需要思考[40]。数据外流也是不能忽视的问题,国内学者在国外期刊发表论文时,会按要求将数据提交到指定的存储机构,一些由我国基金资助产生的数据在国内未充分利用前就已丧失主权[41]。

2.4 科学数据保密与安全面临的困境

《办法》第二十七条要求“主管部门和法人单位应加强科学数据全生命周期安全管理,制定科学数据安全保护措施;加强数据下载的认证、授权等防护管理,防止数据被恶意使用”;第二十八条要求“法人单位和科学数据中心应完善数据管控、属性管理、身份识别、行为追溯、黑名单等管理措施,健全防篡改、防泄漏、防攻击、防病毒等安全防护体系”;第二十九条要求“科学数据中心应建立应急管理和容灾备份机制,按照要求建立应急管理系统,对重要的科学数据进行异地备份”。在科学数据安全保护方面,科学数据全生命周期涉及流程众多,数据认证、数据授权、身份识别等环节需要强大的网络安全和加密技术作为支撑,行为追溯需要获取网络行为日志,在此过程中稍有不慎可能侵犯普通用户的隐私安全[42]。在科学数据应急管理方面,异地备份时需要选择与现有科学数据中心软硬件环境相当的空间,这对备份过程及后续维护都提出巨大挑战。

2.5 科学数据管理绩效考评面临的困境

《办法》第八条第五款指出主管部门的职责之一为“建立完善有效的激励机制,组织本部门(本地区)所属法人单位科学数据工作的评价考核”,第十七条要求“法人单位应加强科学数据人才队伍建设,在岗位设置、绩效收入、职称评定等方面建立激励机制”,第三十条要求“主管部门和法人单位应建立完善科学数据管理和开放共享工作评价考核制度”。由于数据的内在价值难以评价[43],在科学数据管理成效考核评价方面,一方面需要综合考虑如何构建涵盖多方的指标层次体系;另一方面需要思考如何科学合理分配不同指标之间的权重系数。在科学数据管理激励机制构建方面,尽管科学技术部印发的《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》明确提出将科学数据纳入考核范围[44],但尚未有典型范例可参考,因此如何合理把握好科学数据和传统科研成果之间的比例需要思考。

3 区块链核心技术推介

3.1 块链结构

从数据结构角度而言,区块链采用了以区块为单位的链式结构[45]。一个区块由区块头和区块体两部分组成:区块头中封装了当前区块版本号、默克尔树根、交易时间戳(记录区块的产生时间)、难度值(区块要解决的难度阈值)、随机数(当前证明算法的解决方案)、前导区块签名值等信息[46];区块体中封装了当前区块的所有操作信息。当操作发生时,节点根据时间顺序对操作进行排序,通过哈希运算得到每个交易的哈希值,拼接不同的哈希值再次运算得到新的哈希值,不断拼接计算后即可得到默克爾树根哈希值,默克尔树根哈希值代表了一段时间内的所有操作信息,若操作发生改变,重新哈希运算得到的默克尔树根哈希值必然与先前值存在差异[47]。由于一条完整的区块链上存储了所有节点的历史信息且这些信息被不断确认和锁定,要想篡改某个区块信息就必须计算该区块后续所有区块信息并使结果重新被全系统51%以上的其他区块认可,完成篡改的理论可能性几乎为零。因此,只要获得最后一个区块的版本号,即可溯源链上所有区块信息。

3.2 加密算法

区块链采用加密算法来维护系统数据的安全性,一个加密系统的基本要素包括明文、密文、加密密钥、解密密钥、加密算法、解密算法等[48]。加密过程中,通过加密密钥和加密算法对明文进行加密,得到密文;解密过程中,通过解密密钥和解密算法对密文进行解密,得到明文。根据所使用密钥是否相同,加密过程可以分为对称加密和非对称加密,对称加密的密钥相同,非对称加密的密钥不同。非对称加密算法的安全由大数质因子分解、离散对数、椭圆曲线等复杂的数学问题来保证,在非对称加密的基础上还衍生出数字签名技术来证实数据内容的完整性和确认数据来源[49]。非对称加密算法使用私钥和公钥两种密钥[50],私钥一般通过系统随机生成,公钥通过私钥生成。系统中每个节点都有专属密钥,公钥向全系统广播,私钥由节点自行保存。在操作中,节点如果使用私钥对数据进行签名加密,其他节点则需要使用公钥对数据解密以确认数据来源的真实性;同理,节点如果用公钥加密,则需要用私钥进行解密。

3.3 共识机制

为了解决由多方节点参与导致的拜占庭容错问题,区块链采用共识机制来保证数据区块的生产和验证过程,一个完整的共识过程分为选主—造块—验证—记录4个阶段[51]:收到区块链网络中的操作数据后,首先需要从全体参与节点中选取记录节点,即选主;其次,记录节点将操作数据向区块链系统中全体节点广播,完成造块操作;然后,监督节点对接收到的交易数据进行验证审核;数据验证无误后,记录节点将封装好的数据区块添加到区块链中,记录操作完成。目前主流的共识机制有工作量证明机制(PoW)、股权证明机制(PoS)和股份授权证明机制(DPoS)。PoW的主要思想是每个节点基于自身算力资源来竞争解决一个复杂的数学难题,最快解决问题的节点将获得区块记账权或奖励[52]。PoS主要基于权益存量实现权益分配[53],系统中拥有最高权益的节点将获得区块优先权限。DPoS借鉴了类似“董事会决策”思想,每个参与节点可以将其享有的权益授权给少数节点,少数节点进入轮流进行业务操作并从中获得奖励[54]。

3.4 智能合约

智能合约是一套以数字形式定义的承诺以及合约参与方执行这些承诺的协议[55]。从本质上来看,智能合约是一组由事件驱动的、可针对特定情景专门设置的程序化规则和逻辑。类似于数据管理系统中的触发器,所有逻辑规则经全系统传播和审核节点验证后被编译成程序代码内嵌在操作对象和操作记录中,当达到预设条件后,全网节点通过技术手段自动执行程序并将执行结果写入区块链[56]。区块链技术的出现重新定义了智能合约并使其实现,作为区块链基础结构中合约层的核心要素,智能合约可以内嵌在任何有形或无形资产交易中,智能合约及其所有操作结果都会在区块链中保存并在系统中同步,所有节点的智能合约结果完全一致,形成了软件定义的系统和资源,能够主动处理数据、储存发送价值。由于智能合约执行过程中任何外界因素都无法对其干预,且其编译和运行均在隔离的沙箱环境中进行,既实现了“代码即法律”的目标,又有效保证了操作的公正性和安全性。

4 区块链与《办法》的耦合性分析

4.1 参与主体耦合

区块链技术最主要的特征是中心化[57],即不存在具有绝对权力的中心节点和层级结构,任何机构、团体、个人、组织在满足一定条件后可申请加入区块链系统并成为系统节点,各节点地位平等且以扁平化拓扑结构相互连接共享数據信息,是一个多主体参与的多元化、多层次、多功能数据共享生态体系[58]。《办法》中提及的利益相关者包括国务院科学技术行政部门、国务院相关部门、省级人民政府相关部门、科研院所、高等院校、企业、科学数据中心、科技计划管理部门、科研人员、科学数据使用者等,涵盖了数据生产者、数据使用者、数据加工者、数据保存者、数据管理者、数据服务者等多个主体。可以看出,区块链和《办法》都体现了多主体参与的去中心化思想,它们之间存在参与主体耦合关系。

4.2 管理对象耦合

从数据管理角度来看,区块链是一个存储大量全序关系数据的分布式数据记录系统[59],其主要包含3个基本要素:交易、区块和链[60]。交易是指节点的所有事务操作行为,区块中封装原始数据及某段时间内对数据的所有交易状态记录,链是由区块按照交易发生顺序依次串联而成的日志记录。《办法》所称的科学数据主要是指“科学研究活动的原始数据及其衍生数据”,《办法》的适用范围为“科学数据采集生产、加工整理、开放共享和管理使用等”相关活动。区块链和《办法》的管理对象都是数据资源及其利益相关者,它们之间存在管理对象耦合关系。可以看出,区块链的管理对象既有数据实体又有实体行为,《办法》的管理对象既有数据资源又有数据管理行为,它们之间存在管理对象耦合关系。

4.3 功能作用耦合

区块链的主要贡献是为分布式社会系统研究提供了一套行之有效的数据结构、交互机制和计算范式,为实现平行社会奠定了数据基础和信用基础,体现着平等和自由、共识和共治、公开和透明的技术特色[61]。就数据层面而言,区块链通过高度冗余的分布式节点存储,将掌握在少数人手中的数据扩散到所有人手中,能够真正实现“数据民主”[62],若将点对点的价值交换扩展至全社会即可形成新型的智慧型契约社会[63]。《办法》制定的目的是“进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和国家安全”。由此可见,区块链和《办法》都是以数据资源的价值最大化实现为目的,它们之间存在功能作用耦合关系。

4.4 应用场景耦合

当前,区块链技术的主要应用场景基本可以分为价值转移、数据存证和授权管理3种类型[64],价值转移是指数字资产在不同账户之间转移(如跨境贸易),数据存证是指将数据或实物数据化后记录到区块链中(如数字票据管理),授权管理则是由合约机制控制数据的访问使用(如商品拍卖)[65]。《办法》的适用场景涵盖了科学数据政策规划、科学数据生产采集、科学数据加工保存、科学数据开发利用、科学数据评估考核等多个流程,既有价值转移过程(如科学数据产品开发),又有数据存证过程(如数据汇交凭证开具),还有授权管理过程(如数据共享范围限定)。由此可见,区块链和《办法》都是针对数据驱动型应用场景发挥作用,它们之间存在应用场景耦合关系。

5 区块链视角下的《办法》落实路径选择

5.1 打造科学数据管理生态体系

由前述分析可得,《办法》落实不仅流程复杂而且涉及诸多利益相关者,这将是一个融合科学数据、方法技术、人员机构、政策规则等于一体的科学数据管理生态体系[66],涵盖了主体要素、客体要素、技术要素、环境要素等多种要素。该生态体系营造了一个“人人都是提供者、人人都是使用者、人人都是管理者”的科学数据管理环境,打造了一个具有正向反馈机制的科学数据管理生态圈,圈中各参与者通过某种特定关系相互连接,共同促进生态圈“自我进化”[67]。根据《办法》落实要求,新的科学数据管理生态体系需要在现有的环境基础上,一方面通过区块链技术解决科学数据可信问题;另一方面能够作为一种新型信息基础设施和创新理念将多种要素关系形成新的信任关系,实现各利益相关者互联互通,实现各方数据共建共享,充分调动起各力量参与科学数据管理的积极性。基于区块链的科学数据管理生态体系是一个可以无限扩大且稳定的社群系统,其中包括了环境、系统、数据、利益相关者、行为等多个因素:牵头单位、主管部门、科研院所、高等院校、企业、科学数据中心、科技计划管理部门、科研人员、科学数据使用者等都可以成为这个特殊社区的参与主体,它/他们在国家大数据法律法规、省市科学数据管理实施细则、国际国内科学数据管理标准规范等各层次政策环境的约束下,借助科学数据生产系统、科学数据采集系统、科学数据汇交系统、科学数据计算分析系统、科学数据可视化系统、科学数据发现共享系统、科学数据成效评估系统等技术手段,通过科学数据管理计划制定、科学数据采集生产、科学数据加工整理、科学数据开放共享、科学数据系统运维、科学数据安全防护、科学数据管理成效考核评价等行为,管理基础研究数据、应用研究数据、试验开发数据、观测检测数据、考察调查数据、检验检测数据、科学数据产品等科学数据资源客体。

基于区块链的科学数据管理生态体系的实质是将传统科学数据管理活动中的主客体直接互动放入到区块链系统中,通过科学数据资源和区块数据将所有的主体节点串联成线,科学数据流通皆在安全可控的分布式环境中进行,形成“点”“线”“面”融合的科学数据管理可信生态[68]。

5.2 构建科学数据管理联盟链

根据节点加入退出区块链系统的方式,可以将区块链分为公有链、私有链和联盟链3种类型[69],3种不同类型的区块链也各有特点与适用范围:公有链允许任何节点参与区块链系统治理,节点可以自由加入或退出系统;私有链仅允许受信任的极少数节点加入,系统中节点之间彼此可信透明但不对外公开;联盟链假使部分节点可信,允许部分获得授权许可的节点加入,链中可对参与节点数量、节点功能权限等进行设置。由于科学数据一般在科学共同体之间流转,且各利益相关者之间无需全系统节点参与共识,联盟链符合科学数据管理所需的存储可靠、传输可信、访问可控等需求。构建科学数据管理联盟链(SDMAChain),允许部分节点有条件加入系统,对链内节点完全开放,链外节点有条件共享。确定牵头负责单位、主管落实部门、具体执行单位等为可信节点且具有一定权限,科学数据生产者、科学数据使用者、科学数据服务商的加入和退出需要得到可信節点的认证授权,认证内容包括用户资质、保密条件、利用目的等,授权内容包括科学数据的保密等级、保密期限、开放条件、审核对象、审核程序、共享范围、共享程度、共享等级等。根据科学数据管理生态体系,可以预设其他子区块链作为联盟链的支撑体系,科学数据管理联盟链的具体构成如图2所示。

5.3 管控科学数据全生命周期

块链结构、加密算法、智能合约、共识机制等为科学数据管理提供了技术支持[70]。基于以上核心技术,本文设计了涵盖科学数据全生命周期的理论管理框架——PAVRSS,如图3所示。

PAVRSS框架共包括计划制定(Plan)、身份认证(Authentic)、数据验证(Verificate)、数据记录(Record)、数据共享(Share)、监督评估(Supervise)6个流程。①在科学数据管理计划制定阶段,利益相关者就科学数据的生成方式、管理方式、描述方式、分析方式、存储方式、共享方式、保存方式等达成共识,形成一份不可篡改的正式文本嵌入联盟链中;②在节点身份认证环节,各利益相关者向联盟链系统提交注册申请,系统调用智能合约自动验证注册信息是否合规;身份验证通过后为每个

参与节点分配一个由哈希运算得到的唯一的虚拟身份,身份信息包含节点ID、公钥地址、信誉积分等;普通节点经系统共识认证后可升级为记录节点,记录节点经共识认证后可升级为监督节点,从普通节点到监督节点,所拥有权限逐渐增大;③在数据审核验证环节,现有所有节点就数据格式标准、组织标准、语义标准、体量标准等达成共识并形成数据标准库;当新数据上传时,记录节点和监督节点调用智能合约自动验证数据是否合规,合规数据被允许加入SDMAChain系统并辅助数据标准库动态更新,非合规数据在修改完善后可重新上传并接受验证;④在数据上传记录环节,普通节点对验证通过的数据进行加密处理,得到数据摘要和数据签名并向数据记录节点发送请求,数据记录节点解密并比对数据摘要和数据签名,比对通过后数据摘要被存储在区块中,数据实体分布式存储在科学数据中心,数据摘要中记录了时间戳、版本号、哈希值等;⑤在数据共享利用阶段,主管部门、法人单位、科学数据中心调用智能合约自动化构建科学数据资源目录,也可据此开发相关科学数据产品,产品价格由全体参与节点共识而得;当使用者标注或引用相关科学数据后,智能合约自动判断数据价值并向数据所有者转移;⑥在监督评估环节,每隔一段时间(如1分钟)监督节点就记录节点的监督结果进行二次校验,确认记录结果无误后,智能合约自动向记录节点转发若干奖励;监督节点也会调用智能合约比对科学数据目录按照科学数据管理计划的完成情况,如果比对结果在约定的范围之内,则向相关节点发放奖励。

5.4 引入基于行为的激励机制

区块链技术最大的贡献是通过加密算法解决了拜占庭将军问题[71],即在不依赖可信第三方的前提下实现分布式节点的共识互信,其信任建立在技术背书之上,通过共识机制衡量参与节点的贡献程度进而激励节点积极参与。本研究拟引入激励机制,即由国务院科学技术行政部门在联盟链中发行一定的数据币,数据币总量可按照国家各级科技计划(专项、基金)的总预算额度进行匹配。数据币的生成和分配由智能合约自动完成,如果节点做出积极贡献,会得到数据币奖励;如果节点做出不良行为,则会被扣除数据币。因此,数据币可以看作用户贡献度的直接体现,数据币拥有量可作为节点权限分配的重要参考依据。在此基础上,进一步引入“币龄”这一概念[72],用以表示节点在某段时间内的数据币拥有程度。假设某节点在t1时刻的数据币拥有量为n1,在t2时刻的数据币拥有量为n2,则其币龄为$=(n2-n1)*(t2-t1)。币龄的具体累积情况如图4所示(阴影部分所占面积即为币龄)。

从图4中可以看出,币龄累积方式存在差异:①节点起初拥有大量数据币,后续消极参与任务,数据币和币龄都减少(如L1所示);②节点起初拥有大量数据币,后续即使处于非活动状态,币龄也会逐步累积(如L2所示);③节点起初拥有少量数据币,后续积极参与任务并在短时间获得大量数据币,币龄显著增加(如L3所示)。积累币龄的过程反映了用户持续参与的状态,针对L3类型的参与节点,可以考虑给予更多奖励,对于L1、L2类型的参与节点要及时发现并清理出联盟链系统。本文认为一个良好的情况是节点持续参与并积极完成任务。数据币的引入一方面督促节点积极参与科学数据管理活动;另一方面实现了对联盟链内节点的奖惩,调动起节点参与科学数据管理的积极性[73],有助于形成良好的数据共享氛围。

6 结 语

《办法》落实是多种治理思维、技术手段、政策制度的复杂综合体,落实成效因思想认识、重视力度、配套细则、基础设施、技术水平、学术研究等要素差异而千差万别。本文通过对《办法》内容的梳理和区块链核心技术的介绍,认为区块链技术与《办法》在多方面存在耦合关系,可以借助区块链技术解决《办法》落实面临的现实困境。本文的创新之处有:一是在学术界首次关注《办法》的落实问题;二是从探索区块链技术支持下的《办法》落实路径,既为《办法》落实寻找可行路径,也是对区块链技术应用场景的扩展。文章的主要不足之处:一是仅从宏观理论层面提出了《办法》的落实路径,尚未进行设计技术细节;二是引入激励机制时过于理想化,未考虑多场景叠加。后续研究可从以下方面展开:一是设计实现一套科学数据管理原型系统并测试验证其实践效果,在用户认证、数据验证、数据记录等环节可结合大数据、人工智能相关技术;二是参考经济学、博弈论等学科理论,设计更加详细具体合理的数据币增减规则。

参考文献

[1]国家科技基础条件平台中心.国家科学数据资源发展报告(2016)[R].北京:科学技术文献出版社,2016:1.

[2]《农业大数据学报》编辑部.“科学数据管理”专刊介绍[J].农业大数据学报,2019,1(4):3-4.

[3]张丽丽,温亮明,石蕾,等.国内外科学数据管理与开放共享的最新进展[J].中国科学院院刊,2018,33(8):774-782.

[4]阮冰颖,刘桂锋,苏文成.我国科学数据管理实践探索的回顾与展望[J].情报科学,2021,39(2):185-192.

[5]中华人民共和国科学技术部.科技部 财政部关于发布国家科技资源共享服务平台优化调整名单的通知[EB/OL].http://www.most.gov.cn/mostinfo/xinxifenlei/fgzc/gfxwj/gfxwj2019/2019 06/t20190610_147031.htm,2021-01-22.

[6]重庆市人民政府.重庆市人民政府办公厅关于贯彻落实科学数据管理办法的通知[EB/OL].http://wap.cq.gov.cn/zwgk/fdzd gknr/lzyj/qtgw/202001/t20200114_4623463.html,2021-01-23.

[7]中國科学院办公厅.中国科学院印发《中国科学院科学数据管理与开放共享办法(试行)》[EB/OL].http://www.go.cas.cn/gzdt/201902/t20190221_4679909.html,2021-01-24.

[8]重庆青年职业技术学院科研处.重庆青年职业技术学院科学数据管理办法(试行)[EB/OL].http://www.cqqzy.cn/index.php?m=content&c=index&a=show&catid=33&id=110,2021-01-25.

[9]国家空间科学数据中心.国家空间科学数据中心召开科学数据合规工作专题研讨会[EB/OL].https://www.nssdc.ac.cn/mhsy/html/newsdec.html?f3af46d1-56d5-4249-849a-6df3a468d5 f1,2021-01-26.

[10]中国科学技术期刊编辑学会.关于促进学术出版科研诚信及伦理规范的声明[EB/OL].http://www.cessp.org.cn/info/739 25.jspx,2021-01-27.

[11]李庆刚.制度的生命力在于执行[J].红旗文稿,2020,(10):17-18.

[12]王代礼.基于利益相关者的高校图书馆科学数据管理策略分析[J].图书馆工作与研究,2020,(9):67-72.

[13]于戈,牛保宁,金澈清.区块链数据管理专题前言[J].软件学报,2019,30(9):2569-2570.

[14]张恬,孟美任.学术交流应用区块链技术的场景与案例剖析[J].中国科技期刊研究,2019,30(5):469-475.

[15]张俊,王飞跃.基于区块链的电网大数据数字资产管理架构[J].电力信息与通信技术,2018,16(8):1-7.

[16]王继业,高灵超,董爱强,等.基于区块链的数据安全共享网络体系研究[J].计算机研究与发展,2017,54(4):742-749.

[17]Zyskind G,Nathan O,Pentland A,et al.Decentralizing Privacy:Using Blockchain to Protect Personal Data[C]//IEEE.2015 IEEE Security and Privacy Workshops.San Jose:IEEE,2015:180-184.

[18]Rossum J.Blockchain for Research[EB/OL].https://digitalscience.figshare.com/articles/Blockchain_for_Research/5607778/1,2021-01-28.

[19]刘硕,胡泽文,李玉平.区块链模型、技术与典型应用探究[J].情报工程,2019,5(6):15-36.

[20]中国政府网.习近平主持中央政治局第十八次集体学习并讲话[EB/OL].http://www.gov.cn/xinwen/2019-10/25/content_5444957.htm,2021-01-29.

[21]Azaria A,Ekblaw A,Vieira T,et al.MedRec:Using Blockchain for Medical Data Access and Permission Management[C]//IEEE.2016 2nd International Conference on Open and Big Data.Vienna:IEEE,2016:5-30.

[22]王姝,晏敏,刘佳,等.基于区块链的科学数据标识技术创新应用模式[J].数据与计算发展前沿,2019,1(6):62-74.

[23]姚敏.基于区块链技术的图书馆科学数据仓储模型研究[J].图书馆学刊,2018,40(6):94-97.

[24]侯玥,彭长辉,杨铭霞,等.基于区块链技术的生态观测数据存储与共享模式[J].农业大数据学报,2020,2(2):55-66.

[25]郝世博,徐文哲,唐正韵.科学数据共享区块链模型及实现机理研究[J].情报理论与实践,2018,41(11):57-62.

[26]谷俊,许鑫.人文社科数据共享模型的设计与实现——以联盟链技术为例[J].情报学报,2019,38(4):354-367.

[27]师衍辉,韩牧哲,刘桂锋.融合区块链技术的机构知识库科学数据监护模型研究[J].现代情报,2020,40(1):101-109.

[28]王芳,赵洪,马嘉悦,等.数据科学视角下数据溯源研究与实践进展[J].中国图书馆学报,2019,45(5):79-100.

[29]赛迪智库.《科学数据管理办法》的亮点与思考[J].中国工业和信息化,2018,(9):12-14.

[30]邢文明,洪程.開放为常态,不开放为例外——解读《科学数据管理办法》中的科学数据共享与利用[J].图书馆论坛,2019,39(1):117-124.

[31]秦顺,邢文明.开放·共享·安全:我国科学数据共享进入新时代——对《科学数据管理办法》的解读[J].图书馆,2019,(6):36-42.

[32]高瑜蔚,石蕾,朱艳华,等.《科学数据管理办法》实施细则比较研究——以正式发布的11份细则为例[J].中国科技资源导刊,2019,51(3):1-10,17.

[33]白锐,吕跃.基于修正多源流模型视角的政策议程分析——以《科学数据管理办法》为例[J].图书馆理论与实践,2019,(10):50-55.

[34]张洋,肖燕珠.生命周期视角下《科学数据管理办法》解读及其启示[J].图书馆学研究,2019,(15):37-43,13.

[35]邢文明,洪芳林,李晓妍.科学数据管理体系的二维视角——《科学数据管理办法》解读[J].图书情报工作,2019,63(23):30-37.

[36]温亮明,李洋,张丽丽,等.《科学数据管理办法》语词分析[J].新世纪图书馆,2020,(5):81-89.

[37]李洋,温亮明.《科学数据管理办法》落实现状、影响因素及推进策略研究[J].图书情报工作,2021,65(2):65-74.

[38]Kleindienst D.The Data Quality Improvement Plan:Deciding on Choice and Sequence of Data Quality Improvements[J].Electronic Markets,2017,27(4):387-398.

[39]Stanford N J,Wolstencroft K,Golebiewski M,et al.The Evolution of Standards and Data Management Practices in Systems Biology[J].Molecular Systems Biology,2015,11(12):851.

[40]温亮明,张丽丽,黎建辉.大数据时代科学数据共享伦理问题研究[J].情报资料工作,2019,40(2):38-44.

[41]李洋,温亮明.我国科学数据外流:表现、问题与对策[J].图书馆杂志,2019,38(12):72-81,115.

[42]李洋,温亮明.我国科学数据安全保障路径研究[J].图书馆,2021,(3):99-105.

[43]牛超越,郑臻哲,吴帆,等.个人数据交易:从保护到定价[J].中国计算机学会通讯,2019,15(2):39-47.

[44]中华人民共和国科学技术部.科技部印发《关于破除科技评价中”唯论文”不良导向的若干措施(试行)》的通知[EB/OL].http://www.most.gov.cn/mostinfo/xinxifenlei/fgzc/gfxwj/gfxwj2020/202002/t20200223_151781.htm,2021-01-29.

[45]邵奇峰,金澈清,张召,等.区块链技术:架构及进展[J].计算机学报,2018,41(5):969-988.

[46]Zheng Z,Xie S,Dai H,et al.An Overview of Blockchain Technology:Architecture,Consensus,and Future Trends[C]//IEEE.2017 IEEE International Congress on Big Data.Honolulu:IEEE,2017:557-564.

[47]Narayanan A,Bonneau J,Felten E,et al.Bitcoin and Cryptocurrency Technologies[M].Princeton:Princeton University Press,2016:20.

[48]Xu J,Xue K,Tian H,et al.An Identity Management and Authentication Scheme Based on Redactable Blockchain for Mobile Networks[J].IEEE Transactions on Vehicular Technology,2020,69(6):6688-6698.

[49]楊保华,陈昌.区块链:原理、设计与应用[M].北京:机械工业出版社,2018:58-59.

[50]李经纬,贾春福,刘哲理,等.可搜索加密技术研究综述[J].软件学报,2015,26(1):109-128.

[51]袁勇,倪晓春,曾帅,等.区块链共识算法的发展现状与展望[J].自动化学报,2018,44(11):2011-2022.

[52]Laurie B,Clayton R.“Proof-of-Work”Proves Not to Work[EB/OL].https://www.cl.cam.ac.uk/~rnc1/proofwork.pdf,2021-01-30.

[53]King S,Nadal S.PPCoin:Peer-to-Peer Crypto-Currency with Proof-of-Stake[EB/OL].https://peercoin.net/assets/paper/peercoin-paper.pdf,2021-01-31.

[54]Asolo B.Delegated Proof-of-Stake(DPoS)Explained[EB/OL].https://www.mycryptopedia.com/delegated-proof-stake-dpos-explained/,2021-02-01.

[55]Szabo N.The Idea of Smart Contracts[EB/OL].http://www.fon.hum.uva.nl/rob/Courses/InformationInSpeech/CDROM/Literature/LOTwinterschool2006/szabo.best.vwh.net/smart_contracts_idea.html,2021-02-02.

[56]Gatteschi V,Lamberti F,Demartini C,et al.Blockchain and Smart Contracts for Insurance:Is the Technology Mature Enough?[J].Future Internet,2018,10(2):20.

[57]袁勇,王飞跃.平行区块链:概念、方法与内涵解析[J].自动化学报,2017,43(10):1703-1712.

[58]张衍斌.基于区块链的电子商务信息生态系统模型研究[J].图书馆学研究,2018,(6):33-44.

[59]张志威,王国仁,徐建良,等.区块链的数据管理技术综述[J].软件学报,2020,31(9):2903-2925.

[60]夏清,张凤军,左春.加密数字货币系统共识机制综述[J].计算机系统应用,2017,26(4):1-8.

[61]袁勇,周涛,周傲英,等.区块链技术:从数据智能到知识自动化[J].自动化学报,2017,43(9):1485-1490.

[62]袁勇,王飞跃.区块链技术发展现状与展望[J].自动化学报,2016,42(4):481-494.

[63]李晓,刘正刚.基于区块链技术的供应链智能治理机制[J].中国流通经济,2017,31(11):34-44.

[64]朱建明,付永贵.区块链应用研究进展[J].科技导报,2017,35(13):70-76.

[65]欧阳丽炜,王帅,袁勇,等.区块链智能合约的发展現状:架构、应用与发展趋势[J/OL].自动化学报:1-13[2021-02-02].https://doi.org/10.16383/j.aas.c180586.

[66]李云婷,温亮明,张丽丽,等.科学数据共享系统的现状与趋势[J].农业大数据学报,2019,1(4):86-97.

[67]张衍斌.基于区块链的电子商务信息生态系统模型研究[J].图书馆学研究,2018,(6):33-44.

[68]王平,李沐妍,刘晓春.区块链视角下文件档案管理可信生态的构建[J].档案学研究,2020,(4):115-121.

[69]Peters G W,Panayi E.Understanding Modern Banking Ledgers Through Blockchain Technologies:Future of Transaction Processing and Smart Contracts on the Internet of Money[M].Berilin:Springer,2016:239-278.

[70]Wen L,Zhang L,Li J.Application of Blockchain Technology in Data Management:Advantages and Solutions[C]//Li J,Meng X,Zhang Y,et al.International Conference on Big Scientific Data Management.Beijing:Springer,2018:239-254.

[71]章宁,钟珊.基于区块链的个人隐私保护机制[J].计算机应用,2017,37(10):2787-2793.

[72]夏清,张凤军,左春.加密数字货币系统共识机制综述[J].计算机系统应用,2017,26(4):1-8.

[73]付瑶瑶,李盛恩.授权股份证明共识机制的改进方案[J].计算机工程与应用,2020,56(19):48-54.

(责任编辑:孙国雷)

猜你喜欢
全生命周期区块链技术激励机制
湿地恢复激励机制的国际立法及启示
激励机制助推节能减排
基于区块链技术的我国央行数字货币的前路展望
区块链技术发展现状及其潜在问题文献综述
浅谈“一带一路”下区块链技术在金融领域的应用
二维码标识管理系统在教育装备管理中的应用
绿色建材全生命周期的研究与落实方法
范式转换视角下建筑工程全生命周期的工程造价管理研究
山西票号的激励机制及其现代启示