基于区块链技术的档案数据共享策略探究*

2020-11-21 09:34
山西档案 2020年4期
关键词:区块

(上海大学图书情报档案系 上海 200444)

0 引言

大数据时代,数据成为重要的生产资料、稀有资产和新兴产业,被誉为“新的石油”。档案数据是一种重要的数据记录,也是重要的社会记忆。当前,档案数据急剧产生,档案数据保存状态与开放共享水平不相匹配,存在着“重数量轻质量、重创造轻开放、重保存轻利用”的现象,在数据质量、集成管理、开放共享、隐私保护等方面面临着越来越多的挑战和风险。2016年,《“十三五”国家信息化规划》提出,“当前公共数据开放共享水平不高,难以满足国家治理体系和治理能力现代化的需求,要加快建立公共数据资源开放共享体系。”[1]2016年,《全国档案事业发展“十三五”规划纲要》提出,“制定档案数据开放计划,明确档案数据开放与维护的责任,率先实现涉及民生的档案数据开放共享。”[2]区块链以其安全的性能、高效的运作效率在解决档案数据开放共享、多元互动、公开透明等问题上有广阔应用前景。2019年,习近平总书记强调,“要借助区块链技术促进数据共享、提升协同效率、建设可信体系,积极探索区块链数据共享模式。”[3]在大数据时代探讨区块链技术在档案数据共享中的应用具有重要的理论意义和实践价值。

1 基于区块链技术的档案数据共享相关研究

1.1 区块链技术和档案数据的内涵

区块链最早是由学者中本聪在《比特币:一种点对点式电子现金系统》一文中提出。他认为,“区块链是用于记录比特币交易账目历史的数据结构”。[4]2016年,工信部在《中国区块链技术和应用发展白皮书》中指出“区块链有狭义和广义两种涵义。狭义的区块链是一种链式数据结构,链上的数据同时存储在多个节点上,因此,区块链又称为分布式账本,存储的数据以加密方式保证其不可伪造、不可篡改,并依据一定的时间顺序将数据块相连。”[5]广义上的区块链代表的是一种技术概念,是一种全新的分布式基础架构与计算范式。本文使用的是广义区块链概念,立足区块链的共识机制、加戳加密、智能合约等核心技术,探讨将其看作一套基于多种技术组合的治理架构应用在档案数据共享中。

档案数据是指各级各类档案机构收集保存的具有档案性质的数据记录,包括各种数据形式的档案资源,以及档案管理与利用过程中产生的数据。档案数据具有来源广泛、结构复杂、形式多样、数量巨大等特点,是国家经济和社会发展重要的战略性信息资源,蕴藏巨大的价值潜能,在国家治理现代化、政府治理重塑、社会政策优化、公共服务提升等各项工作中发挥着基础信息支撑作用。“通过加强档案数据共建共治共享,推动档案数据成为政府科学高效决策的可靠依据,公共服务质量提升的不竭动力,社会治理精准精细的创新引擎,有力提升国家治理现代化水平。”[6]当前档案数据共享中面临着中心化存储、整合效率低、“数据孤岛”、信任程度弱、安全性能差、隐私保护难等问题,难以满足社会对档案数据的共享需求,而区块链技术可以有效弥合这些不足,推进档案数据的共享利用。

1.2 关于区块链在档案数据共享中的研究现状

区块链是一种颠覆性技术革新,“它将从技术底层根本解决长期以来档案数据共享中面临的‘数据孤岛’‘数据确权’和‘数据信任构建’等问题,重塑档案数据共享模式和结构。”[7]进而重构档案数据边界和深度挖掘档案数据价值,提升档案数据治理能力和水平。

随着区块链技术的迅速发展,国内外研究者展开了广泛论述,对区块链技术支持档案数据共享也进行了一些相关研究。Swan探究了区块链技术在部分国家公共服务领域的应用实践,安全可信的政务档案数据基础设施的可行性,认为“区块链技术具有去中心化、安全可信等特点,在知识产权保护、健康数据共享、政务档案数据基础设施建设、构建智慧政府服务等方面具有巨大潜力。”[8]Oscar详细论述了区块链技术的运行机制,指出“区块链技术可以安全高效的实现政府档案数据共享。”[9]Taylor认为,“对于政府部门而言,区块链技术是安全可靠、值得信赖的,能够降低公共服务成本、提高政府透明度,增强政府公信力,促进政府、企业和公民之间的数据共享。”[10]总体来看,国外有关区块链技术应用档案数据共享的理论研究较少。但近年来,英国、美国等发达国家已经开始实施区块链应用于档案数据基础设施试点项目,充分显示了区块链技术在档案数据共享研究中的广阔前景。

我国对区块链技术应用于档案数据共享的研究起步较晚。李高峰,胡国强认为,“区块链技术能够有效解决数据共享中的关键问题,保障档案数据共享的安全,有利于档案数据的分析和挖掘。”[11]谭海波,周桐等人提出了一种基于区块链的档案数据保护与共享方法,“借助智能合约和数字签名技术确定档案数据所有权;通过加戳加密等技术验证、追溯档案数据;通过公有链与联盟链相结合的方式降低档案数据共享的成本和风险,提高档案数据开放透明度。”[12]马仁杰,沙洲“构建了一种以联盟区块链为基础,涵盖长三角地区的档案信息资源共享模式,并分析其优劣势及对策。”[13]聂云霞等人“以浙江省政务服务改革为切入视角,分析了当前政务档案信息共享中存在的突出问题及应用区块链技术实现政务档案信息共享的可行性。”[14]总体而言,目前国内学界对区块链应用于档案数据共享的研究尚未深入,已有的研究主要分析了区块链技术在增强档案数据安全共享方面的作用和应用可行性、应用方法等。

2 区块链技术应用于档案数据共享的契合点

区块链与实现档案数据共享有浑然天成的契合点。基于区块链的档案数据共享是一种理念的变革,是一种全新的数据共享模式,能有效推动档案部门在档案数据共享中的角色转换和职能转变,促进档案数据管理部门结构扁平化,提高档案数据开放透明度,提升档案数据共享效率效能,推动档案数据价值互联延展,提升档案治理能力和水平。

2.1 去中心化——促进档案数据共享的多元融通

区块链最重要的特征就是去中心化。“去中心化意味着在区块链中的每一个节点,功能相对平衡对等,数据可分布式存储和运行,不再依赖数据管理系统和硬件设施上的中心化管理。”[15]首先,去中心化意味着多中心化,区块链的去中心化能够实现档案数据共享过程中的多中心参与、多主体治理、点对点平等、信息对称、档案数据自治等功能,使得各个主体处于平等地位,从根本上重塑档案部门与社会、公民之间的良性互动关系,改变档案部门在档案数据共享体系中的绝对中心状态。其次,“运用区块链点对点技术能够实现多元主体的多向联通、双向融通,无需依赖第三方平台,便可建立点对点的去中心化通道,促进档案数据跨界流动、畅通共享。”[16]用户可以根据自身需求在区块链上访问、查询、利用档案数据,实现多中心协同参与,有利于形成档案数据多元共建、多元共治、多元共享良性格局,契合档案部门由传统档案管理向档案治理方式转变的要求,提升档案数据治理能力。最后,去中心化并非指所有主体权责完全均等,而是通过采取点对点的形式,对档案数据共享中各主体、各节点进行有效的权责划分,不仅要发挥档案部门在档案数据共享中积极协调、统筹规划的“元治”角色,也要吸纳社会力量、公民、市场的积极参与,从而保证区块链系统中的档案数据共享的有序有效进行。

2.2 共识机制——夯实档案数据共享的信任基石

区块链的共识机制是指,“利用区块链特有的共识算法,防止数据篡改和伪造。”[17]区块链的共识算法保证了档案数据一旦上链即无法被篡改,除非攻击者能够控制绝大多数节点,才能使篡改行为被区块链网络所接受,但是攻击过程会被全网见证,各主体就不会再信任这套系统,该系统的信任机制随即崩塌,系统失去价值,攻击者为控制节点而投入的大量资金和时间成本便无法收回,攻击者的行为随即失去意义。区块链的共识机制对建立档案数据共享的信任体系主要表现在以下三个方面:

第一,由于档案数据具有原始性、高价值性等特点,是真实的可靠凭证,这是档案数据区别于一般数据的重要特征。因此,确保档案数据的真实完整、质量可靠十分重要。共识机制能够确保档案数据不可更改、不可伪造、可靠可用,提高档案数据的标准化程度,减少数据异构,保证档案数据质量,从而为档案数据共享打下信任的第一步。第二,“在以往档案数据共享模式中,主要依靠一个中心化机构来维护其他档案机构提供的档案数据资源,各档案机构的信任往往建立在对中心化机构的信任之上。一旦中心化机构在技术、管理方面出现失误和漏洞,就会给存储其中的档案数据带来巨大风险。”[18]共识机制能够实现存储数据依靠所有节点共同维护,保障各分布式节点间的数据共享在各方信任的状态下进行,实现档案数据的集体信任和自信任。可见,基于共识机制的集体信任与自信任可以相对完美地解决档案数据共享的信任问题,从而大大提高各主体间的信任程度,加快档案数据共享进程。第三,“区块链的共识机制要求各主体之间遵守共同协议并履行义务,共同管理和协调整个信任体系,共同维护和监督档案数据的安全。”[19]因此,基于区块链形成的信任体系有助于实现档案部门、社会机构和公民之间良好的合作秩序,在相互信任的基础上进行有效沟通、深度对话,从而借助技术手段从根本上夯实档案数据共享的信任基石。

2.3 加戳加密——降低档案数据共享的安全风险

安全是档案数据共享的生命线,确保档案数据安全是实现档案数据共享的前提。大数据环境下,档案数据面临着数据泄露、数据滥用、黑客攻击、病毒侵染、隐私侵犯、缺乏安全共享渠道等风险。区块链的加戳加密技术能够有效降低档案数据共享的安全风险。一方面,区块链的时间戳,用于标识某一时刻的时间,具有唯一性。“在区块链中,当共识节点打包区块数据后,紧接着就会在区块头中添加时间戳,准确记录数据的入块时间。随后按照数据入块的时间顺序依次添加时间戳,形成一条带有时间顺序的原始链条。”[20]时间戳形成的时间链为档案数据增加了一个时间维度,可以保证存储在区块链中的档案数据具有极强的可追溯性、可验证性,档案数据的任何异常情况都会形成相应的时间记录,从而避免了某些人为因素导致的数据泄露、数据盗取风险。同时,时间戳也是一种存在性证明,能够证明档案数据的真实性,增强档案数据的可读性,从而应用于知识产权保护等时间敏感领域。

另一方面,档案数据中涉及大量公民隐私信息,在共享过程中,有可能在用户无法有效控制和不知晓的情况下,受到黑客攻击、病毒传播等,将用户的生活情况、身份特征暴露,侵犯个人隐私。“借助于区块链的加密技术,通过基于哈希算法的非对称加密算法,分析档案数据特征,利用一一对应的公开密钥和私有密钥组成加密方法,对部分涉密档案数据、隐私档案数据进行加密,确保档案数据安全。”[21]通过采用非对称加密技术,可以对档案数据的操作访问权限精细划分,保障保密性较高的档案数据安全,降低社会对档案数据共享中的隐私安全担忧,提升档案数据共享的安全防护能力。

2.4 多链配合——推动档案数据共享的开放透明

区块链具有多种类型,根据开放程度不同,可分为公有链、私有链和联盟链。公有链对所有人开放,任何人都可以共享数据;私有链只对某个组织或个人开放,联盟链对特定组织和群体开放。按照对接类型来划分,区块链可以分为单链、侧链和互联链。“单链,即单独运作的区块链系统,是当前应用最广泛的区块链结构。”[22]侧链,起源于比特币侧链,目的是实现跨链的数据交互。侧链技术能够将不同的链结合起来,将多条链打通,实现优势互补。将以上不同类型链彼此互联就产生了互联链,一旦功能不同的区块链互联,能够实现功能互补,有助于进行多链之间的多重验证,改善系统可靠性,提高系统扩展性,为社会发展带来更高层次的智能化,但当前互联链技术尚未完全成熟,应用有限。

根据档案数据开放程度不同,可以采用不同的区块链并适当加以结合。对于面向全社会公开的档案数据,可以采用公有链,全民所有,全民共享,但当前尚不适用;对于跨区域、跨部门、跨行业之间共享档案数据,可以配合采用联盟链与公有链,如“同一区域数字档案馆之间构建联盟链,共同管理和维护此区块链的稳定运行,并将档案数据快照定期与公有链进行锚定,在保障档案数据安全的同时,提高数据的公开透明度。”[23]这是当前应用前景最为广阔的链条。针对某个部门或涉及个人隐私的档案数据,可以采用私有链,内部共享,应用有限。通过区块链不同链式的合理运用,能够有效解决档案数据共享中存在的“数据孤岛”“数据分散”“数据流通难”等问题,从而提高档案数据的共享程度。

2.5 智能合约——提升档案数据共享的效率效能

“智能合约的本质是一种已转换为区块链软件语言的合约,这种严密的合约存储在区块链上,可由触发事件实现自动执行。”[24]换言之,智能合约是在区块链上编程和保存的一系列if/else语句。如图1所示:

一旦满足智能合约的权限要求,合约将自动执行,并将操作结果在区块链中存储和共享。否则则执行else语句,拒绝利用申请。“智能合约的实现流程如下:首先,多元主体共同商议、共同参与制定一份智能合约;其次,合约通过P2P网络扩散并存入区块链中;最后,当满足提前设置的条件时,区块链构建的智能合约就会自动执行。”[25]当档案用户需要读取、利用档案数据时,区块链中的每个节点就会共同生成一份智能合约,然后区块链会自动研判,一旦符合要求就会执行命令,提供给用户所需的档案数据,满足用户需求。依托智能合约,档案数据共享服务将大大降低人工干预,减少人工操作,从而简化利用流程,减少利用手续,提升利用档案数据的效率,提高档案数据共享的效能。“如英国国家档案馆创新工作方式,利用基于区块链的智能合约促进档案数据共享的自动操作,提高了档案数据的运行效率,获得了广泛赞誉。”[26]

3 基于区块链技术的档案数据共享策略

3.1 理念引领:明确应用区块链实现共享的共识

“世界著名管理大师德鲁克曾坦言:当今社会不再是技术、软件和速度的革命,而是一场观念的革命。”[27]思想引领行动,要明确应用区块链实现档案数据共享的共识,学界要积极探讨区块链技术应用于档案数据共享中的可行性、必要性及相关法律标准等理论研究;档案部门要加强区块链认识,探索区块链与档案数据共享的具体结合方法、实际案例。

一方面,档案界要清楚的认识到区块链作为一项颠覆性技术,给档案工作、档案事业、档案数据治理带来的巨大机遇,密切关注区块链在档案数据共享领域的发展进度,认清区块链技术的发展规律,指导区块链深入应用于档案数据共享中。如2015年,由美国国家卫生信息技术协调办公室主导,区块链被应用于美国医疗档案数据共享领域。每个区块记录患者的身份信息、经过加密的病历数据、病历数据单元的时间戳、档案数据格式等元数据内容。“所有不同类型的档案数据(包括图像、文本等)都会结合数字签名技术进行加密,然后被存储于区块链数据库中。当医疗机构产生新的病历数据时,智能合约自动将数据上传至区块链,实现档案数据的自动生成和更新。上传后的档案数据严格遵循保密原则,档案数据提供方可依据自身考虑,限定访问者身份权限,这样有效保障了医疗档案数据的安全共享和隐私保护。”[28]另一方面,区块链技术正处于发展初期,在性能、隐私、安全、技术升级等方面面临诸多挑战,档案界需要权衡利弊,顺势而为,既要认识到应用区块链的时代必然性,又要理智对待其不足,加以完善改进。

3.2 法治护航:推进应用区块链共享的法治建设

法律是治国之重器,良法是善治之前提。“由于是发展初期其安全问题面临诸多挑战,仅2011年到2018年4月,全球范围内因区块链安全事件造成的损失高达28.64亿美元,且损失金额呈指数上升趋势。”[29]为此,建立健全区块链标准规范体系刻不容缓。

国际方面,“2016年9月,国际标准化组织ISO成立了区块链和分布式账本技术技术委员会ISO/TC307,开展区块链术语架构、本体分类、安全隐私、身份认证和智能合约等方面的标准化制定。”[30]国内方面,2016年10月,工信息部出台我国首个官方指导文件——《中国区块链技术和应用发展白皮书(2016)》,弥补了我国区块链法规标准方面的空白。目前我国已经形成了国际化区块链方面的200多项专利,相关区块链国家标准治理组织和治理计划也已经筹备和公布。

对于档案部门来说,需要积极构建基于区块链治理架构所配套的制度法律。“2019年4月22日,美国华盛顿州Governor Jay州长签署SB 5638法案(Substitute bill 5638),承认利用区块链等分布式账本技术所保存电子记录的法律地位。”[31]这启示我国档案部门要加强顶层规划,成立由国家档案局牵头的区块链共享档案数据的组织机构,在宏观层面谋划区块链应用在档案数据共享中的法律保障框架,对照现行法律规范,定期审核和修订不适应区块链发展的法律法规;制定相应政策,鼓励各级各类档案机构对区块链技术应用在档案数据共享的先试先行和经验总结。档案部门要依托相关国际、国家标准,加强区块链应用于档案数据共享的标准体系建设,包括共享中的基础标准、应用标准、技术标准、过程方法标准、操作标准、安全标准等,并验证标准的适用性,加强对区块链的治理和规范。

3.3 多元共享:构建档案数据多元协同共享模式

2016年5月,由美国特拉华州公共档案馆牵头采用新兴的区块链和智能合约技术,使用分布式账本进行存档记录和数据共享,取代缓慢的、容易出错的纸质文件,加快了检索速度,减少了错误和欺诈的发生,削减了共享成本。特拉华州成为美国首个实践区块链技术的州。“分布式数据共享是该项目中最具潜力的部分。特拉华州公共档案馆通过与区块链创业公司Symbiont、消费者团体、律师协会公司法委员会协同合作,还任命了流程监察专员加强监管,利用分布式账本技术来存档、加密和共享数十个州和地方机构持有的政府档案数据,最终实现在遵守档案留存和销毁有关的法律的同时档案数据共享自动化。”[32]

此案例启示我们,当前基于区块链的档案数据共享应形成以档案部门为主导,多中心协同参与的共享模式,如图2所示。这种以档案部门为主体的协同模式实质上是一个由多主体组成的主权互联链,基于此可以对档案数据进行存储、交换和共享。其中,档案部门是档案数据收集、存储、管理、共享利用的主要承担者,是档案数据共享政策的制定者、共享服务的提供者、共享权利的协调者、共享利用的监管者,决定了向社会提供档案数据的格式、种类、数量和质量,是档案数据共享的主要责任体,发挥着主导作用,“需要充分借助区块链技术加快从‘数据孤岛’转向跨领域、跨地域、跨层级、跨系统、跨部门、跨业务的档案数据多元共享。”[33]不断推动档案数据开放透明,促进多元主体整合融通、协同互动,为区块链技术在档案数据共享中的运用营造开放包容的环境,增进社会公平。链上的其他主体可以是区块链第三方产业、其他档案数据的产生主体、社会机构、公民等,节点之间通过协商,达成一定共识,并共同维护该共识,在共识机制下,根据多方主体的实际需要和权限形成智能合约,智能合约在区块链上自动运行,实现各主体间直接对接,并进行数据交流、共享。

图2 基于区块链技术的档案数据多元共享模型

“各个节点上的主体共同维护、监督上链档案数据,只有当某节点档案数据与其他档案数据保持一致时,该节点才可以将自身需要传输或共享的档案数据上链,从而保证链上档案数据的可靠性和非重复性。”[34]数据上链时由特定加密算法进行加密并加盖时间戳,各主体可以根据手中私钥,发出利用请求,一旦符合身份,就会执行智能合约,密钥随之解密,档案数据需求者就可以对链上档案数据进行查询、获取、利用等操作,流程如下图3所示。

已上链档案数据不能被单一或少数节点篡改,只有在多数节点达成一致的前提下,方可对链上档案数据进行修改,且修改记录会被在链上永久记录并保存。在此基础上,一方面,各主体可以通过协同合作的方式,就档案数据共享利用中的问题进行讨论、协商,从而保证决策的科学性与准确性;另一方面,区块链上的各主体有权利和义务共同监督和维护链上档案数据,档案数据的形成来源可追溯,最大程度地保证了档案数据的可靠性,从制度和根源上形成了有效的多方信任基础,从而提高档案数据的利用效能。

图3 基于区块链技术的档案数据利用流程

3.4 人才保障:加强区块链技术的专业人才培育

治国经邦,人才为急。首先,技术人才是关键,技术人才负责技术应用和攻关,直接决定区块链技术在档案数据共享中作用的发挥程度,是实现区块链档案数据共享的基础,要加强区块链应用档案领域的跨学科人才队伍建设。其次,管理人才是核心。管理人才直接决定着区块链应用与档案数据共享的推进力度和共享效果,发挥着统筹谋划、顶层设计的导向作用,是区块链应用档案数据共享战略规划、政策制定、总体设计、宏观指导的核心。“区块链应用档案数据共享架构的建设,既需要技术人才在关键领域实现技术对接和创新,又需要懂专业的管理人才支撑应用体系的设计和规划。”[35]两者互相配合,才能促进区块链在档案数据共享中的落地生根。最后,“面对区块链等新兴技术浪潮给档案工作带来的冲击,作为向档案部门输送专业人才的档案学专业高等教育,需要转变教育理念,注重学科交叉,加强区块链技术和数据管理类课程的教学,建立理论与技术并重的高层次创新人才培养体系。”[36]

4 结语

大数据时代数据资源的空间结构发生颠覆性改变,数据呈现出飞速膨胀、分布广泛、价值多元、深度共享等特征,档案数据作为国家机构、社会组织和个人在社会活动中直接形成的具有保存价值的数据记录,是一种最真实、最可靠、最具权威性与凭证性的原生数据资源。“档案数据相对于其他类型的数据更加真实可靠,价值密度更高,关联意义更大,决策依据性更强,蕴藏巨大的价值潜能,是一种最重要的数据。”[37]大数据环境下,档案用户的利用需求更加多样化、多元化,档案数据共享需求更加迫切,需要立足社会信息资源共建共治共享理念,打破数据壁垒,推动档案数据开放共享、跨界流动、互联互通和价值发挥。区块链技术的发展与应用,为解决档案数据共享过程中的问题、难点和风险提供了机遇与方法,能够促进档案数据共享的多元融通、夯实档案数据共享的信任基石、降低档案数据共享的安全风险、推动档案数据共享的开放透明、提升档案数据共享的效率效能,为档案数据共享提供理念指引、技术支撑、模式创新和安全保障。今后,档案界需要加强区块链技术的深入认识和理论研究,结合国内外实践案例,推动区块链技术应用于档案数据共享的落地生根,发挥档案数据潜在的系统性、流动性、共享性特征,优化档案数据共享环境,实现档案数据共享的智能化、社会化、个性化。

猜你喜欢
区块
天津茶淀“区块链葡萄”熟了
《红楼梦》的数字化述评——兼及区块链的启示
为贸易金融插上区块链的翅膀
区块链助跑财资管理
百度推出“区块链操作系统”BBE平台
区块链产业发展速度放缓
一场区块链引发的全民狂欢
区块链只有真正地为实体经济服务,才是有前途的
区块链助力企业创新
Unicorn正式上线区块链浏览器UIC—Explorer