区块链技术在档案管理中的应用研究
——以国外经验为例

2021-06-19 09:52李景
山东档案 2021年2期
关键词:哈希爱沙尼亚文档

文·李景

一、引言

自2008年比特币诞生,区块链技术的应用逐渐被世界各国布局研究。我国高度重视区块链的发展,尤其是在2019年10月24日,习近平总书记在中共中央第十八次集体学习中强调,要把区块链作为核心技术自主创新的重要突破口,加快推动区块链技术和产业创新发展。目前,我国区块链产业蓬勃发展,产业规模和企业数量不断增加,国际竞争力显著提升,垂直行业应用落地项目不断涌现,国家各部委及各地方政府先后推出近300余条政策,鼓励区块链技术和产业创新发展。国内互联网巨头企业也纷纷布局区块链应用,阿里、华为、百度、腾讯、京东等企业纷纷推出区块链平台,包括央行和四大国有商业银行在内的36家银行机构也纷纷开展区块链应用,并取得优异成果。

档案数据是国家各行业的重要信息资源,随着技术的革新和社会的发展,档案数据共享成为主流趋势,但在共享过程中,存在中心化存储整合效率低、孤岛现象严重、信任度低、安全性差、隐私保护难等问题,无法适应社会对档案数据共享的发展要求。区块链技术的出现和应用,有效解决了以上问题,因此,深化区块链技术在档案数据共享中的应用势在必行。

二、区块链技术简介

区块链作为一项创新的技术架构,是一种分布式记账技术,其核心是去中心化。它是可以在众多参与方之间共享和复制的数据库,并且这个数据库只能通过遵循预先建立的规则进行更新,一旦更新它将与所有各方共享,实现价值的传递。诸如在银行卡、支付宝、Paypal等电子现金的交易过程中,区块链不需要任何中心化记账人,而是通过被称为共识机制的算法再结合一系列密码学与博弈论的巧妙设计,实现透明化的共同记账。由于区块链是一个点对点网络,它为事件设置时间戳,因此不需要第三方来验证记录,这种形式的记录暗示了共识和信任,并且是无法篡改的,确保了账本数据库的一致性与准确性。

区块链包含三个部分:区块、链和网络。区块包含事件列表,这些事件可以是任何类型的活动,记录的规则是在首次创建网络时建立的,例如限制事件的大小或数量。当块达到最大时,它就会被通过哈希值连接成链。哈希值是一种从可变数据字符串生成固定长度值的算法,就是将一个块的哈希值插入到下一个块中,再将新块与前一个块链接起来。对未修改的数据块重复使用,哈希值连接将始终生成相同的固定长度的值,如果数据块被更改,哈希值的输出将会不同。因此,不同的哈希值输出表明原始块已被篡改,不值得继续信任,可以将多个哈希值组合在一起并再次赋予哈希值,从而创建一个新的哈希值或Merkle根,附加的哈希值被添加到根目录中,从而创建一个Merkle树。区块链网络由节点组成,每个节点包含所有事件的完整记录,不存在集中式副本,也不存在比其他节点更受信任的节点,数据完整性由所有节点上复制的区块链维护。

区块链网络有三种类型:公共的、得到许可的和私有的。公共网络通常是一个大型网络,它允许任何人参与,比如用于加密货币交换的网络。一个得到许可的网络仅限于某些方面,但也可能很大;最小的网络是私有网络,它受到严格控制,通常在可信实体之间建立以共享机密信息。

三、区块链技术在档案管理中应用存在的潜在问题

支持使用区块链技术应用到档案管理,其原因在于区块链技术可以提供一种对记录有效性建立信任的方法。档案记录的关键在于公众的信任,担心政府权力的滥用有可能破坏档案数据的真实性,而区块链技术的特征却能够证明记录的真实性,并使逃脱记录的篡改尝试变得不可能。需要指出的是,区块链在档案管理中的应用并非能够解决一切难题,自身不存在任何问题的灵丹妙药,通过阅读研究国外实践的经验,区块链技术在应用的道路上需要解决以下两点重要问题:

其一,区块链技术只能说明在添加到区块链之后的记录没有被修改过,在链接到区块链之前,它无法说明记录内容的有效性的真实性。对于区块链技术本身而言,提供完全信任的存储记录仍然是十分必要的。

其二,区块链技术减少了验证凭证的文书处理量,并且增加了对机构的信任。然而,这也引发了新的担忧,区块链实现可能会解决短期问题,但是需要仔细考虑将这些记录与这种类型的技术绑定在一起的长期可行性,包括考虑如何在必要时将记录从区块链迁移出去而不使其失去可信度。

区块链迁移数据的能力越来越重要。以欧盟(EU)和加州的新数据隐私法为例,欧盟《一般数据保护条例》(GDPR)和加州《消费者隐私法案》(CCPA)都允许个人直接控制他们的部分个人数据,允许他们从网上删除这些数据,这将给链本身带来潜在风险。系统的真实性意味着数据的删除需要某种版本的硬分叉(hard fork)才能满足数据删除的请求。区块链上有两种“叉子”,软叉和硬叉,两者都是对管理区块链操作规则的更改。软叉是向后兼容的,而硬叉不是。硬叉是一种激进的措施,可以通过改变网络上的规则,并指定网络在前进时将访问哪些旧数据,从而使区块链网络上以前有效的数据无效。然而,虽然硬分叉可以改变数据块的有效性状态,但无法将它们从网络上删除,要完全删除数据,需要从运行该区块链的每个节点进行删除,这将使区块链无法存储任何受隐私法约束的数据。

以上是区块链技术应用到档案管理中可能出现的问题,需要在未来的实践和应用中通过技术研究加以解决。最重要的是,目前对区块链的研究主要来自计算机科学和金融行业,这对于一种根本上只是记录保存形式的技术来说,它的开发明显缺乏来自记录人员和档案管理人员的参与。本文通过对国外此类实践经验进行总结介绍,以期对我国档案管理的实践应用和技术研究提供有效经验。

四、区块链在档案管理中应用的国外经验

(一)爱沙尼亚的“数字爱沙尼亚”实践

爱沙尼亚是前苏联加盟共和国,1991年获得独立。从1940年到1991年的51年时间里,爱沙尼亚一直作为前苏联加盟共和国的身份,参与国际政治大家庭。当年独立的时候,整个国家只有一条电话线是通向外部世界的,甚至连这个国家独立的信息,还是由芬兰政府帮助向外部世界发布的。但是2017年在克罗地亚举行的In Future会议上,爱沙尼亚代表报告说,区块链技术已经在爱沙尼亚的公共系统中使用了,每个爱沙尼亚人都可以随时在任何公共机构访问他的电子数据,区块链系统也会记录访问的历史,从而确保了数据的透明性、安全性和真实性。在2017年DLM论坛会议上,爱沙尼亚国家档案馆电子档案(Kuldar Aas)副馆长Kuldar也谈到了在电子健康系统、地籍管理、法律登记、遗嘱等领域使用区块链技术的经验,而且他提出建议,档案工作者现在也应该了解这项技术,并评估其解决数字资料长期保存的问题。

爱沙尼亚已经将所有公民的档案记录数字化,并连接了区块链系统,因此爱沙尼亚是世界上第一个在区块链上建立数字公民身份的国家。甚至,德国总理默克尔、法国总统马克龙、日本首相安倍晋三等都是该国的数字公民。爱沙尼亚曾提出了名为e-Estonia的项目,即“数字爱沙尼亚”计划。该计划有三个支柱:X-Road、数字身份证和区块链系统。X-road是一个跨国家、跨部门的信息共享基础设施,打通了爱沙尼亚、芬兰、瑞典等数百个不同的政府部门、大型公关企业和银行机构的数据库,实现数据的互联和互通。数字身份证项目使爱沙尼亚公民皆能拥有属于自己的电子身份证卡,用于服务公民在生活中各方各面的需求,如在网络上投票、自动化报税、申请社会福利、银行服务等方面。爱沙尼亚曾宣布将数字公民身份向全世界公民开放,推出了e-Residency 项目,区块链系统项目则是爱沙尼亚两位教授2007年开发的KSI无签名区块链系统,目前已在国家的行政、司法、商业、医疗、交通体系中得到充分应用。

(二)加拿大区块链文档管理研究

加拿大不列颠哥伦比亚大学电子财务文件研究中心主任、著名专家Victoria Lemieux提出了一个问题,“使用区块链技术进行文档管理是帮助还是炒作?”从档案学的意义上讲,区块链技术是一种文档管理技术,提供了从形成、使用到存储控制文档的新方式,通过分布式记账以实现记录不可篡改的目的。例如改变对文档进行身份验证的方式,从依赖受信任的第三方到基于系统自身的身份验证方法。但是在某些情况下,人们高估了区块链技术用于文档管理的期望值,例如我们认为可以运用区块链技术长期确保电子文档的真实性和完整性,但实际上区块链并不提供长期的数据可用性。显然,人们对区块链应用于档案管理的理论和实践知之甚少。尽管区块链技术的本质是一种文档技术,并且有许多新项目专注于在档案管理中使用该技术,但是关于区块链技术对档案管理影响的研究相对较少,我们需要档案管理领域的研究者与区块链技术的研究者之间更紧密的互动,这将有助于双方的发展。

(三)美国国家档案与文件署的研究

为了了解区块链对档案管理的潜在影响,美国国家档案与文件署(NARA)在2018年专门开展了一项研究,随后NARA将主要的研究发现汇集并在2019年2月发布了《区块链白皮书》。该白皮书旨在帮助联邦档案管理人员更好地了解区块链技术,并考虑其所在机构使用它。

NARA指出,数字签名作为一种常见的数据交流形式,可以存储在区块链上。目前,当我们对电子文本文档(如PDF)进行数字签名时,签名存储在文档本身中,这些签名必须按顺序进行,如果证书过期,文档的有效性可能会被质疑。区块链技术一方面可以消除顺序签名和对证书的要求,从而保证文档的有效性,这对于土地契约和遗嘱等需要长期保存的文件尤其有用;另一方面区块链可用于确定实物或不动产的真实性,比如在艺术界,由于真品证书保留在区块链中无法伪造,因此能够确保购买的画是真实的;第三,区块链可用于档案真实性检验,当组织向用户提供文件时,通常可以提供出处和认证,证明它是真实准确的副本,之后如果有任何问题,则必须将其与原件进行比较,但如果真实性证书保留在区块链中,则可以重新对文件进行哈希运算以确定文件是否被更改或调整。

(四)英国的ARCHANGEL项目

英国的ARCHANGEL项目是萨里大学与英国国家档案馆和开放数据研究所(ODI)合作建设的区块链档案管理项目,其目的是通过设计、开发、试用区块链技术来确保数字档案的长期可持续性,以促进可访问性和确保内容的完整性。同时通过新颖的商业模式最大程度地发挥其影响力,例如英国国家档案馆是世界上最大、最古老的档案和记忆机构(AMI)之一,负责保存英国政府的数字记录,包括官员做出的重要决定和收到的建议。这些信息中有些是公开的,有些则一直秘密封存数十年。AMI是建立在公众信任和中立的基础之上,其不可篡改性和完整性对于维持其客观性至关重要。通过使用区块链来记录和校验数据,此项目允许在长达100年的时间跨度内验证它们的完整性,这些数据来自于扫描的物理记录或原本就以数字形态记录的数据,通过点对点分布和一致性检查永久保存,从而不需要可信的第三方。

从技术角度来看,ARCHANGEL利用尖端的机器学习技术,收集物理的和原生数字化数据进行存储。用于呈现内容并验证其来源和完整性的签名和程序代码都将在区块链中进行编码。新型的商业模式将成为支撑此项目的基础,例如利用多个AMI在创建和使用ARCHANGEL中的贡献建立商业运营模型。这种方案可以移植到任何数字档案中,如大学的数据存储库,跨国公司的财务和法规记录,科技公司中的技术记录等。

五、结束语

通过对国外实践经验的了解,笔者发现,区块链技术在档案管理中应用的程度存在相当大的国别差异,爱沙尼亚作为波罗的海三小国之一,其人口和经济科技实力并非出类拔萃,但在此一方面却世界领先。这说明发展区块链技术的应用关键之处在于理念上的重视,另外,产学研相结合也十分重要。以英国为例,高校和国家机构的合作研究成果卓著,ARCHANGEL已经十分成功,并探索出了可持续运营的商业模式,这一点对于一项新兴技术的生命力和可复制性来说至关重要。

在这方面,我国也进行了大量实践,比如,2019年,中石化开展了电子文件归档管理区块链应用试点,拉开了实践层面的探索序幕。中科院合肥分院、沈阳市档案馆等多家单位紧随其后,开展了各有特色的应用。从2020年国家档案局科技项目申报情况来看,涉及区块链技术的推荐项目占信息化和现代化项目总数的24.4%。从立项情况看,涉及区块链技术的立项项目共14项,占信息化与现代化项目立项总数的17.5%,占各类科技项目立项总数的11.7%。获得立项的14个具体项目中,除了1个软课题外,其余均聚焦具体的应用场景或系统建设。可以预计,档案界的区块链应用将在未来一段时间内迅速发展。

猜你喜欢
哈希爱沙尼亚文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
轻松编辑PDF文档
哈希值处理 功能全面更易用
Windows哈希值处理不犯难
文件哈希值处理一条龙
Word文档 高效分合有高招
丛林中的爱沙尼亚狙击手
巧用哈希数值传递文件