陈臻钰
(湘潭大学 公共管理学院,湖南 湘潭 411105)
2016年,国务院印发了《“十三五”国家信息化规划》,正式将“区块链技术”纳入国家规划[1]。2020年新修订的《中华人民共和国档案法》对数字档案馆和档案信息资源管理、共享服务建设提出了新的要求[2]。这两项条例和法案体现了区块链技术应用于国家信息化建设中的更多可能,也体现了国家层面对于档案馆数字化转型与电子档案资源共享的深层次需求。自2017年起,国家档案局的科技研究项目一直出现区块链应用于电子档案管理、利用等,体现了区块链技术在电子档案中应用的活力。
理论上,区块链技术不可篡改、透明可溯源、安全性高的优势与在传输共享电子档案前后需要保障其真实、完整、安全的需求有较高的适配度。实践中,区块链不断被各级档案局、馆应用于电子文件归档、管理、跨馆利用等,说明区块链技术在管理使用电子档案的各流程中能够适配不同的应用场景,也说明了区块链技术是当前档案馆数字化、智慧化转型过程中保障电子档案安全可信度相对较高、成熟度较高的技术。因此,在实现电子档案跨部门共享过程中,运用区块链技术解决其中可能存在问题有一定的理论和实践的基础。
学界对于区块链的定义并未达成共识,因为其应用于不同学科和行业表现出的特性有所不同。从数据传输共享的角度出发,可以说区块链是一种比较安全的数据传输和存储的方式。区块链最重要的特性是去中心化和分布式,这代表不需要任何权威组织对区块链中传输、存储的数据进行集中管理、维护,其依靠的是每个上传数据的用户节点进行共同维护,同时每个用户节点都有权对节点上每个数据进行查看和复制,保障了其在存储空间足够大、存储量大的情况下能使数据维护成本保持较低,还能使用户间方便快捷地进行数据共享。区块链技术在保障每个用户节点能方便快捷地访问海量数据库时,能使用哈希算法、Base58编码和零知识证明等加密算法保护每个节点上的数据,使数据被上传后不可被更改,保障数据在不同用户节点间传输的安全性,而在每个节点上的数据被传输到另一个用户节点后还需进行解密才能获得原有形式的数据,保证了传输后数据仍然可靠。
根据区块链上用户上传和访问数据的权限不同、去中心化的程度不同,区块链被分为公有链、私有链和联盟链,而不同类型的区块链能够适配不同的数据管理利用场景。
公有链:公有链中,公有代表该链对每一个想进入区块链的数据所有者都是开放的,也意味着每个数据所有者都能上传数据形成一个数据节点,成为区块链中的用户,其数据节点的数据能被链上的其他用户随时访问,而该用户也能随时访问节点上的其他数据。公有链的去中心化程度高,任意用户都能上传数据并访问链上所有数据。也正因为每个用户都能上传数据,公有链上的数据量相对较大,对于存储、访问数据的服务器硬件性能要求高,数据处理速度也相对较慢。
私有链:私有链仅对单个用户开放上传和访问数据的权限,只有获得授权的节点才能接入,进入该链后,用户可以按照其规则参与数据的读写。私有链速度快、成本低、抗恶意攻击能力强,但由于其完全不开放,对私有节点的控制高度集权化。
联盟链:对特定的一组用户开放上传和访问数据的权限,只有获得授权的节点才能接入,进入该链后,用户可以按照其规则参与数据的读写。通过控制用户的数量,联盟链在一定程度上兼备了公有链的去中心化程度高和私有链传输效率高的优点。
在国外,区块链应用于电子档案共享早已有实例。爱沙尼亚曾提出了名为e-Estonia的项目,即“数字爱沙尼亚”计划[3],这一计划通过记录公民档案,将一个个公民化身为一个个数字公民的身份,通过数字身份识别在区块链系统实现跨部门乃至跨国家的电子档案资源的共享。美国国家档案部门发布的《区块链白皮书》中提出用区块链保障电子文档在传输利用时的有效性与时效性,相比于数字签名保障电子文档有效性而无法保障时效性,区块链上的数据难以篡改并能很好地长时间保障其真实性与时效性。英国的萨利大学同英国国家档案馆和开放数据研究所设计运用区块链技术保存电子档案,同时保障其内容的完整性与可靠性,从而促进电子档案能更好地被访问、更好地被共享。
相较于国外已将区块链技术应用于电子文件共享水平成熟,我国对于区块链应用于电子文件共享研究理论上,贺智明等[4]提出了区块链与可搜索加密结合的电子病历共享方案,该方案将原始电子病历保存在私有链上,最大限度地保障了电子病历数据的安全性,降低了数据泄漏的风险,而将电子病历的索引词保存于联盟链中,使数据访问更加细化,也减少了通信的消耗。岳征祥[5]提出的区块链文件系统实现了电子病历共享,以区块链技术中心的联盟链为核心,解决了医疗数据在共享过程中的信任问题。电子文件共享研究实践中,我国将此类技术主要应用于民生档案的异地共享利用。
与国外已经较为成熟落地的基于区块链的电子档案共享案例相比,我国关于区块链在电子档案中的应用主要侧重于管理和安全层面,应多将意识提升到共享利用层面,提升我国电子档案跨部门共享的水平,以提高电子档案利用效能。在进行电子档案跨部门共享研究与具体落实时,可以参考国外跨部门、跨国家共享的经验,结合我国电子档案体量与具体分布情况,充分了解区块链不同类型链的特点,推进我国电子档案跨部门共享具体机制和模式的建立。
数据标准不统一、网络环境不相同和基础平台有差异等技术原因已成为阻碍数据资源整合共享的重要因素[6]。而电子档案资源要实现便捷的跨部门共享,首先就需要专有的共享平台。各部门都拥有自身的电子档案管理系统,使得在互联网背景下政府和社会不断增长的数据共享需要的情况下,业务办理效率大打折扣,响应共享需求的时间变长。
在电子档案的共享过程中,会存在各共享参与部门在进行共享电子档案上传时有所保留,甚至可能出现不愿参与共享的情况,而导致不愿共享的原因是担心部门利益受到影响。大数据时代,人们对于数字化资产的保护意识逐渐提高,电子档案是资产的一种,关乎利益,而经济利益又是部门对自身各方面进行升级改造的基础,是关乎部门发展主导地位的重要影响因素。电子档案的共享过程中可能因为数据安全等原因导致经济利益的受损,也许是档案部门和其他政府机构不愿主动推动电子档案共享最直接的原因。而问题的本质其实是政府机构的风险规避文化[7]。互联网环境下电子档案在共享过程中的确存在着许多安全隐患,在电子档案采集、存储、处理、传输、交换、销毁的全生命周期6个阶段都存在不同程度的安全风险。若是在此过程中造成了数据的泄露,不仅可能给部门带来安全威胁,还可能会因此被问责。各参与共享的部门,特别是档案体量较大的综合档案馆,为了规避这种数据安全威胁,思想上不敢于共享,对于共享的积极主动性不高,行为上表现为提供共享的电子档案数据不全,从而导致电子档案共享内容和共享范围上的受限。
目前,档案的电子化大多数停留在对档案目录数据化的阶段,缺少对档案内容的数字化与数据化,不利于对电子档案的内容进行数据层面的提取和集成,也不利于对档案内容的深入高效挖掘而提升档案价值。我国按部门对档案进行管理的原则一定程度上限制了学者对于某种类型档案搜集、整理和研究的完整性,如果形成数据化档案库,通过关键词检索能很好地解决这一问题。档案数据化程度不高在很大程度上是由档案原始记录性的特性所决定的。纸质档案和纸质档案经过扫描形成的图片形式的数字化档案与数据化档案相比,篡改难度较大,档案被数据化上传到数据库中是以数据的形式存在的,非常容易被篡改,很容易使档案的原始性受到破坏。因此,如何保障电子档案不被篡改,保护电子档案的安全是从技术层面解决档案数据化程度不高这一问题的关键。
电子档案资源共享平台的建设,首先需要建立统一的数据标准,因为数据标准是数据治理的基础,能很好地保障数据质量。电子档案跨部门共享能与区块链技术中联盟链的应用场景相适配,而进入联盟链的前提除了是被授权用户,还需按照各节点用户共同制定的规则写入数据,这为制定电子档案共享平台的数据标准提供了契机。同时,由于有档案馆这类数字化、数据化的主要实践部门和其他政府机构这类对档案查询及利用需求高的部门作为节点用户共同制定数据标准,能够很好解决单机构制定数据标准带来的元数据属性制定得不够实用的问题,强化电子档案的流转能力,让其能在各政府职能部门被充分地共享利用,解决政府职能部门间存在的“信息孤岛”问题。
一般说来, 区块链技术适用于“新型数据库、多业务主体、彼此不互信、业务强相关”的场景[8]。联盟链作为区块链技术的一种类型,兼备了公有链允许不止一个用户在区块链上进行数据的读取写入以及私有链只允许授权用户在区块链上进行数据读取写入的特性。电子档案作为信息资源的一种,其共享需要相关利益方一同参与,才能保证电子档案共享的安全。在联盟链应用到电子档案跨部门共享时,表明共享数据的开放只针对授权用户,而授权用户指的就是作为自身数据节点和电子档案利益代表方的政府部门。一方面,政府是社会中可信度高的机构组织,另一方面,在电子档案跨部门共享的过程中只有政府部门能写入、读取共享区块链上的数据,这两点能有效防止电子档案在传输过程中泄漏,同时,因为共同的数据利益,政府部门会增强自身数据节点安全意识,防止电子档案从自身所在数据节点泄漏,以此建立起联盟链内部参与电子档案共享的各政府部门间的相互信任。出于数据利益的交换与相互间信任度的提升,各用户节点能逐步全面上传和共享所拥有的电子档案,一同共享海量的档案资源。
区块链中运用复杂的加密算法,如哈希算法、Base58编码和零知识证明等,加密算法能够将数据转换成一串随机的数字,用密钥解密后才能将其还原成原有的数据形式。此类加密算法能保障区块链上数据的不可篡改性,也保障了数据在不同用户节点之间的安全传输。电子档案是档案的另一种形式,档案经过数据化变成电子档案后在存贮、传输过程中仍然需要保有其原始性的特征,而区块链中使用的加密算法能很好地保障电子档案不可被篡改,从而保障其原始性,让更多政府机构进行档案的数据化形成更多的电子档案在不同层级政府部门间进行流通共享,不仅从技术层面解决了档案数据化程度不高的问题,同时强化了电子档案在各部门跨层级流通能力。
其一,区块链信用性好、安全性高、透明性强、可拓展性好的优点非常利于区块链上的机构、部门进行电子档案的跨层级共享,但其优点是在电子档案上传到区块链上后才能保障的,也就是说其强加密性可以保证已经存于一个个区块上的电子档案的不可篡改性,但在其保存于区块前的电子档案真实性并不能得到保障,在其存储之前,电子档案是否可信、是否完整,这些需要各部门在档案管理阶段就应做好并保障。其二,目前区块链作为账本数据库, 存储的数据类型多为文本, 单个文件的数据量都不是很大[9],但在数据化时代,区块链若是作为信息资源共享中心,而各节点发展程度又不一样,一些区块即共享节点的承载程度将受到很大挑战。其三,当今默认区块链能保障节点上的信息不可更改,但也只能说运用区块链进行电子档案资源共享的模式是具有较高安全性的,并不存在绝对的安全。随着计算机计算能力的高速发展,区块链运用的加密算法被快速解出的情况也不是没有可能出现的。其四,任何一种技术如若离开了标准化, 便很难推广和发展下去[10]。虽然中国区块链技术和产业发展论坛先后发布了《区块链参考架构》和《区块链数据格式规范》两项团体标准,但区块链的标准化仍然处于成长阶段,不够成熟,区块链的发展过程会对电子档案的共享模式造成一定的影响,而这种影响的好坏也是未知的。
随着大数据时代的到来,数字化、数据化深刻地影响着每一个行业,档案部门、各政府职能部门的档案室也受到了很大的影响,电子档案出现不仅方便了档案资源的存储,更方便了对其进行共享利用与价值挖掘。但如何运用现代化技术保障电子档案在各跨层级共享过程中的完整性、可靠性是当今一个重要的课题。区块链技术的出现带来了信用性好、安全性高、透明性强、可拓展性好的数据保护技术,为电子档案这一对完整性、真实性有极致要求的信息资源在进行跨部门共享利用上提供技术支持,促进了我国数据治理能力与治理水平的提升。但是,区块链是依靠复杂算法保障区块上的信息资源不被破坏的,因此,在计算机更新迭代快速的今天,区块链上的信息资源仍然有被篡改甚至删除的风险,选择提升区块链算法的复杂性还是颠覆原有基于区块链的电子档案跨部门共享方式是今后电子档案跨部门共享发展过程中需要深思熟虑的问题。