电子档案单套制管理区块链模式应用研究

2018-01-24 21:05孙大东郑州大学信息管理学院
浙江档案 2018年9期
关键词:私钥区块数据库

孙大东 杨 晗/郑州大学信息管理学院

区块链技术具有去中心化、集体维护和可信数据库等特征[1],将其引入电子档案单套制管理可以从信息安全、实体安全以及载体安全三个方面提供保障,有效解决用户对电子载体的不信任问题,为档案管理方式从双套制向单套制的转变提供技术支持。

根据实际应用需求和去中心化程度的不同,区块链技术可以分为三种应用模式——公共链、联盟链和私有链,其向社会开放程度逐渐减弱,与开放电子档案和不开放电子档案管理的要求相契合。

1 公共链模式在电子档案单套制管理中的应用

“公共链是完全去中心化的区块链,分布式系统的任何节点均可参与链上数据的读写、验证和共识过程, 并根据其PoW或PoS贡献获得相应的经济激励”[2]。可以看出,公共链具有开放性和共享性特征。值得注意的是,在三种模式中公共链模式的开放程度最大,也最适合于开放电子档案的管理。笔者构建了一个基于公共链模式的开放电子档案管理体系,具体内容如下:

1.1 数据层

数据层封装了开放电子档案数据区块以及相关的数据加密技术,包括时间戳技术和非对称技术。

1.1.1 数据区块

区块链中的数据由各节点共同形成,并存储在所有参与形成数据的节点中。区块链是一个庞大的数据库,根据应用场景的不同,其保存的数据类型也不同。将其应用于开放电子档案管理可以存储所有机构形成的开放电子档案数据:通过P2P网络将电子档案形成、保管单位组合起来;将经过鉴定可以开放的电子档案数据包括内容信息、元数据、配置数据、日志数据等打包,进行数字签名后保存到区块中;将承担档案资源的区块向全网广播,并使其他区块对该区块的软硬件环境、元数据、病毒等信息进行检测,确保上传电子档案的真实性、可用性和完整性;通过验证的区块会加盖时间戳,根据哈希函数值(对原始数据经过散列函数计算而得到的一组由数字和字母组合的字符串)链入主区块链;没有达成共识的区块则会被废弃,以防止无效数据继续广播。档案数据区块形成的全过程公开透明、不可删改、不可篡改,各个节点共同认证新上传区块数据的有效性,可有效提升档案资源质量和信息流通速度。

1.1.2 时间戳技术

利用区块链的时间戳机制,可以对电子档案的形成、流转、改动、保存、移交等过程中形成的信息加盖时间印章和信息主体的数字签名,为档案信息变动提供证据,可有效、全面记录电子档案生命周期的管理过程,从而形成连续、完整、可证的档案保管链。时间戳技术可使电子档案数据得到前所未有的信任背书,也可保证电子档案来源的可追溯性。

1.1.3 非对称加密算法

为满足身份验证和数据安全的需求,区块链运用了非对称加密技术,即通过椭圆曲线加密、RSA、Elgamal等算法产生一对非对称密钥,分别称为公开密钥和私有密钥(以下简称公钥和私钥)。其中公钥用来加密信息,只有对应的私钥才能解开信息。此算法具有单向性,其他人无法通过公钥推算出其对应的私钥。如区块链技术最初在比特币中应用时,其私钥是由操作系统底层的随机数生成器生成的256位随机数组成的,总量可达2256[3],其他人极难通过不正当途径获得比特币的私钥。区块链中的非对称加密算法从传输层可保证电子档案的安全,杜绝黑客非法入侵、窃取信息的行为。将非对称加密算法应用于开放电子档案的管理,公钥和私钥都可以向社会公开,以便公众查找所需的电子档案。

1.2 激励层

“公共链采用独特的经济激励机制来吸引节点完成工作,促使节点提供算力或其他资源,保证整个分布式网络的顺利运行”[4]。在比特币中应用时,网络中的节点通过数学运算、解决数学问题,可获得一定数量的比特币以及区块的记账权。由此可知,在开放电子档案数据库中应用区块链技术时,亦可通过经济奖励来吸引各单位存储其形成的开放电子档案、自发地维护数据库,从而保证数据区块的持续增长,使全国性的开放电子档案数据库长期运行成为可能。

1.3 应用层

在开放电子档案管理中可引入公共链模式做分布式记录和存储,任何开放电子档案的形成者、接收者、保管者均可跨部门、跨地区存储经过鉴定后可以开放的电子档案,形成全国性的开放电子档案数据库。公共链的完全去中心化,可以使这些机构在没有中心机构的管理下组织起来,解决目前中心化模式存在的高成本、低效率和安全性差等问题。

公共链具有公开透明和共享性,系统中每个节点都可以获得一份完整的数据库拷贝,因此每个节点既是电子档案数据的形成者,也是数据的获取者和传播者,以此为依托建成的开放电子档案数据库既可作为保存库,又可作为管理库和利用库,可有效解决“三库分离”的现象、节约管理成本。并且由于建成的数据库是全国性的开放电子档案数据库,利用者可在最短时间内快捷地找到所需要的电子档案,提高了开放电子档案的利用效率。

2 联盟链和私有链模式在电子档案单套制管理中的应用

由若干机构联合发起、允许授权机构参与该区块链的读写被称为联盟链,如R3区块联盟、BiTA和金链盟等。准入权限只向特定机构内部公开、网络中所有节点都由该机构掌握的区块链被称为私有链。联盟链模式和私有链模式的主要区别在于中心机构个数,联盟链模式是部分去中心化(或称多中心化)的区块链,私有链模式则是完全中心化的区块链,两者都是写入权限在一定机构内、读取权限在一定程度上被限制的区块链模式。部分去中心化和完全中心化都意味着公众不能随意阅读,因此联盟链和私有链模式较适用于不开放电子档案的管理。

根据管理的不同特点和需求,联盟链和私有链模式可以应用于不同类型的不开放电子档案管理中,如电子健康档案、人事档案和学籍档案等。笔者以企业电子档案和私人电子档案为例,构建了基于联盟链模式的企业电子档案管理体系和基于私有链模式的私人电子档案管理体系。在管理企业电子档案中引入联盟链模式,运用联盟链模式多中心化特性形成多中心的企业电子档案管理联盟,可使企业内部的职能机构或者不同企业通过共识机制和智能合约,更加有效地整合企业档案信息资源。私有链模式是完全中心化的区块链,其写入权限由该机关的中心机构控制,而读取权限可视情况有选择性地对外开放,适用于私人电子档案只允许形成者和特定机构(人员)查阅的特性。

2.1 两种管理体系共有的技术架构

2.1.1 数据层

综上所述,国内外学者对水牛乳的理化特性都进行了大量研究,但要充分了解我国水牛乳理化和生物学特性还需要大量研究。此外,在研究时,还需要特别注意乳水牛品种、生活地域环境、产乳胎次等因素,才能得出较为客观的结论。

两种管理体系都有最底层的数据层且与基于公共链模式的开放电子档案数据库的建设步骤相似,时间戳技术和非对称加密算法能够确保数据的真实可靠性,只是保存的数据种类和形成者不同。在数据种类方面,企业电子档案管理体系是集档案信息一体化的管理,包括档案、图书、情报、以及资料等数据;私人电子档案管理体系则侧重于对书信、手稿、照片和字画等数据的保管,相比较而言,前者电子档案数据的形成速度快且数量庞大,比如中国航信集团目前存储着超过2PB的结构化档案数据,每年结构化档案数据增长量为35%,因此对数据层应变性能和存储空间有更高的要求。在形成者方面,企业电子档案管理体系中集团企业旗下的子公司或者企业内部的职能机构或者不同的企业是这个联盟的成员;私人电子档案管理体系中则保存的是“私营企业事业单位以及公民个人在私务活动中形成的和通过继承、赠送等合法途径获取”[5]的私人电子档案,其“形成者比较广泛,既包括国家领导人、科学家、艺术家、劳动模范等著名人物,又包括普通老百姓,同时也包括私营企业事业单位”[6]。但是这两种管理体系一般均只允许授权节点参与系统数据的读写和查看。

2.1.2 应用层

一方面,随着知识经济的进一步发展,企业档案由实体信息资源管理向知识资产管理模式转变,因此在管理过程中更加注重企业电子档案资源的交流和共享。引入联盟链技术,使得不同企业电子档案形成者组成管理联盟,从而有效打破各企业间的“信息孤岛”,建设跨主体的企业电子档案共建共享网。另一方面,当前许多企业的档案散落在各部门或者个人手中,极易造成档案的泄密或丢失。在企业内部引入联盟链技术,可让总部档案管理部门、子公司档案形成部门及各职能机构“形成一个分布的、受监督的档案登记网络,各方均保存一个完整的档案副本”[7],有助于打破企业内部的“信息孤岛”,建设跨部门的企业电子档案共建共享网。而且联盟链模式整合了不同企业内部的电子档案,有利于运用大数据技术对数量庞大的电子档案进行数据挖掘和价值分析,可更加充分地挖掘企业电子档案的潜在价值,为市场调研和企业决策提供依据。

在私人电子档案管理体系中,私有链模式通过加密和验证机制,公钥只向档案管理部门公开,私钥归网络中特定节点所有。机构内的任何用户都可以上传电子档案,并通过公钥加密信息;私钥严格保密,只有档案形成者或管理者才能使用私钥解密信息,如此一来就能够防止档案信息泄露,有效保护和传承社会记忆。

2.2 两种管理体系特有的技术架构

2.2.1 企业电子档案管理体系中的合约层

目前,我国企业档案管理大体上有两种模式:大型民营企业主要采用自主管理模式,中小型企业主要采取业务外包模式。但由于档案意识淡薄以及资金匮乏等诸多原因,企业电子档案管理未能形成完整规范的管理流程,企业档案流失现象较为严重。通过引入联盟链模式中的智能合约(“一套以数字形式定义的承诺,包括合约参与方可以在上面执行这些承诺的协议”[8]),可对企业电子档案归档的内容、范围等方面提前预置触发条件和响应规则,如可设置各部门形成的档案在一定时间内自动向总部档案室移交、企业档案室在一定时间内自动向相应档案馆移交电子档案等。这样既无需人工操作,也可规范企业电子档案的管理流程,又可整合企业内部的电子档案资源,节省人力、物力和财力,有助于改变当前企业电子档案管理松散、混乱的现象。

2.2.2 私人电子档案管理体系中的权限层

私人档案的内容既具有私密性,又具有社会性,这使得私人电子档案在管理中既要保护档案内容不被外人所知,又要使档案管理部门能够了解到其内容的历史价值和社会价值。因此,可以在私人电子档案管理体系中引入权限层来解决这个问题。

首先是私人电子档案上传者的身份验证,可通过引入PKI技术,从注册、交易两级安全证书体系及随机生成交易证书序号的方式实现,只有通过验证的节点才能登录此档案系统上传电子档案。其次是允许档案形成者之外的单位或个人对其进行合法查阅的问题,目前有两种解决方案:一种是在Fabric架构中,在权限隔离层面将节点分为验证节点和非验证节点,根据实际情况将这些查阅者设为验证节点,可以查看数据库、维护账本,而非验证节点即形成者只能上传电子档案,维护上下节点间的安全;另一种是国际大银行区块链联盟R3在分布式账本Corda中采用的方案,Corda在账本层面各个节点之间的数据不向全网广播,只有数据关联方才能收到相应信息。这两种方案都可以解决私人电子档案管理中查阅权限的问题,使得私人电子档案管理既满足了个人层面的私密性要求,又满足了社会层面的开放性要求。

本文在分析区块链技术三种模式特点的基础上,将公共链模式引入到开放电子档案管理中,构建了包括数据层、激励层和应用层的开放电子档案管理体系;将联盟链模式和私有链模式引入到不开放电子档案管理中,构建了基于联盟链模式的企业电子档案管理体系和基于私有链模式的私人电子档案管理体系。可以看出,区块链技术能够适用于不同类型的电子档案管理,其应用和管理要求也各有不同,并且由于区块链技术具有自身的优势和特点,将其运用于电子档案管理能够更好地推动电子档案单套制管理的进程。区块链技术仍处于不断发展和完善阶段,将其应用到电子档案管理中的具体技术细节和步骤还需要进一步研究。

猜你喜欢
私钥区块数据库
清扫机器人避障系统区块链私钥分片存储方法
比特币的安全性到底有多高
Spatially defined single-cell transcriptional profiling characterizes diverse chondrocyte subtypes and nucleus pulposus progenitors in human intervertebral discs
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
区块链将给媒体业带来什么
区块链+媒体业的N种可能
一种基于虚拟私钥的OpenSSL与CSP交互方案
数据库
数据库