区块链技术在文件档案管理中的应用初探

2018-06-20 07:22刘越男数据工程与知识工程教育部重点实验室中国人民大学信息资源管理学院
浙江档案 2018年5期
关键词:区块档案管理

刘越男/数据工程与知识工程教育部重点实验室、中国人民大学信息资源管理学院

1 研究背景

随着比特币的巨幅升值,其底层技术——区块链(Blockchain)的价值不断凸显,甚至被认为是可能触发新一轮信息技术革命的核心技术。当前英、美、澳、新、印等多个国家和地区纷纷出台政策,促进其应用[1]。我国也采取了积极行动,《国务院关于印发“十三五”国家信息化规划的通知》(国发〔2016〕73号)中,区块链被当作战略性技术提前布局;《国务院关于进一步扩大和升级信息消费持续释放内需潜力的指导意见》(国发〔2017〕40号)将开展基于区块链的试点应用作为重点任务之一。目前,该项技术的应用已经在金融、合同管理、资产管理、供应链、公共服务等领域迅速铺开。

迅猛发展的区块链正在构成文件档案管理的一种新技术环境。2017年和2018年国家档案局科技项目立项选题指南以及2018年国家社科基金项目立项指南中,均设有区块链技术在文件档案领域应用的相关选题,彰显出研究的迫切性。

2 文献综述

区块链环境下形成的文件将以一种永不删除的方式保存,并通过链式数据结构、摘要、时间戳、数字签名等技术保证文件内容不被更改[2],因此在文件档案真实性保护方面具有突出优点。然而文件档案管理领域对区块链的专门研究极其有限[3],我国仅有少数学者初步研究了区块链技术在电子证照管理[4]、高校档案管理[5]、电子健康档案[6]中应用的可行性和基本设想,探讨了其在电子档案管理中的适用性[7]。加拿大不列颠哥伦比亚大学(UBC)Victoria Louise Lemieux的相关研究一枝独秀。她根据文献研究和访谈调研,得出区块链技术本质上是一种文件档案管理技术的结论[8]。她还立足于ISO15489、ISO14721、ISO16363等国际标准中可信数字文件保存的需求,分析了应用区块链技术管理数字文件的局限性和风险,包括区块链技术不能确保文件的准确性、可靠性,其安全风险可能导致真实性受损,格式转换、迁移等其他长期保存要求未被考虑等[9];并根据档案学理论构建了区块链技术评价框架,进一步分析了该技术的不足之处[10]。此外,她基于案例研究,总结了不同区块链文件管理模式及其对档案保存领域的影响[11],并针对区块链中数字文件有机联系揭示不足的缺点,定义了一种数据模型及其语法[12]。

现阶段国内相关成果主要探索区块链给特定领域文件档案管理带来的好处,较少涉及其不足,也很少进行总结和反思,总的来说研究相对简单。而国外研究较为深入,有实践的追踪和总结,也有基于档案学基本理论的剖析。不过,其侧重点主要是从档案管理的角度分析区块链技术的不足和影响,未从与其他技术对比的角度分析区块链技术在文件档案管理方面的突破,新技术应用背景下档案界的反思和发展谋划也有所不足。

图1:区块链技术参考架构图[14]

3 研究思路

本文采用文献研究法,对区块链技术在文件档案管理中的应用及影响进行探索性研究。在对区块链技术进行简单的介绍之后,鉴于业界已经公认区块链在可信数据维护方面的贡献,本文首先分析其在文件档案真实性保障方面的突破;其次结合区块链技术在文件档案管理中的应用类型,探讨其对文件档案管理的冲击,阐述档案部门可能面临哪些区块链技术应用带来的挑战;最后根据电子文件管理的既有经验,就区块链环境中的文件档案管理研究提出建议。

4 区块链技术简介

区块链有狭义和广义两种理解。狭义上的区块链是一种链式数据结构,链上的每个数据单元即数据区块,这些区块按照时间顺序依次相连,并以密码学方式保证其不可篡改和不可伪造,区块链同时存储在多个节点上,也称为分布式账本。广义上的区块链代表的是一种技术,是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式[13]。本文使用的是广义区块链概念,主要着眼于区块链技术的一般性特征展开研究,并不讨论区块链技术的细节。

区块链不是单一的技术,而是分布式数据存储、点对点传输、共识机制、加密算法等多重技术的创新集成,且处于不断发展中。区块链体系架构包括网络、共识、数据、智能合约、应用等层次,上述技术分别工作在不同层次上,如图1所示。根据笔者的理解,区块链在更多时候代表着一种底层技术架构,其上层的应用可以千变万化。

按照网络节点进出的自由程度,区块链分为公有链和许可链。公有链中,任何节点都可以加入并查看网络上的任意信息;许可链则只允许授权节点加入,其查看信息的权限也受到规制。多个机构共同运维管理的许可链称为联盟链,所有节点归某一个机构所有的许可链即私有链[15]。许可链是区块链商业应用的主流[16]。

5 区块链技术在文件档案真实性保障方面的突破

业界指出,区块链最大的作用就是解决数据的信任问题,甚至有人认为这是其唯一的作用[17],由此可见这种技术对于文件档案真实性保护的价值。而在区块链之前,已有多种维护文件档案真实性的技术,最典型的莫过于后来在区块链中得到整合应用的三大技术:数字签名、时间戳和数字摘要。数字签名用来识别文件责任者,防止伪造、抵赖和篡改;时间戳用来记录文件创建或签署时间,防止时间上作假;数字摘要是将文件经哈希函数运算后获得一个值,该值被称为摘要,也称数字指纹、哈希值,原文若有变化,哈希值则随之不同,常用来检验文件是否被破坏。相比这些传统真实性保障技术,区块链至少在以下两个方面有了创新性突破:

5.1 将所有文件的真实性维护任务绑定在一起

在区块链中,文件通过非对称加密机制签名,打上时间戳,计算了哈希值。更为精妙的是,为了防止事后造假、抵赖和篡改,它将业务记录按时间逐条串接成链式结构,前一个区块链的哈希值放入第二个区块链中。这样一来,实现了区块链的“块块相扣”,对任何文件的任何非法修改,势必引发其他所有数据块中哈希值的改变,正所谓“牵一发而动全身”,一份文件真实性有变,则所有文件的真实性均受到影响,如图2所示。

图2:区块链链式结构示意图[18]

业务记录一旦登记进区块链,永远不能被删除。如果确实存在合法修改某条业务记录的必要,则只能在链上新增修改后的记录,原记录不得被覆盖。用户可以通过区块链追溯整个业务过程。这使得链上文件的真实性因业务流程的不可逆与业务记录的不可篡改而得到保障。

5.2 实现了去中心化的真实性维护机制

区块链网络中的各个节点保存同样的区块链数据,且每个节点都参与数据的验证和维护。只有超过半数以上的节点都同意故意修改数据,才能达到篡改数据的效果,而这在实际场景中几乎是不可能的。这种发挥每个参与方作用的信任机制被称为去中心化的信任机制,第一次依靠技术而不是某个权威机构的方式实现了跨节点的信任。传统的数字签名技术,依赖认证中心(CA)给用户颁布数字证书,用户的身份及其签名文件最终需要CA背书。区块链通过签名算法给每一个用户颁布一对密钥,其公钥即为身份,无需权威机构认证。区块链中时间戳技术同样也是分布式的,并不一定需要授时中心等第三方机构的时间服务。全节点参与的共同治理模式,开启了信任保障的新机制。因此,京东认为区块链不仅是技术,更是理念,是“信任经济”的技术基础[19]。其真实性维护能力如此之强,以至于2016年6月美国佛蒙特州通过一项法案,确认了区块链中的电子文件具有法律可采性,且无需另行证明其真实性[20]。

6 区块链技术在文件档案管理中的应用类型

6.1 按照应用场景划分

按照应用的场景,区块链技术在文件、档案管理中的应用有三种类型:一是基于区块链的业务系统,用以支持文件的创建和保存。这是目前最为普遍、也是最引人关注的一种应用。比如互联网保险公司众安保险采用区块链电子保单系统处理健康险业务,将计费、客户及理赔信息添加到区块链上,截至2017年2月,已处理电子保单 21.27万份,涉及保费收入 3736.36 万元[21]。

二是基于区块链的电子文件管理系统(Electronic Records Management System/ERMS,国内也翻译为电子档案管理系统,如GB/T29194-2012《电子文件管理系统通用功能要求》将ERMS翻译为电子文件管理系统,而GB/T 18894-2016《电子文件归档与电子档案管理规范》则将其翻译为电子档案管理系统——笔者注),用来支持电子文件的归档管理。此类应用很少,笔者看到的仅有一例,即美国特拉华州公共档案馆牵头实施的“智能文件”项目,州政府机关的文件捕获登记进入区块链中,并利用智能合约技术来实现电子文件的到期自动处置[22]。

三是基于区块链的电子档案保存系统(也称数字档案馆系统,是档案最终归宿地,主要应用在档案馆。我国也有电子档案管理系统的说法,如国家档案局2017年底印发的《电子档案管理系统基本功能规定》——笔者注),用来支持电子档案的接收、长期保存和利用服务。已有一些国家的档案馆先行先试,比如鞑靼斯坦国家档案馆、英国国家档案馆都在开展区块链应用实验,在接收电子档案时,将其哈希值登记进区块链中[23]。无独有偶,石化盈科于2017年底也提出了基于区块链的电子档案征信体系的设想方案,要求不同地方、单位的档案部门构建档案联盟链,电子档案移交进馆时其哈希值同步存入各节点的区块链中,链中各节点相互为电子档案的真实性背书[24]。

6.2 按照存储对象划分

Victoria Louise Lemieux按照区块链中所存数据对象的不同,将区块链系统分为三种类型[25]:一是镜像型(Mirror)。此类区块链主要作为电子文件哈希值的存储库,电子文件本身并不进入区块链中,其首要目的是为保护电子文件的完整性。由于区块链存在访问效率的瓶颈,因此大部分区块链都只存文件的哈希值,并不保存文件本身,下文中提到的法链即属此类。

二是数字文件型(Digital Record)。此类系统中,除了数字文件的哈希值之外,其本身也通过智能合约的方式保存在区块链中。上文中提到的众安保险区块链电子保单系统即属此类。

三是资产凭据型(Token)。此类系统中,不仅文件内容数据及其哈希值保存在链上,文件记载的资产(如土地、珠宝等)被编码为凭据(或译为通证)也记载在区块链上,成为文件的一部分。如巴西土地文件局基于UBITQUITY平台开发的登记系统,采用SaaS模式,通过应用程序接口(API)将Web客户端捕获的土地信息与事务处理信息登记到比特币区块链上,该系统使用彩色币(Colored Coins)协议表示土地凭据。Victoria认为资产凭据型是最具创新性的解决方案,档案馆若接收此类档案,将在保存文件的同时也保存资产,成为真正的宝藏。

7 区块链对文件档案管理的冲击

7.1 进一步加剧了文件档案管理技术环境的复杂性

从社交媒体、云计算到大数据、物联网,每一种新技术的产生和应用都对文件的形成和管理产生影响,给文件档案管理工作带来新机遇和新挑战。如大数据技术一方面给海量数据的分析处理创造条件,另一方面也带来筛选具有长期保存价值数据的难题;又如云计算在为文件档案保管机构分担责任、分享算力、分摊成本的同时,也使其面对由于分散带来的合规性风险、技术风险和管理风险。区块链的应用进一步加剧了文件档案管理技术环境的复杂性,智能合约、资产凭据等新型管理对象浮出水面,分布式管理机制也将引发跨机构、跨司法辖区的管理问题。而一个机构可能同时应用上述多种技术,文件的形态、结构、格式、存储方式、管理主体各不相同,复杂技术环境将日益成为文件档案管理的一种常态。

7.2 将专业的文件档案管理功能变为一种可能泛在的信息基础设施

传统数字环境下,历史数据并不能也不适合长期保存在原系统中,否则将极大影响业务系统的运行效率,归档不仅是长远谋划,也是现实需要。区块链以一种不可篡改、可追溯、全历史的方式存储业务处理记录,从而实现了ERMS的固化入库、电子档案保存系统的长期存储及真实性保障功能。这意味着原来由专业文件档案管理应用系统承担的部分功能,在底层技术架构上实现了。基于区块链的业务系统,自然而然地具备了上述文件档案管理专业能力。这些系统的使用者,很可能不再另外使用ERMS和电子档案保存系统管理区块链文件。而专业功能纳入底层信息基础设施的结果是专业的泛化。随着区块链的发展,它很有可能成为一种泛在的信息基础设施,文件档案管理的专业性将面临更大范围的挑战。

7.3 对鉴定等档案业务的必要性提出挑战

文件一旦存入区块链,便永不删除。使用基于区块链的业务系统,采取的是“有文必档”的策略。如果系统使用单位不再采用其他文件档案管理系统,那么鉴定这项档案核心业务就不会提上议事日程。可以说,在大数据和区块链的双重夹击下,档案鉴定工作正面临前所未有的挑战。

7.4 档案部门集中管理文件档案的中心地位受到冲击

如果文件自创建之后起一直存放在原区块链中,那么其管理和维护是去中心化的,主要依赖各网络节点,并不需要档案部门的参与。与此同时,一些社会机构借助于区块链开展了存证、公证的服务,比如成立于2016年8月的全球首个商用电子存证区块链联盟“法链”,目前每天存入约80万份来自第三方合同平台“法大大”的电子合同、“阿里邮箱”的邮件等文件的签署时间、签署主体、哈希值等[26]。这些联盟链及其背后机构正在成为新型文件档案保存和服务者,档案部门集中管理文件档案的中心地位面临进一步冲击。

长期以来,档案部门凭借公权信用,承担重要凭证信息的集中保管和利用服务。婚姻登记、学籍学历、工龄职称、土地房产等民生档案的查询利用一直是档案部门的特色服务。随着电子政务的推进,许多凭证性材料正以数字形式产生,不少地方政府推出了以电子证照为代表的凭证文件共享服务,这些数字凭证共享服务系统中的信息是否归档以及如何归档尚未提上议事日程。2017年7月,广东佛山禅城区发布全国首个区块链政务应用[27],国外政府也正工商注册、土地登记、基金分配等领域应用区块链技术[28],政府内外多个机构参与建设。区块链技术一旦推开,链上节点、第三方机构很有可能继续瓜分文件档案管理的地盘。

7.5 国家和社会的信息资产和集体记忆面临实存风险

区块链只是底层技术,并不具备ERMS和电子档案保存系统这两类应用系统的完整功能,它在造成档案部门专业职能弱化风险的同时,并不会承担所有的文件档案管理功能。而基于区块链的业务系统通常不会考虑鉴定、迁移、格式转换等其他重要的文件档案管理功能,当软硬件环境变更时,其中数据很可能面临不可用的境地。如果我们意识不到这一点,从长远来看,很可能导致业务系统和档案管理双输的局面,最终受损的是国家和社会的信息资产与集体记忆。

8 区块链技术环境中文件档案管理研究建议

区块链技术受到日益广泛的关注,也有炒作过热的嫌疑。对于这样一种不容忽视的外部存在,研究是采取有效应对措施的前提,就相关研究提出以下建议。

8.1 加强区块链技术的认识和研究

Victoria Louise Lemieux根据InterPARES项目“可信文件”的研究成果,即可信文件必须具备三个方面的特征:准确性、可靠性和真实性,且这些特性在长期保存中一直得以维护,将准确性、可靠性、真实性和持久性作为评估区块链技术的指标。该研究认为,除了真实性之外,可信文件的其他质量要求都不能实现[29]。笔者认为,一方面,任何技术都不能完全防备文件形成者有意或无意地在内容上偏离客观事实,ISO15489告诉我们,文件形成者而非形成技术要对文件本身的准确性、可靠性负责,所以区块链在准确性、可靠性方面的不足是可以接受的,这正是管理需要发挥作用的地方。用评估整个文件档案管理体系的指标来评估一项特定的技术固然有些不妥,但上述研究能让我们清楚地看到区块链技术环境下本专业的不可或缺。另一方面,区块链技术正处于发展初期,在性能、隐私、安全、技术升级等方面面临诸多挑战[30],我们应关注并跟踪其发展,并从文件档案管理的角度提出完善建议,比如技术领域应当关注区块链服务变更、链上文件读取环境变化时区块链数据的迁移问题。

8.2 开展区块链平台下电子文件法律可采性研究

面对区块链技术的发展,美国多个地方政府不约而同地首先对其法律条款进行修改,以体现对新技术、新事物和创新发展的接纳和欢迎[31]。区块链牵涉范围广,涉及多个方面的法律问题,其中在证据领域就面临可采性问题,如智能合约是否属于正式合同。文件档案管理领域可就此提出专业化建议。

8.3 加强区块链解决方案的案例研究

随着区块链技术在应用领域的不断探索,实践部门的解决方案将成为学习和理解区块链的生动素材,也是我们研究区块链如何改变文件档案管理的一手资料。当我们对区块链下的文件档案管理没有太多思路的时候,收集、跟踪并挖掘这些案例,分析不同方案中文件构成及其管理要点,是我们获取理论和方法的重要源头。

8.4 开展区块链环境下的文件档案管理适用性和需求研究

虽然世界上已有档案部门尝试应用区块链,但是对文件档案管理是否适合采用这种技术,业界尚有争论。比如美国伊利诺伊州的研究指出,使用区块链管理公共文件有很多好处;但是佛蒙特州的区块链研究小组认为,目前公共文件管理使用区块链成本太高,收益很少[32]。那么,那些在区块链中产生的业务文件,究竟该以何种方式归档管理呢?是继续留在原环境中,将档案部门这个传统中心机构排除在外,还是需要走一条中心结构和新技术联姻的新路?应如何利用区块链底层技术实现更为完备的文件档案管理功能?这是我们无法回避的问题。传统数字环境下,ERMS功能需求规范在引导市场产品发展方面积累了富有成效的经验。新的技术环境下,我们可在此基础上,开展更有针对性的研究,推动基于区块链的文件档案管理专业系统的问世。

围绕区块链技术和应用,UBC建立了跨学科研究的虚拟社区Blockchain@UBC,包括计算机科学、商学、法学、档案学在内的众多学者展开了多个项目的研究。我国区块链技术发展并不慢,有全球首个商用电子存证联盟链、首个云平台和区块链结合的安链云,相关技术专家也在区块链国际合作组织中担任要职,希望我们在文件档案管理研究方面也不落后。

本文系国家社科重点项目《我国数字档案馆建设战略研究——基于生态系统的视角》(批准号:16AZD054)的阶段性研究成果之一。感谢中国印钞造币总公司吴云鹏对本文提出的修改意见和建议。

注释与参考文献:

[1]海川.全球各国对区块链的政策[EB/OL].[2018-02-17]https://zhuanlan.zhihu.com/p/33148030.

[2]袁勇,王飞跃.区块链技术发展现状与展望[J].自动化学报,2016,42(04):481-494.

[3][8]Victoria Louise Lemieux. Blockchain for Recordkeeping;Help or Hype?[R/OL].https://www.researchgate.net/publication/309414276_Blockchain_for_Recordkeeping_Help_or_Hype.

[4]张兆雷,董贵山,邓子建,杨秋华.一个基于区块链的电子证照管理服务模型[J].通信技术,2017,50(06):1270-1275.

[5]张倩.区块链技术对高校档案信息管理方式创新的可行性探究[J].档案与建设,2017(12):21-24.

[6]黄永刚.基于区块链技术的电子健康档案安全建设[J].中华医学图书情报杂志,2016,25(10):38-40,46.

[7]张珊.区块链技术在电子档案管理中的适用性和应用展望[J].档案管理,2017(03):18-19.

[9]Victoria Louise Lemieux. Trusting records: is Blockchain technology the answer?[J] Records Management Journal 2016(26),2,pp.110-139.

[10][29]Victoria Louise Lemieux. Blockchain and Distributed Ledgers as Trusted Recordkeeping Systems: An Archival Theoretic Evaluation Framework[C/OL].(2017-11-29). https://www.researchgate.net/publication/317433591_Blockchain_and_Distributed_Ledgers_as_Trusted_Recordkeeping_Systems_An_Archival_Theoretic_Evaluation_Framework.

[11][23][25]Victoria Louise Lemieux. A typology of blockchain recordkeeping solutions and some reflections on their implications for the future of archival preservation[C/OL].(2017-11-11). https://www.researchgate.net/publication/322511343_A_typology_of_blockchain_recordkeeping_solutions_and_some_reflections_on_their_implications_for_the_future_of_archival_preservation.

[12]Victoria Louise Lemieux, Manu Sporny. Preserving the Archival Bond in Distributed Ledgers: A Data Model and Syntax[C/OL].(2017-04-03). http://papers.www2017.com.au.s3-website-apsoutheast-2.amazonaws.com/companion/p1437.pdf.

[13]中国区块链技术和产业发展论坛.中国区块链技术和应用发展白皮书[EB/OL].(2016-10-18). http://www.fullrich.com/Uploads/article/file/2016/1020/580866e374069.pdf.

[14]邵奇峰,金澈清,张召,钱卫宁,周傲英.区块链技术:架构及进展[J/OL].计算机学报,2017:1-20[2018-03-23].http://kns.cnki.net/kcms/detail/11.1826.TP.20171115.2302.006.html.

[15]沈鑫,裴庆祺,刘雪峰.区块链技术综述[J].网络与信息安全学报,2016,2(11):11-20.

[16]蔡维德,郁莲,王荣,刘娜,邓恩艳.基于区块链的应用系统开发方法研究[J].软件学报, 2017,28(06):1474-1487.

[17]Ray Wang.企业级区块链应用的公有链解决方案[EB/OL].[2018-03-26]. https://zhuanlan.zhihu.com/p/27720777.

[18][30]魏凯.区块链的发展与数据共享[C].(2017-12-11).第八届中国电子文件管理论坛.北京:中国人民大学.

[19]京东.京东区块链实践技术白皮书[R/OL].(2018-03-22).http://www.huanjing100.com/p-3984.html.

[20][22][31]Joanna Diane Caytas. Blockchain in the U.S.Regulatory Setting: Evidentiary Use in Vermont, Delaware, and Elsewhere[EB/OL]. (2017-05-30). http://stlr.org/2017/05/30/blockchain-in-the-u-s-regulatory-setting-evidentiary-use-invermont-delaware-and-elsewhere/.

[21]金融时代网.区块链技术在保险业应用的思考[EB/OL].(2017-05-04). http://www.sohu.com/a/138378021_499199.

[24]江波.基于区块链的电子档案征信体系[C].(2017-12-11).第八届中国电子文件管理论坛.北京:中国人民大学.

[26]法大大.法链?区块链?电子存证?不懂了吧,这就为你破解[EB/OL].(2017-05-15). http://www.sohu.com/a/140672179_387302

[27]国脉电子政务网.广东佛山禅城区发布全国首个区块链政务应用[EB/OL].(2017-07-01). http://www.echinagov.com/news/52920.htm.

[28]胡宁.全球政府区块链技术应用一览[EB/OL].(2016-09-01). http://iof.hexun.com/2016-09-01/185821124.html.

[32]James Condos, William H.Sorrell, Susan L. Donegan.Block technology: opportunities and risks[R/OL].(2016-01-15). http://legislature.vermont.gov/assets/Legislative-Reports/blockchaintechnology-report-final.pdf.

猜你喜欢
区块档案管理
档案管理模式改革在医院档案管理中的运用
如何规范档案管理
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
《红楼梦》的数字化述评——兼及区块链的启示
档案管理中PDCA循环的应用研究
区块链与大数据结合既安全又高效——区块链与大数据结合的研究
区块链将给媒体业带来什么
区块链+媒体业的N种可能
档案管理与企业内部控制关系的思考