基于区块链技术的档案管理体系构建

2023-09-27 04:46连晓晓唐松姚利彬左北辰
档案天地 2023年9期
关键词:标识码合约区块

连晓晓 唐松 姚利彬 左北辰

引言

档案作为重要信息资源和独特历史文化遗产,价值日益凸显,传统纸质档案虽然具有直观反映历史面貌的优点,但也存在收集整理难、储存空间大、易损坏、利用难等弊端。随着数字技术的飞速发展,信息资源越发成为一种重要的战略性资源,档案事业在迎来新的发展机遇的同时也面临着前所未有的挑战。适应并立足新发展阶段,推进档案数字转型和智能升级,推进档案工作适应党政机构日常工作成为一项必不可少的研究课题。2021年国家档案局进一步明确了档案信息化发展工作要点及加快推进档案数字化转型工作[1]。

一、区块链技术研究现状

(一)区块链技术概述

比特币的底层技术就是区块链,自此区块链技术走入国内外学者研究领域,随后区块链技术被应用于以太坊,直到出现了企业级开发平台超级账本,区块链才真正脱离了电子货币的束缚,为其他各行各业应用服务提供了可能[2]。区块链本质上是块链式数据存储结构、共识算法、智能合约来验证、存储、保护数据安全的,目前成果应用于物联网、医疗健康、供应链等领域。

(二)区块链在档案领域应用分析

作为一种安全的分布式账本,区块链意味着任何输出都要经过网格内所有人的验证。张奇文提出一种基于Gossip协议的信任收集共识算法,即通过评估邻近节点的信息度选择通信节点,消息在通信过程中不断收集信任值,以超过全网临界受信阈值时确认为达成共识,提高传统算法的稳定性和效率[3]。区块链技术在解决传统档案管理方面具有巨大潜力,越来越多的基于区块链的应用研究旨在提高档案管理的安全性。王洋以中国电力建设集团有限公司电子文件单套归档和电子档案单套管理试点为例,结合区块链技术进一步保障当前电子文件真实性[4]。聂勇浩以广州互联网法院为例,基于区块链技术针对电子证据的可采、可信、可控和可用问题构建生态系统,保证电子证据安全可靠[5]。宋世昕为解决电子数据易攻击性,很容易被篡改或破坏的问题,基于区块链及IPFS技术,提出了一套基于区块链和IPFS的去中心化电子存证方案[6]。梅胜以健康档案为研究对象,以区块链技术为基础,构建了健康数据跨域共享业务模型,分析了健康档案的跨域共享业务和可信安全需求,旨在通过对数据源节点的 CA 认证,提高数据源的真实性和安全性[7]。基于区块链的业务档案存证溯源由电子档案生命周期牵涉到的各单位构建联盟链,共同打造档案存证溯源和防伪技术认证平台,可提供业务档案数据存证、防伪验证、档案溯源、数据查验等功能,目前多应用于司法领域。除此之外区块链技术还可应用于互联网数据存证、溯源[8]、身份认证等领域。

二、基于区块链的电子档案管理系統构建

(一)电子档案管理系统技术要点

1.基于国密 SM3 和雪花算法,构建高效链上电子档案标识码。

2.基于 leveldb、merkle tree、HBase 构建电子档案分级存证,实现高效电子档案多中心存储、多方背书,实现档案实时业务数据快速读取、查询和验证。

3.基于智能化合约分权机制,实现电子档案隐私数据管理,结合用户业务和档案管理角色,联动封装内部调用智能合约和外部调用合约,给档案数据提供不同级别的保护,内部调用合约不对合约外暴露接口,用于档案隐私数据管理。

(二)电子档案管理系统简介

本系统建设拟采用B/S体系结构,基于J2EE规范开发,采用SOA、WEB2.0技术、工作流、知识管理、互联网等核心技术,同时采取多层安全技术认证和安全管理机制,全面保障信息数据安全可靠。在应用平台方面既可支持Windows和Linux操作系统,也可支持Unix操作系统,来最大可能符合所有档案管理设备,且兼容性较好,支持目前市场上IE8以上及各大主流的浏览器,支持HTTP、HTTPS、JMS、WebServices、TCP/IPSocket、SOAP、FTP、本地文件等传输协议。在适配性满足的情况下,对档案文件等数据信息以及访问权限控制度高,确保档案信息资源的安全可靠。

本系统档案信息资源数据库具备数据采集、数据组织与管理、数据处理、查询统计、数据更新、输出等集中管理功能,便于各职能部门、业务系统跨平台交流,提高档案利用效率。支持TCP、HTTP、SSL及HTTPS多种传输协议。多措并举保证档案信息资源安全,一是对登录系统用户进行身份鉴别。二是严格控制访问权限。三是通过压力测试确保系统具有一定抗攻击性和访问压力。四是通过配置和应用SSL证书来启用HTTPS协议,保证互联网数据传输的安全,实现系统管理数据、鉴别信息和重要业务数据在通信过程中的完整性,防止数据在传输过程中被篡改、窃取或破坏。五是分区存储数据,严格管理数据库密码及权限,定期备份数据。

(三)电子档案标识码生成算法

电子档案标识码生成算法是实现档案管理的基础,需实现对电子档案进行唯一标识码编码,初步定义标识码包括电子档案的完整性校验值、校验算法和用户信息、电子签名和可信时间标识等。包括将档案信息上传并存储至区块链网络;基于区块链网络,使用预设私钥对所述档案进行加密得到数字签名,根据预设规则基于国密SM3和雪花算法,构建高效链上电子档案标识码。结合档案管理应用场景制定电子档案标识码算法规则,标识码共有211bit组成,首先使用国密SM3算法对电子档案进行计算输出128bit摘要值,基于雪花算法对初次上传的电子档案进行分配相应的56bit唯一标识码编码,然后取当前机器物理地址8bit,取可信授时服务器时间19bit(精确到纳秒)。将此标识码写入区块链世界状态数据库,实现在整个生命周期对档案进行反向追溯绑定。

将所述关键信息作为键,数字签名作为与键对应的值生成键值对,并将所述键值对上传并存储至所述区块链网络,同时将所述关键信息与所述校验位顺序连接生成所述唯一标识码。利用区块链的去中心化、可信任特性,从根本上避免了唯一标识码在生成和校验过程中被篡改的可能性,从而确保档案电子数据的可信度和真实性,提升档案管理技术层面和业务层面的协调效率。

(四)智能化合约机制规范文档管理模型

智能合约是区块链网络中去中心化应用程序,基于智能化合约分权机制,实现电子档案隐私数据管理。结合用户业务和档案管理角色联动封装内部调用智能合约和外部调用合约,给档案数据提供不同级别的保护。利用区块链技术打通各档案馆,构建安全有效的档案共享渠道,实现多方参与,支持电子文档的自动处置。系统的智能合约(又叫做链代码)跟Peer节点主要通过gRPC通道来通信,运行在虚拟机内,链码与Peer节点之间的交互过程(图1)[9]。

智能合约可以根据档案共享业务事先制定的规则保证交易的执行,是在档案管理业务链上产生并且编译的软件代码,并由所有节点持有。根据合约自动执行的特点,用户部署在区块链上的合约,是在虚拟机中执行的,因此,无需第三方干预,具备安全性和可靠性的优势,电子档案流转的各个环节不再需要依赖中央网络节点进行数据信息传输,完成共识操作,且具有可扩展性。虚拟机,是智能合约代码的执行器,智能合约被编译成二进制文件后,被部署到区块链上[10]。

电子档案的获取、归档、跨机构调取均通过调用智能合约的Inrstance接口(节点调用EVM的接口)和Callback接口(EVM回调节点的接口),来触发智能合约的执行操作,区块链网络中节点共识后,会将记录追加存入区块链中,后续不可再更改(图2)。

有档案查询需求不同业务端口通过和区块链支撑平台之间建立智能合约接口来实现档案信息共享。依托智能合约接口可将相关业务系统内电子档案的形成、修改、审核和提交等环节所形成的档案上链。此外,还可用于将接收、检测、利用和销毁等电子档案上链。区块链支撑平台包括平台支撑服务、联盟链、数据库等部分,其中平台支撑服务使用基于联盟链的智能合约和数据库所提供的服务,构建身份管理、档案保护、档案验证等服务,为业务系统和电子档案管理系统提供档案真实性保障支持[11],图3为我们基于此技术独立研发设计的电子档案管理原型中部分改能展示。

参考文献:

[1] 国家档案局.“十四五”全国档案事业发展规划[EB/OL].[2022-08-15]. https://www.saac.gov.cn/daj/toutiao/ 202106/ecca2de5bce44a0eb55c890762868683.shtml.

[2] 白伊瑞,田宁,雷虹等.基于DID的跨链身份认证研究综述[J/OL].计算机科学与探索:1-17[2023-07-29].http:// kns.cnki.net/kcms/detail/11.5602.TP.20230712.2207.004.html.

[3] 张奇文,王志强,张逸谦.基于Gossip协议的信任收集共识算法研究[J].计算机科学,2020,47(S1):391-394.

[4] 王洋.基于优化共识的区块链在电子文件全生命周期真实性保障中的应用—以中国电力建设集团有限公司电子文件单套归档和电子档案单套管理试点为例[J].档案学研究,2022,No.185(02):89-96.

[5] 聂勇浩,张炘.基于区块链的电子证据保全模式研究—以广州互联网法院为例[J].档案学研究,2021,No.182(05):28-36.

[6] 宋世昕.基于区块链和IPFS的去中心化电子存证系统的研究与实现[D].北京工业大学,2019.DOI:10.26935/d.cnki. gbjgu.2019.000382.

[7] 梅胜,王晓丽,孔斌等.基于区块链的健康档案跨域共享可信安全机制研究[J].中国数字医学,2023,18(05):94-99.

[8] 朱季希凝,王杰华,丁卫平等.基于双链结构和国密算法的疫苗溯源方案[J].计算机工程与设计,2023,44(07):1961- 1968.

[9] 于泽伟. 基于区块链的农产品追溯系统设计与实现[D].大连理工大学,56,2019.DOI:10.26991/d.cnki.gdllu.2019.001907.

[10] 姚超,唐松.區块链技术在冷链食品溯源中应用的研究[J].河北省科学院学报,2021,38(01):78-83.DOI:10.16191/j.cnki.hbkx.2021.01.011.

[11] 袁嘉新,杨安荣.基于区块链技术的电子档案管理应用实践——上海信联信息发展股份有限公司成功实践[J].中国档案,2020(10):28-30.

基金项目:河北省档案科技项目“基于区块链技术的档案管理体系构建”(2022-X-27)

作者单位:河北省科学院  河北省科学院应用数学研究所  河北省信息安全认证技术创新中心

猜你喜欢
标识码合约区块
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
区块链+媒体业的N种可能
读懂区块链
Process Mineralogy of a Low Grade Ag-Pb-Zn-CaF2 Sulphide Ore and Its Implications for Mineral Processing
Study on the Degradation and Synergistic/antagonistic Antioxidizing Mechanism of Phenolic/aminic Antioxidants and Their Combinations
A Comparative Study of HER2 Detection in Gastroscopic and Surgical Specimens of Gastric Carcinoma
合约必守,谁能例外!——对“情势变更”制度不可寄于过高期望