余亚荣 吴振宇
摘 要:本文回顾了中国电子档案长期保存工作的历程,并从目的性出发加以审视,指出传统备份方式存在的瓶颈,引入电子档案数据保全理念,阐述基于电子凭证效力维护的电子档案长期安全保管模式,以期为档案业务部门开展电子档案长期保存提供参考。
关键词:档案备份;数据保全;电子证据;长期保存
Abstract: This article reviews and examines the process of long-term preservation of electronic Archives in China, pointing out the bottleneck of traditional Archives backup methods. It introduces the concept of electronic archival data preservation, and expounds the long-term security management mode of electronic Archives based on electronic evidence preservation, so as to provide suggestions for archival department to carry out long-term preservation of electronic Archives.
Keywords: Electronic archives backup; Archival data preservation; Electronic evidence; Long-termpreservation.
本文通过对电子档案异质异地备份模式和档案数据保全模式开展研究和对比,分析基于长期保存视角的电子档案保存方案。
1 传统电子档案备份的目的及瓶颈分析
1.1 电子档案备份的目的。从目的性角度来分析,开展电子档案备份工作的根本目的在于档案机构要确保馆藏档案在长期保管过程中的绝对安全,这里的安全既包括载体安全也包括内容安全。从传统意义上的备份策略来看,载体安全主要用备份多套来规避存储载体的老化或损伤,内容安全主要依赖传统载体档案的数字化和电子档案的纸质副本或电子缩微品来实现,这也是我们常见的电子档案异质异地备份保管。
1.2 电子档案备份存在的瓶颈
1.2.1 电子档案存储载体不稳定,数据易丢失。与纸张等介质相比,电子档案存储所依赖的磁性介质、光介质、电离介质均不同程度存在易老化、稳定性不足等问题。根据国外数据公司Crashplan发布的《存储介质使用寿命情况》显示,包括硬盘、固态硬盘等在内的诸多存储介质,在常规使用情况下仅有数十年的使用寿命,完全无法满足电子档案所需的长期或永久保存需求,存在极大的数据丢失风险。
1.2.2 电子档案原始性保护无有效手段,数据易被篡改。电子档案在管理模式上与传统载体档案存在较大差异,最显著的就是针对电子档案“原始性”的维护,电子档案特有的“载体与信息内容的可分离性”“信息内容易修改”[1]给保存带来风险,基于保护载体就是保护内容的模式不再适用,而能够实现电子档案固化的技术工具尚未在管理中加以运用,采用异质异地备份模式,可以在一定程度上降低因误操作或有意篡改而造成的电子档案内容失真的风险。
1.2.3 电子档案对技术环境具有依赖,数据存在识读风险。档案机构在开展电子档案保管工作中,不但需要确保电子档案内容的原始性维护有效,还需要对电子档案的技术环境进行管理,更为致命的在于,文件格式、操作系统、应用软件等关系电子档案识读的技术环境也拥有自己的生命周期,早前产生的部分热门和常见文件格式现在已经走向式微,这与电子档案永久保管的需求不相适应。档案机构开展电子档案备份,将电子档案转换成纸质文件等形式进行存储,部分原因也是出于对上述风险的无奈应对。
1.2.4 人为安全事故或自然灾害频发,安全保管风险加大。除上述三个因电子档案自身特性而必须采取备份手段加以规避的因素外,因内部管理不到位所导致的人为安全事故或因自然灾害原因使电子档案受到安全威胁也是各地开展这一工作的主要原因。伴随着社会信息化的深入推进和电子档案备份工作大规模展开,采用该模式的瓶颈也逐步显现。
首先,电子档案备份造成业务工作效率降低。信息化系统和工具在日常工作、生活中普及后,经由信息系统或计算机设备直接形成电子文件成为主流,业务活动中大量形成的电子文件在进入档案管理环节时却需要按照规定形成其他载体形式,而这其中绝大部分的工作是由文件形成部门在归档前需要完成的任务,这对于业务部门而言变成了负担,且因大量重复性文书工作的羁绊,造成业务工作效率降低。
其次,电子档案备份增大档案管理难度。电子档案备份需要形成多套数据,并存储于不同空间和介质,数据的拷贝、检测等工作极大地耗费档案工作者的时间和精力,并在一定程度上形成无形的管理压力,如多套数据的定期检测、数据一致性的检查与维护、数据存储载体迁移等。
再者,电子档案备份造成资源大量浪费。电子档案的备份工作需要使用大量的纸张、存储器、存放空间及配套环境,同一份档案需要在多种介质、多个空间下进行存储,需要消耗数倍的资源。
更为重要的是,电子档案备份无法完全确保电子档案的长久安全保全需要。依赖多套数据备份无法从根本上确保电子档案的安全存储,且因电子档案凭证效力的维护与传统载体档案在方法上的不同,使用传统的异质异地备份模板无法满足“数字转型”背景下的档案长期存储与利用。
2 档案数据保全
2.1 檔案数据保全的含义。基于上文的阐述,仅仅采用异质异地备份模式无法实现电子档案的长久安全管理,也无法彻底根除信息技术存在的瓶颈。
随着信息技术的深入发展,新出现的技术工具成为推动解决电子档案安全风险的有力手段,如2004年《中华人民共和国电子签名法》颁布施行,其中明确“可靠的电子签名与手写签名或者盖章具有同等的法律效力”,并在法条中规范了提供电子认证服务机构的相应要求。
近些年来,区块链、可信时间戳、哈希特征值校验等证据收集、固定和防篡改的技术手段陆续进入司法机构关于“电子数据证据”采信的规则之中 ,则在相当大程度上给予了档案管理机构以启示,档案界也在此方面展开了诸多有益的探索,如“区块链技术在突发公共卫生事件档案管理中的应用”[2]“基于区块链技术的档案数据共享策略”[3]等。
2018年,苏州大学成立档案数据保全中心,首次提出“档案数据保全”理念,采取电子档案数据固化、第三方數据存证[4]、数据状态实时性监管等技术和管理方案,实现对电子档案的长期安全管理。根据张照余教授的观点,“档案数据保全是指采用一定的技术手段和管理措施将档案数据的内容固定并长久保管,确保档案数据的准确、完整、可用和安全,维护数字档案的真实性和法定证据价值”。
2.2 档案数据保全的实现
2.2.1 电子档案数据丢失监测。从业务部门长期实践的经验来看,电子档案数据丢失的主要原因有三个,一是因存储载体老化失效造成保存于其上的电子档案发生信号丢失;二是因存储环境中存在强磁环境而造成数据丢失,三是在管理过程中因人为或其他因素发生的数据误删除等。
基于上述原因,避免电子档案数据丢失的关键在于对电子档案数据开展科学的监测,及时获取电子档案数据存储状态。档案数据保全模式基于系统算法,对存储数据开展实时监测与预警,并根据数据状态的异常变化开展数据保全与数据修复,恢复电子档案原始状态,确保数据内容安全。
2.2.2 电子档案数据篡改控制。电子档案因存在信息的可操作性和易变性等技术特性,电子档案内容极易发生改变。现有技术环境下,电子档案存储过程的内容真实性、完整性维护大多采用诸如权限控制、元数据记录、数据冗余备份等形式予以实现。
档案数据保全模式从数据固化角度审视电子档案能否与传统载体一样,用信息记录载体或其他中间要素去固定档案内容,并能从信息记录载体或中间要素在长期保存过程中的变化情况校验电子档案内容的原始性。
档案数据保全借助区块链技术中的防篡改机制,采用散列算法生成完整性校验值并予以存证,实现电子档案内容的固化。在日常监测中,对电子档案按周期重新生成完整性校验值并与初次形成的完整性校验值进行比对,以此来判定电子档案原始性情况。
2.2.3 电子档案长期可读管控。电子档案的可读、可用是影响电子档案长期保存的重要因素。传统的电子档案备份多采用转换成纸质档案的方式解决可能存在的电子档案识读问题。然而,单套制管理模式的推进、复杂数据结构(如三维模型、声像文件等)的发展均对简单的打印输出方式提出挑战。
档案数据保全模式对电子档案数据存储格式建立格式数据库,开展数据格式全生命周期管控,对诸如数据格式名称、版本、维护者、读取软件、迁移路径等信息进行记录与跟踪,并结合档案长期保存需要开展数据迁移与转换方案研究,极大地提升了数据管理质量,能够有效解决电子档案在长期保存过程中的使用问题。
2.2.4 电子档案凭证效力维护。电子档案凭证效力的维护是电子档案能够以电子形式提供利用的核心前提。电子档案凭证效力的发挥主要基于电子档案自身“四性”的保障及长期保存过程中的管理纪实。
档案数据保全模式采用可信数据存储、电子档案数据固化、数据状态监测、数据存证等方案实现对电子档案真实性、完整性、可用性及安全性的维护。
与此同时,该模式倡导以电子档案凭证效力维护为中心,对接电子数据证据的司法规则适用,从证据的高度开展电子档案收集、监管、转换和使用等工作,切实履行在全生命周期中对电子档案实施管理纪实和技术保障,维护电子档案作为证据的证明力。
基金项目:国家档案局科技项目“电子档案数据法律证据价值的保全策略与方法研究”(编号:2019-R-22);本研究得到江苏高校“青蓝工程”资助;苏州大学人文社会科学团队项目“档案数据保全研究”(批准号:NH33712620)。
参考文献:
[1]冯惠玲.电子文件管理学[M].北京:中国人民大学出版社,2017:31.
[2]薛庆香,于英香.区块链技术在突发公共卫生事件档案管理中的应用研究[J].山西档案,2021(02):62-70.
[3]杨鹏.基于区块链技术的档案数据共享策略探究[J].山西档案,2020(04):105-112.
[4]余亚荣.苏州大学推出首个对外服务档案数据保全平台[N].中国档案报,2018-12-06(01).
(作者单位:余亚荣,苏州城市学院;吴振宇,张家港市城建档案馆 来稿日期:2021-10-20)