周耀林/武汉大学信息管理学院 武汉大学政务管理研究中心
赵君航/武汉大学信息管理学院
数字档案备份是保障档案安全的重要措施之一。自2009年始,国家档案局提出了建立异地备份库的要求后,各地纷纷响应。截至2023年统计,各省、副省级城市综合档案馆都完成了备份建设。然而,调查发现,对比国际标准SHARE 78中计算机灾难备份与恢复的七个层级[1],当前的备份策略无法实现数据的双重在线存储及零数据丢失;实践中,当前的数字档案备份存在内容不完整且质量较低、技术手段缺失、可利用性差等问题。因此,如何采取更先进的备份方法仍然有待研究,这也是落实《“十四五”全国档案事业发展规划》提出的“馆(室)藏全部档案数字资源完整备份”“积极探索备份新途径”[2]的重要方面,具有很现实的应用价值。
当前,我国现有的备份策略主要包括异地备份、异质备份、登记备份制度、数据备份中心和云备份五大类。
2009年国家档案局正式提出各级国家档案馆要建立异地备份库以实现重要档案的异地备份,同时对重要的电子文件还应异质备份。此后,各地开始了对数字档案备份制度的探索、创新及实践应用。2009年浙江省档案局首创档案登记备份制度,2010年辽宁省建成全国第一家电子档案备份中心,档案云备份是由2012年“档案云服务高峰论坛”所提出云计算技术应用的基础上发展而来并最早见诸2017年江西省“档案云中心”的建设。
异地备份与异质备份最早源于杨冬权在2008年全国档案局长馆长会议上提及,异地备份是指将档案原件的复制件存放在异地,待档案原件发生意外损毁、丢失等情况时可启用异地“副本”,并需满足双方所在地相距300公里以上、不属同一地震带、电网等条件。异质备份是借助纸质档案数字化、缩微摄影等技术手段,将档案信息迁移到缩微胶片、磁盘等存储介质上,即不同载体间的转换备份,以减少档案原件在使用中的损毁,如云南省档案馆落实档案异质备份策略,以数字档案转缩微胶片为工作重心并取得重大进展。
登记备份制度最早由浙江省档案局在2009年提出并实施,其是由档案行政管理部门对本区域各单位具有重要保存价值数字档案的形成、保管、移交情况进行登记,并将数字档案在各级国家综合档案馆登记备份中心进行数据备份,如浙江省于2009年12月印发了《关于开展电子文件和数字档案登记备份工作的通知》[3],对档案登记备份制度在全省范围内大幅度推广。上述备份属于冷备份。与之相对的是热备份,即应用系统可通过高速通信线路将数据实时传输到备份系统,如档案数据备份中心和云备份策略[4]。
数据备份中心最早由辽宁省档案局(馆)在2008年提出建设并于2010年建成第一个全国档案馆电子档案备份中心,其是指以档案数据的集中存储为目的,基于网络存储技术,通过运用多种手段实现档案资源的整合、优化与安全维护。
云备份可以追溯到2012年“档案云服务高峰论坛”所提出云计算技术在档案行业的应用[5],此后云计算技术被逐渐应用到数字档案资源备份工作中,尤其是将数字档案在本地备份之外,还需在其它远端服务器进行备份保存,以实现档案数据的多重防护,如江西省加强数字档案馆建设规划,建设档案云中心以实现档案的云存储、云备份和云开发。
现有的数字档案备份策略的优点主要有:第一,已有备份策略具有稳定可靠、安全系数高等优点[6],例如档案登记备份制度采用电子文件时点“固化”和第三方存管的方式,能够避免在备份工作中出现数据丢失、损坏或被窃取等情况并最大限度地确保数字档案的原始性、真实性。第二,已有备份策略具有易于维护、管理便捷、利用效率高等优点,例如云备份制度借助云存储系统,能够实现备份数据的动态管理与随取随用[7],省去了存放场地、硬件设施等额外事项以降低备份档案的管理难度。
与此同时,现有备份策略也存在如下困境:第一,已有备份策略存在流程不规范、标准不统一的问题。例如,国家层面尚未对异地异质备份建设提出统一的意见或标准[8],各地采取不同的方法自愿结为“对子”,存在技术标准与流程规范各自为政的情形,一定程度上会影响备份成果的质量。第二,已有备份策略处于较低层级,无法实现数据的双重在线存储及零数据丢失。与此同时,当前备份策略仅是对数据进行简单的复制,即只是将数据转移到其他地点或介质上,并没有对其应用环境进行同步复制[9],也受限于备份数据再次使用时可利用性较差的限制,难以进行创造性开发利用以充分发挥备份数据价值。第三,已有备份策略中缺乏全国性统一备份平台或备份工作指导机构,各地存在“重复造轮子”的现象,建设同质化的云平台、数据备份中心等,资源的重复建设也导致资金、人力与物力的浪费[10]。最后,已有备份策略注重维护数据的安全性,备份内容只能恢复备份时间点前的档案数据,呈现出相对滞后的状态[11],如若出现数字档案内容后期修改的情形,则不能满足数字档案备份实时更新的需求,也就无法确保档案备份内容的完整性与真实性。由此可见,现有档案备份制度除了无法实现零数据丢失外,还存在诸多不足。如何克服上述不足,实现科学备份,实现数字档案保真,是需要进一步探索的。
数字孪生(Digital Twin)理念最早起源于1969年美国国家航空航天局空间飞行器孪生体计划,2003年美国密歇根大学的迈克尔·格里夫斯(Michael Grieves)教授正式提出数字孪生的概念,是指“用于虚拟表达、描述真实存在的一个或多个特定设施的数字复制品,并以此进行真实环境、条件和状态的模拟仿真测试”[12]。近年来,数字孪生的应用范围从航空航天、军工制造等领域逐渐扩展到虚拟仿真、智能制造、故障诊断等领域。因此,将数字孪生技术应用到数字档案备份领域,既能顺应物理实体与虚拟空间映射、融合趋势,又是对国家政策及未来数字化转型战略重点的准确把握,有助于以技术手段进步为支撑,更好地实现数字档案真实完整、安全可靠的备份目标。与此同时,数字孪生技术也可实现在数字档案备份领域的全周期应用,如图1所示。
图1 数字孪生技术在备份工作中的全周期应用
依据陶飞等[13]提出的数字孪生五维模型概念,可以进一步探讨数字孪生技术与数字档案备份的逻辑关联。
物理实体即数字档案,通常由实物档案与电子档案两部分构成,该维度通过运用传感器等设备实现对数字档案数据的精准采集,其中,数字档案数据的采集包括对实物档案的“高阶”数字化和电子档案的完整收集。
与此同时,数据采集作为数字孪生的基础性阶段,采集的数据质量又会对数字档案的备份效果产生重要影响。相较于数字孪生技术,运用平面扫描、环物摄影等技术手段采集的实物档案数据处于初级形态,电子档案采集过程中也出现格式不规范、标准不统一等问题,由此导致备份效果不理想。以物质文化遗产为例,传感器所采集的数据将涉及三维坐标、材质构成等信息,全面立体化的数据为实物档案的虚拟仿真以及备份奠定良好根基。因此,将数字孪生技术应用到数字档案备份工作中,能实现数据格式的标准统一、数据质量的严格把控与数据内容的精准采集。
虚拟实体维度是数字孪生的核心环节,其原理是将所采集的数据在虚拟空间中完成映射以实现数字档案的动态仿真,从而创造出虚拟化的“数字孪生体”,其中虚拟化的仿真是对数字档案真实、全面的数字化形式表达。
换言之,数字档案进行数字孪生的过程,也就是创造一个“数字孪生体”的过程。一方面,数字档案备份的核心要义是借助数据及其应用环境的“复制”以实现长期保存、安全维护的目的,而数字孪生技术正契合创建档案“克隆体”的需求,可为数字档案备份工作的开展提供全周期支撑。另一方面,数字档案在数字空间中通过映射所形成的仿真实体,以更“高阶”的数字化形态加以呈现,能最大限度地确保数字档案库数据的齐全完整。
服务维度是数字孪生的目的,即通过对数字档案所采集的数据进行深度挖掘、分析,开展模拟仿真、模型构建等步骤,并据此提供科学化决策、智能性检测及精准化维护等服务。
数字档案的长期保存是数字孪生的首要目的与重要目标,而对档案数据的深度挖掘和开发利用则是有力保障。数字档案的备份并不是简简单单的“复制”,而是对需备份的数据内容进行智能化分析与深入性挖掘,能更好地实现档案数据及其应用环境的完整“复制”。一方面,如针对单位日常产生的档案,可通过大数据分析、数据融合分析等技术手段,挖掘出文书档案、科技档案或财务档案等各类型档案材料中生成规范程度最高的类别,创建出档案材料生成的数据模型及数据标准,契合备份工作对标准化档案材料的需求。另一方面,可基于对实物档案如珍贵文物档案的数据采集,开展模拟仿真以分析其状态,既可预测实物档案在现实中可能遇到的各种威胁因素,为消除或避免可能对其造成损毁的潜在威胁提供解决方案,实现实物档案的精准化维护,又能借助档案“数字孪生体”,通过数据恢复、分析可为实物档案的修复提供最优策略,高度契合档案备份对于长期保存、运维和恢复的需求。
通过对物理实体、虚拟实体与服务三大系统生成的档案数据进行转换、关联等操作所形成的档案孪生数据,即是对数据进行衍生、集成以实现数字档案相关信息增值的过程,其作为数字孪生的动力存在。
数字档案备份过程是综合性与全面性的系统工程,数字孪生契合了档案备份在数据集成与衍生方面的需求,既能形成更加全面、完整的数字档案备份内容信息,又有助于借助信息的增值推动档案高阶服务体系的转型。
数字孪生的连接维度是实现物理实体、虚拟实体、服务与孪生数据四大系统间两两相连的纽带并为数据的动态实时传输提供桥梁,其在数字档案备份过程中发挥着纽带作用。
数字档案备份以确保内容的“真实”与“完整”为重要目标,但无论是实物档案还是电子档案,往往备份之后档案原件由于各种原因出现内容修改或发生毁损的情况,且内容修改或损毁后的状态不易被追踪,因此备份工作也就呈现出相对滞后的缺陷,即原件出现意外情况时只能借助已备份档案恢复备份时间点前的内容,无法做到档案备份数据或状态的实时更新。与此同时,数字孪生技术可以实现档案原件、档案数字孪生体与孪生数据间的互联互通,当数字档案状态发生变化时能及时进行数据的动态更新、实时传输,避免了数据易被篡改的风险,契合了数字档案备份安全性维护需求。
由此可见,数字孪生技术在数字档案备份领域具备较强应用潜力与空间,其逻辑关联如图2所示。首先,数字档案的数据采集是备份工作的基础,档案孪生数据也为数字档案的运维提供科学策略;其次,档案数字孪生体是基于档案孪生数据在数字空间中完成映射所形成的虚拟实体,同时也为档案数据的孪生提供支撑;再次,通过对数字档案数据进行分析、评估、预测等操作以推动数字孪生备份平台的构建与数据价值的衍生;最后,围绕档案孪生数据为核心,数字档案、档案数字孪生体与数字孪生备份平台三者间也实现着数据的动态、实时互联互通,能最大限度地确保档案备份内容的真实与完整。因此,数字孪生技术与档案备份具备较高契合度,应将探究数字孪生技术应用到数字档案备份中的实现进路以及两者间更好地融合放到关键位置去考量。
图2 基于数字孪生技术的数字档案备份逻辑关联
数字孪生技术与数字档案备份领域具备较强逻辑关联,因此秉持从宏观到微观、从内部到外部的视角,探究数字孪生技术在数字档案备份领域的实现进路具有极强的现实意义。
当前,《“十四五”全国档案事业发展规划》提出建设“国家电子档案战略备份中心”的目标,国家档案局出台行业标准《电子档案单套管理一般要求》等,但相关政策并未对数字档案备份流程、标准等进行具体规制,同时数字孪生技术的体系、框架等尚未完善,也缺乏数字孪生技术在备份工作应用的相关战略规划与政策统筹。因此,需将前瞻性的战略规划、相关政策与规章制度的制定放到关键位置去考量。
第一,档案主管部门需出台相应战略规划,将数字孪生技术作为档案领域数字化转型的抓手,充分发挥数字孪生技术在档案数字化、长期保存、备份等方面的作用,为实现其在数字档案备份领域的应用厚植政策土壤。
第二,档案主管部门需制定数字孪生备份相应的标准及体制机制,一方面,相应的国家、行业标准能为数字孪生技术在备份工作中的应用提供指引,引导其沿着正确合规的道路发展;另一方面,也需完善绩效考核体系,在原有综合考核评价体系的基础上,将数字孪生备份工作推进成效纳入各地档案部门或区域性备份中心的考核评价中,同时对数字孪生备份的具体程序作出规制,包括备份流程、内容孪生、应急预案等。
第三,各地档案部门、区域性备份中心等需加强基础设施建设,一方面是数据采集传感器、计算机硬件等数字孪生备份硬件设备的配备,另一方面是智能传感器、人脸识别、物联网、档案管理信息系统等数字孪生备份软件系统设施的完善[14],涉及备份内容数据的收集、分析、挖掘等全流程。
数字孪生备份平台的目标是为实现数字档案备份全周期的保障,提供从数字档案收集归档、迁移入库、数字孪生、数据恢复的全流程服务。与此同时,数字孪生备份平台可由档案主管部门牵头建设,实现国家电子档案战略备份中心建设项目的接入,同时由相关单位、科研人员、技术企业等共同参与建设方案、执行标准等的制定,鼓励各省市、企业使用该数字孪生备份平台进行档案数据的备份。最后,具体到平台运行机制而言:
第一,数字档案收集与数据采集对应归档环节,数字档案材料的质量会影响备份工作成效,因此平台需对档案数据的采集流程、标准等作出规定;
第二,数字档案迁移对应移交接收环节,电子原文格式类型的繁杂不仅会对数据迁移造成影响,也会出现备份后再次调取无法打开的情形,因此平台内亟需制定统一的数据迁移标准;
第三,数字档案基于备份平台系统的基础上,在虚拟空间内完成映射,创造出“档案数字孪生体”,并利用大数据、数据挖掘等技术对档案数据进行深度挖掘,实现数据价值的集成与衍生;
第四,数字孪生备份平台将档案数据存储在云端数据库中,当数字档案、数据或系统等发生灾难性损毁导致运行瘫痪时,可借助平台存储系统内的远程复制软件,由智能存储系统对云端数据库内的档案数据在最短时间内复制到受灾系统中[15],实现数据及其应用环境的整体恢复,并做到“全真还原”。
技术的不断进步是数字孪生永葆生命力的基石,换言之,关键技术的深层次突破有助于实现数字档案备份工作的优化与数据更好的孪生。
第一,数字孪生技术部门或企业需积极将时代发展的新型技术产物融入其中,以关键技术的深层次突破为抓手,组建关键型多元核心技术框架[16]。具体而言,关键技术应以3R(AR、VR、MR)、模拟仿真、沉浸式云XR、边缘协同认知计算、大数据等多元信息技术的突破为引领[17],加强技术攻关,涵盖数据采集、数据孪生、数据备份、数据恢复技术变革的方方面面,同时关键技术的突破也可借助更精准的数据分析挖掘,从而提供更为科学的决策、智能化运维等服务。
第二,制定数字孪生备份科学合理、权威统一的技术标准,推动相关技术标准的改进与完善。技术标准是对技术事项所需制定的统一化标准,其可针对具有普遍性的技术问题提出最优解决策略,而数字孪生技术标准的制定是数字孪生备份技术深层次突破与创新的基础性保障,可为技术创新体系的构建提供指引。数字孪生备份技术标准的制定可由档案主管部门牵头,鼓励各单位技术部门和相关企业积极参与其中,则更能实现所制定的标准与技术前沿接轨。
“人”的因素在数字孪生备份工作中的重要性逐步凸显,其对掌握或具备档案、计算机、数据挖掘、数字孪生等多领域能力的复合型人才需求日益迫切。
第一,为契合数字孪生备份工作需求,数字孪生技术的应用促使档案部门工作人员除掌握档案及档案备份的专业知识,还需具备运用大数据、数字孪生等新技术的能力。因此,一方面,各级档案主管部门可组织开展工作人员的继续教育工作,鼓励并支持工作人员参加针对综合能力提升的继续教育培训班,制定科学合理的激励机制,以期提升其在档案、信息管理、计算机等方面的技能与信息化素养;另一方面,各地档案部门需积极“引智”,加强引进数字孪生备份工作各环节所需的专业化人才。
第二,各地档案部门一方面可加强与本区域内高等院校的合作,既可将数字孪生、大数据、建模等技术理念融入档案学专业培养体系中,又可成为高等院校档案学专业的实习基地,鼓励档案学专业学生在数字孪生备份的业务实践中进行实习,以期为未来数字孪生备份工作的发展储备人才;另一方面,各地档案部门可定期组织本单位工作人员去数字孪生备份工作实施成效好的单位、企业参观交流,学习其先进经验。
数字孪生技术应用的档案备份工作具备虚拟交互特征,通过对档案数据进行集成、衍生与挖掘,亦可丰富档案备份工作内涵,实现开发利用方式的创新与实体运维手段的丰富。
第一,数字孪生技术可带来虚拟交互的沉浸式体验,创新了档案备份工作保护与管理的方式。部分珍贵档案材料由于年代久远,经常性地翻阅、展览等会对档案材料造成不可逆的损毁,同时数字孪生备份技术可实现对档案材料的模拟仿真,从而打破时空限制,代替实物档案进行异地展览、在线查阅等。与此同时,借助数字技术、新媒体技术与计算机技术,基于档案数据孪生、衍生与集成,能以可视化的形式对备份数据进行直观展示、科学管理与挖掘利用。
第二,数字孪生技术可实现对档案备份数据的孪生,为数字档案及数字孪生体的动态感知、模拟仿真、智能运维、科学决策及风险预警等提供保障。当前关于档案数字化“备份”以实现安全维护的研究颇丰,如Sharaf Alkheder[18]从约旦沙漠宫殿三维可视化档案系统建设的角度入手,对其中应用的技术进行详细解析,但与此同时,针对实物档案的3D化并不能实现其自身维护需求,数字化“备份”也未充分发挥在长期保存、运营维护等方面的作用。因此,借助数字孪生对珍贵档案进行备份时,可通过数字化虚拟实体的构建,实现数字档案相关数据的动态采集、实时传输,使保管单位能及时感知实体的动态变化,并借助大数据、数据挖掘等技术,为其风险预警、灾害规避等提供科学策略。
数字孪生技术是近年来出现的新兴技术模式,既可为驱动档案备份工作由物理空间向数字空间的映射及实现物理世界与虚拟世界的交融提供契机,又有助于推动“数智时代”背景下档案备份工作的数字化、数据化转型。数字孪生技术在档案及档案备份领域具备广阔的应用前景,将会成为未来档案事业发展新态势,因此数字档案备份工作亦应顺应信息技术发展,抓住契机,实现档案备份工作的创新性、跨越式发展。