电子档案管理的元数据方案探析

2023-05-30 18:59赵钰婷
档案天地 2023年3期
关键词:档案管理

赵钰婷

一、引言

电子档案被定义为“具有凭证、查考和保存价值并归档保存的电子文件”,由于容量大、占地小、便于检索和管理,逐渐成为当今时代常用且与时俱进的档案形式。在档案管理中,元数据是描述档案资源内容、结构、背景等的数据,有助于高效管理电子档案,保障其真实性、完整性、可靠性和可用性等。随着电子档案的大量产生,识别、收集和管理用于电子档案管理的元数据至关重要,迫切需要探析科学的元数据方案,定义电子档案元数据和元数据元素之间的逻辑结构,助力电子档案管理工作,以便为后续的档案信息化建设工作提供指导。

二、元数据对电子档案的作用

(一)规范电子档案管理流程

元数据是电子档案不可或缺的组成部分,伴随着电子文件的产生到归档的全程,因此,充分捕获与收集元数据十分重要。与传统的档案收集相比,电子环境下以更准确和科学的方式和数据形式捕捉档案的内容、结构和背景。可以说,元数据作为重要的基本数据,是实现电子档案标准化管理的重要基础[1],它贯穿电子文件生命全程,组成电子档案,并规范其管理流程。

(二)辅助电子档案数据查询

在档案数据管理时代,任何类型的档案数据采集都离不开对元数据的关注[2]。元数据是电子档案数据查询的基础,查询与利用电子档案就是检索元数据。元数据不仅能辅助电子档案查询,如输入文件名、机构等元数据实现电子档案的精准定位,还能通过设置并规范填写元数据辅助结构化分析,基于此可以实现电子档案的统计、编研、分析利用。

(三)助力电子档案四性检测

四性检测是电子档案生命周期管理的关键要素,其目的是通过验证电子档案的真实性、完整性、可靠性和可用性。电子文件是可复制、可修改的,而元数据是伴随电子文件从生成到最终归档管理的数据,能充分记录其各项内容信息,包括电子文件自身属性、技术环境等,是电子档案真实性的重要保障,可以说,元数据构成了四性检测的来源和基础。

(四)推动电子档案资源开发

元数据是实现语义网的基础,它能为不同形态的电子档案提供描述方法、基准,也为分布式信息以及多种档案资源的信息系统提供整合工具,令其具备最基础的结构特征[3]。元数据不仅是确保电子档案真实性、完整性、可读性等的基础,也是整合档案资源和信息集成与共享系统不可或缺的工具。可以说,元数据是电子档案数据的基础和核心,有利于电子档案的保护与长期有效的存储、有利于科学管理电子档案、有利于电子档案的查询和利用[4],以此推动电子档案资源开发。

三、电子档案及其对元数据方案的影响

(一)电子档案的特性

第一,电子档案基于系统生成,并且在创建电子文件的同时生成相关元数据。从创建电子文件到归档形成电子档案的整个过程都离不开系统支持,元数据记录了各种痕迹、特征,是电子档案系统依赖性的直接体现。第二,由于在虚拟环境生成,档案工作者难以通过固定载体来判断电子档案是否为原件。电子文件从生成到归档始终处于实时运转过程,由于其与载体的可分离性,判断是否为原件需采用技术手段,通过严格的运作程序,能够最大程度避免失真。第三,电子档案的存储时间长且要求高。不同种类档案的重要性和保存要求也存在差异[5],凭证价值的维护、复杂的数据形态和巨大的数据体量也对电子档案的保存构成了挑战,因此,电子档案的存储要求比普通计算机数据严格得多。

(二)电子档案对元数据方案的影响

上述特点使电子档案面临真实性、完整性、可用性和安全性等多方面的挑战,继而影响电子档案管理的元数据方案设计。一方面,档案与其他事物最本质的区别在于其原始性和真实性,因而要突出元数据能够保证电子档案的原始性和真实性的价值[6],电子档案可修改复制、元数据的完整性维护、电子档案不同组成部分的关系保持等都是需要考虑的问题;另一方面,对元数据方案的设计提出功能实施层面的要求,由于电子档案种类繁多,需要按照电子档案的类型、技术环境、职能等特征进行标准化分类,便于各个领域获取相应的档案资源。

四、电子档案管理的元数据方案

(一)设计原则

第一,电子档案也是档案,其相应的元数据方案应以尊重档案、尊重客观、尊重元数据与整体间的有机联系为原则,使元数据与电子档案內容信息保持关联。第二,电子档案元数据伴随其整个生命阶段生成,元数据方案的设计应始终坚持前端控制与全过程管理的原则,推动电子档案管理工作科学展开。第三,充分考虑数据格式、编码规则等,使得元数据与电子档案内容信息间的关联有效、有逻辑可言,进而实现数据交换、信息共享,提高元数据管理的效率。

(二)元数据方案

元数据伴随电子档案的生命全过程,从生成到捕获,再到封装,最后到维护,每一环节环环相扣,需要进行合理的安排,以此助力电子档案管理工作。

在生成环节,主要是确定元数据的值域以便形成确定的元数据内容,应采用统一软件进行处理,避免元数据格式转换中的错误,并将识别的元数据内容存储在数据库中。在捕获环节,采用人工与计算机著录相结合的方式,并检查元数据的内容、逻辑等,做好质量控制。在封装环节,按照不同级别对元数据进行封装,每一个封装包要包含一个基于XML结构的数据文件和相关元数据,多个文件封装包就形成了更高一级的基于XML结构的数据文件。在维护环节,关键在于保持电子档案与元数据间的关联,避免由于存储方法而影响电子档案的整合和它们之间关系的稳定性。

为了更好地进行电子档案管理,充分发挥电子档案价值,电子档案的原始文本及其索引数据可以单独保存,由专门的文件资源管理系统对接数据库系统。前者负责获取存储站点和数据文件之间的关系,并将数据报告给后者便于其记录与存储,而后者则是通过XML的元数据记录导入或更新数据表,并通过这些数据表提供其他应用程序、访问和服务(图1)。

在电子档案管理过程引入元数据方案,旨在更好地记录电子档案著录信息、标识、管理信息,并为用户提供完善的服务。电子档案的所有索引信息存储在与电子档案的原始文本相对应的XML文件中,新增文件资源管理系统,以确保索引文件与相应档案的原始文本之间的关系不受干扰,用户通过前台系统提取所需档案相关信息。如此一来,系统可以自动完成关于电子档案的一切操作,并且记录电子档案的读取时间、操作过程,从而在一定程度上保证了电子档案真实性、完整性、可靠性和可用性。

五、实施路径探析

(一)制定科學的元数据标准

目前为止,我国已经制定了一些元数据行业标准,如《文书类电子文件元数据方案》《照片类电子档案元数据方案》和《电子文件元数据标准》等。没有及时捕获、记录和有效管理元数据是造成电子档案损失的一大风险因素,应对此类风险因素,国家层面应当制定电子档案长期保存元数据标准,相关部门也亟需制定科技类、音频类、视频类电子档案元数据标准。除了对电子档案元数据的设计和捕获提出要求,还应关注其管理,制定相关元数据管理标准,以此对元数据检测、保存和记录等管理方面的要求作出规定。此外,还应区分不同类型的元数据,制定专门针对长期保存的元数据标准[7],为电子档案的价值发挥奠定基础。

(二)探寻独特的档案元数据

档案与诸如图书、情报之类的其他相似事物有本质区别,在其他领域成功实践的元数据标准难以直接运用于电子档案管理,因此,档案界迫切需要建立属于档案领域自身的元数据标准。在现有的标准基础上,根据档案领域特殊要求扩充一些新的元数据信息,既不影响通用标准的使用,也可以在电子档案备份、还原、移交等业务操作过程中保持电子档案信息的完整。当然,若电子档案元数据只是简单地著录,没有建立起数据间的关联关系,则很难真正发挥电子档案价值。因此,为了更科学有效地管理电子档案,最大程度揭示并整合电子档案之间的有机联系,有学者提出了“档案元数据核心集”的概念[8]。基于完整描述档案自身形成过程中历史联系的信息,在可视化描述中展现档案的内部联系。应结合历史主义精神,根据档案历史联系与历史的“同构性”规律[9],挖掘档案所特有的元数据标准并构建专属档案领域的元数据核心集[10]。

(三)构建完善的前后端管理

一方面,应依托前端控制思想,改造前端业务系统。电子文件转化为电子档案的时间节点不清晰,且涉及管理权的转移,若只关注电子档案的形成结果而忽视其形成过程,易产生电子档案真实性存疑的风险并且不可逆转。为了避免这种安全风险,首先应以前端控制思想为指引改造原有的业务系统,在形成电子档案期间按照相应要求收集所有类型的元数据,做到应收尽收,以证明电子档案的创建在整个过程中处于受控状态。

另一方面,还应建立实时响应机制和备份机制。电子档案数据库应定期备份电子档案及其元数据,便于在遭到破坏后及时恢复数据。但若电子档案管理系统没有及时获知破坏信息,错误的电子档案及其元数据就会自动备份,使电子档案的真实性存疑。因此,可以同时建立实时响应机制、备份机制,完善电子档案管理的后端工作,切实保障电子档案信息的安全,以便后续开发利用。

(四)形成丰富的元数据描述

在电子档案时代,档案元数据具有了结构化、集中化、标准化等基本属性,一般以XML格式进行表达[11]。元数据不仅可以为不同形式的电子档案提供标准化的描述标准和方法,还可以为由多个电子档案组成的分布式信息系统提供集成工具和链接。然而,在电子档案管理实践中,利用元数据对电子档案进行初步的语义描述只能解决资源描述问题,语义异构问题依然严重。各档案机构采用的元数据规范不同,不利于电子档案规范化管理工作的开展。而语义本体是元数据的补充形式,对电子档案具有强大的描述能力,给异构元数据间的映射、转换、互操作提供帮助。它以XML和RDF为基础,在完成电子档案语义描述的前提下,促进数字档案资源的关联与共享,在语义层面上形成丰富描述[12]。

六、结语

元数据有助于完整地记录电子档案的背景、内容、结构等信息,在保障电子档案的真实性、完整性、可靠性和可用性等方面发挥着重要作用。随着电子档案的大量产生,元数据方案的确定、捕获与管理尤为重要。本文提出了元数据方案的设计原则,认为在电子档案管理过程引入元数据方案有助于记录电子档案著录信息、标识、管理信息,并为用户提供完善的服务。具体实施路径包括制定科学的元数据标准、探寻独特的档案元数据、构建完善的前后端管理、形成丰富的元数据描述,以此提升电子档案管理水平,便于后续开发利用。

参考文献:

[1]李芳芳,吴玉龙,米捷,陈成.机关电子档案元数据体系构建及元数据库建设研究[J].档案管理,2019(05):13-15.

[2]陈雪燕,于英香.从档案管理走向档案数据管理:大数据时代下的档案管理范式转型[J].山西档案,2019(05):24-32.

[3]熊华兰.基于语义本体的数字档案资源知识管理模型研究[D].辽宁大学,2019.

[4]马利涛.档案信息资源管理平台设计与实现[D].西安电子科技大学,2019.

[5]杜琳琳,袁嘉新.电子档案长期保存技术策略研究[J].中国档案,2021(12):67-69.

[6]陶水龙,王贞,田雷,白巍,任文革.电子文件和电子档案元数据分类与方案设计[J].档案学研究,2016(06):83-90.

[7]张瑜.数字档案长期保存风险的识别与应对策略[D].武汉大学,2017.

[8]田伟,韩海涛.发挥档案元数据核心集作用推进“互联网+档案”建设[J].档案,2016,(6):5-9.

[9]任天琪.档案元数据核心集内部要素及关系研究[J].档案与建设,2016(08):12-15.

[10]杨文刚,崔杰,田伟.档案元数据核心集系统的设计研究[J].北京档案,2016(07):12-15.

[11]祁天娇,冯惠玲.档案数据化过程中语义组织的内涵、特点与原理解析[J].图书情报工作,2021,65(09):3-15.

[12]王志宇,熊华兰.语义网环境下数字档案资源关联与共享模式研究[J].档案学研究,2019(05):114-119.

作者单位:上海大学文化遗产与信息管理学院

猜你喜欢
档案管理
如何规范档案管理
对加强城建档案管理的相关思考
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
煤炭企业档案管理的创新
论如何做好档案管理工作
论科研项目档案管理
健康档案管理的“云”前景
关于电力企业档案管理之创新探讨
加强工程项目档案管理的有效途径