城市轨道交通工程中电子文件元数据归档的难点及对策分析

2024-05-03 11:18陈雯袁月王俊淘刘钰刘琦王希
档案管理 2024年1期
关键词:轨道交通实体档案管理

陈雯 袁月 王俊淘 刘钰 刘琦 王希

关键词:城市轨道交通;电子文件;元数据;电子档案;归档;知识管理;数据实体;数据描述

1 背景

元数据是描述文件背景、内容、结构及其整个管理过程的数据,文件元数据是能够在领域内和跨领域间促进文件生成、管理和长期利用的结构化或半结构化信息。①早在2009年,《中共中央办公厅、国务院办公厅印发〈电子文件管理暂行办法〉的通知》中,就强调“电子文件及其元数据应当同时归档”。之后,更是接连多条元数据管理相关的标准问世,包括住建部于2012年发布的《建设电子档案元数据标准》(CJJ/T 187—2012)、2009年发布实施的国家行业标准《文书类电子文件元数据方案》(DA/T 46—2009)等。

近年来,档案信息化的进程在各行各业纵深发展,电子档案管理的重要性与日俱增,科学合理的电子文件管理流程已经成为社会生产和经济发展的关键内驱力。

在城市轨道交通行业迅猛发展的背景下,工程项目中产生了大量的电子文件。为了确保电子档案管理和档案信息化建设的顺利进行,维护电子文件的真实性和凭证性,需要制定科学合理的元数据管理方案,推动电子文件的长期保存和科学管理,促进电子档案的开发利用。

2 元数据科学归档的必要性

2.1 规范电子档案管理流程。元数据是电子档案的重要组成部分,直接体现了电子档案系统的依赖性。从电子文件的产生到归档,元数据始终伴随着其中。相比传统档案管理模式,元数据便于管理者更准确地把握档案的内容、结构、背景信息。电子文件形成、运转、处置、归档到后续电子档案修改、传输、存储过程中的各种痕迹和特征都由元数据反映出来。因此,元数据直接保障电子档案的凭证性,构成了电子档案标准化管理的重要基础。[1]充分捕获与收集的元数据,才能规范电子档案的管理流程。

2.2 保障电子档案质量达标。元数据是在数字环境中伴生电子档案的数据信息,通过其记录的自身属性、技术环境等信息,确保电子档案四性检测的顺利开展。[2]2012年发布的《建设电子档案元数据标准》(CJJ/T 187—2012),目的就是“加强建设电子档案的全过程管理,建立真实、完整、有效的建设电子档案,保障建设电子档案的安全保管与有效开发利用”。②由此可见,做好元数据收集归档工作能有效确保电子文件归档的完整性和真实性,保障电子档案的质量达标。

2.3 辅助电子档案知识管理。档案数据管理时代,任何类型的档案数据采集都离不开对元数据的关注。[3]元数据在电子档案查询与检索中起到重要的辅助作用,多级著录可以实现对检索内容的精准定位,提高查询的准确性和效率。此外,还可以对电子档案的属性和内容进行结构化分析,有助于电子档案的高效统计与编研工作。[4]元数据还构成了电子文件内容的关联性,可以为不同背景和形态的电子文件与电子档案提供描述方法和工具。从档案资源开发角度,元数据能有效辅助电子档案的知识管理,提高建设单位从档案数据挖掘价值的能力。

3 城市轨道交通工程元数据归档现存问题与难点分析

通过对元数据相关法规标准的检索和汇总,对元数据相关研究文献进行总结,以及对城市轨道交通工程单位档案管理活动进行调研与分析,总结目前城市轨道交通工程项目中元数据归档存在的主要问题和难点为以下三点。

3.1 归档范围不明确。元数据分为文件、业务、责任者和关系四类元数据实体,各个行业元数据的区别主要体现在业务层面,地铁项目产生的元数据也会根据业务活动的不同呈现出其特殊性,比如城市轨道交通建设分为不同的标段和线路,这样的信息就要体现在元数据之中;又比如电子文件的技术背景,在城轨工程中可能表现得更加复杂而多元。对于城市轨道交通工程电子档案的元数据来说,还没有一套专门的标准规范其管理流程,反映其业务特征。规范的缺失带来的直接影响就是归档范围的不明确,档案人员难以厘清哪些元数据是真正需要收集的。许多地方出台的元数据方案往往会出于全面收集不错漏的目的,设置较大的元数据采集数量。[5]这种做法不仅加重了工作负担,也导致实际工作中元数据归档范围愈发模糊而难以统一。目前,大部分单位只能按照旧有的工程档案元数据标准进行元数据的捕获,有的单位遵照文书档案元数据的管理规范,工作流程没有考虑到城市轨道交通工程自身的特点,比如不同车辆段和轨道标段的标引,不同参建单位的元数据体现不明显。综上,目前元数据归档的难点之一即如何确定哪些类别元数据需要归档,以及如何划分明确的、科学的元数据归档范围。

3.2 归档技术不成熟。根据调研情况,目前信息技术在档案管理领域应用和发展的不足,会直接影响元数据归档的完整度。以电子文件形成过程为例,由于目前大部分系统功能的限制,导致原生性电子文件缺失,就会让元数据的捕获变得极为困难。如果归档的电子文件只有扫描后的PDF文件,那其附带的元数据也只有针对PDF文件的元数据,电子文件原生的数据环境就无法通过元数据进行体现。也正是因为目前原生性电子文件还无法成为档案数字资源的主体,所以元数据的收集也需要将档案数字化的工作流程纳入其中进行考虑。对于城市轨道交通工程来说,复杂的信息系统带来格式多样的电子文件。比如BIM系统产生的大量描述工程模型的数据资料,这些数据具有很强的动态性,容易进行操作和修改,却因为接口建设的不足无法作为元数据归档。此外,有学者也提到结构化数据归档解决方案尚不成熟等问题,结构更为复杂的数据集无法转为非结构化数据进行归档,[6]这些问题都对元数据归档工作带来了艰巨的挑战。

3.3 归档环境有风险。整合元数据相关的标准规范,可以发现国家出台的大部分元数据标准,发行时间距今已经超过十年,不能完全适应当前工程电子文件元数据的管理要求。随着电子档案管理理念的不断发展和“单套制”管理模式的试点推行,尽管许多单位已经开始进行相应的尝试,但双套归档与单套归档并存的局面仍将维持一段时间。相对于传统的纸质文件归档,电子文件归档的“双套制”和“单套制”形式更为复杂且不断变化,导致建设单位的业务部门和档案管理部门难以及时、准确地理解并统一执行“单套制”管理。[7]档案部门难以插手前端业务,或者缺乏相关意识,徒留元数据在系统中逐渐失去价值。同时,目前大部分的标准还忽视了档案数字化相关工作流程等。[8]在电子文件存放位置不断调整的城市轨道交通工程项目中,元数据存储方式和位置的不确定性同样带来了风险。由于熟练度不足、系统对接困难等现实因素,一些业务系统难以进行物理归档,系統中元数据逻辑归档的位置和电子文件又难以实现统一。这都是元数据归档环境中风险的具体表现。

4 城市轨道交通工程元数据的归档优化路径

4.1 以标准为遵循,制定相关制度规范。新修订的《中华人民共和国档案法》中新增的“监督检查”专章规定电子文件管理要以“来源可靠、程序规范、要素合规”为根本遵循,这也提醒我们:元数据的归档优化离不开以标准为遵循的制度规范。

基于城市轨道交通工程的特点,应当建立规范,规定各个单位建设全过程电子档案元数据设计、捕获、著录的一般要求。元数据的标准制定应当重点围绕收集和归档范围的划分来进行,规划出科学合理并具有行业特色的元数据收集清单。在此过程中,不能逃避那些模糊而晦涩的问题,比如三维模型与二维电子文件的元数据是否一致、纸质档案数字化的各项属性是否需要作为元数据保存等。专业人员还可以设计城市轨道交通工程中元数据的描述示例,用于展示清单内元数据实体元素的描述方式。帮助大多數不了解元数据的档案管理人员认知元数据具体的描述方式和管理活动。最后,标准的制定需要积极面向建设单位的需求,为提高档案标准建设的质量,避免条目冲突、重复立项等问题,可参考国家制定建设项目备案标准的过程中提供的基本逻辑框架。[9]

4.2 以技术为抓手,提高收集方案水平。电子文件管理的水平会直接影响元数据的收集和归档工作,而电子文件管理的技术方案目前还有很大的进步空间。在很早之前,就有学者基于ISO23081提出了聚焦于实体、实体级次及其相互关系确定的ERMS元数据方案设计,其中也强调了OA系统和档案管理系统相集成的一体化管理系统的重要性。[10]城市轨道交通工程集团要针对接口建设不足、系统一体化程度不够等问题,积极开展信息化建设,解决元数据收集不完整、传输有障碍等问题,并逐步利用文本分析、图像识别、语音识别等人工智能技术,实现对电子文件中各项信息的自动化或半自动化的元数据捕获,提高元数据收集的效率和准确性。以OFD标准的打包方案为例,通过容器式封装组织形式实现电子档案的“自包含”,保留大量原始记录及伴生的元数据,构建档案和元数据的强联系,解决了电子档案文件与元数据描述文件分离的问题。[11 ]此外,还可以建立并完善元数据管理系统,对电子文件元数据进行存储、检索、更新、维护,保证元数据收集的完整性,实现对电子文件元数据的全程管理,保证元数据收集的质量和可持续性。

4.3 以业务为核心,推动各方主体交流。科学的元数据归档方案离不开城市轨道交通工程各方主体的积极交流,更不能脱离业务活动空谈理论。再怎么精细设计的元数据清单和描述方法,最终还是要落回到实际的工作中。各方参建单位应当协同并进,保证在工程勘察、设计、施工以及维护等一系列活动中,规范、全面收集电子文件元数据,各方负责人在确保程序合格的同时提高流转效率,实现电子档案元数据的全程管理。同时,各项标准规范所规定的元数据方案也需要不断进行内在的拓展和实时的更新。档案人员在和业务部门对接的过程中,也要根据不同的工作节点、不同的使用目的,对元数据内在的实体层级和实体元素进行拓展,不断提高相关标准规范的适配程度,符合工程建设和档案管理的需要。

5 元数据捕获清单与归档方案构建示例

综合上文论述,可以看出元数据归档面临的首要挑战即如何确定需要收集的元数据的内容,划定其范围。基于此,本文提供部分示例,展现构建元数据归档方案的过程,为城市轨道交通工程企业提供参考。

5.1 方案设计原则与参照。元数据捕获清单与归档方案的设计应遵循两个基本原则。第一,元数据管理也是档案管理的一部分,应当遵循基本的档案管理原则,尊重档案的原始记录性,保持元数据和电子档案的内容之间的有机联系。第二,电子文件元数据应充分考虑当前的数据格式和编码规则,确保元数据管理的成果得以实现数据流通和信息共享,符合信息技术的基本逻辑,提高元数据管理的效率。

元数据方案的设计应当积极参照现有法规标准和前沿理论,同时重视方案在实践中的反馈和评估。重点需要参考的法规标准包括《电子文件归档与电子档案管理规范》(GB/T 18894)、《建设电子档案元数据标准》(CJJ/T187—2012)等标准,同时在专业类档案的元数据管理上,还要参照与之对应的标准。而城轨交通工程形成电子文件的元数据,不仅包含文书、科技、工程、照片、录音等多种类型的,还与公路建设、桥梁建设等横向工程形成的元数据有共同之处,需要分析并把握共通点,学习元数据方案设计的内容。

此外,许多地方部门已经制定出适用于本地区的元数据管理规范,并在试点实施过程中取得了一定的实践经验,这些规范和经验为电子档案管理的标准化和规范化提供了有力支持,有助于提高元数据的质量和准确性,为电子档案的管理和利用提供了更好的基础。比如《天津市文书类电子文件元数据规范》(DB12/T 692—2016),《苏州市建设电子档案元数据规范》(DB3205/T 1071—2023)。广东省、江苏省、浙江省、山东省、上海市和北京市等地的地方标准在不同程度上涉及电子文件元数据管理。其中,《天津市文书类电子文件元数据规范》详细规定了电子文件全过程管理的元数据设计、捕获和著录,并涉及规范应用的范围、所引用的规范性文件、规范所要求的术语和定义以及电子文件元数据索引表。这些标准的制定和实施有助于提高电子文件管理的标准化和规范化水平,确保电子文件的真实性和长期保存。[12]

广东省标准规范在元数据的定义方式上解释了信息固化,描述了电子文件的归档工作中收集齐全的状态。江苏省最新的标准规范也强调了元数据采集与保存工作对于电子文件管理的重要性。对于地方标准的先进经验,地铁集团也应当积极学习。

最后,在制定元数据管理方案时,应谨慎选择参照方案,避免死板地模仿其他标准,而是根据自身情况进行适当的分析和创新。例如,《建设电子档案元数据标准》在标准中未包含档号、全宗号、数字签章等档案信息化不可或缺的元数据元素。此外,目前的大部分标准忽视了档案数字化相关工作流程,无法对非原生性电子档案进行详细描述,因此在方案中需要补充和完善这些内容。

5.2 元数据实体及实体层级。元数据方案的顶层设计应当围绕四类元数据实体进行,即元数据实体的四种类别以及各个类型的元数据实体理论上应当包含的内容。可从不同维度将元数据实体划分为文件实体、业务实体、责任者实体和关系实体。这样的分类有助于更好地理解和组织元数据,提高电子档案管理的效率和准确性,如表1所示。

5.3 各项元数据实体的构成。元数据实体构成,即各项实体类型具体包含的元数据,以文件元数据实体为例,展示一部分元数据清单,如表2所示。需要强调的是,清单需要着重体现城市轨道交通工程业务的特点,各建设项目根据实际可自行扩展需要的元数据。

5.4 元数据描述方式。元数据的描述方式,即运用标准化与结构化的方法,对元数据各项进行描述,如表3所示。对于大部分档案管理人员来说,元数据的概念较为生疏,为使档案管理人员能够更加清晰工程建设各节点及文件管理全过程中元数据归档工作内容,元数据描述需要将模糊的元数据内容清晰化。以表4为例,展示“分部工程”这一业务元数据实体元素的可能的描述方式。

5.5 元数据方案评估与维护。在提出的方案不断推进的过程中,信息化的发展可能会使得工程电子档案在内容和形式上产生变化。建筑业与信息化不断融合,就是建立在BIM技术应用的基础上,系统中的建设档案数字资源膨胀式增长,各方对这些“元数据”的接受程度就很可能不一致。因此,各方主体需要积极围绕业务活动展开交流,对各项元数据实体包含的元数据元素进行充分评估,不断丰富元数据归档的方案细节,保障元数据标准规范的弹性和生命力,也确保元数据收集和归档的步调在建设项目中保持一致。

6 总结

元数据的归档完成度,深刻影响了档案人员能否在管理活动中保障电子文件和电子档案真实性、完整性、一致性、关联性和长期有效性。要顺利完成元数据的归档活动,既要求档案人员厘清元数据采集范围和内容,也要求制定科学的元数据采集框架,排除元数据归档环境中存在的风险。元数据可以帮助电子文件进行有效的集成管理和后续的服务利用,更是构建数字档案馆信息资源库必不可少的工具。元数据归档方案的設计与制定可以帮助建设电子档案元数据科学化、规范化和标准化,本文基于元数据归档的难点,提出了三条归档优化路径,试图帮助档案人员提高管理效能,挖掘元数据潜在的价值,推动城市轨道交通行业电子档案管理水平的提高。

(作者单位:1.南通轨道交通集团有限公司 陈雯,硕士馆员,主管;袁月,助理馆员;2.徐州地铁集团有限公司 王俊淘,学士,助理馆员;刘钰,学士,馆员;刘琦,学士,高级规划师;3.常州地铁集团有限公司 王希,学士,助理馆员 来稿日期:2023-10-20)

猜你喜欢
轨道交通实体档案管理
轨道交通产品CE认证论述
高速轨道交通发展趋势
前海自贸区:金融服务实体
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
健康档案管理的“云”前景