王青 马小亮
摘 要:真实性、完整性、可用性和安全性是电子档案的重要属性,“四性”检测是电子文件接收过程中,保证这些属性的一种重要手段。在档案系统和PDM接口开发过程中,对“四性”检测的实现进行了初步探索,本文对实现过程及实现效果进行了描述,为“四性”检测的最终实现提供参考。
关键词:电子文字;归档;“四性检测”;实践
DOI:10.12249/j.issn.1005-4669.2020.25.101
随着信息化建设的推进,越来越多的业务应用系统上线使用,如档案管理系统、PDM系统、OA系统、ERP系统、知识管理系统、软件工程化系统以及合同管理系统等。通过和档案系统开发集成,大量的电子文件通过接口将被推进档案系统内,那么如何保障接收电子文件的真实性、完整性、可用性及安全性(即“四性”),已成为档案电子信息化管理中亟待解决的问题。针对这一问题,结合“四性”检测要求,笔者在档案系统和PDM系统的接口开发过程中,进行了初步实践。
1 “四性”检测的定义和意义
1.1 “四性”检测的定义
DA/T70-2018对“四性”的定义为:
1)真实性,是指电子档案的内容、逻辑结构和背景与形成时的原始状况相一致的性质;2)完整性,是指电子档案的内容、结构和背景信息齐全没有被破坏、变异或丢失的性质;3)可用性,是指电子档案可以被检索、呈现或理解的性质;4)安全性,是指电子档案的管理过程可控、数据存储可靠,未被破坏、未被非法访问的性质。
1.2 “四性”检测的意义
随着档案信息化建设的推进,越来越多的电子文件归档到档案系统,电子文件将逐步取代纸质文件,成为主要的档案管理对象。电子档案“四性”检测是保证电子文件、电子档案真实性、完整性、可用性、安全性的重要手段,也是确保电子档案凭证价值、查考价值和保存价值的重要措施。因此,在电子文件接收以及电子档案管理过程中,“四性检测”具有举足轻重的作用。
2 PDM接口开发及“四性”检测的实现过程
2.1 接口集成方式
档案系统和PDM系统之间的接口采用Web Service的方式及SOAP协议来实现集成。档案系统作为服务提供者,发布Web Service服务; PDM系统作为服务请求者,请求服务。
Web Service是使原来各孤立的站点之间的信息能够相互通信、共享而提出的一种接口,是建立可互操作的分布式应用程序的新平台,其定义了应用程序如何在Web实现互操作性。Web Service所使用的是统一、开放的标准,如HTTP、XML、SOAP(简单对象访问协议)、WSDL等,所以Web Service可以在任何支持这些标准的环境(Windows,Linux,Unix)中使用。Web Service具有平台无关性、普遍性、易于使用等优点,可以沟通不同平台、编程语言和组件模型中的不同类型系统,方便地实现异构系统之间的集成。
2.2 集成方式的优点
采用Web Service方式具有以下特点:
1)实时性好,PDM系统中调用Web Service方法,可以实时将数据转入到数字档案综合管理系统中;2)通用和扩展性好,双方系统的耦合度低,一方的需求和系统变动不会带来另一方开发工作量的增加;3)安全性好,双方只需沟通传递的数据内容和格式,均不需要了解对方的数据库地址、表结构,不会对对方数据造成潜在危险。
2.3 接口“四性”检测内容及实现过程
2.3.1 真实性检测
在真实性检测过程中,对电子文件内容、电子文件元数据及相关的目录信息等内容、技术信息属性进行了检测,主要包括以下内容。
1)目录信息检测:PDM将电子文件相关的目录信息写入XML结构中,档案系统接收到XML结构后,归档接口检测目录信息是否符合档案著录规则要求,包括数据类型、长度、格式、值域以及信息内容是否合理等。2)目录和电子文件关联准确性检测:检测电子文件与目录信息是否关联。关联信息包括:电子文件名称、电子文件大小以及电子文件的哈希值。3)电子文件名称检测:对比PDM上传的电子文件名称是否与XML结构中电子文件关联信息的文件名称相同(包括扩展名称)。4)电子文件大小检测:获取PDM上传的电子文件,计算文件大小是否与XML结构中电子文件关联信息的文件相同(单位为(KB)字节)。5)电子文件哈希检测:通过MD5算法计算PDM上传的电子文件的哈希值,对比哈希值是否与XML结构中电子文件關联信息的文件哈希值相同(MD5算法)。
2.3.2 完整性检测
在完整性的检测过程中,对电子文件内容、元数据及其相关目录信息内容完整、项目齐全等进行检测,主要包括以下内容。
1)电子文件类型检测:检测电子档案类型与移交接收类型是否一致,包括变更单、图纸及签署页等。 2)目录项目完整性检测:按照档案著录规则检测档案目录项目是否填写齐全(必填项检验)。3)电子文件完整性检测:检测每条归档的电子目录是否都有对应的电子文件(一对一,或者一对多)。
2.3.3 可用性检测
在可用性检测过程中,对电子档案的目录数据、电子档案内容能够长期保存,并被合法用户无障碍地使用进行检测,主要包括以下内容。
1)目录数据可用性检测:检测电子档案目录数据是否可以被正常检索(条目检索)。2)电子档案内容可用性检测:检测电子档案内容是否可以被正常打开和浏览(全文检索)。
2.3.4 安全性检测
在电子档案安全性检测过程中,对电子档案具有安全保管和长期可用的环境进行检测,主要包括以下内容。
1)目录数据安全性检测:检测著录项目中的密级和控制标识是否规范,确保电子档案利用安全。2)按照“四性”检测要求,应该对电子文件进行病毒检测,检测电子文件是否感染木马或病毒,确保电子档案保存和利用安全。实现这一功能需要和杀毒软件进行开发集成,在本次接口开发中暂未病毒检测。
3 实现效果
通过在档案系统和PDM系统接口增加了“四性”检测功能,除了病毒检测外,基本实现了对PDM在线归档数据的“四性”检测,确保了电子文件、电子档案的真实性、完整性、可用性及安全性,同时,也促进了电子文件及归档过程的规范性。
1)能够准确无误地将电子文件元数据和电子文件归档到档案系统中,保证在归档过程中数据不丢失、不被篡改。确保了归档电子文件的真实性。2)通过对归档条目信息属性以及电子文件关联关系的校验,能够确保归档数据的完整性,使不符合归档要求的数据被拒退回,并提示归档人必须完善所有归档信息后才能正确归档。提高了归档文件信息的完整性及规范性。3)避免档案人员手工录入条目和挂接电子文件,以及这一过程中可能出现的错误。档案利用者可能通过条目检索、全文检索快速的获取档案信息。在确保电子可用的同时,提高了档案管理和档案利用的效率。
4 结束语
目前档案界对“四性”检测的研究还处于起步阶段,实践领域的成功案例也很少。基于这种情况,在这次PDM接口开发过程中,对“四性”检测的功能实现也仅仅是一个初步的探索,还存在一些不足,比如,病毒检测未能实现,随着进一步的使用及“四性”检测技术的成熟,还有待进一步改进优化。
参考文献
[1]DA/T70-2018.《文件类电子档案检测一般要求》
[2]骆建珍,杨安荣,马来娣.电子档案“四性”检测要求及其实现方法[J].浙江档案,2017(12):27-30.
作者简介
王青,女,副研究馆员,研究方向:科研院所档案信息化建设,数字档案馆建设;产品档案管理。