文/南京旭洲电子科技有限公司 吴巧姑
随着档案信息化建设的不断推进,数字化的档案资源和相对开放的管理环境给档案资源建设带来新的机遇。基于此,档案工作者应积极探索数字化档案资源的多元价值与特征,探寻档案管理系统建设的方法措施,以更好地推动档案管理高质量发展。
档案管理系统建设的最终目的是更高效地管理和利用资源,因此资源建设可以说是档案馆的立馆之本、强馆之基,更是活馆之源。在档案信息化建设大背景下,档案信息资源的载体、形式和种类更加多样,甚至一个单位不同部门所存储的档案信息也呈现出高度的离散化、多样化特征,这需要有一套成熟且完善的管理信息系统和数据库对大量档案资源进行整合。从资源建设的角度来看,档案管理系统中的数据库建设尤为重要。为搭建更符合工作需求的数据库,应做好如下几步:首先,应整合所有部门累积的信息资源,同时要对单位的其他系统进行调研,如OA办公系统、人事管理系统、资产管理系统等等,筛选出其中与档案数据库建设相关的归档信息。其次,数据库建设时要采取前端控制并且参与全程管理,即对数据产生、归档、流转和失效的所有过程进行管理。对于各个部门未经过数据库或系统产生的非结构化数据,还应以统一的数据标准移交给档案馆,再由档案馆录入数据库。最后,应不断优化数据库中的馆藏目录,根据业务特点和管理需求,定期对数据库中的索引和目录等进行更新,以适应最新的利用需要。
第一,随着档案信息种类和载体的日渐丰富,资源建设工作更应在日常的工作实践中不断提高数字化质量。在实践层面,档案管理系统建设一般由管理层统筹,档案管理部门牵头开展实地考察,各职能部门、管理人员和员工要充分发挥作用,探索不同分管领域和利益主体下档案资源的功能和价值,汲取共性、有价值的内容,去除重复、存在意义不大的部分。除记述类的信息外,还要进一步凸显档案的专业化和个性化。第二,考虑到档案数量激增、管理条目增多和数据类型更加复杂的情况,目前相关职能部门开始参与专业档案的管理与审核,同时定期对备份档案进行验收。
(一)档案数字化加工模块。1.实体档案整理。在进行档案数字化的过程中,管理人员应根据档案归档标准对实体档案进行整理,包括对档案数量、范围、顺序、载体等问题进行统筹规划。一是对应用价值高、利用率高的档案进行扫描。扫描前的整理工作主要包括清点、调卷、“顺卷”、移交登记。清点主要是对扫描对象的信息进行整理,如档号、题名、归还时间等,为保证工作流程规范化,应要求清点人员填写《交接登记表》;二是根据前期统筹规划的顺序依次提取档案;三是“顺卷”。“顺卷”环节主要是对扫描对象进行检查并理顺,同时对是否存在缺页、漏页、不适宜扫描的情况进行登记,以确保扫描质量;四是以上步骤无误后,交由扫描方进行数字化扫描。2.档案管理系统的维护与更新。为提高实体档案数字化效率,提高档案资源建设的范围,在纸质档案数字化时,要对档案管理系统进行实时更新与维护,具体而言,是在前端将需求嵌入系统、后端提供数据库接口。在管理系统前端,应根据数字化扫描工作的特点增加系统功能,其中最为重要的是OCR识别和全文检索。其中,OCR识别主要应用于文本类纸质档案的数字化扫描,能直接转换为电子文本信息,但也存在一定误差,需要后续进一步审核;全文检索要提供同音、近义和拼音检索,既能够检验数字化转换的成效,又有利于档案的后续开发与利用。目前,除部分手写、字迹相对模糊档案无法识别外,文本类扫描纸质档案基本能够实现全文检索。扫描前,还要对目录数据库梳理核实,著录格式要符合规定,著录项目要与实体档案信息一致,尤其不能出现漏项,对于“有名无档”“有档无名”等特殊情况,在备注栏注明。3.硬件准备。扫描硬件直接关系到数字化文本的准确性,特别是对于一些图片类档案来说,其分辨率高低直接关系到档案价值。一般来说,在数字化扫描时,应最大限度地减少对实体档案的破坏,目前使用的大多是A4高速双面自动进纸扫描仪。需要注意的是,根据实体档案纸张材质、尺寸、形状等外观特征,应准备多种多样的硬件。同时,分辨率的选择也应根据实际业务需要,不能片面追求高分辨率,导致数字化成本大大提高。
(二)数据库设计。当前,主流档案管理系统的数据库设计采用了三层设计模式,包括显示层(UI)、业务逻辑层(控制层)以及数据访问层(数据库)。这种设计模式能够满足大多数档案管理与利用需求,同时也存在一定的容错率,能通过个性化的模块设计满足系统个别功能的实现。UI层是面向用户的,能直观呈现给用户相应输入,同时也能将用户输入的数据根据一定规则存储在后台并传递给业务逻辑层;业务逻辑层主要对数据库和前端传递来的数据进行梳理和分包,业务逻辑层在整个数据库中承担着中枢神经的作用,能够根据业务需要对数据载体、类型进行处理;数据层存储了所有的档案信息资源,根据档案体量大小和载体不同设置不同的查询语言,以提高读取效率,同时也提供了数据正确性、一致性和完整性支持。1.逻辑设计。从上文可以看出,逻辑层承担着数据库的控制和处理,因此逻辑设计是数据库建设乃至档案管理系统建设中最重要的一环。逻辑设计最主要的工作就是对实体、实体属性和实体之间的关系进行处理,关键在于如何把抽象化的档案信息资源通过一系列的加工以可视化的形式呈现在前端,同时也要将前端的数据逻辑通过一系列的处理编码成数据库中的信息。在逻辑设计中,通常采用E-R图模型来表示实体和实体间的关系,根据一般档案馆的业务需求,实体通常包括提交单位、档案管理人员、档案室等,根据不同单位的业务特点可在逻辑设计时灵活增减实体,如高校在提交单位中可能包括职能部门、二级学院、师生等等,本文以四个实体为例。2.关键表设计。结合档案管理部门采用的数据库特性,可对数据库中的关键表进行细致设计,本文以SQL2008为例,根据业务特征对关键表进行一定阔成,得出部分档案信息表,如表1所示。
表1 档案信息表
(三)信息资源整合设计。1.数据交换平台架构。目前,机关根据业务类型不同开发引入了多种多样的操作平台,其在数据结构、编程语言方面都有差异。近年来,随着政务一体化的发展,面向公众的档案服务基本实现了“一站式”,但从业务角度来说,仍采用类型不同的管理系统,这给资源整合带来难度。对此,应从前端将信息资源整合到一起,实现数据交换与共享。具体而言,可根据不同开发平台的底层逻辑,建立起一个面向前端的数据交换平台,将该平台嵌入各管理系统中。根据各业务部门的数据特征建立数据采集模块,在各个业务流程中进行数据埋点。采集模块的标准应统一规范。数据采集后,通过编码以XML文档的形式流入数据连接模块,经过业务逻辑层的解析后进入数据库。2.服务接口设计。根据档案利用的不同场景,服务接口可采用Web服务程序,通过标准的Web协议提供服务,目的是保证不同平台的应用服务可以相互操作。服务接口除了集成档案资源外,还应提供档案的过程信息,如版本号、时间、操作管理员等,借助统一接口实现集中管理、集中开发,形成完备的数据库,集成检索服务,构建一站式的服务平台。同时,构建个性化的档案服务方式。具体而言,提供模块化的服务功能,用户可根据个人需求在管理系统的各个服务模块查询和获取信息,这就改变了传统档案的中心服务模式,用户与档案资源的直接距离进一步缩短,点对点的利用方式有助于提高档案利用率,化解传统模式下的“信息孤岛”难题,构建出多主体参与的协同服务模式。3.数据存储设计。通过在不同平台中的统一数据采集接口,将文件目录数据和文件附件存储到档案管理系统中。具体存储的属性、字段类型、长度和说明以表1中的档案信息为主,后续根据业务变化灵活添加。
(一)提高档案收集的规范化水平。从上面的分析可以看出,无论是数据库搭建还是信息资源的整合,都需要档案资源的标准化与规范化,因此应特别注重档案在收集阶段的规范化水平。对此,应在档案管理系统与接口平台形成统一的档案数据标准与规范并尽可能多的收集元数据信息,进行自动化的初步鉴定,排除重复和无价值的档案内容;其次,对于有价值的信息,由相应部门提出存储需求;最后,将整合好的档案数据借助数字化管理方式保存到相应设备,这便完成了一次完整的档案收集流程。档案收集时,要确保所有的档案数据都通过管理系统完成,以实现每个数据接口都能够完整地记录和查阅收集过程。在这一阶段,档案管理部门应参考档案管理与利用需求多元化的趋势,充分整合原生电子档案和传统档案的数字化产品,事先编制好档案的收集范围与标准。此外,要进一步探索档案管理系统的发展前景与趋势,不断探索其与档案资源整合的契合点,遵循差异化、层次化的原则,同时也要考虑到信息技术更新迭代可能带来的新问题,采用量化评价的方式对档案管理系统的应用及成效进行预测,为后续新技术的部署和应用提供参考。
(二)推进信息化建设,做好数字档案备份。第一,加强软件系统的开发。档案数字化资源管理应满足多渠道、多元化档案利用的技术要求,形成系统优化、功能完善、以档案为中心、多种形式的档案资源模式。应由档案管理部门搭建以多种格式、多种介质、多种方式为特点的备份体系,保障档案资源的灵活调用。根据不同的数据管理需求,可分别采用线上和线下备份系统。其中,在线备份主要保存经过适当压缩的、数据量较小的数字化成果,以利用需求为重点,是档案数字化成果的“利用级”备份。离线备份主要保存清晰度高、数据量大的数字化成果,以档案实体的保护为重点,侧重于档案数字化成果“档案级”备份。第二,采用多元化的备份策略,综合使用移动硬盘、磁盘阵列、光盘等多种备份介质,在实施档案数字化工作时,将验收合格的档案数字化成果存入光盘和移动硬盘,进行妥善保存。同时,为满足在线利用需求,可以配置大容量的磁盘阵列,用于备份存储低容量格式的档案数字化成果。通过不同介质的互相搭配,发挥各自优势,兼容并蓄、优势互补,使得档案数字资源管理体系更加完备。
(三)强化档案信息安全防护能力。档案管理系统中的资源建设具有数据量大、数据密度高的特征,一旦发生信息安全事件,会造成海量档案泄露或损坏。因此,不仅要强化档案管理系统的信息安全防护能力,还要对信息化环境下线上操作系统中的档案编辑工作站、元数据数据库、密钥数据库、规则数据库和高分辨率电子档案存储等核心环节进行防护,其工作重点包括两个方面:一是防止数据的丢失和损毁,针对此类问题主要采用数据备份技术。对电子档案的数据备份应采用异地备份方式,当下较为主流的是采用云存储,确保数据的永久保存;二是防止数据被窃取。档案管理部门通常采用授权和秘钥管理的方式,但上述两种方式存在一定的主观风险。对此,可引入区块链的非对称加密,同时对电子档案编辑工作应采用全面的数据标记,确保数据在可控范围内。档案管理部门应进一步完善权限机制,根据档案价值的大小、利用需求和使用场所将访问用户分为系统管理员、档案管理员、一般用户和禁止访问等几类,并根据用户的调用、查阅、流转等操作进行权限匹配。除此之外,档案数据的流转还应推动各类数据与管理平台共享共建,进一步完善档案资源易地备份模式,对相关存储标准进行细化,共同构建档案资源管理的长效机制。