文/王靖元
当前,大数据信息化已经成为新时代一大发展潮流。异地档案查询系统的建网,实为档案事业发展的一大最佳选择。本文通过分析研究,提出异地档案查询系统设计方案,无疑为提升档案的服务功能与开发利用,又开辟了新的有益的路径。
当前,数字化的浪潮在各国乃至各行各业间引发了巨大的变革,我国也将建设“数字中国”作为国家发展的重大战略。在这样的时代背景与国家战略背景下,档案部门应该将档案工作数字化作为工作的一大重点,这是责无旁贷的最佳选择。另一方面,政府部门的首要任务是服务人民,对档案单位来说不断提升档案服务的便捷程度恰恰是人民之需求,档案系统的数字化不仅是在顺应时代发展、响应国家号召,也在很大程度上满足了人民的需求。
时下,在各地各级档案馆、档案局中,档案工作的主要内容一般为档案收集与整理、档案管理、档案检索服务三项,数字化系统在前两项中已经有了较为成熟的应用,许多地区的档案局、档案馆都有一套服务于档案的收集、存储、管理全生命周期的系统,这类系统也在面向公众的档案检索服务中发挥了一定作用。近年来随着小程序的兴起,软件开发与使用的门槛都有明显的降低,一部分档案部门也紧随技术发展的步伐,开发出微信或支付宝平台上的小程序专门用于提供档案查询服务,查档案的人无需反复跑路,在小程序中就可与档案人员交流,确定所需档案的位置。
“建设数字中国”,业已成为国家发展的重大战略。近年来,信息技术的飞速发展给各行各业带来了发展的勃勃生机,不过其作用区域仅限于档案单位所在的地区,各地的档案单位并未结连成“网”,如果所查档案存储在异地,查询起来就会十分麻烦。要想使档案查询服务的便捷度有质的提升,建立一个连接各地档案单位的异地档案查询是十分必要的。为此,本文就从档案系统数字化现状、异地查档系统架构、模块实现方案等三个方面,论述数字化时代异地档案查询系统的实施方案
上述这两种系统已经覆盖了档案工作主要的三项内容,不过对于档案不在生活所在地的人来说,查档案最麻烦的短板仍未得到解决,要查一些档案还是免不了长途跋涉,解决这一问题的唯一方法便是建立异地档案查询机制。目前,并没有一套完善的异地档案查询系统。在新冠疫情期间,遂宁市与北京海淀区联合开展了异地查档服务[1],但这一服务主要还是基于工作人员之间的协调,合作也仅限于达成约定的几个地区之间,没有普遍意义。总的来说,我国档案系统的数字化在异地查档上的应用还是较为空缺,尽快补足实为所需。
由于实体档案是以档案局或档案馆为单位统一集中管理的,因此异地查档系统将每个档案单位抽象为系统中的一个节点。在系统中,档案的数字信息分布于不同节点之上,由于每个档案单位既需要提供档案查询服务,又需要请求别的档案单位帮它查询档案,因此系统中的每个节点都要同时扮演客户端与服务端的双重角色。采用分布式架构的模式可以实现异地查档系统所需的功能,总体架构的层次结构如图1所示,当通过一个节点的客户端查询档案时,客户端会向“异地查档系统中间件”发送查询请求,如果所查档案位于本地,中间件就直接从本节点上的数据中查询,如果档案位于异地,就通过互联网访问对应节点的中间件,目的节点以本地查询的方式查询到档案数据后返回给本地节点。最终查询到档案信息后,由本地节点上运行的中间件将数据返回给客户端。
图1 异地查档系统总体架构
在异地档案查询的业务信息中,所查档案的位置范围是可以确定的,因此客户端发送给中间件的查询请求会带有档案的位置信息,即指定的档案单位,因此每个节点的中间件中还应维护一份所有档案单位的目录,供客户端选择。
由于目前各地档案单位数字化水平不一致,投入使用的数字化系统采用的技术与信息存储和传输格式没有明确的标准,想要直接建立起这样一个系统几乎是不可能的,因此,本文将异地档案查询系统的构建分为两个阶段:
阶段一:实现档案馆之间请求数据与回复数据的通道
在这一阶段中,在一个节点收到档案查询请求之后,将由工作人员完成档案的查询,再将档案数据发送给“异地查档系统中间件”,这一阶段中档案查询客户端需要同时具有“请求查询档案”和“回复档案数据”两个功能,如图2。
图2 异地查档系统:阶段一
在这一阶段中还应规定客户端与中间件通信的消息格式,以便于在进入第二个阶段最大程度上保留第一个阶段开发的结果。消息格式采用的标准将在下一节中详细介绍。
阶段二:本地节点实现自动从数据库中完成查询,返回档案数据
这一阶段的主要目标是在各档案单位部署具有统一接口的“档案查询服务”。对于还未对档案进行数字化管理的单位,可以直接部署系统配套的“档案查询服务”;对于已经有数字化管理系统的单位,可以选择部署新系统的服务,也可以选择部署一个“档案查询服务代理”,从旧系统查询数据返回给中间件,这一阶段的架构如图三,其中节点A对应使用新系统的方案,节点B对应使用服务代理的方案。
图3 异地查档系统:阶段二
安全性:
由于档案信息涉及到个人、群体或国家的秘密,档案系统工作人员接受过良好的保密培训,日常工作也都会近距离接触档案,因此系统最重要的便是确保档案数据在传输中不会泄露。在网络中,任何数据都是以同样的形式传输的,要确保数据的安全性必须使用加密算法进行加密。档案数据的加密可以使用非对称加密的RSA算法与对称加密的AES算法相结合的方式实现。
目前,RSA算法是应用最为广泛的非对称加密算法之一,在RSA公开密钥密码体制中包含一组密钥对,即公钥和私钥,一般公钥对外公开,而私钥是私密的,由用户保管[2]。AES算法是一种分组密码算法,在扩散性混淆性等方面具有明显优势[3]。
在异地查档系统中,信息加密发生在“异地查档系统中间件”内部,每个节点上运行的每个中间件服务有各自的RSA私钥,在一次数据传输的过程中,发送数据的节点生成一段随机的128位的AES密钥,通过AES算法对发送的数据进行加密,再用自己的RSA私钥加密本次生成的AES密钥,将这两份加密好的数据发给中央节点的中间件,由于各节点的RSA私钥之间不能互相解密,所以中央节点需要用自己的RSA公钥对收到的AES密钥数据进行解密再加密,然后发送给目标节点。目标节点得到数据后,先通过RSA私钥解密得到AES密钥,再通过AES算法解密得到原始数据。
数据传输格式:
传输的数据由数据头、AES密钥、数据体三部分构成,由于敏感信息已经加密,可以采用明文传输的HTTP协议[4],将数据头加入HTTP请求头,ARS密钥和数据体封装到HTTP请求体中进行传输。数据头中的信息应包含请求发起节点代号,目的节点代号等表示信息。
毋庸置疑,面对大数据信息化的发展总趋势,构建档案异地查询系统,势在必行。而如何加快这个进程,这就需要有关领导重视与支持,相关专业人员深入研究、提出解决方案,各行各业勇于践行,形成一个共同为实现“建设数字中国”发展战略而拼搏奋力的“数字大军”,完全可以预见,实现档案异地查询目标指日可待。