王飞
近年来,随着信息技术的迅猛发展,国家对档案馆的信息化建设越来越重视,各省、市对数字档案馆建设提出了新的要求,也在持续加大支持力度。国家档案局发布的《数字档案馆建设指南》中数字档案馆的定义是指各级各类档案馆为适应信息社会日益增长的对档案信息资源管理、利用需求,运用现代信息、技术对数字档案信息进行采集、加工、存储、管理,并通过各种网络平台提供公共档案信息服务和共享利用的档案信息集成管理系统。可以说,数字档案馆建设就是一项系统工程,无论顶层设计规划系统架构,还是集约型开发建设,都要统筹考虑与其他部门之间的系统交互和接口问题,因此研究数字档案馆系统架构,做好整体设计,是建设数字档案馆的重要一环。
一、数字档案馆系统架构现状和特点
目前,各省市都在建设或者建成数字档案馆,仅就数字档案馆系统而言,大多数数字档案馆系统架构中数据库构成还是以馆藏档案数字化内容为主,以接收电子档案的增量数据为辅。系统支撑硬件和网络设备以国外产品为主,国内自主可控产品为辅。系统运行网络以局域网为主,以政务网和互联网提供档案业务服务为辅。可见目前的数字档案管理系统的特点,主要还是体现在提升档案馆自身档案业务管理信息化水平和馆藏档案资源管理和利用效率方面,而在对外实现档案信息资源互联互通,服务电子政务发展等方面的作用相对较弱。因此为了推动各部门做好电子档案规范化管理,提升电子政务能力,把数字档案馆建设放在打通数字政府最后一环的重要位置。为了建设档案信息资源共享服务平台,推动档案数字资源跨区域、跨部门共享利用。为了建设自主可控的数字档案馆系统,确保档案信息系统绝对安全,都需要对数字档案馆系统架构进行研究,提出切实可行的数字档案馆系统架构解决方案。
二、数字档案馆系统架构的发展趋势
一是数据结构越来越复杂。从数据库构成来看,数字档案馆的数据构成是以数字化档案信息为核心的信息资源库,除了接收进馆的电子档案外,还有馆藏实体档案的数字化成果,即通过数字化扫描转变为计算机可识别和处理的数字信息。从数据库类型看,有关系型数据库和非关系型数据库,如电子档案的目录和元数据都属于结构化数据,适用于关系型数据库,而电子档案和传统载体档案数字化副本等内容数据属于非结构化数据,适用于非关系型数据库,而这两者在档案数据存储和管理可形成互补,形成统一的关系型数据库和文档型非关系数据库组成的数据库系统。从数字档案种类看,数字档案馆系统管理的数据类型越来越多,包括文档、网页、音频、视频、图像、社交媒体数据、邮件等各种类型的数字档案。
二是信息结构标准越来越统一。统一标准的信息结构是数字档案信息交换和共享的前提条件。在数字档案馆系统建设中,需采取统一的标准规范来保障数字档案格式的一致性,只有做到信息结构标准统一,才能打通电子文件从生成、运转、归档、进馆整个链条,形成电子文件成闭环管理,才能管理好电子档案,为建设数字政府服好务,打通数字政府建设最后一环;也才能为建设互联互通的档案信息共享平台,实现数字档案信息的共享利用做准备。
三是网络架构层次越来越丰富。数字档案馆系统是以实现资源共享和网络化信息服务而建立起来的信息集成系统,在档案接收和利用服务中可借助计算机和网络系统突破时空限制实现档案信息的传递。因此数字档案馆系统按照服务的对象和数据的开放程度,需要在局域网、政务外网、政务内网、互联网等四个网络进行部署。其中,局域网是数字档案馆的核心,所有数字资源汇聚于此形成档案资源总库,提供“收管存用”四大功能。政务外网主要服务电子政务,是实现档案信息互联互通的主要通道,虚拟档案室为省直各单位提供电子档案管理服务,归档中心为政务服务及审批事项电子档案提供实时在线归档和单套制管理服务,以及为立档单位提供开放档案查询利用和档案移交接收等服务。政务内网比较简单,提供涉密档案移交接收和管理利用功能。互联网提供公开档案查询、展览和向社会档案征集等功能。
三、数字档案馆系统架构和功能解析
数字档案馆建设一般包括基础设施建设、应用系统建设、信息资源建设、标准规范建设、保障体系建设等内容。根据数字档案馆建设内容和信息化项目系统架构特点,数字档案馆系统架构一般应由基础层、数据层、平台层、应用层、接入层以及标准规范和安全运行保障体系等七部分内容组成。其中基础层是整个数字档案馆系统运行的环境和基础,主要是服务器、存储和各网络环境中的交换和安全设备的设计规划;数据层是数字档案馆数字档案信息的存储、交换和共享方面数据库的设计规划;平台层是系统开发和运行所需要的中间件和通用软件的设计规划;应用层是系统开发需要实现具体功能需求的设计和规划;接入层是系统将来需要接入和使用的所有用户的计划安排;标准规范体系和安全运行保障体系是系统能够研发成功和正常运行的基础和保障。具体如下:
(一)基础层
基础层是数字档案馆系统架构中所有应用系统正常稳定运行的支撑平台,包括机房、供電系统、消防系统、安防系统、温湿度控制系统等设施,信息存储计算所需设备包括主机、储存、备份等设备,以及配套的操作系统和数据库基础软件系统和网络通讯所需设备包括局域网、政务外网、政务内网、互联网等网络所需交换机、防火墙、入侵检测、安全审计等网络安全设施等。另外,数字档案馆建设采购设备一般要符合信创要求,采用自主可控产品,主要线路需采用光纤铺设,关键网络设备冗余,网络系统建设包括核心交换区、数据中心区、用户接入区,安全需采用等保三级等。
(二)数据层
数据层即各种类型的档案信息资源库,是数字档案馆系统架构的核心,所有数据均在此汇聚、管理、存储、交互、转换。信息资源数据库的建设,不仅为档案馆自身数字档案馆系统提供数据支持,还可为其他部门提供数据共享服务。根据档案部门信息资源的类型和用途,可建立档案资源总库、档案接收库、档案利用库、档案专题库、数字化加工库、长期保存库等数据库。管理的数据包括文档、网页、音频、视频、图像、社交媒体数据、邮件等各种类型的文件。数字档案馆系统架构需要数据层在政务外网、政务内网和局域网等多个网络部署,因此数据库设计根据需求,分别在不同网域进行设计,具体如下:
政务外网:政务外网接收库、政务外网利用库、馆际共享库、政务服务网归档库。
政务内网:政务内网接收库、政务内网利用库。
局域网:档案资源总库、馆藏档案利用库、档案离线接收库、档案数字化加工库、长期保存库。
为了确保数据安全,数字档案馆系统架构中各个数据库之间的数据交换方式有所不同,如:局域网和政务外网是物理隔离,为了确保安全,数据交换需要手工摆渡,互联网和政务外网是逻辑隔离,通过数据交换平台实现数据交换等。
具体如图所示:
(三)平台层
平台层指基础和通用的平台和工具软件,包括基础组件平台、系统管理平台、报表自定义平台和系统配置平台等应用基础平台,以及文件格式转换工具、电子文件检测工具、通用格式浏览工具等工具软件,包括中间件、智能OCR、全文检索系统、办公软件、检索软件等,这些架构在平台上的应用系统一方面可以大大缩短开发周期,降低系统建设风险,另一方面可以大大提升系统的性能和稳定性。
(四)应用层
应用层是数字档案系统架构最核心部分,这里将实现数字档案馆系统所有技术应用,汇聚了所有数字档案馆具体的应用系统,是解决数字档案馆具体问题的关键环节。应用层包括电子档案移交接收系统、电子档案管理系统、电子档案利用系统、电子档案长期保存系统等应用模块,值得注意的是实际上应用层的系统架构需要在局域网、政务外网、政务内网和互联网等四个网完成,具体如下:
1.局域网域。主要为档案馆内部提供数字档案资源的“收、管、存、用”等数字档案馆的核心功能,是传统数字档案馆的建设核心,支持开展数字档案离线接收、档案辅助鉴定、档案编研开发、档案数字化、档案查询利用、数据安全备份恢复等工作。主要应用系统包括:档案接收系统、档案管理系统、电子档案长期保存系统、档案利用服务系统、档案数字化系统、虚拟库房管理系统等。
2.政务外网域。主要为各立档单位提供虚拟档案室服务,为政务服务网提供政务服务事项电子文件归档服务,为各档案馆之间提供馆际共享等服务,是对外实现电子档案互联互通和信息共享的核心区域。主要应用系统包括:虚拟档案室系统、政务服务网归档中心系统、电子档案移交接收系统、立档单位查询利用系统、馆际共享利用系统等。
3.政务内网域。主要为各立档单位提供涉密数字档案信息的接收、保管和利用等服务,是数字档案馆系统涉密电子档案数据传输的重要途径。主要应用系统包括虚拟档案室系统、电子档案移交接收系统、立档单位查询利用系统等。
4.互联网域。主要为社会公众提供公开档案信息查询、档案征集、档案展示等服务,是数字档案馆系统公开档案提供征集、利用和展示的窗口。主要应用系统包括手机查档系统、互联网信息采集系统、档案展示系统和档案征集系统等。
(五)接入层
接入层是指数字档案馆系统服务的用户和对象总和。数字档案馆的系统将通过接入层向档案馆内部工作人员、立档单位人员、社会公众提供服务,角色包括领导、档案管理员、利用人员、系统管理员等,并在权限允许的前提下实现相关的数据访问和应用操作功能。
(六)标准规范体系
数字档案馆系统建设,还需要建立一套与之相适应的标准规范和运行保障体系,为数字档案馆系统正常运行作保障。这是数字档案馆系统实现各级各部门电子档案的互联互通和数据交换的基础,只有制定相关的技术规范,才能将数字档案馆的服务前移,实现电子档案前端控制,通过数字档案馆电子档案移交接收的规范性,倒逼各部门电子档案归档的规范化,最终实现电子档案生成、运转、归档、进馆全过程规范化管理。实现以上目的,要研究制定的标准和规范内容:
1.OA办公系统归档模块技术规范。用于解决立档单位OA办公系统中电子文件归档难题,确保电子政务中电子档案的生成、运转和归档等过程都实现规范化,对电子档案进行前端控制。
2.政务服务类電子文件归档技术规范。研究制定政务服务类电子文件归档技术规范,为政务服务事项电子文件归档建立具体可行的标准规范,为实现政府服务类电子档案单套制管理提供技术支撑。
3.电子档案归档和管理技术规范。通过数字档案馆虚拟档案室子系统的开发设计,制定各单位档案室电子档案管理方面的具体可行的技术规范,确保电子档案移交前的规范性。
4.电子档案移交与接收技术规范。按照国家电子档案移交接收相关标准规范,从技术和可行性方面进行深入研究,制定具体可行的电子档案移交接收方面的标准要求,把好电子档案入口关。
5.档案数字化技术规范。数字档案资源建设是数字档案馆系统建设的重要内容,为了确保档案数字化的质量,要根据国家标准,从数字化质量、目录著录挂接、原文存储结构命名、OCR识别等方面总结经验做法,制定可以实现档案数字化副本长期保存、数据交换和数据挖掘的档案数字化技术规范。
(七)安全运行保障体系
信息化项目确保安全是第一位的,因此系统架构要建立安全运行保障体系,严格按照国家计算机信息系统安全方面的有关规定和要求,将安全方案纳入数字档案馆的总体设计方案。安全运行保障体系要运用先进技术,全面强化安全管理,建立健全防范机制,确保应用系统和档案数据的安全。建立统一的信息安全管理体系和安全管理框架,从安全管理制度、安全管理机构、安全管理人员、安全建设管理及安全运维管理等方面进行系统规划设计,建立统一的网络安全管理系统,落实各项管理制度等。
以上数字档案系统基本架构是目前数字档案馆系统建设所需的基本要求,五层系统架构和两条保障体系是目前数字档案馆建设可以参考的基本框架。
参考文献:
1.《数字档案馆建设指南》(档办〔2010〕116号)
2.《数字档案馆系统测试办法》(档办发〔2014〕6号)
3.《基于文档型非关系型数据库的档案数据存储规范 》DAT 82-2019 《电子档案移交与接收办法》(档发〔2012〕7号)
4.《政务服务事项电子文件归档规范》(DA/T 85-2019)
5.《档案移动服务平台建设指南》(DA/T 73-2019)
6.《电子信息系统机房设计规范》(GB50174-2016)
7.《关于印发档案信息系统安全等级保护定级工作指南的通知》(档办发〔2013〕5号)
作者单位:河北省档案馆(河北省地方志编纂委员会办公室)