薛四新/清华大学档案馆
2016年4月,国家档案局发布《全国档案事业发展“十三五”规划纲要》,提出“有条件的部门开展电子档案单套制、单轨制管理试点”[1]要求,旨在引导各单位逐渐地将信息化环境下生成的原生电子文件,无需打印成纸质仅以电子方式进行归档和保管,促进电子文件管理走向科学化。这不仅能够降低电子环境下文件档案管理的行政运营成本,而且能够提升管理工作能力和效率,实现电子文件的电子化归档和电子档案的系统化保管。中国石油、中国石化、天津轨道集团、交通银行、福建福清核电、江苏核电、国泰君安等33家企业率先被国家档案局和国家发展改革委遴选为电子文件归档和电子档案管理的第一批试点单位;截止到2019年4月,此33家企业全部通过了试点验收[2]。试点工作的开展推动了档案领域信息化系统建设和现代化管理业务开展,促进了以“电子为主纸质为辅”的档案工作新业态的快速形成,标志着我国电子文件和电子档案单轨制工作进入了快速发展的新轨道。总结和分析这些试点工作的开展,就会发现推行单轨制,要想达到电子文件电子化可信归档和电子档案系统化安全管理的理想状态,还有许多难关需要突破,重点体现在以下几个方面。
一是单轨制政策难以彻底执行。各单位基于系统开展管理工作时,依然会产生一些纸质文件,归档时虽然对纸质文件进行扫描处理,但仍然会同时将纸质文件进行归档保存。二是电子文件的档案化处理缺乏标准和规范。归档电子文件是否需要电子签章、电子签名,是否需要进行唯一标识和编号,归档电子文件是否需要进行封装以及如何封装等,缺乏系统层面的电子档案数据结构和存储标准的质量要求。三是电子档案的质量检查不够全面。目前主要进行电子档案四性检测,但缺乏对电子档案的查重处理、电子档案存储格式(如OFD、PDF)的标准符合性检测。四是电子档案的入库处理和数据库建设不够精细。电子档案的“原件”“衍生件”“备份件”是否需要进行分库保存,如何在网络环境下保障电子档案原件的凭证性还有待深入研究。五是电子文件在线归档系统的功能不够全面、自动化处理程度不够强大。哪些业务可以由系统自动进行,哪些业务需要人工参与,自动化处理过程中系统与档案人员职责如何界定?这些问题需要认真思考。六是跨网络、跨平台的归档处理业务如何更方便、更安全地进行?离线的档案移交和数据交换如何确保电子档案不丢失、不被篡改?解决这些问题的关键在于分析电子文件可信归档和电子档案安全保管的业务框架,细化每个业务过程及其具体的实施策略和方案,从系统功能、数据结构、业务规则和技术实现等方面制定更为详细的电子档案管理标准和规范,引导和指导单轨制工作的有效开展。
归档是文件转变为档案的关键业务过程,是档案机构及其人员接管文件管理权限的起点。电子环境下,机构各类电子文件是在各业务部门使用的办公自动化系统(OA)、企业资源管理系统(ERP)、财务系统、电子政务或电子校务等各类前端的业务系统或终端电脑上形成。这些业务系统通常是以围绕其职能活动过程的“事项”形成各类数据、记录和文件,并多以关系型数据库方式在业务系统中进行结构化存储[3]。早期建设的一些业务系统基本都缺乏文件归档功能,由此在启动电子档案单轨制工作时,首先需要对这些尚无归档功能的业务系统进行升级改造,增加电子文件归档处理功能;同时,也需要对档案人员正在使用的档案管理信息系统的归档接收和登记入库的功能进行改进,甚至需要重新开发增加新功能。譬如,增加四性检测功能、电子档案的凭证性验证、电子档案的封装和格式转换等功能。图1梳理了基于系统开展电子文件电子化可信归档和电子档案系统化安全保管的关键业务。其中,文件捕获整理和文件归档处置是生成电子文件的业务系统中应具备的归档功能,归档文件质量检查、电子档案入库处理、档案管理系统(通常包括档案长期保存、档案管理和档案利用三类系统)是电子档案系统应具备的必要功能。
图1:基于系统的电子文件归档和电子档案管理的业务框架
从图1可以看出,单套制工作模式下,前端业务系统需要新增电子文件的档案化处理和电子化归档功能,后端的档案管理系统需要增加电子档案入库前的质量检查、凭证性验证和入库后的基于“分库”思想的精细化管理功能。特别的,基于系统开展电子文件归档和电子档案管理需要一个安全可信的公共支撑环境,譬如需要实现电子签章的CA认证服务、需要有前后统一和管理连续的电子文件与电子档案接口标准与技术规范。电子档案来自于不同行业、不同种类的业务及其系统,有电子公文、电子会计档案、产品数据档案、工程基建图纸与三维模型、信息化项目、录音录像等各种类型,即便是同一类型的档案,也会由于业务系统的建设具有技术平台、数据存储和技术方案的不同而具有异构性和非标准性。由此,单套制归档业务中最基础、最重要的任务就是确定业务系统中文件、记录和数据的归档范围、归档文件及其元数据的捕获方式与档案化处理规范。不同种类文件的档案化处理要求和方法也需要进行个性化定义和程序化约定。目前,通过试点的33家单位,主要在电子公文、电子会计档案和CAD文件电子化归档方面进行了一些有益的探索和试验,建立了一定范围内电子文件单轨制管理的应用系统,积累了一定的基础和经验,但依然还有很多难点和重点问题需要进行突破,特别是在电子文件的可信性、电子档案的凭证性和档案数据库的精细化管理等方面,需要进一步结合单轨制业务模式进行深入探索和研究。
实行单套制管理,业务系统和档案系统的升级改造是不可避免的。就目前已经通过验收的单轨制试点工作情况看,各单位基本上是对某个系统中形成的某个类型的电子文件实现电子化归档,其中共性的、重点难点问题还需要进一步提炼和总结,才能够进一步促进单轨制业务的全面推进。本文针对图1中提出的单轨制业务框架,重点从可信生态环境的建设、电子文件电子化可信归档、电子档案分库管理三个方面阐述应进一步重点解决的重点和难点问题。
云计算、区块链、人工智能等新技术的快速发展和广泛应用,推动了各行各业信息化系统的普及与深化,电子文件广泛生成但缺乏科学有效的管理,造成业务系统因滞留了大量的历史文件而运转效率低,系统维护和数据备份的成本高,系统升级时造成数据丢失等系统隐患和数据失信等问题[4]。这是当前单轨制实施最大的障碍,解决这一问题,需要重点从以下几个方面进行突破。
第一,建立电子文件归档和电子档案管理的标准规范和管理制度体系,促进机构内部电子文件管理文化的逐步建立和单轨制工作的有序开展。机构内部任何一名员工都可能是电子文件的形成者,每位员工应对其制作、使用和归档的电子文件的真实性、完整性和有效性负责,电子文件单轨制工作的顺利开展必须是全员参与和整体行动[5],任何一个环节的疏漏都会造成潜在的风险与隐患。
第二,建立面向各个业务系统共享使用的统一数据接口和统一编码服务系统,保障各类电子文件交换和共享使用时的一致性、便捷性和有效性。电子档案管理工作是将各业务系统中形成的各种类型的电子文件进行逐步聚合并进行系统化关联管理的过程,这就需要每类电子文件在共享使用、数据交换,特别是归档时按照电子档案管理的具体要求进行规范化统一处理,需要对每一份电子文件赋予唯一标识,以确定其来源与身份,因此应从机构全局设计和规定每类电子文件的编码规则,就像为机构内部每个部门、每个人员、每个系统赋予唯一代码一样,机构需要从全局角度规定每一类电子文件的编码规则,确保每份电子文件形成时就具有唯一的编号,以及与每份电子文件相关的文件与附件能够通过电子文件的编码建立关联关系。
第三,建立面向各个业务系统和档案系统共享使用的数字签名、身份认证、时间戳等公共服务设施与系统及其使用规范,保障电子文件和电子档案的法律效力和原始凭证性。推行单轨制工作,不仅仅要在电子文件归档时使用电子签章,更需在电子文件形成的关键业务如起草、审核、批复和发布等环节记录其证据信息,保障关键过程的真实可信;同时,还应在档案接收、入库、鉴定、处置和格式转换、数据迁移等可能造成电子档案被修改的关键业务环节使用数字签名和时间戳,保障电子档案管理业务过程信息的可追溯性。
由此,各单位在推行电子文件单轨制时,不仅仅是局部的业务系统的功能改造,更重要的是机构全局的电子文件管理文化和可信运作体系的形成。
电子化可信归档是单轨制工作的关键业务,它涉及归档部门和档案部门双方的业务协同与信息交互、标准规范的共同制定和一致遵从,以及电子文件管理对象与权限的转移和交接。“一键自动归档”[6]和可信归档的实施是单轨制工作需要达到的理想效果,要实现这一目标,还需要重点从以下几个方面进行突破。
第一,建立归档移交的业务规范,开发能够实现自动化处理的系统功能,确定归档移交过程中相关责任者的职能和系统承担的角色。电子文件归档不再像纸质档案一样需要进行组卷,而是以“件”为单位进行归档,“组件”则成为归档系统必备的功能。它是以“事项”为单位将事项办理过程中的主文件、附件及相关依据性文件进行归类、排序和编号,形成符合电子档案管理要求“归档件”,这个过程需要档案部门与文件形成部门(复杂的事项通常会涉及牵头部门和多个参与部门)对现有系统中文件的形成规律和存在形态进行详细分析,明确归档责任部门、实施归档的业务系统、归档范围、归档计划、归档电子文件的数据格式与有效性构成要素、归档文件整理方法和归档实施的技术路线,确定归档移交的业务规范和技术标准并基于此开发归档移交的系统功能。“归档件”移交是归档部门与档案部门之间的业务交互并通过系统进行实现的过程,即归档部门需要给予业务系统发起归档任务并发送消息给档案部门及其使用的档案系统,档案系统需要对“归档件”进行质量检查、确定是否入库、返回归档成功与失败消息,并记录归档过程信息。要想完全实现系统自动化处理,则需要预先针对每个业务系统中每类事项形成的每件电子文件进行详细分析,设计归档策略和归档业务的处理规则,明确系统自动化处理的功能与归档相关责任者之间的角色关系。因此,系统自动化功能的实现是需要预先将责任者的职能及其业务规律和工作标准嵌入到系统中,由系统代替人工完成任务,这将会带来电子环境下系统自动化处理业务的电子签名责任,以及文件和档案人员角色变化等相关问题[7]。
第二,建立电子档案管理的技术规范,检查归档电子文件的质量,采用技术方法确保电子档案归档过程的可信性。电子档案的质量要求和长期保存方法决定了归档电子文件整理和移交的技术标准,电子文件元数据结构、电子文件的组成要件、电子文件的存储格式、归档时如何“组件”、是否需要进行封装等都是电子文件归档系统功能开发前要确定的技术规范。目前多数档案系统实现的四性检测功能是参照《文书类电子档案检测一般要求》(DA/T 70-2018)进行设计,主要从电子文件信息包的规范性,电子文件的元数据、内容信息及其关联性等方面对其真实性、完整性、有效性和安全性进行检查,但是普遍缺乏对电子文件存储格式的标准符合性进行检测,如归档的一份OFD文件是否符合国家标准《电子文件存储与交换版式文档》(GB/T 33190)中的相关规定和存档保管的要求。一个符合GB/T 33190要求的OFD格式文件可以是包括元数据、文本和图像3层结构的电子文件,如果仅以图像方式进行归档形成的电子档案,是无法支持全文检索、文件内容信息语义关联和目录索引等功能的。另外,电子文件归档过程中通常需要采用商用密码算法对归档信息包、归档电子文件及其组件生成数字摘要等技术,以保障归档过程的可信性,更重要的是可以支持电子档案“查重”功能的实现,并确保已归档的电子档案信息包不再重复归档,已归档的多个部门共享使用的一份电子文件不再被重复归档。譬如,一份电子合同已由法务部归档,在会计凭证归档时该份电子合同就没必要作为合同付款业务记账凭证的附件再次归档,只需要建立记账凭证与归档电子合同的关联即可。系统“查重”功能的开发不仅能解决各机构内部共享使用的电子文件重复归档问题,而且能够促进机构信息化规划人员重新思考多个业务系统实现电子文件归档业务的协同与集成,甚至会触发机构人员从全局角度研究如何优化和重组机构内部的跨部门的信息化系统体系结构,通过建立公共的电子文件服务中心,实现系统间的文件共享,增强电子文件的科学管理和有效利用。
基于分库思想实现电子档案的精细化管理,是许多试点单位按照档案的归档件、长期保存件、复制件或利用件等基本形态,以及档案机构内部的网络与基础设施情况而采取的技术方案。要想实现对档案资源的精细化管理,还需要重点从以下两个方面进行突破。
第一,依据电子文件归档和电子档案管理的实际环境,科学设计和合理规划档案数据库,支持电子文件可信归档和电子档案的长期保存与有效利用。如图1所示,一个支持精细化档案业务管理的信息系统,在数据库建设时,通常会设计归档文件库、档案长期保存库、档案管理库、档案利用库、凭证库和备份库等。其中,归档文件库是临时的,当归档文件通过质量检查入库后转变为电子档案,归档文件就可以删除;档案长期保存库用来保存原生电子文件及其归档时按照电子档案保管要求而形成的电子档案的“原件”,维护电子档案的原始凭证性,通常以物理隔离(如刻录成光盘、存储在单独的服务器)方式进行专门保管,有条件的单位可以考虑建立专门的电子档案库房与长期保存系统;档案管理库支持档案人员利用档案管理信息系统开展档案的归档接收、质量检查、入库处理、鉴定处置、格式转换、数据迁移、统计检索、公开发布和出库移交等业务,其存储的数据包括档案目录、档案复制件和档案业务过程记录,用于支持档案管理业务的实现与审计,以及档案工作的统计分析与辅助决策;档案利用库是档案机构面向用户提供开放档案的查询、检索和浏览的数据库,或者针对特定或专门的档案利用者而临时生成的个性化档案数据库,利用库中的档案是档案管理库的子集。具体实施时,档案利用库与档案管理库可以是逻辑权限上的区分,也可以是物理上的单独存储,这与档案部门开展利用服务的业务范围和网络环境及其安全要求有密切关系;凭证库是用于支撑电子档案可信管理而设计的,专门用于记录电子档案的凭证信息并支持电子档案凭证性验证,是独立于档案的长期保存库、管理库和利用库的数据库;备份是为应对突发事件而由系统运行维护人员开展的一项日常业务,所形成的备份库内容主要包括档案系统程序、前述各类档案数据库和系统运行基础数据等。
第二,制定电子档案相关的数据库管理和运行维护方案,处理好多个档案数据库间的数据同步问题,保障多个档案数据库中同一份电子档案在内容信息上的一致性。档案数据库是档案系统正常运行和档案业务顺利开展的基础支撑,档案数据库中各类档案的分类、组织、关联、存储格式与存储空间等都需要有明确的技术实施方案,归档文件在通过质量检查后,入库时应依据长期保存库、档案管理库的要求分别进行处理,长期保存库中的电子档案通常以档案信息包的形式进行整体性的保管,以维持档案入库时的“原貌”,因此电子文件的元数据、内容和结构等通常以格式化文件的形式进行统一封装,譬如文档类文件三层结构的OFD或PDF就是其中一个典例,也就是说长期保存库中存储的电子档案应为归档入库的“原始件”;对于档案管理库,在档案管理系统接收归档文件入库时,通常需要对归档文件信息包进行拆分,形成电子档案元数据和档案目录数据库,并以关系型数据库方式进行管理,以方便检索、查询和统计,档案管理库中的电子档案通常采取降低分辨率、增加水印、加盖电子签名等技术,保障网络化环境下档案系统的高效、安全和可靠运行,但是需要保障电子档案的元数据和内容信息在多个数据库中是一致的,因此多个数据库的结构设计和多个数据库之间的档案信息的一致性是数字档案馆建设和运行维护需要解决的又一重点问题。
电子化单轨制是实现电子文件科学管理的主要途径,是档案机构未来开展现代档案管理工作的一项重要业务。由于各单位的信息化程度、水平和实施范围参差不齐,同一单位的不同系统中形成的电子文件,在数据结构和存储格式等方面也不完全相同,因此在实施电子化归档时,需要针对每个业务系统中的每类电子文件进行个性化的分析,并设计和开发特定的归档处理功能,实现对每类现有业务系统进行功能升级和改造,这其中最重要的还是需要 档案部门制定电子文件归档和电子档案管理的统一标准和技术规范,如此才能从系统功能开发和数据结构设计的微观层面推动单轨制业务的科学开展和规范实施。