杨晶晶
摘要:在新形勢下,建设企业高质量档案数据中心势在必行,我们通过档案数据的自动归类整合与分析,可以有效保障企业档案数据安全及实现档案数据应用。该文论述了企业档案数据自动分类管理的目标、意义、规则设置、实施以及管理模式等,以期将档案数据自动分类管理进一步推广,使其成为企业中一项可持续、可执行的常态化工作。
关键词:档案数据 数据分类 数据管理 自动化
在数字时代背景下,企业档案数据增长快、体量大。为充分发挥企业档案数据的资产价值,使其能够准确、清晰地反映业务经营成果,进而推动企业高质量发展,企业在业务经营管理过程中,就需要深入开展档案数据管理,对档案数据分类管理模式做进一步的研究与创新。这里需要指出的是,本文中所提及的企业档案数据自动分类主要是借助专业系统对前端业务系统收集归档到数字档案馆中的数据实现自动组卷/件、分盒、添加管理标识等。
企业档案数据自动分类管理的目标主要在于实现企业档案数据自动整编功能,按照整理规则对整编库中的数据进行模拟组件、装盒,生成档案著录项,自动添加文件标识,比如归档章、条形码、页码等,并由管理员进行复核审查,完成档案的整编。
企业档案数据自动分类管理的主要意义在于:第一,实现全程系统控制,减少了人工著录,降低了著录错误率,提升了规范化水平;第二,极大地提高了档案整编的工作效率,降低了人力物力成本;第三,提高了档案整编的规范性,在整编过程中规范归档章、页码、条形码等格式及内容;第四,提升了企业档案数据管理水平,优化了其管理、存储、利用整体过程。
(一)企业档案数据自动分类管理目标
1.实现档案数据自动组卷/件,主要实现途径为:数据组卷/件规则的设置、程序设计以及系统处理。
2.实现档案数据著录及编码,主要实现途径为:数据著录规则设计、数据编码规则设计以及系统处理。
3.实现档案数据标识及归档管理,主要实现途径为:数据标记及添加水印、数据检查及处理、格式管理并生成归档文件。
4.实现档案数据模拟封装组盒,主要实现途径为:数据模拟封装规则设计、程序设计及系统处理。
(二)企业档案数据自动分类规则设置
企业档案数据自动分类管理功能应与统一管理平台无缝对接。在改造升级时,二者可以同设计、同开发、同测试、同实施,功能建设尚未一致的应及时通过二次开发实现。
自动格式转换是实现自动整编及打印的前提,并且有利于数据及电子文件的长期保存,统一的格式有助于模拟组件、分盒、添加页码标识等;自动整编是系统整体承上启下的重要步骤,是实现自动化管理、解放人力物力的关键,管理员的角色也由档案整编者向审查者转变;全文检索有助于提高查询利用效率。各个分项功能互相关联,最终助力企业实现档案数据的自动化分类管理。以下为具体系统规则设置要求。
1.系统设置组卷题名规则为“年度+部门”,数据库待整理中的文件按照系统分类字段自动加入各个当前卷(除合同/资料类数据外)。
2.行政发文、行政收文、行政合同类数据组件规则为:同一部门及保管期限一文一件,按照文件形成时间排序,同时设置部门顺序。
3.生产合同类文件组件规则为:同一部门一文一件组件,按照文件编号排序。
4.档案数据模拟装盒规则为:同一部门同一保管期限内,根据文件页面数量判定盒号,盒号编制:01、02、03、04……NN。
5.档案编号规则为:全宗号+年度+保管期限+件号。
6.将整编库中每条数据对应的全部电子文件进行格式转换及文档合并,将电子文件按照批办单—正文—附件的顺序合并为一个PDF版式文档。
7.合并文档命名规则为:档案编号+文件编号+题名。
8.将合并后的PDF版式文档添加归档章、条形码、页码水印。
企业档案数据及电子文件归档依据企业文件材料归档范围和数据保管期限表执行,电子文件的背景信息和元数据的保管期限应与电子文件内容信息保管期限一致。电子文件及数据收集归档时间按照各类规定执行。
(三)企业档案数据自动分类管理的实施
企业档案数据自动分类管理的组织及实施过程如下所述。
1.系统对档案数据进行处理前首先需要进行数据检查,“数据检查”功能将针对打印任务中的数据进行文件下载、文件格式转换(将非PDF格式文件转换为PDF格式文件),在检查过程分别对正常的、异常的数据予以标记。
数据检查完成之后,系统就可以进行生成归档文件的操作。生成归档文件功能,可实现将数据进行标识后按照文件顺序合并生成一个版式文档,这样既便于数据应用,同时又便于数据的长期保存。
2.档案自动组卷功能需将组卷规则设置到程序设计中,启动程序后,该功能项将待组卷数据分类别归入不同数据卷内。
3.生成数据编码功能将会按照规则生成件号和档案编号。其中,件号的生成规则为:同一部门同一保管期限内按照文件形成时间升序排列,顺序生成三位编号(位数不够的,在数字前用“0”补位);档案编号的生成规则为:全宗号+年度+保管期限+件号。生成档案编号之前,系统会对必需的字段进行检查,当存在必需的字为空的情况时,不能进行档案编号生成,必需的元数据项为:部门、年度、保管期限。
4.自动模拟组盒功能按照部门、保管期限、页数的制定规则生成盒号,系统默认每盒页数不超过300页,不同部门、不同保管期限的数据不在同一盒中进行混装,装盒时按照“档案编号”字段升序顺序进行。在开始进行自动组盒之前,系统将对必需字段进行空值验证,验证的字段为:部门、保管期限、页数。
5.系统设置生成审批单功能,针对档案数据,根据数据目录生成PDF格式审批单文件,并且自动在生成的审批单文件中添加对应的条形码及归档章标识。
企业档案数据自动分类管理系统的功能属性如下所述。
第一,整编数据自动组卷管理,主要包括:组卷设置,即依据数据管理及分类编码数据设置组卷信息;数据分类程序设计,即通过程序实现类别判定自动化辅助;数据组卷结果存储使用,即对数据组卷完成结果予以查验,查验无误后,应用组卷分类结果开展数据管理。
第二,数据编码管理,主要包括:编码设置,即依据数据分类规则设定数据编码规则;关键字段验证,即对编码规则中必要的关键字段实施验证,验证通过后自动编码;数据编码实施并存储,即实施数据编码并将数据编码结果设定专门字段存储。
第三,线下登记数据管理,主要包括:数据标识,即对线下登记数据增加数据标识,便于与接口处收集的数据统一管理;数据格式维护,即将格式统一为版式文件;审批单设置及生成,即为线下登记数据设计与接口数据同类的审批单模板。
第四,数据模拟封装及自动组盒,主要包括:模拟封装设置,即根据数据容量的大小判定模拟封装设置规则;数据字段验证,即对开展模拟封装的必要字段进行验证,验证无误后开始封装组盒;封装盒号判定,即对封装盒号给出系统判定;封装依据设置,即根据实际情况修改封装依据的设置;加入当前封装盒,即对判定无误的数据加入系统给出的模拟封装盒;重新组成封装盒,即对判定不准确的数据重新组成模拟封装盒。
第五,数据处理,主要包括:数据检查,即对待处理的数据开展检查,对于检查正常的,进行数据处理,而对于检查异常的,待将异常数据处理完毕后再予以检查;生成归档文件,即为数据对应的电子文件添加标识等必要程序后生成可用于档案数据管理的归档版式文件;数据导出,即对待处理数据按照需求格式导出;数据合并上传,即数据对应不同电子文件的合并上传;数据格式管理,即数据格式统一转换为PDF版式文件予以管理。
系統建设前,企业档案管理员对于数据整编主要依靠手工操作,质量上可控度弱,影响了数据管理工作的质量及效率,因此亟须改进。随着技术的升级及高效管理的需求,企业需要在此基础上提升系统自动化管理水平,加强前端控制,提高管理的规范性及增强质量管控,降低人力物力成本,实现提质增效的目标。企业档案数据自动分类管理模式如图1所示。
企业档案数据自动分类系统按照规则能够实现电子文件自动组件功能,统计电子文件页数,模拟装盒,生成著录项及设计标识水印,实现电子文件全文检索等。这一系列操作大大提高了企业档案数据管理效率,节省了人力物力,进而可以推动企业提质增效,实现高质量发展。
参考文献:
[1]杨帆,王强.大型企业档案资源分类体系建设实践与思考.北京档案,2020(10):33-34.
[2]霍光煜,张勇,孙艳丰.基于语义的档案数据智能分类方法研究.计算机工程与应用,2021(6):247-248.
[3]王泓.电子文件自动分类方法概述.档案与建设,2017(1):29-31.
作者单位:中交第一航务工程勘察设计院有限公司