杨冬梅,郭晓翠
数字化转型背景下图书馆档案管理的问题与对策
杨冬梅1,郭晓翠2
(1.西安电子科技大学 网络与继续教育学院,陕西 西安 710071;2.中国农业银行审计局 西安分局,陕西 西安 710004)
档案的数字化提高了档案收集、保存、管理与应用的效率。本文分析了档案数字化工作中的主要工作内容以及数字化档案管理的主要流程,针对其中的财务档案报表数据结构化问题和不同业务信息系统原生档案的自动归档问题,从档案管理者方面进行分析,并给出了对应的要求与解决对策,为档案数字化工作提供了借鉴与参考。
数字化档案;数据结构化;自动归档
随着信息技术与网络大数据应用的发展与普及,档案作为人们在各项社会活动中直接形成的具有保存价值的原始数据,档案数字化以及数字化档案收集、保存、管理与应用越来越受到重视,档案数字化工作以建设档案共性数据库为核心,开发符合功能要求的综合档案管理系统,制定一系列标准规范,使各级档案馆成为档案信息资源的来源和基础,最终实现对数字档案信息资源的网络化管理以及分层次多渠道提供档案信息资源利用和共享服务[1]。
档案数字化及其管理系统建设的目标包括实现档案数据快速采集、实现海量数据的存储、实现档案信息的系统管理、实现档案信息的共享和实现数字档案信息的安全保护[2]。
根据不同单位自身特点和数字化档案建设要求,档案数字化与管理系统建设的工作内容包括六个方面,即:基础设施建设、档案资源数字化、综合管理应用系统开发、档案规范标准建设、人才队伍建设以及档案的安全保障体系建设,如图一所示。在这些工作中,管理系统的建设是档案信息化的工作抓手,也是各项工作的纽带[3-4]。
数字档案馆的基础设施建设包含系统软件的建设、硬件设施的建设还有网络环境的建设。其中,硬件设施包括服务器、终端、存储还有数字化的设备。系统软件包括操作系统和数据库系统。
建设数字档案馆的核心工作是信息资源库的建设。依据统一标准优先创建馆藏档案的文件级目录的数据库,逐渐再对以传统为基础的档案做数字化加工,以实现不同的信息平台所产生的文件的管理与接收,建立多个种类数字化的档案资源库。
各单位根据档案管理业务流程开发和应用具有“收、管、存、用”等基本功能的档案管理系统,在管理平台未统一的前提下,管理系统应包含数字档案资源采集模块、数字档案资源库管理模块、数字档案资源共享利用模块三个子系统的建设。
数字化档案管理系统的主要业务流程包括现行的文件管理、预立案卷的管理、档案的管理和借阅的管理四个部分。现行文件管理主要完成档案原始材料的收集、提交与组织,为预立案卷准备文件,包括文件编辑、原文编辑、文件分拣、文件所有者权限以及打印管理等主功能。预立案卷管理对现行文件进行自动或者手动组卷,生成预立案卷,主要完成现行文件组卷、案卷编辑、案卷文件等主要功能。档案管理实现档案库的管理功能,主要完成案卷管理、文件编辑、移交申请审批、销毁申请审批、档案删除与还原、档案更改等主功能。借阅管理实现档案的在线查询与借阅过程的控制,主要完成档案借阅申请、借阅审批、借阅发放、归还、借阅方式维护等主功能[5]。
图1:档案数字化与数字化档案管理系统建设工作的内容
根据国家标准和通用规范,制定和完善一系列的标准规范,规范数字档案建设内容,形成完善的标准规范体系。标准规范按照内容的划分分为三类,即技术性、业务性以及管理性标准规范。
安全保障体系的建设是数字档案建设的基础性工作,数字档案的安全包括数字档案数据和信息系统安全以及网络平台的安全。运用可靠的技术措施和完善的管理制度,建立数字档案馆安全运行保障体系,保证数字档案信息的可靠可用、不泄密、不被非法篡改,保持系统软硬件的稳定性、可靠性、可控性[6-7]。
财务报表是财务档案中的主要内容,一般数字化方法为利用扫描识别软件工具将财务报表档案扫描,然后再识别表头中的文字和表中的数字,而表头与数字之间的结构关系就丢失了,由此致使对财务报表的数据进行结构化的查询、统计时,无法进行或者无法得到准确的查询结果和统计结果。
为使数字化后财务档案报表数据可以进行准确的查询与统计,需对分散的报表数据进行结构化还原,即还原出报表数据中原始的对应关系[8]。目前大多采用人工后期校对加工的方法进行处理,这种方法效率低,也由于人的因素难免产生新的差错,为了避免这类因素的影响,多采用双层图文结构弥补此方法的缺陷。所谓的双层图文结构,即在识别数据的上层再覆盖一层原始扫描图片,这样在查看浏览时可以看到原始财务报表。但是该方法仍然解决不了结构化查询与精确统计的问题。为了解决财务档案报表数据结构化问题,通过对扫描识别系统的原理分析,建议采用财务报表数据词典与报表数据几何位置自动匹配的方法,恢复财务报表数据结构化信息。该方法首先根据财务报表数据在扫描图片中的位置信息,判断数据之间关系,再对文本进行语义分析,得出报表的表头文本,最后将报表数据归类到位置一致的表头下,从而完成报表数据的结构化[9-10]。
财务档案报表数据结构化处理基本流程包括纸质档案的扫描、扫描图片的校正、文本与数据识别、结构化信息计算等,最后输出为结构化的报表数据。
随着单位各类业务信息系统的应用,这些信息系统产生大量的数字化档案,这类档案在生成之初即是数字化的,所以成为原生数字化档案,通过档案管理系统与业务信息系统之间的接口可以实现原生数字化档案的自动归档。目前此类接口主要有以下三种方式,即:
(一)通过应用服务程序实现接口,这种方法又分为推送和读取两种方式;
(二)数字化档案管理系统直接读取业务系统的数据库,或者读取中间交换文件实现;
(三)通过数据库管理系统的功能实现数据库之间数据的直接交换,这种方法又分为存储过程和触发器两种方式。
第一种方法的优点是数据安全性高,缺点是对原有系统要进行接口设计与开发,增加原有系统的工作量。第二种方法的优点是可由一方完成,比如档案管理系统的开发方可以完成与其他各个信息系统的接口设计,缺点是需要对要接入的信息系统充分分析,要进行数据的安全性测试,以提高数据的安全性。第三种方法的优点是效率高,可实现档案文件的自动生成,缺点是对原有信息系统的数据库有一定影响,需要利用空闲时间运行。
具体采用哪一种方式自动将原生数字化档案归档,需要根据不同业务信息化系统特点具体分析,如果某一单位信息化建设水平较高,对不同信息化系统掌握充分,建议采用第二种或者第三种接口方式,实现档案管理系统与其他信息系统的接口。如果数字化档案管理系统已经建成,而某些业务信息化系统还未建成,即可按照第一种方式,要求后建的业务系统提供与档案管理系统之间的应用服务接口。表一所示为某单位业务信息系统原生档案的自动归档方式。
表1:不同业务信息系统原生档案的归档方式
档案的数字化工作设计各个业务部门的工作,开展此项工作之前不仅要从应用技术方面,而且更要重视从管理模式与流程方面进行完善的设计。本文仅仅分析了档案数字化工作中的主要工作内容以及数字化档案管理的主要流程,针对其中的财务档案报表数据结构化问题和不同业务信息系统原生档案的自动归档问题,从档案管理者方面进行分析,并给出了对应的要求与解决对策,仅供档案数字化工作参考。
[1] 叶文玲.高校档案数字化管理系统的设计与实现[J].兰台世界,2018(7):45-47.
[2] 梁惠卿.档案数字化、数字化档案和数字档案概念辨析[J].档案管理,2013(1):38-40.
[3] 吕和顺.信息化发展给档案工作带来的挑战与机遇——在国际档案理事会东亚地区分会2014年研讨会上的报告[J].北京档案,2015(1):5-7.
[4] 史建侠.对档案数字化管理工作的几点认识[J].黑龙江档案,2014(3):165-166.
[5] 梁兵.浅析档案数字化与数字化档案[J].贵州档案,2003(4):23-24.
[6] 苏桃.高校数字化档案系统安全性的思考[J].才智,2016(11):241-242.
[7] 周亚萍.高校数字化档案系统安全性问题探讨[J].科技情报开发与经济,2011(15):145-146.
[8] 李霄霄.基于OCR的字符识别的研究与实现[J].科技视界,2017(14):98,119.
[9] 李道奇.OCR字符处理软件在文档处理中的应用[J].交通与计算机,1997(3):33-34.
[10] 秦旭光,徐爱功.图像几何校正在OCR文字识别中的应用[J].辽宁工程技术大学学报,2006(S2):64-66.
The Key problems and countermeasures of archives digitalization and management under the background of digital transformation
YANG DONGMEI1, GUO XIAOCUI2
The digitization of archives improves the efficiency of collection, preservation, management and application of archives. This paper analyzes the main work content of the digitalization of archives and the main process of digital archive management. Aiming at the problems of data structure of financial archives and automatic archiving of original archives in different business information systems, the paper analyzes the problems from the archives manager's point of view, and gives the corresponding requirements and solutions, which provides reference for the digitalization of archives.
Digitalize archive; Data structuring; Auto-archivin
G278.6
A
1008-472X(2018)04-0024-04
2018-09-15
杨冬梅(1964-),女,河南开封人,西安电子科技大学网络与继续教育学院工程师,研究方向:数字化档案管理;
郭晓翠(1979),女,北京人,中国农业银行审计局,研究方向:金融审计。
本文推荐专家:
张喜民,陕西国际商贸学院,教授,研究方向:系统工程。
孙改玲,兵器工业第二零三研究所,高级工程师,研究方向:数字档案馆建设。