数据转型背景下的档案业务过程数字化策略研究*

2020-07-16 14:11
山西档案 2020年2期
关键词:机构数字化数字

(沈阳集美档案管理有限公司 沈阳 110015)

1 研究背景

当前,世界经济已进入新旧动能转换期,以云计算、大数据、移动互联网、物联网和人工智能为代表的新一轮科技革命和产业变革正在孕育兴起。数字化转型正在深刻改变着当今的商业形态[1],包括中国在内的许多国家政府机构都在不遗余力地推动“互联网+政务服务”,企业部门则是积极探索和实践业务流程“无纸化”和文件管理的“单套制”等。

在这一过程中,机构的业务信息系统每天需要处理的信息中,既有原生的电子文件和数据,也有非数字源信息,如纸质文件和照片等。这些非数字源文件需要在业务过程中转化为数字格式,才能够独自或与电子文件和数据一起纳入业务信息系统进行管理,执行与原生电子文件或数据相同的技术和业务处理程序,以保证业务系统运转顺畅。否则,机构因线上获得的信息无法保证完整性而不得不再通过线下去调阅实体信息。这不仅大大影响了工作效率,更无法满足远程化、分布式和移动网络业务处理这一越来越占主流趋势的需求。而现实情形是,在较长时期内,这种实体与电子记录长期并存的所谓“混合状态”仍是机构信息管理的常态。因此,在数字转型背景下如何实施业务过程数字化,将成为机构实现全面数字化转型成败的关键因素之一。

目前,国内数字化相关研究大多数围绕已归档的纸质和非电子档案的数字化,这得益于政府和企事业单位档案信息化建设步伐的加快,特别是2014年中央办公厅、国务院办公厅印发的《关于加强和改进新形势下档案工作的意见》和国家档案局提出的“存量数字化,增量电子化”发展战略的指引,要求加快推进传统载体档案数字化[2]。而在政府部门和企事业单位如何应对“混合状态”、处理业务过程数字化、实现全面数字转型方面的研究和实践成果相对较少,机构开展业务过程数字化缺乏科学系统的指导。鉴于业务过程数字化对数字转型的重要意义和关键作用,本文从数字化转型背景下机构应采取的业务过程数字化策略角度开展研究。

2 业务过程数字化分析

2.1 业务过程数字化与业务系统

业务过程数字化不同于传统的档案数字化,它嵌入在业务流程中,甚至是在机构的业务系统中实施和完成的。按照《GB/T34840.3-2017信息与文献 电子办公环境中文件管理原则与功能要求 第3部分业务系统中文件管理指南与功能要求》的定义,业务系统是指生成或管理机构活动数据与证据的自动化系统。一般来讲,业务系统主要包括旨在为机构部门与客户之间开展事务处理提供便利的应用程序。常见的业务系统包括电子商务系统、客户关系管理系统、为特定目的而构建的或为客户定制的数据库、财务或人力资源管理系统等。在政务服务方面,业务系统的应用也很广泛,包括网上行政审批、金税工程等。

2.2 业务系统与文档管理系统

业务系统的特征是包含动态数据,通常符合不断更新(实时)、能够转换(可操作)以及保留当前数据(非冗余)。电子文件与档案管理从广义的角度上理解也是业务系统的一种,文件管理的数字转型已成为世界范围内文件档案领域的普遍共识和发展大势[3]。目前国家档案局在全国范围内选择建筑、制造、商业、中介服务等多个行业的企业和政府机构进行试点,推动的电子文件归档与电子档案管理和单套制归档。从档案全生命周期理论看,业务系统与文档管理系统是对同一管理对象不同阶段的管理,它是一个连续的过程,两者需要密切配合,才能实现文件及其元数据的无缝管理。本文研究的重点仍是与机构数字化转型更为密切和关键的业务过程数字化问题。

2.3 业务过程数字化与传统档案数字化

从档案管理视角看,业务过程数字化也是档案数字化的一种类型。后者是指应用各种计算机数字化技术来处理原始文件、档案、资料,形成数字化的电子数据文件,最常见的数字化案例是以国家综合档案馆为代表的很多政府或企事业单位,将馆藏档案或在档案室保管各类型档案,往往是已经归档的纸质档案和模拟信号构成的音像档案,根据需要进行扫描或影像化处理,一般情况下,数字化处理方式是以批量方式集中进行的,加工成数字格式的档案用于方便存储、管理和利用。在业务方式上,很多机构出于人力资源、设备、场地等原因选择档案服务外包方式。而过程数字化主要体现在业务过程中对非数字源的信息进行即时数字化处理,数字化文件即时纳入到业务信息系统用于业务流程,数字化处理方式多是以单件方式进行的。一般而言,业务过程数字化不采取外包方式,而是由机构人员操作,除非与此相关的业务流程全部外包。

2.4 业务系统中文件流转模型

为清晰的了解文件和数据在业务系统(包含文件管理和档案系统)的流转,我们设计了以下模型,供实施业务过程数字化的机构参考。

图1 数字化文件流转模型

3 实施业务过程数字化的策略

档案数字化经过数十年的发展,无论是国家综合档案馆的馆藏档案数字化,还是各行业、各门类的档案数字化也已有成熟的做法和经验,与档案数字化相关的业务标准和操作规范也比较完备。目前,国内主要采用的标准包括:《DAT31-2017纸质档案数字化规范》、《DAT43-2009缩微胶片数字化技术规范》、《DAT77-2019纸质档案数字复制光学学符识别(OCR)工作规范》、《GBT33870-2017干部人事档案数字化技术规范》、《GBT20530-2006 文献档案资料数字化工作导则》等。上述规范虽然大多针对传统档案数字化项目,但业务过程数字化作为档案数字化的一种,也有其共通性,如档案扫描中相关的设备选型、扫描色彩模式、扫描分辨率、存储格式、图像命名以及图像处理中的图像拼接、旋转及纠偏、裁边、去污、图像质量检查等。同时,我们也应看到,由于业务过程的多样性和复杂性,相关的技术标准并不完备,加之实施数字化的软件、硬件和人力资源也存在诸多不足,机构在实施业务过程数字化方面也存在一些困难和问题。本文研究的对象是业务过程数字化如何助力机构的数字转型,而非更好地保护非数字档案原件及方便利用层面。因此,对于业务过程数字化的策略,拟从以下四个主要方面论述。

3.1 可行性评价策略

显然,机构实施业务数字化是为了提升业务运营的效率,促进数字转型。业务过程数字化需要机构在设备、软件、系统集成、数字化人员、业务和技术标准等多个方面做出规划和做准备。因此,要充分考虑技术可行性、工作量和成本效益。若简单的认为数字化能提升业务系统效率就贸然实施数字化,则可能给机构带来较大的风险和压力。在众多失败的数字化案例中,未实施客观、严谨的可行性分析往往是一个共通的原因。因此,机构在实施业务数字化前,应认真全面地评估其可行性。

3.1.1 必要性评估

拟数字化的信息是否是业务系统操作所必需的,是供本地人员使用还是需要向远程人员提供。数字化文件不受实体文件的限制,具备由多人从任何地点和任何时间调阅一份文件的能力;如必须提供给远程人员使用,则无疑这种数字化是必要的。另外,在数字化过程中如何捕获必要的元数据,以满足业务过程和未来查询需要。

3.1.2 工作效能评估

总的来说,业务过程数字化主要服务于业务活动的自动化,更好地集成到业务信息系统,实现在结构化的工作流中传递影像文件,实现高效的业务协同;帮助机构全面实现数字化转型,摆脱“混合状态”给机构带来的困扰。机构在实施业务过程数字化前,需要对业务流程和工作效率提升做出评估。

(1)业务操作中是否需要将非数字源文档全部实现数字化,消除混合(纸和数字并存)系统,这些系统可能会给用户造成混淆。若不能全面消除混合的纸质与电子或数据状态,一部分纸质文档等非数字源文件仍需要在业务系统外流转,则在整个业务流程和业务系统中形成“栓塞”瓶颈因素,导致运行效率可能得不到全面提升。

(2)如果通过规范的数字化处理,在法律规范允许的情况下,可以通过销毁对应的非数字源文件信息,减少硬拷贝占用的物理存储空间和维护成本。如果实施数字化后,仍不宜销毁对应的非数字源文件,或者法律法规要求必须保留其原始格式,则机构需要同时保管和维护两个或多个版本,这无疑给机构带来管理的压力和成本开支。

3.1.3 成本效益评估

很多时候,机构并未就业务过程数字化的成本和效益做出全面的量化评估。由于业务过程数字化嵌入在业务流程之中,成为机构和人员日常业务活动的一部分,因此有必要对其做出全面测量和评价,以帮助机构做出相关决策。

3.1.4 风险评估

机构实施业务过程数字化也存在一些风险,值得注意。

(1)技术风险。由于技术进步等原因,创建数字影像的原有技术和相关技术标准发生显著变化,而影响未来数字化文件再利用的可持续性和效果;

(2)法律风险。机构按照现行法律法规的要求,将实施完数字化后的非数字源信息进行安全销毁后,在后期业务实践中可能承担因销毁原始记录而承担其它间接责任,这种风险也可能来自法律法规的不一致或变更;

(3)财务风险。在数字化过程之后不宜销毁非数字源记录,尤其是在有充分理由以非数字形式保留记录的情况下,例如对国家或个人身份或其他社会或文化意义。或根据法律,某些特定类别的记录必须保留其原始格式,在某些情况下,非数字化记录甚至需要与数字化对应方一起保留一段时间。上述情形会给机构带来额外的管理成本风险。

3.2 数字化影像管理策略

业务过程数字化的输出结果是数字化文件,因此,机构实施业务过程数字化要综合考虑业务系统和后期文件与档案管理系统和其它业务分析决策系统等对数字化文件的要求。

3.2.1 合理确定数字化影像文件的技术参数

随着技术发展,影像文件的规格标准正在迅速演变,采用技术标准的首要考虑因素是确保数字化图像的可读性或可用性。影像文件主要技术参数包括:文件格式、分辨率、彩色分辨率或位深、压缩比以及色彩管理等,在选择技术标准时,应遵循以下基本标准:

(1)应将可实际支持的最高质量技术规范纳入数字化流程;其衍生版本可以用于其它应用场景,如通过互联网分发的缩略图等;

(2)文件格式应为开源或采用开放标准的,该标准已在公共领域发布并有行业组织进行维护,格式应被许多软件应用和操作系统支持;并且当需要时,应有充足的技术支持以保证持续的维护和迁移能力;

(3)格式不应包含嵌入对象,或链接到格式的特定版本以外的外部对象。

3.2.2 满足业务系统和文件档案管理系统的要求

数字化文件生成后,首先会被应用在业务系统,因此其首要满足业务系统查看利用要求,在此基础上,也能够满足未来业务完成后的归档需要,如满足机构出于文件和档案管理而建立的文件管理或长期档案管理系统的要求。这里不仅是对文件本身,还应包括其生成与管理过程的元数据也能得以规范化管理。

3.3 元数据管理策略

元数据是描述文件的背景、内容、结构及其管理过程的数据。如前文所述,元数据管理始终是档案数字化业务的最薄弱的环节之一。从实践看,业务过程数字化不同于历史档案数字化,后者多出于保护原件并提供一个更方便的调阅,而业务过程数字化要支持正在进行的业务流程,业务结束后还要实现电子归档,最终实现以无纸化为表现形式的数字转型。因此,元数据管理方案要有助于保证数字化文件的真实性、完整性、可靠性、可用性,保障电子文件的证据特性,便于对电子文件的理解、管理、交换和利用。换句话说过,一个系统管理档案的好坏很大程度上取决于系统的元数据管理功能。

3.3.1 元数据特点

由于业务过程数字化文件其生成背景和目的与传统的档案批量数字化不同,因此对元数据的要求也有较大的差异。

以馆藏档案数字化为例,数字化文件的元数据包括(1)目录数据。按照DA/T 18的要求,主要有题名、责任者、密级等目录元数据;(2)数字化属性。主要有数字化对象形态、扫描分辨率、扫描色彩模式、图像压缩方案、唯一的数字影像ID、数字化的日期和时间等。对数码拍照形成的数字化文件比照上述要求,没有要求按照可交换图像文件格式(英语:Exchangeable image file format,简称Exif)记录数码照片的属性信息和拍摄数据。而且,上述元数据信息多采用著录方式,自动获取模式较少采用,即使保管的原始文件中自包含了相关元数据信息,也并未实现统一的提取、管理和利用。

相比较而言,业务过程数字化文件的元数据除了满足常规档案数字化对元数据数量和类型的要求外,还要包含数字化影像本身和扫描影像过程的元数据、业务背景、业务机构相关的元数据。如果考虑数字化文件的证据属性和电子归档(如机构不再包括非数字源的记录),则要考虑电子签名相关的元数据;进一步讲,有的业务系统需要利用与数字化记录内容相关的数据,如一份合同中涉及的合同方名称、合同金额、履行时间等要素,则数字化过程中还要提取内容相关的元数据。

3.3.2 元数据管理原则

鉴于业务过程数字化对元数据的数量和类别要求较高,且元数据的捕获都是在业务进程中由业务操作人员完成的,因此在制定元数据方案时,要注意以下坚持原则。

(1)捕获范围:元数据的采集要覆盖实施业务过程数字化的业务系统。一份文件的元数据应该涵盖该文件从生成到销毁的全生命周期管理过程。如果业务系统的功能不包括电子文件的档案管理功能,则需要在业务系统中完成的元数据不必包括捕获点后的元数据,只包含在数字化文件生成、流转、捕获、归档的同时完成元数据采集和管理。

(2)捕获方式:元数据要最大限度地继承现有系统和设备的数据值。大多数元数据可以自动从管理数字化过程的软件和硬件中获取,因此出于提高工作效率还是包括数据真实、准确原因,都应最大限度地自动捕获元数据,减少手动和人工归集。当数字化文件在捕获节点被电子文件与档案管理系统作为证据捕获时,可通过API或FTP等方式实现自动捕获,更要避免人为录入数据。

(3)标准化和互操性:互操作性是指两个及以上自动化系统成功地交换、识别、处理和使用信息的能力。一个互操作系统应能够在技术、语义和语法层面同时发挥作用。标准化的元数据是信息系统互操作的必不可少的前提条件。因此,用于业务系统的数字文件元数据应有助于数字化文件在机构内业务系统之间、业务系统与管理档案的档案应用软件之间、涉及业务流程执行的多个机构之间、形成档案的业务系统与保管档案的档案系统之间的跨时间管理等方面支持互操作性。

(3)特殊要求。满足机构数字转型对数字化文件元数据的特殊要求。为满足机构全面向数字化转型,机构可能要求数字化文件与原生电子文件一样,要满足“四性”要求。如果机构不仅要求数字化文件满足业务程序要求实现流转,还要对业务系统形成的数据进行数据分析,这时,可能要求数字化文件的元数据还要包括业务的内容。另外,为提升元数据采集效率,实现自动化过程,对于结构化的表单类文件,可能通过智能OCR技术,将模板结构中对应的字段自动获取。

3.3.3 元数据模型设计

在设计业务过程数字化文件的元数据模型时,我们可以参考《ISO23081-1:2017 Information and documentation-Records management process-Metadata for records Part1:Principles》中关于元数据类型及关系模型,构建业务过程数字化文件的元数据种类和关系模型,如下图所示:

图2 数字化文件元数据类型和关系模型

(1)文件类实体元数据

数字化文件的文件实体元数据主要包括:内容描述、形式特征、电子属性、数字化属性、exif属性(若是数码拍照或速拍仪等形成的数字化文件)电子签名、存储位置、权限管理等。

在实体元数据中,可以根据业务系统或档案管理的需要,由机构指派更多的元数据种类,以帮助业务流程执行或用于信息管理利用。

(2)机构人员类实体元数据

机构人员类实体元数据是指实施数字化业务的机构相关的元数据元素,主要包括:机构人员类型、机构人员名称、组织机构代码、个人职位等。

(3)业务实体类元数据

业务实体类元数据是指机构和人员实施业务过程数字化业务相关的元数据,主要包括业务状态、业务行为、行为时间、行为依据、行为描述等。

(4)授权实体类元数据

授权实体元数据是指机构与人员实施数字化业务相关的授权行为元数据,主要包括授权标识符、授权名称、授权类型、发布时间等。

3.3.4 元数据的质量控制

在业务过程数字化管理中,元数据的质量与数字化文件的影像质量具有同等重要性。因此要根据对照元数据方案,对数字化后的元数据质量进行必要的质控程序。考虑到业务的连续性,建议采用自动化的方法完成元数据的质量控制,而且能够实时发现和提醒,在业务过程中同步完成纠错。质量控制主要考虑以下几个方面:(1)元数据的相关性和准确性;(2)元数据的创建和元数据解释的一致性;(3)评估所收集的元数据的有用性;(4)确保元数据在多个位置以同步方式更新(例如,与图像相关的信息可能存储在TIFF、JPG等影像内);(5)元数据完整性(建议自动检查);(6)验证文件标识符的准确性;(7)数字化文件名称应一致且具有唯一标识符;(8)验证多页项目的顺序和完整性。

3.4 与业务系统的集成策略

业务过程数字化产生数字化图像要实现无缝集成到工作流程中以支持业务行动,因此,数字化软件和设备要求嵌入到业务系统框架中,要确保了所生产的数字化影像文件的质量满足业务系统的需要。如果考虑在取得数字化文件后销毁非数字源记录,则机构更要关注数字化图像的长期可行性。数字化中使用的设备和软件直接决定了数字化能力,机构在设计数字化系统与业务系统集成方案时,主要从软件及接口、硬件选择等方面加以考虑。

3.4.1 软件及接口开发

数字化软件有两种选择,一是在开发业务系统时,直接将数字化功能嵌入到业务系统,在此系统保留与业务需要的硬件的接口即可。如果机构在实现业务过程数字化,已经完成业务系统的开发,数字化业务系统需要独立开发,则要若数字化系统与业务信息系统是独立的软件程序,则需要考虑在二者之间开发软件接口,通过API实现文件与元数据的捕获和接收。操作机制取决于业务系统从数字化设备或系统中主动捕获或数字化系统向业务系统主动推送两种方式。通常,影像生成过程相关的元数据都要实现自动捕获,与影像内容相关的元数据如果不能实现自动捕获,则可以考虑在业务系统中通过自动赋值,以避免人工干预。只有极少数元数据,可以考虑人员归集。但归集时也建议采用下拉框或选项方式进行选择。

3.4.2 硬件选择

大多数业务过程数字化采用的设备是扫描仪。有的业务场景数字化对象比较简单且要求快速完成的,也常见使用速拍仪等设备,其原理仍属于数字拍照方式。在选择硬件时主要考虑能否支持软件接口、扫描仪的技术参数能否满足业务和扫描生成文件的要求等。

4 结语

随着信息技术的快速发展和数字化转型的深入推进,会有越来越多政府部门和企事业单位在业务流程中引入业务过程数字化环节,以处理非数字化信息,实现业务过程的全面“无纸化”、数据归集抽取的智能化和电子文件归档的自动化。根据《AIIM行业观察论文的自由进展-衡量成果》(AIIM Industry Watch Paper Free Progress-Measuring Outcomes)提供的报告显示,57%的机构认为无纸化是其开启数字化转型的关键开始[4]。目前国内档案数字化研究和实践多侧重在档案馆馆藏档案的数字化,与文件管理数字转型相关的研究也多集中在电子文件归档与电子档案管理上,在业务过程数字化方面的研究较少,相应的技术标准相对缺位;在实践中,数字化文件的“四性”保障和元数据管理等规范操作方面也存在较多问题。由于数字转型是一个连续性和系统性工作,只要混合状态持续存在,即使需要数字化处理的非数字源信息所占比重越来越小,仍然构成业务流程数字化的瓶颈因素。一个机构的数字化转型需要有一个科学务实的策略指引,参照技术标准和相关规范,由业务部门、信息技术部门和档案管理部门的密切配合,才能得以顺利实施。

猜你喜欢
机构数字化数字
家纺业亟待数字化赋能
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
答数字
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
数字看G20
一周机构净减仓股前20名