档案数字化外包多元化质量监控策略研究

2023-03-11 01:30四川音乐学院档案馆徐一男
内江科技 2023年2期
关键词:页面环节数字化

◇四川音乐学院档案馆 徐一男

四川大学图书馆 李 禾

在档案数字化外包中,存在“基于前端监管”“全程监控方式”“关键时刻监控”等多元质量管理策略,但这些方式研究目标大多集中于外包环节本身,而未从不同的风险入手探索适应性的策略。为此,本文通过深入分析档案外包过程中各环节所面临的风险型态,并针对性的提出多元化的数字化外包动态质量管理策略,以期对从事档案数字化质量管理研究的工作,提供一定的借鉴和参考。

今天,信息内涵与形态日益的多元化,加速推动了资源的整合利用。档案作为文献信息资源中不可或缺的组成部分,其科学化管理和利用受到长期关注。新媒体、大数据挖掘、区块链技术等纷至沓来的新技术理念,给档案事业发展注入了持久性动力的同时,如何高效完成大量纸本档案数字化转型,已成为未来发展的重中之重。

档案数字化通常采用自主数字化或数字化外包模式。许多档案管理单位面临设备缺乏、技术力量不足等外部问题,最终选择了外包模式。据案例显示,该模式在具有极大便利性的同时,也有诸多影响其质量的风险存在。而现阶段大多数质量管控模式,尚未能就过程多环节间深度关联性,提出普适性动态质量监控策略。本文尝试以档案信息生存周期为基础,探索档案数字化外包中规避风险,提升质量的智慧化管控途径。

1 档案数字化质量管控的研究进展

传统纸质档案管理中,中外档案学者提出了前端控制理念,即控制文件形成的源头,以保证档案的质量,而当电子档案广泛被应用后,该理论也常被用于数字化质量管理。加拿大档案学者特里·库克也指出:在电子文件时代,由于传统的文件概念和物质形态已经不复存在、待鉴定的文件数量庞大,必须在文件产生之前系统涉及阶段完成对电子文件的鉴定[1]。此外,全程管理的理念贯穿于文件生命周期的各个阶段。

近年来,档案数字化外包中所产生的诸多问题,逐渐被业界所关注。目前,国内外研究成果较多从基本性质、可行性、必要性以及外包风险等方面展开分析,而对质量管理的研究相对较少。截止到2018年,针对质量管理策略、关键点、办法以及路径等多个维度的研究成果共13篇。其中,魏振国建议从档案数字化的标准体系入手,提出了通过外部因素管理来实现外包风险管控[2];罗娟、卢秀英等从不同方面,提出了关键阶段控制的思路[3-4];钟国文、童霞等试图从整体上提出了深入分析自身情况,在全程中坚持责权分明、加强制度管理等,尽可能从规范、标准角度对数字化外包质量进行管理[5];而郄红岩则通过对档案数字化过程中的质量控制问题的分析,提出了全程控制、前端控制及动态控制等原则[6]。

综上,既往研究者尝试从多种途径出发去解决存在诸多质量问题。然而,由于缺乏对外包过程中多种风险因素的深层次分析,许多策略流于浅表。关键时刻、关键阶段等思路在关注细节因素影响的同时,却忽略了过程整体性,尤其对外包多元风险之间的关联性认识不足。为此,本文通过对档案外包的数字化前期(规则制定、基础鉴定、档案整理),数字过程(调卷、数字化加工)及收尾期(还卷、挂接)等多环节过程中各类风险的归类与深入分析,提供了针对性优化方案和策略。

2 档案数字化外包的流程及风险

2.1 档案数字化外包的流程

各级档案馆或其他档案收藏机构,存在服务职能、属性及范围等多维度的差异,其对档案数字化的外包策略、实施途径、数字化目标、个性化需求以及数字化流程等诸方面造成动态影响。当前的档案数字化外包缺乏更具普适性的标准和权威性界定,按照通常经验,大致包含了数字化前期准备、数字化过程以及数字化收尾三个部分。

如图1所示,档案数字化前期是指数字化加工前的准备期。包括规则制定、基础鉴定、档案整理等工作内容。基础鉴定部分是指对特定档案加以管控,由划控鉴定、开放鉴定组成。划控鉴定是指档案机构依据相关法令和规章,对馆藏档案在可接触人群、可传播范围、使用目的、开发形式等方面加以严谨划分和清晰界定的一项工作,目的是保障含有敏感或涉密信息的档案安全可控[7]。开放鉴定需要系统梳理所属档案,剔除过于陈旧、破损严重、失效档案,并根据自身人力、资金、时间、利用率高低及影响面宽窄等因素,挑选出适宜数字化的档案集合,其涉及行政管理、公共管理、专业技术、知识产权、法律关系、信息安全等,需要由多部门协同合作完成[8]。

图1 档案数字化外包流程

规则制定是指全过程中操作规范、服务协议及数据标准的确立。操作规范是指档案的交接、使用规则,如调卷手续等。服务协议是指外包中需要遵循的原则和制度,如记录数字化纸质档案的细节(卷名、页码、标题及内容描述等)。数据标准是指档案数字化元格式、著录标准等。

档案整理是指数字化加工前对纸质档案的清理与核查。主要针对纸质档案的卷页码混乱、缺页、页面模糊、污迹及破损程度等问题,并完成适当处理。

如图2所示,档案数字化过程是利用扫描技术、数字成像技术、多媒体技术将选定纸质档案转换成为数字化信息资源,并对其进行标引的加工过程,即调卷、加工、著录。而档案数字化收尾则包括挂接数据库及归还纸质档案的过程。

图2 档案数字化外包环节中的风险类型

这三部分并非独立过程,而其环节间存在密切关联性,如组织机制的影响贯穿了整个数字化流程,对操作规范及数据标准等进行了界定;纸质档案整理效果直接影响数字化的实施质量,不良预处理必然导致数字化结果存在多种问题。

2.2 档案数字化外包过程中存在的风险

在档案数字化外包中,根据属性和产生机制不同,数字档案质量受到实体、环境、组织机制及系统四个方面[9]的风险影响。

实体风险包括纸质档案在调用、归还、审阅等交接环节中,人为因素所造成损坏、遗失、混乱以及页面污染等情况。

环境风险是指在数字加工中,物质因素(如设备、技术及网络环境等)所隐藏固有不足或漏洞,会对最终质量造成影响。

规则风险是指因协议标准存在缺失或实施中违规操作造成档案遗漏扫描、目录著录错误、关联错误、显示有误、元数据丢失等问题[9]。

系统风险是指在数字化加工中,因非特定风险产生的、偶然性质量下降风险,如扫描中图像歪斜、污染、字迹洇透、拼接缺损以及模糊等偶然性失真;偶然性著录误差等。

如图2所示,在外包过程中,档案管理方通常存在实体、规则等风险,而外包方则通常存在规则和环境等风险。其中,双方需共同面对风险是规则风险、实体风险,与之相对应的是制定标准、调卷、还卷等环节。而系统风险仅存在于外包方数字化加工环节中。

针对上述风险,只有建立科学化的、动态关联的质量管理模式及依靠可信沟通渠道,才能加以规避,实现档案数字化质量的控制和监管。

3 档案数字化外包质量监管策略

当前对档案数字化的监管策略,通常还是采用一定数量的抽查和分析。然而,该方式依然存在诸多不便。当数字化量较大时,如抽查量大,其工作量依然较大,性价比较差。而抽查量不足时,又带来了漏检的风险。比较理想的方式是进行一一检查,但显然该方式需要花费时间和人力的巨大代价。为此,我们思考能否通过对一些策略,精准定位到卷面问题,从而降低质量管理的成本。

3.1 加强可控因素的监管

如前所述,实体风险、环境风险以及系统风险等因人工、设备或其他因素的不稳定性所产生的一系列疏漏。实际上,要完全杜绝上述因素中的各类细小问题,难度很大,但通过一定的措施和策略进行干预,可降低其中可控因素部分的风险。其具体内容包括:在严格遵循《纸质档案数字化技术规范》DA/T31-2005等各类相关标准制度的基础上,针对数字化过程中的不同环节,制定严格管理办法,实行专人负责责任制。如严格执行《文件传递管理办法》,包含基础鉴定、档案整理等环节中的文件传递制度。《数字化设备管理办法》则要求负责参与数字化实施过程的人员,定期监控网络、设备的运行情况,如有异常立即上报,并督促数字化实施单位及时解决。通过一系列严格的规章和制度,实现对各环节可控因素的管理。另外.要求实施单位制定突发事件紧急预案,针对数字化过程中可能出现的问题提出解决方案。

3.2 通过内容标注,加强偶然因素的监管

如上所述,严格制度管理可以进一步加强对可控因素产生的风险误差的管理。而对于过程中所产生的偶然性风险误差,如前文所提到的偶然性失真,可针对前期、中期和结尾等不同阶段的工作,采取内容标注的方式进行管理。

(1)档案数字化前期内容标注。管理数字化前期的内容,可采取内容的标注方式:将待数字化档案卷宗文件所属档案页的集合记为A。鉴定前,按档案页的原顺序标注序号记为。根据页面评级标准(包括普通档案信息要件、页面残损度以及内容等要件),逐页进行标注。例如:普通基建档案所有信息要件完备且页面清洁、无损可计为10分、有折皱扣1分、页面由污损扣1分(可污损或字迹洇染的程度而定),缺少信息要件扣1分等。通过该方式,对混乱、缺失、皱折及污损等原始档案中的卷面信息进行量化标注,建立档案初始信息集合。将整理后的页面同样按照评级规则进行标注(集合包含整个过程中,每个变化过程的卷面评级信息及鉴定人操作信息)。例如:集合为“鉴定”过程后的标注数据集。

(2)档案数字化过程中内容量对比。在纸质文档的数字化加工中,偶然性风险增加。为改善字体模糊、错杂、重复等内容失真,实现对错误地点的精确定位纠错,同样可采用人工方式建立标注对照表。通过数字化加工中不同卷面状况集合表与的一一对比,查找到问题卷页。毫无疑问,面对卷帙浩繁的档案文献,进行人工逐一标注,具有相当难度。为此可利用信息技术手段,可利用高清摄像采集和图像技术获取每页待数字化加工的卷面图像元素,并加上页面序号组成新表θi和 加工后的图像表θi+1利用图像算法进行自动比对,有页面扭曲、页面模糊、字体洇染等卷面情况,则自动将信息标注到数字加工监管信息集合。待文件i所有页面都加工完毕,通过对初始集合和加工后集合的计算:可筛选出存在问题档案页集合,从该集合可进一步查看到无法匹配的卷面存在的问题,也可以根据操作轨迹查找问题责任人,进行后续处理。上述思路中图像对比、自动标注及集合运算均有成熟算法可实现自动完成,可极大提升效率,具有较高可操作性,但需要注意的是由于调卷环节实体风险存在,加工中信息元集合可能存在序号不连续的情况,因此在与进行比对时,缺页和乱序是需要首先被考虑和处理的。

而对于著录环节,则是在相应的数字化平台完成,可以通过该数字化平台调取著录信息,并通过OCR等技术抽取档案提名等关键字信息与之对比,完成相关核查。

(3)档案数字化结尾的监管策略。数字化结尾的各环节中,主要面临风险的是还卷环节,其涉及实体风险和规则风险。它与数字化加工的结果无关,为进一步加强监管,一方面严格执行之前建立的制度,另一方面,可将还卷的纸质档案与数字化前所收集文件页信息量表进行比较,如出现页码缺失、页面情况变化等,则查找相关责任人进行处理。其具体分析策略与上述相似就不过多赘述。

综上所述,针对不同的风险形态采取多元化的方式,有利于寻找更优化的实施手段。其中,内容标注以量化方式对外包质量监管,具备了两方面优势:其一,通过对前后档案输出结果的标注和对比,找出问题,提升档案收集、整理和归档等各环节的质量。其二,建立完备档案数字化过程量化信息,以便发现普遍性的问题,优化后续材料的数字化。

4 结束语

档案数字化外包作为传统档案向多元化管理型态转化的重要节点,但从长期以来,除一些外部因素的干扰,其诸多风险也对数字档案质量造成影响。近年,前端管理、全程管理及关键时刻管理等思路都试图解决数字化外包中质量监管的问题,然而,上述思路固有的静态化、非关联性的质量监管策略很难从根本上解决质量全面的把控,较多涉及浅表性的问题。为此,本文从质量管理流程入手,采用标注方式在质量监管策略方面具有一些创新性,可供类似研究者参考,后续希望在数据实证方面展开更深入的研究。

猜你喜欢
页面环节数字化
刷新生活的页面
家纺业亟待数字化赋能
必要的环节要写清
在农民需求迫切的环节上『深耕』
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数字化制胜
现代学徒制管理模式及其顶岗实习环节
网站结构在SEO中的研究与应用
浅析ASP.NET页面导航技术