档案数据全面质量控制理论研究现状与优化策略

2024-05-03 09:06顾伟郑文静史梦马东方朱晓露
档案管理 2024年1期
关键词:数据治理过程控制PDCA循环

顾伟 郑文静 史梦 马东方 朱晓露

关键词:质量控制;档案数据;数据治理;电子档案;PDCA循环;过程控制

1 引言

档案数据是档案信息资源建设的内容来源,是档案信息化建设的基础和核心。《“十四五”全国档案事业发展规划》中明确提出要加快档案资源数字转型,大力推进“增量电子化”,继续做好“存量档案数字化”。截至2021年底,全国馆藏档案数字化副本已达24 179.4TB,[1]至“十四五”末,全国各级综合档案馆档案数字化率要求达到80%以上。因此,档案数据的质量高低对我国数字档案信息资源形成、开发和利用有着重要作用,对我国档案信息化建设和档案事业高质量发展有重要影响。

档案数据不仅包含各类数字化档案资源和电子档案,还包括具有保存价值但还未纳入档案部门保管范围的数据,如在档案管理业务中产生的管理数据、利用数据和用户数据等。[2]根据数据载体形态可以将档案数据质量控制划分为纸质档案数字化工作质量控制和档案数据管理质量控制两方面内容。纸质档案数字化工作是传统纸质馆藏档案资源纳入档案数据管理的基础工作。但是在纸质档案数字化实践中,纸质档案数字化一直存在统筹规划不够合理、安全管控措施不够到位、成果验收不够严格等管理和质量问题。为此,相关学者分别提出了数字化工作的制度化和规范化[3]、制度流程质量控制[4]、基于第三方监理的控制和评价方法[5]等。同时,为加强与相关标准之间的相互协调、适应数字化技术手段的更新、强化管理过程规范化和精细化并增强档案安全意识,国家档案局修訂了《纸质档案数字化规范》(DA/T31—2017),从制度、组织、管理、技术等方面提出了更加具体的要求,强化岗位、人员、场地、设备、数据、实体等方面的管理制度,增加了档案数字化过程中元数据采集、档案扫描技术参数等内容,细化了数字化成果验收指标。[6]针对档案数据质量存在数据污染、数据异构、数据冗余、数据安全、数据依赖、数据孤岛、数据整合困难等问题,相关学者分别提出了技术保障和质量评估机制[7]、提升安全认知水平和建立档案数据安全防护手段[8]、搭建档案数据质量管理循环系统和优化主体能力与用户反馈[9]等档案数据质量控制的优化策略。但是,相关研究尚缺乏提升档案数据质量的系统方法,本文从纸质档案数字化工作质量控制和档案数据管理质量控制两方面探究档案数据全面质量控制的优化策略和质量控制方法,并通过实践应用验证了该方法的可行性和有效性。

2 质量控制方法

质量控制(Quality Control,QC)是为使产品或服务达到质量要求而采取的技术和管理措施的活动。该方法基本思想是将整个质量管控过程分为计划、执行、检查、处理四个阶段的循环(Plan—Do—Check—Act,PDCA循环),在每一次循环中,首先,通过目标选择、现状调查、设定目标、找出问题、原因分析、制定对策等环节进行“计划”;其次,按“计划”实施,进入“执行”阶段;再次,对“执行”阶段的效果进行检查,查看是否达到“计划”阶段预设的各项目标;最后,对此次循环的实施结果进行“处理”:成功的经验通过制度、规范等方式进行固化保留,存在的问题转入下一次循环去解决。这与《质量管理体系要求》(GB/T 19001—2016)中所采用的过程管理方法思想相一致。

《质量管理体系要求》认为PDCA循环是全面质量管理应遵循的科学程序,适用于所有项目的质量管理。约瑟夫·M·朱兰在质量三元论[10]中将质量管理过程分为质量计划、质量控制和质量改进三个步骤。其中,质量计划部分包括确定顾客、明确顾客要求、开发满足顾客需要的产品、建立产品目标和开发流程、证明流程能力等内容;质量控制包括选择控制点、选择测量单位、建立性能标准、测量实际性能、分析标准与实际性能的区别、采取纠正措施等内容;质量改进包括确定改进项目、组织项目团队、发现原因、找出解决方案、证明措施的有效性、处理文化冲突、对取得的成果采取控制程序等内容。

质量控制方法的PDCA循环与朱兰质量三元论有相通之处,将两者结合应用于档案数据全面质量控制过程中,如图1所示。

首先,确定以提高档案数据质量为研究目标,通过对档案数据质量情况的调研,找出档案数据质量控制过程中存在的问题并分析原因,以此制定提高档案数据质量的对策。其次,按照对策开展纸质档案数字化工作和档案数据管理工作,同时检查和评估执行效果,保留并固化合理的措施,摒弃不合理的措施,对项目实施过程中发现或仍存在的问题进行下一轮循环迭代以期得到解决。

3 档案数据全面质量控制存在的主要问题

当前档案部门开展纸质档案数字化工作和档案数据管理的业务能力已普遍提高,能够重视档案数据的质量,并加大外包单位的监管力度,但还存在规划、协作、检测等方面的问题。

3.1 建设规划不够合理。在档案数字化建设趋势下,档案部门均开展了纸质档案数字化工作和基于档案数据的管理工作,但部分基层档案部门仍存在建设目标不清晰、没有“摸清家底”就盲目追求档案数字化率的情况,没有深刻认识高质量的档案数据对数字档案信息资源建设和档案信息化建设的重要意义和基础性作用,并将纸质档案数字化工作与数字档案信息资源开发利用相结合,科学合理地分步开展纸质档案数字化工作并高质量地达到纸质档案数字化质量要求。[11 ]具体表现为:一是统筹规划能力较弱,不能完全按照纸质档案珍贵程度、保管现状、亟待抢救程度、资金投入等因素开展纸质档案数字化工作,不能分清“轻重缓急”,将重要、珍贵的档案优先数字化。二是未遵循价值原则,档案数据的治理工作“重末轻本”,简单地将档案数据治理看作是档案数据的整理和保存,轻视档案数据等环节,不能充分发挥档案数据的价值。三是档案数据利用率较低。多数情况下已经完成数字化的档案数据仅仅被当作是纸质档案数字化副本保存,未将开放档案接入档案网络中,参与档案信息的共享利用。

3.2 沟通协作不够充分。无论是纸质档案数字化工作还是档案数据治理,都由多个环节组成并分步执行,各个环节的执行结果环环相扣,环节之间的沟通反馈是联系整个工作流程的纽带。[12]

纸质档案数字化工作中从档案出库到档案数字化加工各环节,再到档案入库;档案数据治理中数字资源的数据提取、识别、度量、监控、检测、分析、回溯、预警、解决、反馈、评估等都需要各相关方建立良好的沟通机制,才能切实提高每个环节完成的质量。

当前档案数据治理情况参差不齐,存在滞后性和失衡性,受地方经济、技术等因素影响,存在区域性差异明显的情况。不同区域的档案机构之间关于档案数据的交流合作较少,档案数据受限于各个档案机构的业务范围,难以建立全国范围内的档案数据网络,让开放性档案数据充分“跑起来”。

在纸质档案数字化过程中通常存在发包方与承包方之间的协调沟通、承包企业内部沟通、工作人员与管理人员之间的沟通不够顺畅的情况,使得执行过程中遇到的问题不能有效地进行反馈而造成项目质量不高。档案机构内部和承包方内部多数时候上对下的沟通机制比较顺畅,即命令的传达执行效率较高,而下对上的反馈机制被忽略,工作人员实践中出现的问题,较难反馈给管理人员或发包方,不能及时根据实际情况给出解决方案,帮助解决问题。

3.3 质量检测不够严格。在实践中,档案数据的质量检测包括数字化质检和质量检测两方面。

在纸质档案数字化质检方面。目前,该工作多数是在纸质档案数字化验收时或验收前才开展的工作,目的是为了顺利完成项目验收工作,不是一种过程化质检,而是对最终成果的一次性检查,因此,若发现问题需要返工处理,则代价可能较大,耗时也较长。同时,质检过程中较多关注技术部分的质检,忽略了项目实施情况和档案实体的检查,容易造成項目管理失序、档案实体缺损的情况,不利于项目质量的提高和项目的顺利完成。

在馆内现有数字档案资源的质量检测方面。主要问题是没有充分做好数据化前检查,如数字化档案存储载体是否合格、文件格式是否符合规范要求、档案数据接口是否通用、数字档案资源是否可读、数据挂接是否准确等,都需要制定详细的质检细则,并注意质检过程中的信息记录,做到问题描述翔实、质检责任到人、返修跟踪关注,建立严格的数字档案资源质量检测体系,为高质量的档案数据建设奠基。

3.4 成文信息未受重视。在《质量管理体系要求》中提出了“成文信息”的概念。所谓“成文信息”,在档案数据全面质量控制场景下,是记录档案部门在档案管理业务过程中产生的档案管理数据、档案利用数据、档案用户数据等累积性数据和纸质档案数字化工作各个环节状况、进度和变化的信息,是与档案数据质量控制工作相关的经验总结材料,通过对成功经验加以肯定并标准化,以便于后期推广,对不足之处总结教训,避免二次犯错。

在实际工作中,大多数档案部门重点关注档案数据本身,而忽略对成文信息的记录、保留,没有专人负责成文信息的记录。成文信息在纸质档案数字化工作中往往是作为数字化工作结束后,验收环节的一部分而补充,在档案数据的治理工作中仅仅是作为记录性的流程化信息,并不能纳入档案数据中充分利用。这意味着,档案数据管理过程中有实际价值的信息可能丢失、成文信息不能完整反映纸质档案数字化流程,作为质量保证的可信程度降低,影响日后复检工作的开展,也妨碍档案用户数据、管理数据等的积累,影响档案数据质量。

4 档案数据全面质量控制存在问题的原因分析

档案数据全面质量管理是一项复杂工作,造成其质量问题的原因是多方面的,图2从人员、管理、业务、风险、制度、经费、技术七个维度进行原因分析。

在人员方面,一方面存在由于档案部门人员数量较少使得对项目精细化管理程度不足的情况,另一方面也存在工作人员因对项目实施复杂度和质量管理难度的认识不足而导致对项目重视程度不够的情况。

在管理方面,存在发包方履行监管职责的力度不够、双向交流反馈的管理机制和常态化过程管理未有效建立的情况,使得项目质量管控能力较弱。

在业务方面,由于缺乏对馆藏整体情况的掌握及人财物配套情况的了解,使得科学合理统筹规划项目能力较弱。

在风险管控方面,较多地强调物防和技防手段,忽略了人防的重要性,加之部分人员的风险意识不强和责任感不强,存在实体档案的破损和档案信息的泄露的风险。[13]在制度方面,对已有的相关标准的理解不够全面准确、各项档案数据管理制度的建立和落实不够彻底容易导致项目实施无据可依。

在经费方面,由于资金投入少,项目利润率低,纸质档案数字化环节若采用外包形式,容易造成承包方为节约成本而减少项目施工人员和降低项目实施质量的情况;档案数据环境质量也受限于资金存在技术可靠性、成本效益性等问题。

在技术方面,由于采用计算机技术的自动化检测手段只能对档案数据的部分技术参数进行全检,多数的质检工作还需依靠人工方式进行抽检,因此,质检手段有限、抽检范围不全面。

5 提升档案数据质量地优化策略

5.1 以效益为目的,科学合理地做好项目统筹规划。

《质量管理体系要求》中提出“以顾客为关注焦点”“从增值的角度考虑过程”的思想与朱兰所提出的质量管理的要求,即各类组织用以设计、持续改进并确保所有产品、服务和过程满足顾客和利益相关者需要[10]的要求相符合。因此,应结合档案数据质量控制工作现状,以档案利用为目标,加强顶层设计,制定合理的方案,坚持“预防重于解决”的原则,统筹规划,开展档案数据全面质量控制工作。

5.2 加强沟通协作,提高管理水平和业务能力。档案数据质量不仅包括档案数据本身的质量,还包括档案数据传输、存储、运行和利用的质量。[7]档案机构内部档案数据管理工作的高质量开展离不开上下级人员、各环节人员的密切合作、沟通协作,在数字档案资源质量检测和档案数据化转化的工作中建立上下贯通的交流渠道,如定期开展工作情况汇报会、管理人员深入工作现场了解情况等。

档案机构之间的区域合作是使档案数据“跑起来”的重要渠道。针对区域发展不平衡的现状,可以点对点帮扶,如机构对机构、区域对区域帮扶中西部地区的档案数据建设工作,举办论坛交流先进经验,或外派技术人员指导建设工作等。一定经济、地理区域的档案机构内部积极构建档案数据沟通网络,如长三角档案共展、珠三角档案利用网络等,从小区域到大区域,从大区域到全国,档案数据从基层档案馆层层挂接,实现全国范围内的异地查档、异地调用,提高档案数据的管理水平和业务能力。

5.3 建立全方位的质量检测体系,切实提高质量检测能力。档案数据全方位质量检测包括:纸质档案数字化成果质量检测、档案元数据内容检测、档案著录是否正确检测、电子文件存储路径能否正确打开对应的文件数据的检测、捕获的电子文件内容与档案数据电子属性的一致性检测等。但是当前各项检测人工抽检比例较大,项目质检的水平不高、质检效果不够理想,验收通过的项目仍可能存在较大质量问题。因此,为提高项目质检水平,可以从制度、技术、职责等方面开展。

一是实行过程化质检和最终成果质检相结合的双重质检体系。在项目实施的重要环节,开展过程化的质检,检验该环节的成果是否符合规定并达到预期目标,若存在的问题及时返工。过程质检为最终质检提供保障,二者相辅相成,构成完整的质检体系。

二是对能够使用计算机自动检测技术进行检测的验收内容必须进行全检,对不能利用计算机技术手段进行检测的验收内容应加大人工抽检比率,确保抽检范围具有合理性和代表性。

三是加大人工智能技术的应用,建立智能化质检平台。针对不同的档案数据质检场景采用不同的参数和技术,普遍性兼顾特殊性全面质检。

四是责任到人,档案数据质量管理责任明确、数据治理问责机制明确,确保档案数据质检各个环节落实到位。

5.4 注重项目成文信息的保存。成文信息应记录项目实施取得成果、经验与不足以及对存在的问题的改进情况和未能完全改进的原因,合理之处要形成规章制度进行固化,不足之处要总结改进并在下一次循环中再次提出以便解决。它不仅是有效总结、提升档案数据质量的记录性材料,而且是确保项目质量的可信性材料,更是PDCA循环中“处理”阶段和质量三元论中质量改进工作开展的重要材料,对档案数据质量持续改进有着重要作用。

成文信息一经形成,要保证其真实性和完整性,不得随意改动,不能为满足验收需求而修改,同时注意把档案数据治理过程中产生的积累性成文信息及时纳入档案数据中,用于用户刻画、档案利用统计等工作,反哺于项目方案的统筹设计。

6 纸质档案数字化项目检查与评估

为验证上述档案数据全面质量控制方法的可行性和有效性,对某机关单位连续三年开展的各项档案数据项目进行跟踪检验,认为该方法切实可行且能有效提高纸质档案数字化项目的质量。

6.1 方法可行性评价。该方法的核心在于结合采用PDCA循环和质量三元论建立过程化的质量迭代控制方法来提高档案数据质量。按照档案行业相关规范的要求,将档案数据质量控制工作的各环节进行分解,通过梳理各环节存在的问题,并进行原因分析得出解决问题的应对之策。之后,在实施过程进行检查,验证发现的问题是否得到解决。最后,对项目进行总结,并在下一次项目开展中通过吸取的前次项目的经验和教训以迭代提高项目质量。因此,该方法能够与纸质档案数字化项目应用场景相结合,具有可操作性。

6.2 方法有效性评价。本文采用PDCA循环和质量三元论相结合的质量管理方法能够有效地提升档案数据质量,主要体现在制定方案、多主体合作、操作方法等方面。

根据项目实际制定科学合理的档案数据质量控制工作方案,可以为项目的顺利实施提供保障。档案数据全面质量控制工作涉及多主体合作,如纸质档案数字化工作多数采用外包方式开展,其质量高低与承包方工作态度、业务能力关系密切;档案数据过程质量控制涉及档案数据运行透明度、服务及时性、数据可访问性、存储安全性、高效共享性[14],其质量高低与档案机构内部工作人员能力、业务水平和机构技术支持、资金数目相关。在项目实施过程中,该方法通过建立并执行相关制度、强化人员风险意识、履行监管职责、建立多层次的沟通交流机制、开展过程化质检,可以有效提高项目管理能力。同时,通过采用计算机自动化检测技术、开展人机结合的检测方式以及加大抽检范围等措施,可以为项目质量提升提供技术保障。

全面质量控制方法是一个基于过程的迭代方法,在项目实施过程中会分析存在的问题,并提出解决问题的策略,当项目完成后,将对这些解决策略的有效性进行检查,并保留合理的建议和做法,以成文信息的形式保存。之后,在下一次开展同类项目时会对本次项目实施过程中未解决的问题和可能存在的其他问题再次进行分析,提出更加有针对性的解决方法,通过这样一次次的迭代将问题由大到小逐步解决以达到不断提升项目质量的目的。因此,该方法有助于提高项目的质量。

7 结语

本文所提出档案数据全面质量控制方法通过将过程化管理思想和风险思维融入档案数据管理各业务环节,在项目实施过程中实行质量计划、质量控制、质量改进的基本思路,贯穿迭代“计划—执行—检查—处理”循環达到提升项目质量的目的。但项目质量的提升除要有科学合理的管理方法外,还依赖“人”和“技术”的支持。[15]因此,在项目实施过程中要充分发挥人的主观能动性并加大人工智能技术的应用,才能持续提升纸质档案数字化的质量。

(作者单位:1.安徽大学档案馆、安徽大学管理学院顾伟,副研究馆员,硕士生导师;2.安徽大学管理学院郑文静,通讯作者,本科生;马东方,本科生;史梦,本科生;3.国家电网宿州市供电公司 朱晓露,高级工程师来稿日期:2023-09-28)

猜你喜欢
数据治理过程控制PDCA循环
基于本体的企业运营数据治理
云端数据治理初探
PDCA循环应用于
互联网+背景下数学试验课程的探究式教学改革
创新管理,完成鞍钢自主集成的冷轧2130工程生产线
PDCA循环在企业绩效管理中的实际运用
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理