江丽华
为推动档案工作的转型升级,加快与信息社会融合,1999年,深圳市档案局在全国率先提出并启动数字档案馆建设工程。21世纪初,各级国家综合档案馆围绕档案数据和资源利用,加强档案资源“全数据”建设,馆藏档案的数字化工作逐步铺开,并作为档案工作的一项全新事业、全新工程在全国各地快速推进。作为档案信息化的基础支撑性工作,这项工作取得了很大的成绩,但在实际工作中,也存在一些困扰档案事业高质量发展的根本性问题。
一、档案数字化的现实意义
1.档案数字化是实现档案信息化的重要内容
纸质档案数字化是指采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录数据与数字图像的关联关系。随着计算机技术、网络技术以及通信技术的发展和应用,我国档案事业从传统管理逐步迈向档案信息化阶段。作为信息化转型的关键支撑,纸质档案数字化是数字档案馆和智慧档案馆的核心内容之一,是“互联网+”时代档案工作的必然选择,馆藏资源数字化也是实现档案信息组织与服务网络化、档案实体虚拟化、信息资源共享化、档案利用知识化的基础,是信息化社会给予档案事业的新挑战和新契机。
2.档案数字化是实现档案管理、利用模式转变的重要手段
档案数字化工作以档案存储数字化、利用网络化、服务大众化为目标,改变过去档案工作单一、局限的管理模式,建立网络化的档案利用服务体系,不断增强档案信息社会共享和远程服务功能,统筹安排档案利用服务、政府公开信息服务和其他公共服务,开展档案信息在线检索、调取、浏览、传输等全程化合作,提供查档一站式服务和远程服务,由传统利用方式向现代利用方式转变,形成面向公众、便捷高效的档案信息服务利用体系。
3.档案数字化是充分体现档案价值的重要支撑
档案信息化水平的提升,有利于进一步提高档案工作制度化、规范化、科学化水平,突破档案属地利用限制,打破档案“信息孤岛”,实现馆际档案资源的共建共享。随着国家治理体系和治理能力现代化的深入推进,档案工作发挥作用的空间越来越大,与老百姓的关系也越来越密切,依法树立以开放为原则的服务理念,推动数字档案资源的共建共享,可以全方位、多层次、多角度地为经济建设和社会发展服务。
二、纸质档案数字化工作的现状
档案部门考虑到自身人力和物力的局限性,根据档案信息化发展的需要,通过招标、竞价等方式将档案数字化工作委托给外包服务公司,可以实现档案数字化工作效益的最大化。但是从现有的档案数字化成果来看,数字化工作中也存在一些问题。
1.数字化工作中存在的问题
(1)目录错误率高
根据《文书档案文件级目录数据库结构与著录细则》和《江苏省文书档案文件级目录数据库结构与数据交换格式》规定的相关要求,目录著录的错误包括题名中错字较多、题名不完整、拟题不清、其他著录项错误等。目前在全文检索存在很大难度的前提下,目录数据库的建立是方便档案检索和利用的唯一途径。由于在档案数字化之前,已建立一定程度的目录数据库,数字化过程中核对目录、完善目录数据库工作环节往往被忽视,相关工作人员素质良莠不齐,对文件的理解和把握能力不够,录入文字的准确性不高等,致使虽然数字化已完成,但档案还是查不到或查不全。
(2)数字化前整理工作缺失
纸质档案数字化前的整理工作,是在充分尊重前人劳动成果的基础上,以适应纸质档案数字化要求为目标而开展的兼具回顾性和开创性双重特征的重要基础业务工作,包括确定扫描页、编制页号、目录数据准备、拆除装订、技术修复等环节。例如,许多档案中存在页码编制错误,跳页、漏页等现象,有数字化外包公司省略整理编页环节,也有数字化外包公司在编制页码时采用了“-1”“-2”等副页办法。笔者认为,页码编制不规范会造成两方面后果:一是著录项中载体数量与实体档案页数不符;二是在查档利用时如果只需要一件档案中的部分材料,而扫描页码与档案中实际标注的页码不一致,就会发生选择页码错误,影响查档效率,还有可能在没有认真审查的情况下,打印不需要的页面而浪费纸张。
(3)挂接错误或挂接不上
档案数字化完成后,会发现有档案无法挂接或是打开错误的情况,一般来说有三个原因:一是数字化公司扫描后的文件一般以JPEG格式储存,这时的命名是按扫描的顺序自行命名,为了利用需要,转换为PDF时应该按档号命名,许多公司用自行研发的软件在批量命名时发生错误,这会导致因档号错误而无法挂接,文件打不开。二是档案在归档整理时发生错误,目录著录张冠李戴,如建房证存根,目录拟对应的与实体中反映的不是同一人,在數字化扫描时也未能发现错误,就会发生利用时用正确的目录打开了错误的页面。三是分件错误,数字化公司在图像处理环节进行图像的分件处理时发生错误,而导致一份实体档案的扫描件被分割在多个目录中。
(4)扫描过程中产生的错误
扫描过程中,因为漏页、重复扫描,扫描时纸张扫不全,两页合并扫描等原因,导致了文件缺页、重页、上下重叠扫描不完整等错误。
(5)未能准确区分涉密档案
涉密档案一般不进行数字化加工或由档案馆自行数字化加工后加密存放,工作人员在区分时对涉密文件认识不清或操作不仔细,致使部分涉密文件未能挑出。
(6)利用时文件打开速度过慢
在查档利用时,打开一个文件需要5—10分钟,这一问题产生的原因:一是档案管理软件本身的局限性,全文打开的方式有待优化;二是档案整理时将多份文件装订成一件,如一套创建材料、一套会议材料、一整本工资名册等,因图片过大而导致文件在查阅时打开很慢,影响查档效率。
(7)其他
在扫描中,因扫描仪分辨率不高、纸张放置歪斜、装订顺序错误、过度修图裁边等产生的问题。
2.数字化工作发生问题的原因
(1)数字化前处理工作流程疏于监管
数字化公司为节省人力和财力,相应的规则形同虚设,工作人员为追求利益最大化,视流程为空文。
(2)目录著录方式不规范
许多档案馆要求数字化外包公司在目录著录时采取双机著录的方式,但实际操作中数字化公司为省工没有实施。
(3)数字化公司与档案部门沟通不及时
数字化过程中出现的许多业务问题,数字化公司不与档案馆及时沟通,自行走捷径处理,导致有的问题加工完毕才发现。
(4)数字化公司质检环节走过场
一般的数字化公司会设置质检环节,但在实际操作中并没能按要求严格进行,有流于形式走过场的情况。
(5)抽检机制不合理效率不够高
一部分档案馆会对数字化成果进行抽检,但数字化工作安排中没有为质检与加工留出足够的缓冲时间,质检往往滞后于加工环节几个批次,质检结果出现之前新的加工已经开始,无法及时发现加工方存在的问题,许多问题是在日常使用中才发现的,导致同样错误越积越多,最后难以彻底修改。
三、有效开展纸质档案数字化工作的对策
1.加强顶层设计,完善档案管理一体化系统
形成需求导向的档案信息化管理新模式,档案行政管理部门主动适应互联网和大数据、云计算、区块链、人工智能等前沿技术的发展趋势,围绕战略性、前瞻性、实用性问题开展档案科技研究,关注国家实施大数据战略和推进电子政务、电子商务、云计算的发展成果,研究其对档案工作的影响,切实加强档案信息化顶层设计和长远规划,探索电子文件归档和电子档案管理的可行模式,推行自上而下相对统一的檔案管理系统软件,改变目前由于各地区发展程度不同,档案管理的软件设计、硬件功能、管理流程和管理模式不同而自成一体的割据现状。
2.注重提升效能,确保数字化工作的制度化和规范化
2005年国家档案局出台了《纸质档案数字化技术规范》,从技术标准方面对纸质档案数字化工作作出了相关要求。但由于信息技术的不断发展、数字化设备等硬件的更新换代以及档案内容形式、管理方法、利用方式等的变化,国家档案局于2017年颁布了DA/T 31—2017《纸质档案数字化规范》(以下简称《规范》),提出了更符合新时期信息技术发展的纸质档案数字化工作的规范要求。档案馆和数字化外包单位应以《规范》为统领,研究论证,出台符合自己馆藏特点的细则、要求,并严格组织实施,做到相关流程不走过场,相关制度不流于形式。
3.坚持问题导向,做好档案的基础业务建设和标准化质检工作
随着信息化工作的推进,计算机的辅助管理对档案整理工作提出了更高的要求,档案整理的基础决定了数字化工作的质量,规范档案基础工作,严把档案进馆关,对列为档案数字化对象的馆藏档案,严格按要求进行数字化前处理工作,即在进行数字化之前,对档案逐卷、逐件检查,查看档案分类是否正确、组卷是否合理、编号是否规范、保管期限划分是否准确、页号编写是否正确、盒内文件是否有破损、归档目录填写是否完整、案卷题名拟写是否准确等。对于相关要点,数字化外包公司应熟记并准确掌握,一旦发现问题及时登记或按规范进行处理。建立规范的质检体系,数据从采集到成品应经过生产单位自检、数字化加工小组抽检以及档案管理人员成品验收,质检合格后方可归档入库。
4.开展业务培训,提升队伍的整体水平
加快推进以信息化为核心的档案管理现代化,必须有一支高素质专业化的档案干部队伍。许多基层档案干部知识结构已不符合档案事业发展的需要,档案行政管理部门应建立完善科学的引才育才机制,多措并举,进行电子档案基础知识、计算机管理技术、数字通信技术等强化培训,使他们迅速掌握电子档案管理的技能,建设一支政治过硬、本领高强、作风严谨、有专业水准的高素质档案干部队伍,推动档案公共服务迈向现代化,以适应新时代党和国家对档案工作的新要求、人民群众对档案工作的新期待。