李文媛 王辉 陈湘辉 欧阳琼
摘 要:档案数字化作为档案信息化的基础工作之一既是时代发展的趋势也是现实工作的需求,但在实践中仍然存在经费限制、标准实践差异、质检效果效率失衡、外包管理混乱等问题,据此笔者提出争取重视、合理规划经费,开展试验、敲定标准细节,严格把关、确保质检成效,制定方案、落实工作流程和现场管控等实践工作建议。
关键词:档案数字化;实践;问题;外包
在信息时代背景下,档案信息化发展势不可挡,数字化是档案资源化的重要途径之一,但是数字化工作在实践中仍然存在种种问题。在此情况下,档案工作人员需要认清形势,积极迎接挑战,探索适合本单位的数字化方式,遵循档案管理要求,满足档案和业务工作需求,提高档案利用率,增加档案工作显示度。
1 档案数字化的必要性
1.1 档案数字化是时代发展的必然趋势
当今社会是信息化的时代,信息量剧增、信息传递迅速,传统档案工作模式已难以适应信息时代的要求。只有传统载体的档案资源转化成为数字资源,才能够顺应时代发展,使档案资源在信息化浪潮中得到更有效的应用,档案工作才能取得进一步的发展。档案数字化则是实现档案资源形态转化的必要手段之一。面对新形势新任务新要求,两办提出“各档案馆(室)要大力开展传统载体档案数字化工作”[1],国家档案局《全国档案事业发展“十三五”规划纲要》提出“全面推进档案资源存量数字化、增量电子化、利用网络化”的发展目标[2]。这都是国家层面顺应时代要求对档案工作的新规划新要求。
1.2 档案数字化是现实工作的迫切要求
档案工作既要为国家存史,也要为经济社会发展服好务。存史则要保管好档案,服务则要利用好档案,而当下的档案工作常常面临库房紧张、档案损坏老化、利用效率低等问题,管好用好档案都存在难以长期为继的风险。而档案数字化则能够减少传统档案实体的限制,减轻库房压力、降低档案实体使用率从而在一定程度上保护档案,同时可以提高档案管理和服务效率,能更好地为单位、公众、社会所利用。对于数字化工作的推进,国家和各地方档案管理主管部门了也提出了具体的目标:对综合档案馆来说,国家对馆藏数字化率作出了“全国省级、地市级和县级国家综合档案馆馆藏永久档案数字化的比例,分别达到30—60%、40—75%和25—50%”[3]的明确要求;对机关企事业单位等移交单位来说,许多综合档案馆已经要求移交进馆的档案同时移交数字化副本。这些都充分说明了现实工作对档案数字化紧迫要求。
1.3 档案数字化是档案信息化建设的重要基础
围绕“以信息化为核心的档案管理现代化水平明显提升”的档案管理信息化发展目标[4],档案信息化建设成为近些年档案事业发展和各档案馆(室)的工作重点。档案数字化既是档案信息化的重要组成部分,也是档案信息化建设的重要基础。存量档案数字化是档案信息化建设的数据资源来源之一,与增量电子化共同构成档案信息化的信息资源基础。信息技术也是近一二十年的才迎来高速发展,各档案馆(室)除了面临现在海量的新增电子信息资源,更有积累数十年甚至上百年的大量传统载体档案在库房中亟待更好地发挥其价值,因此档案数字化是一项不可或缺的基础性工作。
2 实践中档案数字化工作的困境
尽管档案数字化工作開展较为普遍,但在工作中还存在着诸多问题,突出表现在经费有限、标准实践差异、质检效率效果难平衡、外包管理混乱等。
2.1 经费限制
各单位档案管理部门虽然可以自行开展档案数字化工作,但是通常情况是专职档案员十分有限、数字化任务量却十分巨大,要自行完成全部馆藏档案的数字化工作难度很大,因此目前采取业务外包的形式更为普遍。虽然档案数字化是一次性投入无后续维护等追加费用,但是数十年馆藏量的积累以及逐步提升的人力成本,一般需要较大的经费投入,从十几万到几十甚至上百万不等的成本开支使得经费问题成为数字化工作能否开展的首要问题。特别是档案工作的存在感较低,在不是以档案资料管理为主要业务的单位,档案工作常是边缘性、非显性的工作,得到的重视程度有限,经费支持相应的也十分有限,直接限制了档案数字化工作的开展。
2.2 标准实践差异
国家层面近些年陆续制定出台了若干个档案数字化工作标准文件,对档案数字化工作开展有很大的实践指导价值。但是这些标准都是行业推荐标准,不具备强制性且用词上也多以建议性为主,所以在实践过程中仍然有对标准尺度把握不确定的问题,例如在扫描分辨率、存储格式、OCR处理的选择。
《DA/T 31-2017 纸质档案数字化规范》规定“扫描分辨率应不小于200dpi。如文字偏小、密集、清晰度较差时,建议扫描分辨率不小于300dpi”,在存储格式上“纸质档案数字图像长期保存格式为TIFF、JPEG或JPEG2000等通用格式”。通过以上条款可知,200dpi的分辨率能够满足档案工作需要,而在实践中,高比低好的心态、移交进馆等要求等促使300dpi的选用成为常态。同样的,在实际工作中JPEG有损压缩的保存格式在视觉感官上几乎难以分辨,但是出于信息完整新的保存还是不少单位会选择TIFF无压缩。然而,分辨率和存储格式的差异,占用空间会有几倍甚至几十倍的差距,在数十万页、数百万页的馆藏数字化量级的情况下更高的分辨率和无压缩的存储格式会给档案信息的存储造成较大压力。全文检索是深度利用档案的一个重要检索途径,数字化资源实现全文检索则要依赖于OCR识别。目前OCR技术对普通文字文档识别准确率较高,但对图表、手写体的识别率则大大降低,在工作中需要投入更多的财力人力进行软件智能学习、人工校对。因此在不少单位对数字化图像进行OCR处理没有进一步要求。
2.3 质量检查效果效率难平衡
成果检查是保证档案数字化成果质量的关键步骤。质量检查分为机器检查和人工检查,也分为全检和抽检。所谓机器检查就是通过计算机软件对数字化扫描参数、图像处理情况、目录数据及挂接等项目进行检查,有速度快、效率高等特点。但据目前了解的情况来看,实践中能够做到机检的并不太多,更多的质量检查工作还是依赖人工。在检查结果上,全检的质量控制效果一般是优于抽检的,但在效率上则很难满足工作实际。因为全检工作意味着要对数字化原件出入库、装订还原等情况进行逐件检查,也要对数字化成果的各项参数、标准等逐件逐页检查,对人力投入有很大的要求。然而,鉴于档案工作人员普遍不足的现状,全检几乎难以实现,人工抽检是目前的较为普遍的选择,因此在质量控制上就有存在误差的可能性,质检效率效果需要仔细衡量。
2.4 外包工作管理混乱
由于人手不足、工作效率较低等因素的限制,档案数字化业务外包成为当前档案部门的普遍选择,由此却引发了业务外包管理的问题。首先是准入问题,尽管各省市均陆续出台了档案中介服务机构备案等管理规定,但行业准入门槛不高、公司人员流动性大、专业程度不高等问题一直存在,是档案数字化工作的潜在隐患。其次是安全问题,数字化项目开展往往是临时安排的工作场所,视频监控系统、工作设备、专用装具等安全保障不一定完备,存在一定的安全风险。最后是过程管理问题,数字化工作一般数量多任务重,工作流程较长且有反复,过程中容易出现监督、指导和管理不及时不到位的情况,也会对档案数字化工作的成效造成影响。
3 对档案数字化实践工作的建议
3.1 争取重视,合理规划经费
通过加强宣传、努力提高档案工作地位、提升档案工作显示度,争取领导对档案和档案工作的重视,争取获得足额工作经费支持并合理使用,以保证数字化工作顺利开展。在经费有限的情况下,更需要科学规划工作、合理安排经费,按档案资料的重要程度划分确定数字化工作对象的优先级,有效地发挥有限经费的最大价值。档案资料的重要程度可以按保管期限、利用频率、是否需要移交进馆等维度来进行判断,保管期限为永久的档案一般价值较高是数字化重点对象,利用频率高的档案说明是工作常用且出于档案实体保护目的应该提前数字化,需要移交进馆的档案因为进馆要求必须数字化。
3.2 开展试验,敲定标准细节
档案数字化最终成果质量的高低依赖于工作要求细化的程度,标准细化程度越高,数字化工作实施更明确。档案数字化工作全面展开前,可以先进行小范围试验,以根据实际情况选择最适宜的扫描分辨率、存储格式,明确文件命名规则、目录数据著录项、图像处理程度以及是否进行OCR识别等工作细节要求。在试验中,应注意测试全面、成果完整,以避免在正式开展工作时出现过多的新问题导致方案频繁修改。同时,积极寻求档案主管部门业务指导,与已开展档案数字化工作单位交流学习,与档案中介服务机构积极沟通,将数字化加工的工作要求、质量标准落在纸上,落实在工作中。
3.3 严格把关,确保质检成效
在数字化工作开展期间,尽量增设人手确保质量检查工作有效开展。在人手不足且以人工检查为主的情况下,需要制定适宜的质检策略,做好质检效果和效率的平衡,确保检查覆盖率更全面、关键点检查不缺失、质检结果有保证。质检策略可以采取分批分步分级分点的方式:分批即将整个項目待数字化的档案根据数量、工期、加工人数等情况分若干批次,完工一批质检一批;分步即数字化工作中每一个后续环节对前序环节质检,并设置全面质检和验收抽检环节;分级即分为项目组和验收组分别质检,分别设置全检和相应的抽检比例分点即明确抽检合格标准;区分关键点(文件命名、目录挂接等)和一般检查点的合格率,针对问题频发和新进人员提交的数据可以进行定向抽检[5]。另外,建议加强加快数字化成果检查软件平台的研发和转化推广,切实减轻数字化质检的工作量,提高工作效率[6]。
3.4 制定方案,落实工作流程和现场管控
档案数字化工作应当早谋划、早准备,明确工作方式、安排工作场所、制定工作方案,严格落实和执行。明确工作方式即明确是自行开展还是引进外包,采取业务外包形式的,则应严格做好资质审查、技术能力评估以及管理能力考察,确保外包单位技术扎实、管理可靠。工作场所则尽可能的提前,在申请经费、制定工作方案的时候即可着手准备符合规范要求的工作场地和设施设备,避免加工项目组即将进场才临时匆忙安排的情况。工作方案和管理制度的制定上,既要明确加工流程及质量也要规范工作现场的管理,因此需要制定工作流程及各环节质量要求及包括人员、场地、设备、数据、实体管理等在内的数字化管理制度,加强全流程安全管理并建立问题反馈机制,根据情况制定实用的工作记录表单,有效落实工作流程和现场管控,做到可备查、可追溯[7]。
参考文献
[1]中共中央办公厅 国务院办公厅印发《关于加强和改进新形势下档案工作的意见》.[EB/OL].[2018-11-1].http://www.zgdazxw.com.cn/news/2014-05/05/content_45061.htm
[2]全国档案事业发展“十三五”规划纲要(档发〔2016〕4号).[EB/OL].[2018-1-10].http://www.saac.gov.cn/news/ 2016-04/07/ content_136280.htm
[3]同上。
[4]同上。
[5]徐杰,杨永,张颖.历史档案数字化质量控制探析[J].中国档案,2018(5):72-73.
[6]王学平.浅议我国档案数字化建设实践与发展策略[J].档案学通讯,2011(6):54-57.
[7]张柘蓉.科技成果档案数字化建设的思考[J].数字与缩微影像,2011(1):24-25.