文/中国电子科技集团公司第五十一研究所 沈玉瑾
二〇〇〇年,我国制定了《全国档案事业发展“十五”计划》,在“工作任务—档案的信息化建设”中明确提出:“加快现有档案的数字化进程。在北京、天津、辽宁、上海、陕西、青岛等地开展档案工作应用数字化和网络化技术的试点。”同一年的《全国档案信息化建设实施纲要》中又明确提出:“积极推进档案数字化进程,加强对珍贵、重要档案的保护,提高档案利用的效率和水平。”国家档案局新修订的《纸质档案数字化规范》(DA/T31-2017)也于2018年1月1日起颁布实施。
(一)纸质档案数字化的定义。纸质档案数字化(digitization of paper-based records)是采用扫描仪等数码设备对纸质档案进行数字化加工处理,使其转化为可以存储在磁带、磁盘、光盘等载体上的数字图像,并且按照纸质档案所存在的内在联系,建立起目录数据与数字图像关联关系的处理过程。
(二)纸质档案数字化的主要步骤。纸质档案数字化主要包括:纸质档案的出库、纸质档案数字化的预处理、建立目录数据库、纸质档案的数字化加工、图像处理、数据挂接、验收与移交入库。
(一)实现档案信息的共享,提供便捷服务。档案的信息化建设是现代档案管理的重要任务之一,以数字化的形式存储,利用计算机系统进行管理,以网络化的形式互相联系,形成一个有序的档案信息结构库,实现档案资源的信息在线利用,使可以公开的档案资源得到共享。运用数字化、信息化技术,把档案变成有用的信息资源,迅速、快捷地为利用者提供服务,是档案数字化最根本的目的。
(二)作为纸质档案的数字副本起凭证作用。纸质档案通过数字化的过程成为纸质档案的数字副本。纸质档案数字副本主要用于重要档案异质备份及网络化查档利用,其作用是代替档案原件为利用者提供凭证,这对纸质档案数字副本的凭证效力提出了较高要求。
1.纸质档案数字化加工场地的选择,应方便纸质档案的搬移,如:出库和入库。2.扫描仪选择对数字化图像质量的影响很大,扫描设备的合理选用非常重要。所以,需要重点分析扫描设备的扫描速度、宽度、厚度、色彩、光学分辨率等。纸质档案一般都是由多种幅面的纸张组成,因此数字化加工应当根据纸质档案的实际情况、数字化目的和数字化规模、计算机网络及存储条件等选择相应设备,并进行相关参数的设定。除配备一般的扫描仪外,对底图图纸应配备大幅面的扫描仪,对于极其珍贵的不可拆纸质档案建议配备非接触扫描的书刊扫描仪。尽可能采用对纸质档案实体破坏性最小的数码设备进行数字化处理,并按相关设备的使用率进行定期维护、保养。
(一)建立纸质档案数字化的工作机构。建立纸质数字化工作组织,对数字化工作进行统筹规划、协调管理、组织实施、监督检查等,便于纸质档案数字化工作的顺利开展。为今后科学、规范开展数字化工作提供组织保障。
(二)制定纸质档案数字化过程所需的规章制度与程序。档案包含很多重要的资料,有的会涉及国家秘密、企业的商业秘密等,出于对企业信息安全和国家秘密安全的考虑,对纸质档案数字化加工过程中应建立纸质档案数字化安全保密制度,制定纸质档案数字化加工过程管理、纸质档案实体交接程序、纸质档案数字化成果验收与交接、存储介质管理、档案实体保护等操作规程或规章制度,采取必要的保密管理措施。
(三)纸质档案数字化过程的安全保密管理。1.制定纸质档案数字化加工场所的管理制度,对数字化加工场所的人员进行严格控制,出入时进行人员登记和身份认证,严禁无关人员进入数字化加工场所;数字化加工人员应参加保密教育,签订保密协议和个人保密承诺书。2.纸质档案数字化加工场所需安装防盗报警装置、视频监控和电子门禁系统。并配备性能良好,数量足够的灭火器材,安装防火、防烟报警装置;严禁拍照,禁止带入具有摄录功能的电子产品,如:录像机、照相机、手机等。3.根据纸质档案数字化计划,严格按照档案管理制度控制档案的出、入库,按文件目录逐件清点、检查,办理交接手续。认真填写档案交接登记表,登记所需扫描档案的件数、页数等,扫描完成后,按目录顺序放回档案盒内。恢复时应注意档案的排列顺序,做到准确不错位无遗漏。
(一)专业化修复。为确保数字化加工图像质量,应对粘连、破损、残缺、褶皱等的档案进行专业化修复。数字化图像加工人员依据目录信息以及数字化规范、细则等,对档案进行顺序扫描,形成PDF、JPEG或TIFF等通用格式图像,并进一步命名核对。
(二)针对不同的档案采用不同的模式进行扫描。对于页面中有红头、印章或有插图、照片、多色彩文字等的档案,运用彩色模式进行扫描;对不带插图、字迹清晰、黑白两色的档案,采用黑白模式进行扫描;但对于字迹清晰度差或带有插图,页面为黑白两色的档案,采用灰度模式扫描。
(三)扫描分辨率参数大小的设置。原则上以扫描后的图像是否清晰、是否完整及不影响图像的使用效果为准。采用彩色、灰度、黑白等不同模式进行扫描时,其分辨率应不小于200dpi。对于文字偏小、密集度高、清晰度较差等或者需要高精度仿真复制的,应将分辨率提高以满足需求。
(四)对图像清晰度、偏斜度、失真度等进行自查。发现不符合图像质量要求的,应对图像重新进行处理。对偏斜、方向不正确的图像进行旋转、纠偏等还原处理,以适应阅读习惯;对图像页面中出现的杂质等进行去污处理,但不能改变档案原貌。
(五)减小存储容量。图像的存储在保证图像清晰可读的情况下,尽量以减小存储容量为准则。一般来说,纸质的文字文档采用PDF格式,图纸采用JPEG格式。
(六)数字化图像质量检查。数字化图像质量的检查是纸质档案数字化过程质量控制的核心,必须严格按照质量规范和技术标准,对数字化图像质量进行系统的、全面的、有步骤的检查、监督。为保证数字化质量,制定合理、有效的分级、分步质检程序。在项目加工过程中,按照数字化加工要求,采取100%原档与数字化图像进行比对,对数字图像清晰、失真度、图像旋转、拼接、纠偏等每一个项目进行检查、比对,检查图像信息的准确性及完整性。对不符合图像质量要求的重新进行扫描处理。
(七)纸质档案数字化的验收采用计算机自动预检和人工检验相结合的方式。1.计算机自动预检。预先定义扫描处理单据,建立表格识别模块、表格登录模块,将扫描得到的图像通过OCR识别技术对目录、图像、挂接、载体4大类项目进行100%的机检。例如:目录中字段的格式、数字化参数等是否符合规范。检验合格率应达到100%。2.人工抽检。抽取比例5%-20%的案卷,(自动预检报告生成的问题案卷和随机抽取案卷)与纸质档案进行比对,确保抽检数据覆盖范围及抽检效果。3.复检。根据检测报告对发现的问题逐一改正,并提交整改清单,验收人员对照整改清单逐条进行对比复检。
纸质档案数字化是企业实现档案信息化管理一个重要的过程,加工过程管理需要一个完整而有序的保障体系。将企业档案数字化建设推向更高的层次,为企业数字档案馆的建设提供强有力的保障,推动档案信息服务工作更加规范、更加安全、更加便捷、更加有效。