美国《文化遗产资料数字化技术指南》介绍及启示

2014-12-14 08:15陈霄
办公室业务 2014年22期
关键词:文稿章节指南

文/陈霄

国家档案局9号令提出,档案馆要适应信息化建设的需要,收集电子档案和纸质档案的数字化副本。档案数字化工作越来越受重视,相应的数字化要求也会越来越高。我国档案工作“十二五”规划中特别就数字化工作作了明确要求。上海市档案事业发展“十二五”规划提出:“档案数字化全文覆盖率平均达到60%-70%”。浙江省档案事业发展“十二五”规划提出:“对机关单位未到移交进馆年限的纸质档案,全部进行数字化”。文化遗产资料数字化技术指南来自于国际档案理事会网站。国际档案理事会(简称ICA)是全球文件和档案专业人员的代表,致力于文件的有效管理和世界档案遗产的保护和利用。在其网站上发布了很多专业的档案项目,其中一个项目为图像视听档案工作组的,指南是其工作的一个重要成果。

一、该指南的基本框架及介绍

指南从技术概述、成像工作流、不同记录类型的数字化规则、文件格式比较、元数据、储存推荐、质量管理等方面全面介绍了如何开展数字化工作。指南共分8个章节,它们是:

第一章:引言

第二章:技术概述

第三章:成像工作流

第四章:各类文稿的数字化规范

第五章:文件格式比较

第六章:元数据

第七章:推荐存储

第八章:质量管理

其目的是开发这套用于鼓励各个联邦机构(以及其它有意向的机构)协作的数码图像指南,为公众提供格式统一的图像,为数字化服务供应商和制造商提供常见的实践方式和技术基准。提供一套符合当前实际的数字化方法。提供一套适用于各种输出和各种用途的一致的成像和元数据收集方法。定义用于描述评价数码成果及用于评测符合规定要求的验证方法的通用的质量或品质指标。

指南指令性条文性的内容很少,信息翔实案例丰富,侧重于实用性。

本文涉及的主题包含以下内容:

静态图像的数字图像采集——主文件创建、图像参数、数字化环境、色彩管理等。

色彩编码准确度——色彩空间、图像处理图像阅览的色温、线性及区域矩阵质量、不同插值算法的质量。

数字图像品质——评估数字图像特性的可操作指标和标准的发展,该指标和标准用于数字图像的检测或质量控制,包括多种位图类型的分辨率、噪声、色彩编码、失真的指标和标准。

图像处理工作流范例——包含图像处理、锐化等方面的指南。

元数据最低要求——讨论为了主文件能够可读、可查、可用所需收集和建立的最小元数据集。

文件格式——主文件的推荐格式和编码等。

文件命名的方法。

基本存储建议。

质量管理——图像、元数据、图像检查、接受和拒绝、计量(保证检测和质检设备读数精确精准)这些方面的质量保证和质量控制。

二、该指南对我们工作的启示

(一)指标量化。指南对数字化过程中各类指标及术语都做了详尽的说明。在技术概述章节中详细描述了数字化过程涉及的各种专业术语,比如栅格图像特性方面的空间分辨率、其测量方式为每英寸的像素即PPI或每英寸点数即DPI,信号分辨率,其表示为位深度,比如8比特位(8-bits),色彩模式、常见的色彩模式包含RGB(红red、绿 green、蓝 blue),CMYK( 青Cyan、品 红 Magenta、黄 Yellow、黑Black[ K:blacK = 黑色,为了避免与RGB的Blue蓝色混淆而改称K])和LAB(明度lightness、红/品红和绿色red-green、黄和蓝 yellow-blue)。

?

?

在数字化环境方面的参数、其中提到数字化中对显示器有较高要求。

扫描仪和数码相机性能的量化章节提供了套用于评估数码成像的通用质量指标,也是该指南的一个关键章节,共六个表,一个主表(第一部分——数码成像性能分类),五个附表(第二部分——数码成像的评估和质量控制)。这些表和评估标准用于指导具体数字化工作。以下是主表(表1)和其中一个附表(表2)的范例。在每个表中任何指标该指南都有详细的技术说明。

(二)范例丰富。各类文稿的数字化规范章节中,对手稿、书籍、图文稿、插画、地图、平面图、照片、航拍照片、实物及文物等类型原稿都有详细的操作实例,并给出了具体的处理建议和技术参数,说明详尽,图文并茂,使读者能很快了解不同原稿处理时的注意点,处理的关键,掌握操作步骤。指南还提供了这些文稿数字化处理工作流实例。

以指南中文稿印章扫描为例,图1中显示的左侧为普通平板扫描的成果,文稿中的印章几乎无法识别。指南在印章处理章节中详细说明如何进行实际操作,右侧是按照指南中印章处理的方法,在扫描过程中采用单侧光源,印章内容清晰可见。

本人在平时的工作过程中,会有档案员咨询如何将本市数字化规则应用到工作中,说明本市数字化规则在设定时,还是侧重于条文,而在范例应用上比较欠缺。以后在制定数字化规则时,可以参考指南,引入操作范例。

(三)元数据在数字化过程中的应用。指南的一大特点就是,在数字化过程中引入元数据的管理。在元数据章节中,指南建议选择合适的元数据,在数字化过程和数字化成果保存利用过程中都需要应用元数据。元数据选取过程中首先要考虑以下内容,元数据是否已在其它系统中存在,比如数据库、书目记录、检索工具、或者类似都柏林核心数据库或本地数据的数据格式中,元数据由谁来获取,如何获取,何时收集,何处存储,如何存储,是否与其他系统交互,元数据记录明细度等。

在质量管理章节中,指南建议数字化图像100%验证,即全面质检,并要求图像的元数据完整。

在我国,元数据在档案信息化过程的应用也是一个热点话题,浙江省也是元数据应用的国家试点地区。而在日常工作中,数字化加工很少涉及元数据。如何将元数据应用在数字化工作中,以确保数字化成果完整性、有效性,使数字化成果能够长久保持,方便利用。笔者认为在这方面可以参照指南,是值得研究的。

指南在文献遗产数字化方面提出的操作标准及理念处于世界领先水平,又是国际档案理事会推荐的数字化标准,因而指南对本地数字化工作有启示意义。当然,指南中的标准及参数是建立在美国联邦机构数字化实践的基础上,与我们的实际工作会有不同的地方,因而在如何学习,如何提高本地数字化工作上,需要做很多努力。

猜你喜欢
文稿章节指南
文稿规范
文稿中统计学符号规范化书写的要求
高中数学章节易错点提前干预的策略研究
利用“骨架突破法”,提高复习效率
指南数读
论碰撞的混搭指南
文稿打字的小方法
八仙过海,各显神通
《烃》一章中的实验考点大扫描
就医指南