王彩莲 黄雨婷
摘 要 论文调研欧美发达国家图像数字化标准建设成果,为我国公共数字文化融合工程数字图像资源建设标准的制定提供参考。论文采用网站调研、文献调研等方法收集欧美发达国家公开发布的9个图像数字化标准,系统梳理标准的特征,认为我国在研制图像数字化标准时应统一部署,吸引各类文化机构参与,按需更新内容,注重版权问题,完善质量指标和评估体系,制定数字化建设方式的选择原则。
关键词 公共数字文化 图像 数字化 标准
分类号 G250.76
DOI 10.16810/j.cnki.1672-514X.2021.03.013
Development Progress and Enlightenment of Digital Image Standards Construction in Developed Countries in Europe and America
Wang Cailian, Huang Yuting
Abstract This paper investigates the construction results of image digitization standards in developed countries in Europe and America, and provides reference for the establishment of digital image resources construction standards of public digital cultural integration project in China. This paper uses the methods of website research and literature research to collect nine image digitization standards published by European and American developed countries, systematically combs the characteristics of the standards, and thinks that China should make unified deployment in the development of image digitization standards, attract the participation of various cultural institutions, update the content as needed, pay attention to copyright issues, improve the quality indicators and evaluation system, and make principles of choicefor digital construction.Keywords Public digital culture. Images. Digitization. Standards.
0 引言
图像资源建设是公共数字文化建设的重要内容之一,其中建立并完善图像数字化标准是图像资源建设的基础。20世纪80年代开始,国际图书馆界已有图像数字化的探索和数字化标准的制定实践[1]。美国国会图书馆1990年开启“美国记忆(American Memory)”计划[2],持续发布和完善数字化标准。荷兰皇家图书馆于1995年开始馆藏数字化的工作,2010年推出图像数字化指南[3]。在理论研究方面,国外有研究比较了经典图像数字化指南的优缺点和应用现状[4];有学者从理论角度总结开展图书馆数字化项目需考虑的问题[5],但缺少操作细节;国内有学者分析了美国FADGI和澳大利亚数字化标准的内容及对我国的启示[6-7],但调研范围较小。
我国现行图像标准有三个,分别为2011年国家图书馆发布的《国家图书馆图像数据加工标准和操作指南》(下简称《操作指南》)、2012年文化部发布的文化行业标准《图像数据加工規范》和2014年国家标准《图书馆馆藏资源数字化加工规范第3部分:图像资源》。但现行标准在技术参数、流程上存在差异,未能跟上当前技术的发展,引用的国际标准文件不是最新版本,且未明确规定数字化中的版权事宜,在实践中引发了著作权侵权的争议。现行标准未能完全满足当前图像加工的需求,制定统一、先进、适用的图像数字化标准势在必行。由此,本文拟以欧美发达国家图像数字化指南为对象,梳理研制情况及内容特征,以期为我国图像数字化标准建设提供启示。
1 发达国家图像数字化标准研制成果及特征
本文调研的欧美发达国家的国家级公共图书馆、相关协会或联盟、资助机构等公开的图像数字化标准文件共9份,如表1所示。文件以指南(Guidelines)、建议(Recommendations)或最佳实践(BestPractices)等形式发布,后文统称为指南。
1.1 指南研制主体多样
图像数字化指南的研制主体多样,包括国家级图书馆、图书馆联盟和科研资助机构。国家级图书馆推进图像数字化工作不仅有利于提升本馆数字化信息服务水平,还能推动国家文化遗产的保存和传播。荷兰皇家图书馆、西班牙国家图书馆、瑞士皇家图书馆和美国国会图书馆均为国家级图书馆,拥有丰富的馆藏、先进的技术以及充足的人才和资金储备,为图像数字化标准编制工作奠定了坚实基础。
IMPACT、ALCTS和CARLI等图书馆联盟作为区域型图书馆组织,促进了资源的数字化、共享和交流。IMPACT是服务于欧洲地区的非盈利组织,旨在“更好,更快,更便宜”地推进历史印刷文本数字化。ALCTS是美国图书馆协会(American Library Association,ALA)成员之一,旨在推动技术服务、馆藏管理、开发、保存和重新格式化技术的发展。CARLI旨在通过共享专业知识、产品、服务,促进伊利诺斯州学术和研究图书馆的教学、研究和创新。
德国研究基金会和美国国家人文基金会均为其资助的数字化项目制定了指南。《DFG数字化指南》用于指导申请人设计规划项目,保证数字化项目评审的公平和规范。美国国家人文基金会与国会图书馆研制的《国家数字报纸计划(NDNP)技术指南》避免了因申请单位的差异造成的数字化资源质量不稳定,便于数字化成果的统一管理。
1.2 更新频率不一
半数以上指南在研制过程中经历过版本更新,根据时代发展修订指南内容,保证指南的先进性。另一些指南为确保指南具备稳定性,在现有版本能够满足使用需求的情况下,未发布更新版本。
美国NDNP指南由专门的项目组维护,总结实践中遇到的扫描、元数据等问题,检查格式文件更新,在每年上半年推出新版本。瑞士国家图书馆2014年将策略型文件更新为实操型指南,并于2017年进一步完善,其最新版原计划于2019年前后推出,但目前暂未发布。美国国会图书馆的《文化遗产材料数字化技术指南:光栅主图像的创建》与原指南相比,规范了数字化流程,细化了不同类型资源和不同质量等级的参数,还增加了质量评估系统和元数据的内容。指南由FADGI的静态图像小组专门维护,计划在未来一到两年内推出新版本。这些指南根据实践需求及时完善,时效性高。但值得注意的是,更新过快也会导致实际应用中数字化的流程、图像参数等变更频繁,从而对实际工作造成影响。
在实际应用中,稳定性也是指南应具备的特性之一。DFG于2013年更新后未发布新版本,ALCTS和IMPACT没有公开更新信息,主要原因是这些机构的指南仅作为数字化思路指导,不涉及图像数字化具体实践。荷兰皇家图书馆的指南于2012年推出,目前仍在使用,虽然更新频率较低,但保证了图像数字化的持续性和稳定性。
2 国外图像数字化标准内容分析
2.1 高度重视版权问题
国外指南对版权的要求较为严格,通常根据本国或地区的法律要求限制数字化对象的使用范围,在选择数字化资源时考虑潜在的版权问题,规避版权风险。
对受版权保护的原始资源,要以遵守当地法律法规要求为原则。在瑞士,作品自存在起就受版权保护,在对资源数字化前必须获得版权所有者的授权。瑞士国家图书馆要求有版权的原始资源在数字化前要与出版商达成授权使用协议。在国际社会,当数字化项目为馆藏、教育或研究等非盈利性目的使用时,可通过版权合理使用制度获得数字化权利[16],但用于传播时,需获得授权。DFG要求在提交项目申请前解决材料的版权问题,包括出版权、人格权、邻接权和档案权,这一规定使项目避免了潜在的法律风险,保证了数字化图像能被合法传播和利用。
为避免潜在的版权纠纷,首先考虑选用公共领域的文献。西班牙国家图书馆和NDNP要求数字化对象的原件是公共领域资源,即由公众共享并可免费使用的不受版权、商标、专利或任何其他知识产权法保护的创造性材料[17]。公共领域的文献使用限制少,不需要获得作者授权,仅需要保护作者的精神权利即可。西班牙国家图书馆和NDNP数字化的目的均为免费展示和网络传播,选用公共领域的文献可避免潜在的版权纠纷。
2.2 强调质量控制与评估
指南对图像质量的控制和评估体现在数字化的整个流程中,包括在数字化前规定国际统一的图像质量维度并明确参数,数字化过程中应用完整的评估系统保证质量,数字化结束后多维检测成品。
首先规定统一的图像质量维度。大多数指南都将图像分为主图像和派生图像两类,其中主图像用于长期保存,采用未压缩的TIFF格式,派生图像由主图像压缩生成,用于传播,有JPEG、PDF、PNG等格式。色彩(灰度或彩色)、色彩深度、分辨率等是普遍采用的图像质量指标,各指南的具体参数要求差异较大,如表2所示。
多数指南对图像分辨率的要求都在300dpi及以上,最低为CARLI中对缩略图要求的100ppi。指南对颜色和位深的要求基本一致,灰度图像多数要求8位,彩色图像要求16位或24位。CARLI中还出现了二值图像的要求,即图像中仅有黑白两种颜色,这在满足需求的前提下,大大减少了存储空间。
此外,还有指南对色彩空间(又名色域,Color Space)进行了限定,色彩空间是对颜色进行编码和组织的方法,影响颜色表现的丰富程度,扫描加工时色彩空间会影响数字图像对原始文献的色彩还原度。常用的色彩空间有eciRGBv2、Adobe RGB(1998)和Gray Gamma 2。eciRGBv2通过人眼感知色调差异的方式构建,适用于高质量印刷品的数字化,Gray Gamma 2.2主要用于灰度图像。FADGI的指南建议将当今彩色显示器上广泛使用的色彩空间sRGB用于以传播为目的的派生图像。
其次完善评估系统。数字化流程的质控需要在不同阶段设定技术目标,并使用测试图表进行质量检查。荷兰皇家图书馆使用的测试图表有Q-13、mini ColorChecker和通用测试目标(Universal Test Target,UTT),FADGI自主研發了图像评估系统——数字成像一致性评估项目(The Digital Imaging Conformance Evaluation Program, DICE)。质控主要检查色彩准确度、曝光、对比度和白平衡等,保证图像清晰度和对原始资源呈现的忠实度。
最后对图像进行多维度检测。图像成品的质控是对数字化过程中的质控的补充,保证了图像及其相关描述、链接的完整性和准确性。西班牙国家图书馆在质检中要求随机抽取小部分页面,检查图像可靠性是否达到一定水平,检查图像的标签、名称和显示状态是否正确。NDNP数字化成品在交付给国会图书馆前均需完成质量检测,项目组开发了JHOVE工具包用以核对文件标识、格式和特征描述,该工具包囊括了NDNP特有的核对规则,可保证数字化成品的质量合格。
2.3 数字化建设方式选择灵活
图像数字化建设依赖于专业的数字化人员、设备和经验,建设方式包括自建或外包。多个指南提出了数字化建设方式的选择原则,图书馆可根据自身数字化资源、能力、成本等灵活选择。
指南规定的数字资源建设方式包括自建和外包两种。自建是指由专门设立的数字化部门负责,其他部门配合完成的建设方式。自建可为未来的项目建立起专业知识储备和基础设施,减少材料损坏的风险,便于控制图像质量,但对图书馆设备和人员的要求较高。外包是指将数字化任务交由合作者或外部服务提供商完成,具体操作过程中,既可以将原始文件带离图书馆,也可以将文件保存在图书馆,由外部服务提供商在现场进行数字化。外包可节约成本和时间,减轻馆员的工作压力,但仍需要内部员工管理项目,保证数字化的质量。
在选择自建还是外包的问题上,DFG、FADGI和瑞士国家图书馆都提出需要同时评估机构的能力、项目和数字资源的性质。评估机构能力的维度有人力资源、职工的数字化技能、物理空间、数字化设备及可用的资金或资源水平;评估项目和数字资源的维度包括项目的紧迫性、文档的类型和数量,文件的保存状况和脆弱性、文件的价值和安全性,及最终产品的预期质量等。综合权衡这些维度可保证决策的正确和科学。此外,根据实际需求,即使在同一个项目中,也可同时采用两种建设方式,通过优势互补完成数字化任务。
3 国外图像数字化标准对我国的启示
3.1 统一部署,吸引各类文化机构参与
欧美发达国家指南的研制主体多样,图书馆、联盟和科研资助机构都积极进行标准的研制工作,丰富了标准的成果,但也造成了标准混乱的问题。我国积极推进统一的标准建设,2019年4月颁布的《公共数字文化工程融合创新发展实施方案》[18]要求统一标准规范体系,编制统一的图像资源建设标准和技术标准。国家的统一部署可以有效避免标准混乱的问题。
吸引各类公共文化机构积极参与标准研制保证了标准内容的科学规范。图书馆拥有丰富的实践经验,可保证内容的专业;图书馆联盟可从数字化共享传播的角度提供建议;科研资助机构可从数字化项目可行性维度提供思路。各类机构积极参与、群策群力,从不同立场提供标准研制的建议,可以使标准更好地指导图像数字化实践。
3.2 按需更新内容
2011年发布的《操作指南》是我国现行最详细的数字化指南。尽管2012年、2014年分别发布了行业标准和国家标准,但是《操作指南》尚无更新版本。FADGI、NDNP、瑞士国家图书馆和DFG的指南在发布后均有修订,有效地保证了指南的先进性和科学性。我国应以实践需求为导向,以先进性和兼容性为基本原则,根据社会发展和科技进步情况及时修订指南文件。随着扫描、显示和存储能力的提升,实践对图像清晰度、色彩丰富性的需求不断升级,图像的分辨率和色彩位深等参数应及时调整。随着技术的成熟,三维建模、环物摄影的三维展示技术被广泛应用[19],“全景虚拟游览”进入人们的视线,新兴技术改变了保存和展示实物文献资源的方式,在指南的更新中应充分考虑应用需求,以决定是否需要纳入指南。
3.3 注重版权问题
版权问题在欧美发达国家的指南中被广泛提及,但在我国现行图像数字化标准中缺乏版权相关规定。在数字化材料的选择中,西班牙国家图书馆、瑞士国家图书馆和美国NDNP项目都要求审查数字化原件的版权情况,要求征得版权所有人的许可或仅选择公共领域的文献,避免版权纠纷。随着我国法制建设不断推进,完善知识产权相关规定的需求被提上日程,国家版权局、文化部等四部门联合发布了《关于加强图书馆著作权保护工作的通知》[20],提出要不断提高图书馆的著作权保护水平,在资源数字化工作中重视版权问题。我国《著作权法》和《信息网络传播权保护条例》将图书馆、档案馆的数字化行为认定为复制行为,在版权问题上对馆藏数字化进行了严格限制。在数字化立项前,应根据法律规定严格审查版权情况。对用于传播的数字化图像,可参考西班牙国家图书馆和DFG的规定,优先数字化公有领域的资源,严谨处理可能存在版权问题的资源。
3.4 完善质量指标和评估系统
在图像的质量维度上,我国与国外基本一致,包括格式、色彩、色彩深度、分辨率,但未将色彩空间纳入指南,色彩空间影响对原始文献的色彩还原度,对包含重要色彩信息的馆藏十分重要,我国指南可参考荷兰皇家图书馆和FADGI,将色彩空间作为图像质量标准评估的维度之一。在图像资源的应用级别划分上,国外一般分为主图像和派生图像,我国指南中的长期保存级对应主图像,复制加工级和发布服务级对应派生图像,其中复制加工级属于过渡级别,可减少对长期保存级资源的使用损耗,比国外指南考量更长远。
在数字化过程的质控上,荷兰皇家图书馆和美国FADGI分别建立起了专用的质量评估工具,而我国指南的过程管理仅用于保证项目的按时按量完成,缺少质控工具。可综合参考FADGI和荷兰皇家图书馆的指标,围绕图像色彩准确性、白平衡等多个维度,建立质量评估系统,保证数字化过程质量。
3.5 提供數字化建设方式的选择原则
DFG、FADGI和瑞士国家图书馆基于图书馆能力、项目复杂度和专业公司能力选择数字资源建设方式。《操作指南》在建设方式的选择时仅考虑了文献类型,尚未提供更具体的判断维度,下一步可从人力资源、设备、资金、馆藏资源的数量和珍贵性、预期成品质量、项目难度等方面建立统一的判断指标。
融合是文化机构未来发展的方向,图书馆在开展数字化工作时,除自建或外包于专业公司外,还可考虑与其他单位合作共建,《操作指南》对此有所述及。跨机构公共数字文化合作[21]是近年来的研究热点之一,合作共建促进了馆藏资源的开发和流通,有利于为用户提供深层次、一体化的信息服务[22]。随着统一的建设标准相继出台,馆际资源共享共建的困难将得到很大程度的缓解,但如何建立高效的沟通合作模式,值得各馆共同探讨和解决。