基于提升民国文献数字信息缩微胶片转换技术的研究

2023-08-21 09:39谢思静
无线互联科技 2023年12期

谢思静

摘要:数字信息缩微胶片转换技术(Computer Output Microfilm,COM)是经光学原理将数字信息转移到缩微胶片上,从而实现长期保存的一门技术。民国时期文献包罗万象,蕴含着丰富的时代信息,供读者研究的重要依据。国家图书馆自2011年开启数字信息缩微胶片转换技术,以便于加强文献保护,将民国图书进行缩微,保存到缩微胶片上进行长期保存。民国文献在读者阅览中需求较大,但随着图书馆新技术的应用及对书籍的保护,缩微胶片转换成的数字影像成为阅览的主要方式。文章分析数字信息缩微胶片转换技术原理、重要技术指标,并从质量及验收角度出发,剖析转换后质检常见问题、产生的原因,最终总结出提升其质量的策略方案,为实现民国时期文献数字化质与量的共同提升作贡献。

关键词:民国图书;胶片数字化;质量验收;对象数据

中图分类号:G255.72  文献标志码:A

0 引 言

随着时代的发展,当下数字化、信息化成为社会发展的主流,科学技术的进步也融入各行各业。在缩微事业中,数字技术与传统缩微技术的融合成了缩微技术一个新的发展方向——数字信息缩微胶片转换技术(Computer Output Microfilm,COM)[1],这一技术在缩微领域的各个方面进行了有效应用。缩微胶片数字化属于数字缩微技术的一个分支,目前已形成较为成熟的工作流程,各图书馆也采用该技术完成多种类型文献数字化,其中开展最早的为民国文献缩微胶片数字化[2]。

针对民国时期文献实施数字信息缩微胶片转换的主要程序是缩微胶片扫描、图像接收、图像前整理、图像后期处理、成品数据质量验收[3]。图像后期处理工作量较大,如何实现民国图书数字化建设的高效性和快速化。如何管控数字化加工后的数据质量,成为当下研究的重要课题。

1 数字信息缩微胶片转换技术原理

数字信息缩微胶片转换技术分为打印转换和拍照转换两种。国家图书馆馆藏的主要是灰度和彩色图像等资料。在实施数字信息缩微胶片转换工作时,有必要考虑到转换成果的色彩表现力。因此,国家图书馆选择拍摄成照片形式,再利用数字转换设备将馆藏数字资源转换为缩微胶卷。该设备的原理是通过曝光拍摄记录数字成像的信息。工作方法是将数字图像高精度地呈现在特定的数字屏幕上,并使用光学技术在屏幕上捕获图像。这种方式与数字打印型刷设备相比,它的优点是转换速度快,能够快速地转换出灰度和彩色图像。

2 数字信息缩微胶片转换技术指标

2.1 影像精度

影像精度主要表现在分辨率强度是衡量光学摄影系统或元件区分两个直接实体的能力的指标。它是缩微技术的一项重要指标之一,以每毫米线对数(Ip/mm)或每英寸线对数(Ip/in)来表示。形象地来说,有的镜头拍出来的图书页影像只能辨认10线,有的镜头拍出来的影像能辨认到100线,这时后者的“解像力”相比前者要高。造成这种影像精度的不同,主要是由原始分辨率、胶片的分辨率和镜头的分辨率强度的不同来决定的,其计算公式为:

1(R系统)2=1(R原件)2+1(R摄影机)2+1(R胶片/放大倍数)2

由上计算公式可知,在特定系统中的胶片分辨率强度和拍摄分辨率强度趋于一致的情况下,其转换后成果质量主要取决于原件分辨率强度。传统拍摄系统的原件分辨率强度受原始图书页面的质量影响,而数字信息缩微胶片转换系统的原件分辨率强度则主要受数字图像的精度影响。

2.2 影像亮度

数字图像的亮度由色阶进行表述标记,它是一种特有属性。影像亮度不受显示设备的显示亮度变化影响。灰度图像的色标与图像的亮度有关,不受色彩影响。对于8位灰度数字图像,位数为8,不同亮度的灰度由2到8次方量级表示。这里白色为最亮,黑色则为最暗。阶数序列越大,产生的图像亮度相应就越亮。数字图像向灰度的转换中,在固定拍摄参数的假设条件下,数字图像的亮度决定了转换后的显微图像的密度,它的造成原理与缩微胶片成像原理是密不可分的。

数字信息縮微胶片转换的成像过程为当屏幕上显示的数字图像的光线穿透胶片的乳液层时,从而促使乳液层中的卤化银晶体产生一系列的化学作用,使与同样暴露在光线下的相邻卤化银晶体聚结,落在胶片上而记录下图像。此处,因篇幅有限,不展开详述,仅列举黑白缩微转换。当乳液层接收到的光通量越大,晶体经历的结构变化和相互聚结就越多。加工后的薄膜密度越高;若光通量越少,晶体变化和聚结越少,密度越低,所以在固定的拍摄参数下,数字图像的亮度越高,投射在胶片上的光线越大,曝光越强,最终胶片上的反射是图像更深,密度会更高。反之,光通量低,密度更低。

3 民国文献数字信息缩微胶片转换后质检常见问题

民国文献胶片数字化对象数据质量检查主要包括图像数据页面质量、数据完整性、对象数据量的命名和质量控制的标准化。对象数据包含TIFF和PDF两种格式。TIFF格式图像主要用于长期保存,PDF格式图像主要用于民国图书发布利用[5]。TIFF格式图像是本研究先期检查的重点内容,TIFF图像检查合格后才能转换成PDF格式图像。

3.1 对象数据检查要点

3.1.1 Tiff图像数据检查要点

Tiff图像的画面质量:图像内容是否清晰、反映内容是否符合图书原貌,图像后处理是否完善;图像命名情况:检查TIFF图像命名是否符合命名规范,分册情况是否符合要求;图像属性:检查TIFF图像中黑白和灰度图像的接收属性是否正确;图像数量:保证文献实际图像数量、单据中的数量一一对应,是否存在多页或少页情况。

3.1.2 PDF图像数据检查要点

PDF图像文件是否能正常打开,是否存在文件过大或者过小情况,PDF图像理论上均要在500 K以下;PDF图像文件的检查重点为灰度图像压缩后是否清晰完整;拼接图合成后的图像是否清晰完整。TIFF格式图像是本研究先期检查的重点内容,TIFF图像检查合格后才能转换成PDF格式图像。文献拼接图的数量、灰度图像的数量、分册问题、说明文件中备注项的内容数量等影响着检查工作的复杂性,也可结合这些具体情况对PDF文件进行更有针对性的检查。

3.2 TIFF图像质检中常见错误分析

TIFF图像检查常出现的错误包含:灰度图像处理格式错误、后期处理文字移位、图像后期处理过度以及其他问题。

3.2.1 灰度图像后期处理格式错误

民国图书体量大,目前数字化转换主要以黑白图像为主,照片或页面带有暗色花纹等情况,就会以灰度图像来展示。处理前灰度图像接收格式是未经压缩的图片,位深度8;页面后期处理后图像直观清晰度明显降低,位深度1,图像属性压缩格式发生变化,其对比如图1所示。

3.2.2 后期处理图书文字位置发生移位

后期处理文字位移是指民国原书文字居右侧或者居左侧。后期处理后,文字位置发生明显移位,不符合原书真实性揭示。如图2对比所示,原图书页面文字居右,处理后页面文字居中。

3.2.3 图像后期处理过度

民国图书原图像带有明显图书信息如页码、题名、印章、序、边框等,或者原民国图书封皮或封底有颜色深浅变化,并且有标签在书脊位置。后期处理后图书页面信息明显缺失,如图3对比所示。在对图书数字化处理时,应注重保留原书页面重要信息,揭示图书原貌。

3.2.4 TIFF图像后期处理其他问题

图像后期处理还包含其他问题,如“张冠李戴”是在图像后期处理保存时出现问题,其他书中的内容保存到另一本书中,导致后期处理后图书页数比原书下发时少页或者多页。

3.3 PDF图像质检中常见问题类型

TIFF图像检查合格后进行格式转换,转换成PDF图像。PDF图像质检中常见问题包含灰度图像压缩后格式错误、拼接图拼接后图像内容不完整、图像压缩后过大超过500 K、灰度图像压缩过小、图像不清晰等。

4 提升质量的改进措施

民国文献数字信息缩微胶片转换技术的优劣体现在最后的验收环节,其验收工作主要包括元数据质检、对象数据质检和存储介质质检3个方面,上文分析了从民国图书胶片数字化质检工作量最大的对象数据质量验收存在的问题,下文将以问题为导向提出质量管控改进措施和方法,主要从数字信息缩微胶片转换技术实施前期、中期和后期提出建议。

4.1 转换技术实施前期

在民国文献数字信息缩微胶片转换技术的前期,有必要对拍摄的原件进行调查和了解,以确定文献是否适合缩微技术转换,并为相应的任务制定计划、质量要求及其他前期准备工作。其需要了解的内容为:原始数字资产的出处、类型、质量、数量、价值以及数字信息缩微胶片转换目的和要求。近年来,由于民国图书数字化转换工作量大,引入外包公司进行图像后期处理,但很多外包公司设备、经验和技术水平良莠不齐,从而很大程度上造成转换的成果质量不高。所以建议加强准入标准、严格资格审核招投标进入。馆方质检人员做好外包公司项目负责人培训工作,制作相关加工规范和细则,下发工作样例指导参考。要求负责公司具体操作人员培训与岗前考核,建立预检查机制,下发外包公司少量具有代表性的数据,进行预处理,对数据进行细致的检查和问题分析,估测外包公司可能出现的问题及应对措施,初期尽量规避错误。

4.2 转换技术实施中期

项目正式展开批量处理要求设立检查岗,对操作人员制作的数据进行先期检查,提升各批次数据质量。双方在合作过程中,发现问题及时梳理,进一步细化技术规范和细则,为后期常见技术问题作指导,帮助外包公司快速处理相关数据问题。根据公司数据质量情况,适当调整各批次检查力度,TIFF数据做到应检尽检,PDF数据可酌情抽检,对出错率较高的灰度图像和拼接图进行重点查验。

由于外包公司通常人员变动较大,加工质量可能不稳定,要求新人必需培训与岗前考核,合同规范错误率,错误率超过一定阈值要求整批次退回返工,规范限制外包公司加工质量,从源头减少民国图书加工中的錯误率。

4.3 转换技术实施后期

项目后期重视技术问题总结和流程梳理。总结各批次错误清单,进一步完善后期处理中容易出现的常见错误,为后期项目延续性开展或其他项目开展提供参考。数据下发和收回都有单据留底,保证数据完整性。考评外包公司工作情况,是否及时提交数据,是否及时修正各批次错误,人员技能培训是否到位,各批次数据错误率是否符合阈值,项目负责人是否沟通顺畅等。对其进行全面评估,为后期进一步合作提供依据。项目结项撰写验收报告,总结本次项目的整体情况,附检查错误单,提出有针对性的改进技术方案。

5 结语

文献数字信息缩微胶片转换技术为一种新型的文档图像数字存储技术。该技术结合了缩微胶片长期存储的优点和数字信息的易用性,是确保古籍文献长久安全保护的最有效的举措之一。随着数字化转型技术的不断推进和完善,在针对民国文献缩微胶片实际数字化转换的过程中也存在着数据质量的各种问题,而践行该数据质量验收是民国文献缩微胶片数字化过程中的重要环节之一,影响着民国文献最终呈现的效果,最终实现民国文献数字化质与量的共同提升。

参考文献

[1]徐桂梅.企业档案数字化外包质量控制的几点看法[J].山东档案,2021(4):49-50.

[2]张玮.民国报纸数字化常见问题研究[J].图书情报研究,2019(3):72-79.

[3]郭琳.浅谈民国图书缩微胶片数字化中的图像补接工作[J].数字与缩微影像,2021(1):11-14.

(编辑 王永超)

Research on the conversion technology of digital information of the Republic of China

Xie  Sijing

(National Library of China, Bejing 100081, China)

Abstract:  Digital information microfilm conversion technology (Computer Output Microfilm, COM) is an optical technology to transfer digital information to microfilm, so as to achieve long-term preservation. The documents in the period of the Republic of China covered everything, containing rich information of the times and providing an important basis for readers to study. Since 2011, the National Library of China has started the conversion technology of digital information on microfilm, in order to strengthen the protection of literature and shrink the books of the Republic of China and save them on microfilm for long-term preservation. The literature of the Republic of China is in great demand for readers. But with the application of quality and acceptance, the paper analyzes the common problems of quality inspection after the conversion, and finally summarizes the strategic plan to improve its quality, so as to contribute to the common improvement of the quality and quantity of the digital documents in the Republic of China period.

Key words: books of the Republic of China; film digitization; quality acceptance; object data