柏晗 陆玉莹
[摘 要]随着网络技术的飞速发展,图书文献资源服务的数字化、网络化需求越来越强烈。为了适应这种需求,在分析南京水利科学研究馆藏资源的现状和读者需求的基础上,提出了在数字图书馆建设方面应采取的初步策略,以此开展馆藏特色资源的数字化建设和研究。
[关键词]数字图书馆;数字化;文献信息;数据库
doi:10.3969/j.issn.1673 - 0194.2018.22.072
[中图分类号]G250.76 [文献标识码]A [文章编号]1673-0194(2018)22-0-03
南京水利科学研究院自1935年建院以来,累积了大量的科研成果报告和20世纪的珍贵水利资料,都是独具特色的宝贵文献资料。这些纸质资源由于存放时间长,加上纸张质量、印刷及库存条件等因素,急需进行保护性处理,否则将会造成难以弥补的损失。同时,随着信息化网络化技术的快速发展,为了方便广大科研人员通过网络环境快速查询下载所需文献资源,为此需要集中力量进行数字化建设,从而有效地保护和利用这些宝贵的文献资源。
1 数字图书馆建设的需求
南京水利科学研究院信息中心是建馆80余年的专业图书馆,从建院之初已经存在,馆内收藏了大量宝贵的文献资料,其中不单包含大量的建国早期乃至清末、民国时期的珍贵水利资料,还保存了从建院之初到现在的所有纸质科研成果报告,但由于各方面的原因,馆藏文献资源的数字化程度较低。为了加快馆藏文献资源电子化、数字化建设的步伐,同时也为了更好地保存这些特色文献资源,需要对这些宝贵的纸质文献进行保护性的抢救处理,并建设独具特色的全文数据库,为科研及水利水电、水运交通行业的生产建设提供更好的服务,这也是建设数字化图书馆的必然要求。
2 现阶段的研究内容
数字图书馆的理念是20世纪90年代美国最先提出的,在建设发展的过程中,特色文献的数字化建设以自身的优势,开始引起各国重视,我国也在进行这方面的建设和研究。基于特色文献数字化所具有的整体优势,南京水利科学研究院的数字化图书馆建设也以特色文献的数字化为突破口,其中图书馆的特色之一就是馆藏科研成果报告。
在馆藏科研成果数字化建设方面,根据南京水利科学研究院图书馆的管理运作现状及考虑到读者需求,计划分为3个阶段进行。现阶段主要对1990-2009年产生的纸质科研成果报告进行数字化处理并建设相应的数据库。主要研究内容包含四点:①数字化建设过程中的控制和管理研究,确定过程控制的流程和管理要求;②数字化建设的规范和标准问题研究,确定扫描方式、色彩模式、分辨率、质量标准、图像存储格式和命名原则等相关内容;③检索库的建设和数据挂接问题研究,确定检索库数据格式和验收標准;④数字化资源的管理、存储和提供服务方式的研究,建立特色资源数据库发布系统。
2.1 数字化建设过程的控制和管理研究
南京水利科学研究院馆藏科研成果全部集中在密集书库管理,每项成果入库时都有2~4本复本,按1~4编号,在书库里是分部门按年份以及成果编号的顺序存放,因此,通过分析纸质文献资源的借还方式和规律,确定了数字化建设过程中的控制方法。
在不影响读者正常借阅的基础上,利用类似于读者借还的方式,工作人员通过已建立的馆藏书目数据库进行检索,导出所需数字化建设资料的清单,按照清单在书库对应区域查找并取复本编号靠前的一本,并在清单上记录相应编号;并通过流通处进行核对、登记、借出等手续,最后在移交清单上签字。在文献资源扫描完成后,再次利用读者借还方式,将之前清单上的文献资料通过流通部办理归还手续,并再次在移交清单上签字确认。
资料扫描前,好需要先了解资料本身的清晰度、完整度等,根据需要确定是否需要拆解,如何拆解并复原,还需要确认是否含有超大图纸页面,确定其扫描及拼接方式,并做好相应的登记工作。
2.2 数字化建设的规范与标准问题研究
很多馆藏科研成果由于历史悠久,会出现各种不同的情况,例如纸张发黄变脆、字迹变淡、插图清晰度不够,甚至由于印刷和借阅导致的污渍、年代和印刷技术导致的差异性。如何提高扫描质量和效率成为数字化建设的一个关键问题。
2.2.1 数字化建设的规范问题研究
(1)纸质文献资源管理方面。实物资料的交接需严格核对文献资料清单与实物是否一致,并做好《资料交接记录》交由管理人员签字确认,对资料的成果编号、数量、经手人及借还时间进行详细登记,确保其完整性。
(2)扫描前的拆分整理工作。由于时代原因,导致纸质文献的装订和印刷存在各种问题,对需要拆分扫描的文献资料需按照原页码顺序整理,并去除其中可能引起扫描问题的订书钉等,尽可能提高扫描结果的清晰度。
(3)扫描加工的规范化。扫描人员需要根据实际情况选择预先设定的模板或重新设定新的参数。同时,由于早年印刷技术、纸张质量及借阅保管不当等导致的各种问题,还应根据需要对扫描所得的图片进行手动去黑边、纠正倾斜角度、页面不颠倒、文件顺序不混乱等,以保证扫描所得数字化文献的整体质量。
(4)扫描过程中纸质资源的保护。按文献资源的页码顺序扫描,处理过的资料也需按顺序摆放整齐,避免资料出现丢失或缺页。同时,按规定操作方法进行扫描操作,避免操作不当导致资料文件或扫描设备损坏。
(5)扫描后的整理工作。对于扫描过程中需要拆解的纸质文献,应按原样再装订还原。
(6)破损文献资源的管理。资料本身存在破损,或扫描过程中出现了损坏情况,需及时告知流通管理人员,并登记。
2.2.2 数字化建设标准问题研究
在科研成果数字化的过程中,如何保证不同资料扫描所得的数字化文件的清晰度和存储大小的平衡,既能保证图像的清晰度完整度,又能有效利用存储空间,方便数字化资源的网络传输和利用,在经过大量扫描和反复修改实践的基础上,终于确定了下列标准。
扫描方式标准:①按文献标明的页码顺序扫描;②对于同一份文献资料或同一页面内存在不同清晰度的内容,特别是早期文献资料存在铅笔、钢笔、圆珠笔同时使用的,以主要部分的清晰度为准,也可以根据不同清晰度一页多扫;③对于纸张质量差、容易破损的,应使用平板扫描,禁止使用滚筒扫描;④扫描图像应该包括文件上的页眉、页脚、页码等所有相关标记,以确保文献的完整性;⑤合成扫描文件时,应使用原文献名称命名,章节名也需如此,同一篇文献的全文文件和各章节文件应存于同一个子目录。
参数设置标准:在实际扫描过程中,因为个人的操作的差异和不同扫描设备之间存在差异,导致扫描的结果也会出现差异,经过大量的比对最终确定了主要参数标准,如表1所示。
图像质量标准:在对扫描完成的图像进行比对之后,确定了以下标准。①图像文件最大倾斜角度不得大于0.5o。②扫描所得图像文件必须是A3、A4、B4的标准尺寸(附件图表除外)。③确保图像文件的长宽比一致。④清理图像文件中存在的污点,确保污点量不超过50%。⑤确保整体清晰度不低于原纸质文献,图像准确率100%,图像文件格式为tiff和双层PDF格式。
2.3 数字化文献资料管理系统检索库建设和数据挂接问题研究
南京水利科学研究院馆藏科研成果报告本身包含多种信息,为了使数字化后的文献资料便于查找和应用,需要重新设计检索库。
2.3.1 检索库数据格式
通过长期从事科研成果编目工作,发现成果报告主要包含26个信息点,其中由于项目类别和要求的差异,所含信息也有不同,通过比对分析最终确定检索库的每个字段数据格式如表2所示。
2.3.2 检索库的数据录入
为了便于录入数据,在数字化扫描的最后要生成双层PDF文件,用于识别文字信息,从而便于识别出检索库各数据化文献对应信息源的信息,准确快速地录入检索数据。所以,检索库的建设过程与数字化扫描可同步完成。
2.3.3 检索库数据挂接问题研究
为了解决数据挂接的问题,需要先确定命名规则,以便于数据批量挂接,同时也便于读者下载时辨别所需文献内容。根据研究确定了以下两条:①每篇成果全文为“1.0”+“报告名称”;②每章节为“1.”+“章节序号”+“章节名称”。
2.3.4 检索库验收标准
在完成检索库录入和全文数据挂接之后,还需要通过验收才能提供读者使用。这里可以直接利用检索窗查询的方式查看所查文献资料是否正确,数据是否完整,链接全文是否能正常阅读和下载。
2.4 数字化资料的管理、存储和服务方式
2.4.1 数字化资源的管理
在文献资料数字化后主要生成tiff和双层PDF两种格式的文件,其中对数字化资源管理是以tiff文件按报告建立目录,而双层PDF文件则作为数据库的备份进行管理。
2.4.2 数字化资源的存储
由于数字化的文献资源是按两种格式进行管理的,因此存储也是一样,tiff文件直接存储在机房的存储设备上,而PDF文件则存储于服务器上,并由系统进行定期备份,以确保数字化资源的安全。
2.4.3 数字化资源的使用
根据我国数字图书馆建设的实际情况,加上“十三五”时期国家重点突出了网络信息安全保障能力建设,而现阶段数字化的文献资源主体为南京水利科学研究院独具特色的成果报告,因此,浏览和下载是需要受限的,根据读者的不同设置不同的权限,有的只能查看,有的可以下载本部门的文献,有的则可以浏览和下载全部文献。
3 结 语
进入21世纪以来,随着移动数字平台飞速发展,信息交流的速度大幅提高,人们可以随时随地获取想要的信息资源,为工作和娱乐带来了很多便利。但带来便利的同时也带来的各种挑战,那就是如何才能更好地满足大众对信息资源的需求,如何才能更快速地为人们提供更迅捷和准确的数据资源,最终促进各行各业的信息化发展,而数字图书馆在其中占据主导地位。
如何建立拥有自身特色的文献资源数据库,将馆藏核心文献及特色文献资源转化为数字信息,实现网络传播、信息共享,建立一个包罗万象的信息仓储,并通过网络为用户提供更高效便捷的信息获取途径,是各圖书馆、信息中心等信息机构未来必须担负的重任。本文的研究成果为南京水利科学研究院馆藏特色文献资源的数字化建设积累了宝贵的经验,能够为以后的数字化建设工作以及其他图书馆在数字化建设方面的交流提供有力的支撑,为今后逐步实现真正意义的数字化图书馆奠定了基础。
主要参考文献
[1]汤红娟.中共党史文献资料数字化建设研究[J].江汉大学学报:社会科学版,2011(5).
[2]张秋.新疆少数民族特色文献数字化构建研究[J].现代情报,2009(8).
[3]蔡屛.图书馆文献资源数字化立项论证工作研究[J].图书馆论坛,2012(1).
[4]龚丽瑛.企业档案数字化研究文献综述[J].办公自动化杂志,2012(6).
[5]苏云,张庆来.面向海量文献的数字化系统研究[J].图书与情报,2010(2).