数字化技术在公共图书馆古籍整理利用中的应用

2025-02-15 00:00:00梁琳
参花(上) 2025年2期
关键词:古籍整理古籍数字化

一、引言

数字化技术对公共图书馆古籍整理工作具有重要意义,能够为古籍的数字化保存、善本典籍的线上访问、跨学科学术的研究分析、历史文化的传承发展提供强有力的技术支持。基于此,本文基于数字化技术应用于公共图书馆古籍整理工作的机遇与挑战,提出数字化技术在公共图书馆古籍整理利用中的应用策略,以期充分发掘并释放数字化技术在古籍整理利用方面的巨大潜能,为相关研究提供参考。[1]

二、数字化技术在公共图书馆古籍整理利用中的优势

(一)降低古籍整理难度,实现加工整理智能化

古籍数字化整理是公共图书馆利用数字化技术开发古籍文献的一个重要环节,其基本过程涉及精准识别古籍中的模糊字和疑难字以及规范处理异体字等高难度工作,[2]能够完成大量专有名词和典故标注与注释、文白翻译等任务,降低了公共图书馆古籍整理工作中的人工成本。人工智能技术为公共图书馆处理古籍中模糊字、疑难字、繁体字与简体字间的转换提供了AIGC等计算机初步处理技术的支持。例如,ChatGPT大模型发布后,古籍整理的智能化发展水平水涨船高,古籍整理过程中通过深度应用人工智能大模型,能够同步完成OCR识别(手写竖式)、标点、专有名词自动标引、引文核对、简繁字转换等多种功能,可以在古籍、善本排版过程中使用InDesign等排版软件,快速完成生僻字及不同字体样式的设置,从而更加准确地区分简体字和繁体字。

(二)提供跨学科数据分析工具,促进古籍整理利用数字化

在跨学科数据整合方面,数字化技术为古籍文献与历史学、文学、语言学等领域之间的数据整合提供了可能,便于数字典籍在全球范围内共享。大部分公共图书馆使用中华书局所集成的“籍合网”古籍整理与数字化综合服务平台来完成古籍整理工作,以满足读者古籍借阅服务的需求。[3]该平台应用数据分析和挖掘技术,能够发现古籍文献所隐藏的丰富信息,突破时间和空间的限制,揭示古籍文献所对应的历史事件和历史发展规律,为历史学、社会学提供参考。在推动文化创新方面,数字化技术为古籍文献资源的创新利用提供了更加广阔的空间。通过数字化手段,艺术家、作家能够将古籍中的文化元素进行快速提取和重组,创作出大量蕴含丰富历史文化底蕴的文艺作品。

(三)提供丰富的教育场景,提升古籍资源利用率

公共图书馆通过数字化技术将古籍资料转化为生动、形象的教学内容,为公众提供了丰富的教育场景和教育资源,增强了公众对历史文化知识的兴趣。数字图书馆的出现进一步丰富了社会教育的形式,如远程教育、在线学习等,促使更多群体触及优质的古籍资源;而虚拟现实、增强现实等数字化技术的应用,则将公众带入历史场景中,为他们提供了沉浸式的学习体验,帮助其更加深入地理解和感受古籍文献的文化内涵,有助于培养大量的文化传承人,创造全新的教育空间。[4]

三、数字化技术在公共图书馆古籍整理利用中面临的挑战

(一)数据质量有待提升

数据质量是公共图书馆古籍数字化整理过程中的重中之重。传统古籍文献展现的是其原始状态,但往往因时间流逝、磨损程度加深以及自然条件影响等多种因素的共同作用,而产生一定程度的损坏与腐蚀,导致古籍文本失真或部分内容遗失。这一问题可能导致在数字扫描古籍的过程中,机器设备难以全面、无遗漏地捕捉古籍的所有细节。特别是在处理特殊字体、手书文字以及不规则、无规律的文字时,OCR技术极易出现错误识别的问题。因此,公共图书馆要投入大量的时间成本或人力成本,来进行古籍文本的校对与修复工作,以确保古籍在数字化整理后的真实性和准确性。[5]另外,在古籍整理过程中,一旦元数据存在明显的不确定性,以不完整的数据形态出现,将严重影响古籍文献的实际可用性及文献可检索性。鉴于此,公共图书馆要在古籍整理过程中应用图像处理等先进的数字化技术,通过对扫描图像进行去噪、增强、纠正等操作,来提升数据质量,确保数字古籍能够拥有较高的可信度。

(二)版权争议有待解决

在公共图书馆进行古籍数字化整理的过程中,不可避免地会遇到复杂的版权争议问题。一般而言,古籍文献的版权状态往往具有较大的不确定性,尤其是那些历经长时间流传的古籍,其版权状态可能已变得模糊不清。例如,在进行融合环境下的善本古籍数字化整理项目时,公共图书馆使用这些数字古籍可能会受到法律层面的限制。又如,在海外中华古籍调查暨数字化合作项目中,涉及古籍的隐私性保护等问题,数字化修复工作需明确版权归属并获得相应授权,严格遵循著作权法的各项规定,以确保相关数字化行为符合法律规定,不侵犯任何版权,从而合理利用数字化技术完成古籍的数字化修复与保存工作,防止数字化修复行为超出既定范围,确保修复工作的合法性与合规性。[6]

(三)古籍数字化的持续开展受阻

随着现代科学技术的飞速发展,数字化技术迭代更新迅速,这对数字化善本古籍的开发与利用产生了深远影响。为了确保善本古籍数字化整理成果的可持续性,公共图书馆不得不投入大量资源用于更新数字化技术和设备。然而,鉴于古籍数字化过程的长期性和复杂性,公共图书馆在资金投入上面临着巨大压力,这严重限制了古籍整理工作中资源的有效分配,进而使古籍数字化的全面深入开展面临阻碍。

(四)接续保存有待完善

公共图书馆在古籍数字化成果的接续保存方面,面临着硬盘、光盘等数字存储介质可能出现的物理损坏、数据丢失、数据格式与软件兼容性变化以及数字化成果长期维护与更新等多重挑战。这些挑战均需要公共图书馆投入大量的数字化技术和构建安全管理机制来应对,因此,对于公共图书馆而言,这是一项前所未有的艰巨任务。[7]在接续保存的过程中,如何有效运用数字化技术保障数字化成果的完整性,已成为公共图书馆亟须关注和解决的问题。

四、数字化技术在公共图书馆古籍整理利用中的应用策略

(一)提高古籍数字化精度

1.图像采集及处理

为了提升数字化古籍的数据质量,公共图书馆在扫描古籍善本文字、图片及纹理的过程中,需采取以下措施。

一方面,优化关键设备配置,依据古籍的藏量与类型选用高分辨率扫描仪或专业相机等数字化扫描设备,对古籍进行逐页逐帧的高精度扫描与拍照,确保所得图像清晰度高且细节丰富。同时,运用图像处理技术如去噪、增强、纠正等,以消除或减轻古籍文献中的模糊字节与失真损坏现象,进一步提升图像质量。另一方面,建立古籍数字化的标准化处理流程,该流程要对图像格式、分辨率、色彩模式等方面作出统一规定,并运用文本纠偏、形态学分析算法等先进技术,以确保数字化成果的质量与一致性。此举旨在防止OCR识别过程中出现误识别、识别结果失真以及文字难以分离识别等问题,从而确保数字善本古籍、文献、拓片、地方志等数字化成果能够忠于原著、原文与原版。

2.标准化校对与修复

为了充分确保善本古籍的文字、图像等信息准确无误,公共图书馆有必要组织专业人员对古籍数字化成果进行专业的整理、鉴定、校对及修复。针对善本古籍中存在的破损、污渍等问题,可采用AIGC等先进的数字化修复技术进行修复与还原处理,旨在恢复善本古籍的原始面貌。这一过程能够确保善本古籍在文本、文义等方面的一致性、可读性,同时保证数字版本具有较高的准确性。

(二)重视古籍版权保护

在古籍数字化转化的过程中,明确古籍的版权归属并高度尊重原作权益至关重要。对于无法确定版权归属的善本古籍,必须开展详尽的版权状态调查并谨慎处理,以规避任何可能的版权侵犯情形。具体而言,在调查善本古籍版权状态时,应运用系统且全面的分析方法,准确界定古籍文献所涉及的公共领域范围,以及善本古籍是否已处于版权保护之下。鉴于善本古籍可能在流转过程中跨越多个国家和地区,版权管理需充分解读并遵循相关国家的法律法规。因此,公共图书馆应明确数字化成果的版权归属、使用范围、授权方式等关键要素,以规范古籍数字化的版权管理工作。为进一步加强古籍数字化的版权宣传与教育,增强读者的版权保护意识,公共图书馆可以通过开展讲座、培训班等多种形式的活动,深入开展版权知识的普及与教育工作。

(三)提升古籍数字化工作的可持续性

古籍整理数字化项目的可持续性需全面涵盖数字化项目的愿景、目的及整体框架,并辅以周密的财务规划。对于长期运行的数字化项目而言,确保后续工作的顺利开展,离不开稳定的资金支持。为提升古籍整理数字化项目的可持续性,公共图书馆需从两方面着手。一方面,加强与其他图书馆、研究机构、国际合作伙伴的协作,实现公共图书馆资源的有效配置与合理利用,避免资源重复建设等现象,提高工作效率。另一方面,鉴于技术的不断进步,数字化技术本身亦需持续更新与升级。因此,公共图书馆应密切关注数据备份、存储、访问及迁移等领域的最新技术动态,并积极采用先进的技术手段推进古籍数字化工作。[8]

(四)构建数字化古籍长期保护机制

1.存储和备份数字文献

为防止数据丢失,公共图书馆在制订善本古籍长期性保存方案时,需建立科学合理的数据备份机制以及相应的古籍数字化成果定期备份策略。这要求公共图书馆及时将数字化古籍整理成果备份至不同地方的存储设备上,以有效应对自然灾害及软硬件故障等引发的善本古籍数据丢失的风险。以江苏省各大公共图书馆为例,它们通过将备份数据异地存放于地理位置相距较远的地点,显著降低了区域性自然灾害对互联网及数据安全的潜在威胁。为确保数字化古籍文献能够按照整理需求顺利迁移至新的存储设备,这些公共图书馆还开发了古籍数字资源平台,实现了典藏善本古籍的线上检索、阅览及查询等功能,从而进一步提升了古籍数字化成果的可用性和安全性。

2.构建长效保存机制

数字化技术不仅有助于妥善保存古籍所蕴含的关键的历史文化信息,还能以经典活化的方式,在传播中华优秀传统文化的过程中构建起内容丰富的古籍资源库。为了制订长期的古籍保存方案,公共图书馆需采取以下措施。

首先,制订古籍数字化管理体系,明确数字文献在存储、使用、维护等方面的具体规定。[9]其次,公共图书馆要完善善本古籍的安全机制,提升数字古籍文献的安全管理水平,采用加密技术、防火墙等先进技术手段,切实保护数字古籍文献的安全性。最后,为确保数字文献的完整性和可用性,公共图书馆还需定期对数字古籍文献进行监测和维护,以保障其长期保存与有效利用。

五、结语

综上所述,公共图书馆在古籍整理利用的过程中采用数字化技术,降低了古籍整理的难度,为各学科研究提供了技术支持,创造了更为多元的教育场景,从而开辟了广阔的教育空间。然而,实践中公共图书馆面临着数据质量、版权争议、技术水平及接续保存等多重挑战。为了确保古籍资源文化价值得到有效发挥,公共图书馆应从提高古籍数字化精度、重视古籍版权保护、提升古籍数字化工作的可持续性、构建数字化古籍长期保存机制等方面着手,以保障古籍善本的不断传承。

参考文献:

[1]张潇.基于互联网视角简析图书馆古籍整理工作的创新实践[J].文化产业,2022(16):113-115.

[2]洪涛.古籍数字出版的机遇与挑战[J].出版参考,2023(11):5-9.

[3]郭亚军,杨紫楠,卢星宇,等.中国公共图书馆信息无障碍服务现状与提升对策研究——基于128家市级以上公共图书馆的调查[J].图书馆学研究,2022(01):41-48.

[4]郭慧.新技术赋能基层图书馆智慧阅读推广创新服务研究——以响水县图书馆数字化服务为例[J].新世纪图书馆,2024(04):55-59.

[5]陈芳芳.数智技术驱动下公共图书馆古籍数字化建设研究[J].图书馆工作与研究,2024(06):52-58+80.

[6]陈燕琳.基于区块链技术的公共图书馆古籍数字化版权保护策略[J].图书馆工作与研究,2023(05):75-81.

[7]王子柱,曹雅婷,崔丽娟,等.普及传播目标下高校图书馆古籍数字化改革路径探索——以河北大学图书馆为例[J].文化创新比较研究,2023,7(04):150-154.

[8]陈涛,苏日娜,张永娟,等.智慧数据驱动的古籍智慧性保护体系研究[J].中国图书馆学报,2023,49(01):68-81.

[9]雷珏莹,侯西龙,王晓光.数智时代古籍数字化再造的逻辑与进路[J].数字人文研究,2022,2(02):46-56.

(作者简介:梁琳,女,本科,河南省图书馆,中级,研究方向:阅读推广)

(责任编辑 刘冬杨)

猜你喜欢
古籍整理古籍数字化
斯盐最灵,此籍可餐
——盐业古籍整理新成果《河东盐法备览合集简注》出版
中医古籍“疒”部俗字考辨举隅
家纺业亟待数字化赋能
论“明清实录藏族史料类编丛书”古籍整理工作
西藏研究(2021年1期)2021-06-09 08:09:50
关于版本学的问答——《古籍善本》修订重版说明
天一阁文丛(2020年0期)2020-11-05 08:28:06
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
关于古籍保护人才培养的若干思考
天一阁文丛(2018年0期)2018-11-29 07:48:08
首届宋云彬古籍整理奖颁奖典礼在京举行
出版人(2017年7期)2017-07-20 16:24:54
我是古籍修复师
金桥(2017年5期)2017-07-05 08:14:41