摘 要:人工智能技术的发展推动了图书馆古籍智慧化服务的开展。文章分析了图书馆古籍智慧化服务存在的问题,提出了利用人工智能技术对古籍进行智能化加工、提升古籍智慧化服务效能、推动实现古籍的活化利用及加大古籍共建共享力度等图书馆古籍智慧化服务策略,以期图书馆能有效活化利用馆藏古籍资源,大力开展古籍智慧化服务,传承和弘扬中华优秀传统文化。
关键词:人工智能;图书馆;古籍智慧化服务
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2025)01-0106-03
1 背景
自2007年我国实施“中华古籍保护计划”以来,全国各级图书馆、博物馆、高校等机构大力开展古籍普查登记、修复、借阅、数字化阅读、宣传推广等工作,取得了显著的工作成效。中共中央办公厅、国务院办公厅于2022年4月印发《关于推进新时代古籍工作的意见》,要求统筹实施国家古籍数字化工程,并积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级[1]。近年来,以深度学习、自然语言处理、大语言模型等为代表的人工智能技术快速发展,逐渐推动各行各业的智能化转型升级。在此背景下,我国图书馆应积极接受和利用人工智能技术,在OCR识别、自动标点、实体识别等方面提高古籍智能化加工水平,开展古籍智慧化服务,提升古籍资源加工和服务效能。
2 图书馆古籍智慧化服务存在的问题
2. 1 没有统一古籍数字资源建设标准
我国现有的古籍数据库没有遵循统一的技术和知识加工规范,不同数据库在知识标注、资源展示和资源检索等方面存在明显差异,服务质量参差不齐。随着相关数据库及服务平台数量的不断增多,古籍数字资源建设标准缺失的问题逐渐凸显,既不利于读者快速检索所需的古籍资源,也不利于图书馆共享古籍资源[2]。
2. 2 古籍数字化加工能力不强
目前,图书馆主要以影像文件的形式加工古籍资源,不仅难以满足读者的全文检索、阅读需求,还难以进一步对古籍进行文本分析、知识抽取等深度挖掘与利用。此外,现有的古籍智能化加工平台普遍存在文本识别准确率不高、古籍知识的细颗粒标引不够深入、校勘和整理深度不够等问题,导致数字化古籍资源的利用价值大打折扣[3]。
2. 3 服务效能有待提升
目前,图书馆的古籍智慧化服务形式仍以资源阅读为主,资源分散,检索渠道单一,仅能为读者提供原文展示服务,不注重场景化、知识化服务的开展,不利于读者理解古籍内容,服务效能不高[4]。
3 人工智能驱动下的图书馆古籍智慧化服务策略
3. 1 利用人工智能技术对古籍进行智能化加工
3. 1. 1 文本识别。图书馆应利用深度学习技术,提高古籍OCR文本识别的准确率,特别是对繁体字、生僻字、异体字、通假字、避讳字的识别准确率,有效识别古籍的标题、段落、注释、图像、印章等元素,并对古籍的版面进行分析,为后续的文本处理和版式还原奠定基础。
3. 1. 2 知识加工。图书馆应利用自然语言处理技术,对古籍进行细颗粒知识自动标引、自动抽取等处理,如:从古籍全文中抽取目录数据,生成三级目录标引;抽取古籍中的引文、注释、附录等,方便读者理解古籍内容;抽取古籍中的人名、地名、事件、事物、典故、机构等,分析这些内容的语义关系,构建古籍知识库;抽取古籍中的文本、图像等,利用生成式人工智能技术生成古籍多模态知识数据。
3. 2 提升古籍智慧化服务效能
3. 2. 1 开展一站式知识获取服务。图书馆应积极整合古籍相关的元数据、影像数据、文本数据、多模态数据、知识数据等,建设古籍数据库及智慧化服务平台,为读者提供古籍资源的一站式检索、分类导航、元数据揭示、全文阅读、细颗粒度知识揭示等一站式知识获取服务。
3. 2. 2 开展古籍文本分析服务。图书馆应根据古籍文本无标点、晦涩难懂等特点,为读者提供古籍断句与标点、字体转换、知识注解、情感分析等文本分析服务,为读者顺利阅读古籍提供便利。此外,图书馆还应分析古籍的版本、作者、成书背景等信息,揭示不同版本古籍之间的差异及存在差异的原因,帮助读者准确了解古籍的内容和价值。
3. 2. 3 提供基于自然语言交互的智能设备。图书馆应为读者提供基于自然语言交互的智能设备,依托智能设备开展古籍全文检索、知识问答、来源回溯、知识百科等服务,为读者阅读古籍提供便利。此外,图书馆还应利用检索增强生成技术开展提问式语义检索服务,即通过智能设备收集和分析读者提出的问题,利用大语言模型对相关问题和信息进行总结,快速解答读者提问。
3. 3 推动实现古籍的活化利用
3. 3. 1 开发优质数字人文产品。图书馆应积极开发优质古籍数字人文产品,如:利用地理信息系统技术,生成古籍相关的地图、人物形迹图、文献分布图等数字人文产品;利用人工智能技术提取古籍知识元素,生成人物关系图谱、人物形迹图谱、社会关系网络图谱等数字人文产品。
3. 3. 2 创新古籍活化产品宣传推广方式。图书馆应利用虚拟现实、沉浸式参与、人机交互、智能传播等技术,创新古籍活化产品宣传推广方式,加大古籍活化产品宣传推广力度,引导读者树立古籍保护意识,如:国家图书馆利用全景视频拍摄、三维动画制作等技术拍摄制作了《永乐大典》VR资源,全景再现了《永乐大典》的成书过程及历史变迁[5],受到读者的广泛关注。
3. 4 加大古籍共建共享力度
3. 4. 1 统一古籍数字资源建设标准。有关部门应统一古籍数字资源建设标准,包括元数据建设标准、影像数据扫描标准、知识数据加工标准等,正确指导图书馆开展标准化的古籍数字资源建设工作,为图书馆古籍资源的共建共享奠定基础。
3. 4. 2 合作建设古籍资源及服务平台。图书馆应积极与相关机构合作,共同建设全国古籍大数据平台,对古籍资源进行统一登记,并整合古籍文献的存藏流转、版本沿革、出版再造等数据信息;建设古籍智能化加工平台,以云租用的方式为地方图书馆,特别是技术水平不高的中小型图书馆提供OCR文本识别、命名实体识别、自动断句、自动标点、自动翻译、自动分类索引等智能化古籍文本加工服务;建设全国图书馆古籍智慧化服务平台,整合和揭示全国图书馆的古籍知识数据,形成服务合力,提升服务效能。
4 结语
近年来,我国图书馆在古籍数字化加工、智能化整理、智慧化服务等方面取得了一定的成就,积累了大量数字影像和文本内容,为读者提供了资源导航、资源检索、全文阅读、知识图谱、个性化推荐等古籍智慧化服务,在一定程度上满足了读者的阅读需求。人工智能驱动背景下,图书馆应积极探索新兴技术在古籍资源建设及活化利用方面的应用方法,为读者提供古籍知识的自动化聚合揭示、语义化检索、智能化问答等服务,为读者阅读和理解古籍内容提供便利,推广和传承中华优秀传统文化。
参考文献:
[1] 中共中央办公厅国务院办公厅印发《关于推进新时代古籍工作的意见》[EB/ OL]. [2024-11-18]. https:/ / www. gov. cn/ zhengce/2022-04/11/ content_5684555. htm.
[2] 刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017(5):32-41.
[3] 王秋云,龙欢.我国古籍领域开展数字人文研究与实践现状分析[J].图书馆界,2023(4):19-25.
[4] 王昊,王蕾.中华古籍活化的实践框架与发展路径[J].中国图书馆学报,2024(4):4-20.
[5] 周笑盈.国家图书馆“《永乐大典》VR全景文化典籍”实践探索:虚拟现实赋能图书馆沉浸式阅读推广的创新路径[J].国家图书馆学刊,2022(6):80-89.
(编校:冯耕)