摘要:智慧图书馆的建设内容与发展方向是图书馆界的研究热点之一,生成式人工智能技术的异军突起为智慧图书馆知识内容的生产与服务能力建设带来了无限可能。本文以生成式人工智能如何重塑智慧图书馆数字资源组织方式与服务为切入点,对跨模态数字资源的组织与分析能力构建、生成式人工智能视域下智慧图书馆服务,以及智慧馆员未来应具备的数字素养与信息技术能力进行了探讨,并对生成式人工智能应用中如何提高数据的安全性与加强隐私保护提出了相关建议。
关键词:智慧图书馆 生成式人工智能 AIGC
2021年4月,文化和旅游部发布的《“十四五”公共文化服务体系建设规划》要求“拓展公共文化服务智慧应用场景。依托云计算、大数据、人工智能、区块链等新一代信息技术,加强云端数据挖掘和分析能力,推动公共图书馆、文化馆(站)实现包括智慧服务、智慧分析、智慧评估和辅助决策等功能在内的智慧化运营,优化数据反馈模式”[1]。
人工智能公司OpenAI于2022年11月30日推出的ChatGPT(一种人工智能技术驱动的自然语言处理工具,是人工智能生成内容技术发展的成果),仅仅在上市两个月之后,每月活跃用户数就达到了1亿人,ChatGPT跃居史上用户数发展最快的应用技术。生成式人工智能(以下简称“生成式AI”)技术的崛起引发了全球的广泛关注,随着数字内容生成质量、推理能力达到甚至超过人类专家的水平,生成式AI正逐渐成为数字内容创作的中坚力量。生成式AI的数字内容生成能力完成了由量变到质变的跨越式发展,与此同时,开源项目的引入与快速迭代降低了开发者进入该领域的门槛,加快了相关项目落地的速度,使生成式AI技术成为AI应用领域最具活力的增长点。
随着生成式AI技术的逐渐成熟,该技术已经完全可以通过提供实时参考咨询服务[2]、智能化分类标引等方式进入智慧图书馆的应用场景,为图书情报领域带来了人工智能时代又一次发展机遇。
生成式AI技术赋能智慧图书馆服务与建设
目前,智慧图书馆仍然处于发展建设的初期阶段,缺乏成熟的理论与实践经验,智能化转型过程中面临缺乏成熟的技术标准、发展目标不明确等诸多难点,业内专家在这方面提出了很多建设性的架构与解决方案。
随着生成式AI技术的发展,智慧图书馆建设不能只拘泥于智慧导航、问答机器人等人工智能技术的初级应用。从服务层面看,人工智能生成内容(AIGC)的加入加速了图书馆服务方式、服务内容以及服务效果的转变[3]。王诺等分析了如何利用AIGC为元宇宙的构建提供多样化的内容,助力GLAM(美术馆、图书馆、博物馆、档案馆)等公共文化服务机构向智能化方向转型升级[4]。蔡子凡等描绘了生成式AI技术在图书馆智慧服务多个场景中的运用,提出了图书馆如何满足用户多元化服务需求的建设策略[5]。从智慧图书馆的资源组织与管理来看,李白杨等提出通过生成式AI技术与相关算法的有机结合,给信息资源管理的研究和实践带来实质性的推动与促进[6]。李佳轩等通过辨析AIGC应用于智慧图书馆中的伦理与实践困境,以此实现AIGC赋能智慧图书馆的黑箱透视[7]。业内专家如何利用生成式AI技术对图书馆工作全流程进行智慧化升级时给予了很多关注,并积极展开了探讨。
生成式AI重塑智慧图书馆的资源组织方式与服务
跨模态数字资源的组织与分析能力构建。智慧图书馆可从以下两方面着手推进。首先,优化多模态数字资源组织与利用方式。智慧图书馆资源建设面临多模态异构数据源的整合问题,优化多模态数字资源的组织与利用方式是智慧图书馆提升知识服务能力的关键一环。面对多模态信息内容和多元化的用户需求时,图书馆员很难利用传统的信息组织方式满足读者对信息资源的需求。借助生成式AI对文本、音频、视频等多模态的数字资源进行学习,建立馆藏数字资源的组织与利用体系,同时结合外部知识库与网络资源进行模型训练,增加生成式AI训练数据的多样性,可形成多个生成式AI智能体综合分析的结果,提升知识服务质量,产生相较于传统数据库更加高效的资源组织与利用方式,推动智慧图书馆资源组织方式的智慧化转型,探索融媒体时代资源融合与利用方式的解决方案。
其次,构建跨模态馆藏数字资源服务体系。跨模态横向挖掘图书馆馆藏资源知识体系价值是生成式AI在智慧图书馆建设中的重要应用场景。生成式AI多模态信息获取能力不断提升,突破原有文本、音频、视频资源之间在构建知识体系中的障碍,充分利用大语言模型的语言理解、分析、总结能力,挖掘不同模态馆藏资源在知识体系构建中的潜在价值与内在联系,实现馆藏数字资源的跨模态深度挖掘与知识服务体系构建。
训练生成式AI系统对多模态数据资源进行描述与标识,使其具备数字资源的细粒度标引与多维度分类能力,提高现有数字馆藏资源的处理效率,减少人力资源的使用,在此基础上利用统计学等相关学科的研究方法将经过预处理的信息资源进行分析,实现智慧图书馆跨模态数字资源服务体系建设。与此同时,加大内容过滤系统及应用程序接口开发,提高知识服务层面内容的可控性与对外扩展能力。
生成式AI视域下的智慧图书馆服务。生成式AI给图书馆服务带来的变化主要体现在以下几方面。
一是智慧问答系统的应用。大语言模型具备了人类语言的分析与处理能力。以智能对话系统为服务切入点,以智慧图书馆海量数字资源与常见问题为训练样本,在对本地化大模型系统进行角色定义与完整训练的基础上,结合读者的上下文语境进行回答,使智慧图书馆真正具备实时咨询服务能力,极大地提升了图书馆服务的泛在性和用户体验,同时实现了多语种的服务能力。针对专业领域的智慧问答系统,通过添加文本过滤器的方式对问题进行分类预处理,提高回答问题的准确性[8]。
二是阅读推广服务效能的提升。组织阅读推广活动已经成为图书馆非常重要的读者服务方式之一,也是生成式AI技术应用的主要场景。生成式AI具备多模态的内容生成能力,深刻改变了图书馆融媒体内容的创作手段与制作方式。随着Midjourney与Stable Diffusion等交互式图像生成人工智能系统的不断发展、完善,配合LoRA(Low-Rank Adaptation,一种高效的AI模型微调技术)等技术对模型进行专项训练与微调,可生成风格多样的宣传海报、图书插画、活动视频等多媒体内容,缩短活动的准备周期,减少了设计人员的数量,提高了阅读推广活动的运行效率与宣传效果,成为生成式AI技术助力阅读推广发展的重要方式。此外,收集阅读推广活动的相关统计数据,充分利用生成式AI的数据分析能力,为阅读推广活动内容与形式提供更加精准的指引,不断提高读者对阅读推广活动的参与度和满意度。
三是虚拟数字人的设计与应用。随着增强现实、虚拟现实、3D建模等技术的日臻完善,通过与生成式AI技术的有机结合,将虚拟数字人的设计与应用推向了新的发展阶段。虚拟数字人作为人工智能时代智慧图书馆与读者交互的全新主体,依托生成式AI强大的知识储备、推理能力与数字内容生成能力,能为读者提供多模态的数字资源与知识服务,给读者带来沉浸感更强的服务体验,也能为图书馆面向残障人士等特殊群体提供阅读推广服务带来更多的可能。设计与构建生动有趣的卡通数字人,使之成为儿童读者服务的主力,可在数字绘本的制作与讲解、辅助阅读等方面发挥重要作用。
生成式AI视域下智慧馆员的数字素养与技能。馆员从事的机械性、重复性的工作将被生成式AI替代,智慧图书馆馆员主要参与需要创意与流程优化类的工作,在生成式AI的助力下,馆员的角色将更加丰富,工作更加高效。从提高生成式AI技术应用能力的角度出发,馆员需要规划好自身数字素养与人工智能算法应用能力的提升路径,不断吸收新知识,与人工智能发展水平相适应。
一是智慧图书馆馆员发展成为生成式AI流程设计师。未来智慧图书馆馆员将成为众多数字内容生成系统的流程设计师,通过对不同类型生成式AI系统的功能进行充分整合,搭建多模态数字资源与生成式AI系统之间数据流桥梁,将不同功能、不同知识背景的生成式AI智能体有机地结合在一起,从而完成特定知识内容与数字资源的产出,重塑图书馆原有的工作流程,提高服务质量与效率。
二是全面提升信息技术能力与释放创造力。智慧图书馆的建设与发展以智慧馆员能力的全面提升为着力点。为了让生成式AI更好地落地,智慧馆员不仅需要充分掌握类ChatGPT大语言模型的提问方式与工作原理,更要全面提升机器学习、编程语言等深层次应用生成式AI所需技能,促进生成式AI技术在智慧图书馆领域的全面落地。
生成式AI应用中的数据安全与隐私保护。一是强化训练数据审核与监管。以大语言模型为代表的生成式AI在训练时需要海量的语料内容才能完成。由于模型训练的语料内容质量参差不齐、数据来源缺乏有效的监管机制,可能带来知识产权归属不明确、信息泄露等方面的问题。智慧图书馆在训练本地化大语言模型时,应对训练数据内容的准确性和可靠性进行认真评估,通过加大定制化模型训练数据来源的审核力度,实现从数据源头加强对生成式AI的监管,并对生成的内容进行审核与监控,在提高生成数字内容质量的同时,防范控制可能带来的法律风险,并出台相应的监管制度加以规范。
二是加强隐私保护。生成式AI技术在智慧图书馆服务中的应用前景广阔,同时不可避免地会遇到隐私保护与数据安全问题。智慧图书馆利用大语言模型提供咨询与数据分析服务时,可能会收集读者的某些敏感信息,并在交互式问答过程中使用这些信息来生成相应的答案。智慧图书馆在应用生成式AI系统提供服务时,应该遵守保护读者隐私信息的法律法规,并采取加密、数据脱敏、内容过滤等安全措施来防止信息泄露,确保读者的隐私信息得到应有的保护。
三是建立行业行为准则与服务规范。智慧图书馆应该在国家相应法规的基础上建立本行业相应的行为准则与服务规范,确保对生成式AI的应用进行监督与管理。2023年8月15日,我国开始施行《生成式人工智能服务管理暂行办法》[9],在促进生成式AI技术的规范化使用与健康发展的道路上迈出了重要一步。
四是增强馆员的法律意识。在生成式AI建设与应用过程中,智慧图书馆应加强馆员相关法律知识培训,培养馆员的知识产权保护意识、数据安全意识等,同时建立相应的意见反馈与监督机制,引导馆员以积极、包容的心态接受投诉与建议,并及时处理生成式AI建设与应用过程中产生的法律问题。
结语
生成式AI的快速应用为元宇宙等技术在智慧图书馆的落地应用筑牢了数字内容创作基础,并为现有的图书馆服务场景提供了更加丰富的数字资源内容与更强的用户体验,可提高图书馆服务的核心竞争力。
随着生成式AI技术的持续发展,为了降低模型部署的门槛,许多人工智能企业推出了模型参数规模适合单机部署的产品,同时伴随着百度文心一言、阿里通义千问、华为盘古等国产大语言模型的快速迭代与逐渐成熟,为国内图书馆界自主可控应用该项技术提供了更多选项。智慧图书馆通过对预训练大模型进行特定领域专项知识的学习和训练,可以实现多样化、定制化的应用场景部署,构建更精准、更智能的服务体系。
作者单位:济南市图书馆
本文系2023年度济南市哲学社会科学课题“生成式人工智能技术助力智慧图书馆建设的研究”(项目编号:JNSK23C28)阶段性研究成果。
参考文献
[1]“十四五”公共文化服务体系建设规划[Z/OL].(2021-06-23).https://zwgk.mct.gov.cn/zfxxgkml/ggfw/202106/P020210623598673338311.pdf.
[2]刘莉,邵波.生成式AI赋能智慧图书馆的融合路径探析——以扎耶德大学图书馆为例[J].图书馆学研究,2023(12).
[3]储节旺,杜秀秀,李佳轩.人工智能生成内容对智慧图书馆服务的冲击及应用展望[J].情报理论与实践,2023,46(5).
[4]王诺,毕学成,许鑫.先利其器:元宇宙场景下的AIGC及其GLAM应用机遇[J].图书馆论坛,2023,43(2).
[5]蔡子凡,蔚海燕.人工智能生成内容(AIGC)的演进历程及其图书馆智慧服务应用场景[J].图书馆杂志,2023,42(4).
[6]李白杨,白云,詹希旎,等.人工智能生成内容(AIGC)的技术特征与形态演进[J].图书情报知识,2023,40(1).
[7]李佳轩,储节旺,杜秀秀.关联、黑箱与赋能:AIGC驱动智慧图书馆的转型路径[J].图书情报工作,2023,67(23).
[8]张鹤译,王鑫,韩立帆,等.大语言模型融合知识图谱的问答系统研究[J].计算机科学与探索,2023,17(10).
[9]生成式人工智能服务管理暂行办法[Z/OL].(2023-07-13).http://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm.