类ChatGPT 人工智能在图书馆智慧服务中的应用与思考

2023-11-29 08:22:12董怡婷上海大学文化遗产与信息管理学院

图书馆理论与实践 2023年6期

王毅，董怡婷（上海大学文化遗产与信息管理学院）

2000 年起，人工智能迎来了发展暴发期，全球主要经济体都将其视为引领未来的前沿战略技术，人工智能成为新一轮科技革命和产业变革的核心驱动力［1］。2015 年7 月，国务院发布《关于积极推进“互联网+”行动的指导意见》，将发展人工智能视为重要任务与重点行动［2］。2017年，《新一代人工智能发展规划》发布，明确将人工智能上升为国家战略，提出了“三步走”战略目标［3］。作为重要的社会文化机构，图书馆应努力跟随智慧化转型的脚步，将人工智能纳入发展新方向，实现人工智能与数字化转型、智慧图书馆建设的深度融合与创新发展。笔者以人工智能聊天机器人应用ChatGPT 为例，以“3+3”模型为基础，从六个维度对ChatGPT 进行评价，分析图书馆与ChatGPT 结合的可行性，以图书馆资源拓展、智能咨询、阅读推广、文化创意为切入视角，探讨更智能化的语言交互型人工智能如何赋能图书馆智慧服务，以期为我国图书馆开展智慧服务与智慧图书馆建设提供参考。

1 人工智能与智慧图书馆

人工智能技术已被业界视为引领第四次工业革命的重要力量［4］。随着多学科融合，人工智能已成为一种集物理学、心理学、语言学等多学科内容与计算机科学于一体的应用型技术。在此基础上，人工智能还可以通过知识图谱等方式链接不同领域的知识，实现跨领域知识整合。此外，深度学习技术的广泛应用使得人工智能可以分析图像、视频、声音等多模态数据，实现多媒体下的知识整合。大数据、云计算、物联网等信息技术的发展，推动了以深度神经网络为代表的人工智能技术的快速发展，人工智能在图像分类、语音识别、知识问答、人机对弈、无人驾驶等领域迎来了爆发式增长的新高潮［5］。

2003 年，芬兰图书馆学者Markus Aittola 提出“智能图书馆”的概念，认为智能图书馆是一种空间有限、可感知的移动图书馆服务［6］。如今，智慧图书馆已跃升为一种面向未来的图书馆发展新理念。2021 年6 月，文化和旅游部发布的《“十四五”公共文化服务体系建设规划》明确提出，要以全国智慧图书馆体系建设项目和公共文化网络平台为引领，推动公共文化数字化网络化智能化发展取得新突破［7］，标志着我国智慧图书馆从研讨阶段迈入实质推进的起步阶段。

智慧图书馆的建设与人工智能技术密不可分。一方面，人工智能代表着智慧图书馆的本质与内涵，即智慧图书馆可以像人一样“思考”，模拟用户的思维去实现知识整合与服务；另一方面，人工智能是智慧图书馆的基础与内核，人工智能技术成果与图书馆服务的有机融合提供了智慧图书馆建设的有效路径，依托人工智能所蕴含的技术智慧、数据智慧及价值发现，才能全面激活图书馆及用户社区的智慧［1］。目前，智慧图书馆各个方面均涉及人工智能技术，包括智慧导览导航、智慧咨询等多个业务场景，相关技术主要包括专家系统、机器学习、生物识别、智能定位与物联网、AR 和VR 等。

在智慧图书馆提供的信息服务中，图书馆使用机器学习和人工智能算法对用户基础数据、访问历史等进行画像建模，以标签化信息为基础，利用自然语言处理技术为用户提供更易于访问和使用的精准内容和服务推荐。此外，人工智能可以通过数字水印和机器学习算法追踪资源的使用和分发轨迹，从而达到防止盗版的目的，保护图书馆的知识产权。

在智慧图书馆的展现形式中，相比传统图书馆，人工智能技术为智慧图书馆带来智能小助手——机器人。图书馆利用虚拟或实体机器人从事智能书库管理、读者导航和服务咨询等服务工作，将图书馆员从大量枯燥、重复、标准化的工作中解脱出来，将更多的时间与精力投入更有创造力的工作，开创人机交互与协作的新生态。

整体而言，智慧图书馆运用人工智能技术感测、分析、整合图书馆各核心系统的关键信息，智能响应关于图书馆业务、图书馆读者服务、场馆活动、公共安全、环保在内的各类需求。将更加适用的人工智能技术应用于智慧图书馆的转型升级，有助于使其真正发展成为智能化、主动化的智慧图书馆，从而实现智慧图书馆服务的精准化和个性化。

2 ChatGPT 的特征与评价

2.1 ChatGPT 概述

当前，网络信息呈爆炸式增长态势，传统的信息检索服务已难以满足用户的知识需求，用户渴望出现一种直截了当的方式取代从零散杂乱的信息中提取知识再整合的烦琐模式，直接呈现可用性强、易于接受的答案。为满足用户日益个性化、高效率、智慧化的全新需求，语言交互型人工智能应运而生。语言交互型人工智能最早可以追溯至19 世纪60 年代一个名为Eliza 的Chatbot，但其并不能真正理解用户话语中的含义［8］。随着新技术的井喷式发展，海量数据作为语料训练语言交互型人工智能的“思维”，令其能够真正意义上实现同用户的情感交互与思维碰撞，进而将人工智能技术的发展推向新高潮。

2022 年11 月30 日，ChatGPT（Chat Generative Pre-trained Transformer）正式与用户见面，并掀起了全领域的浪潮。各大新闻媒体平台纷纷推送ChatGPT 相关内容，标志着新一代知识增强大语言模型将对人类的生活方式产生颠覆性的巨变。2023 年，谷歌、百度等科技企业紧跟步伐，相继发布了各自的大语言模型（见表1）。可以预见，基于大语言模型的人工智能应用将成为包括图书馆行业在内的各领域的技术发展的重心。

表1 2020 年至今各大科技企业发布的大语言模型

ChatGPT 是由OpenAI 研发的聊天机器人程序［16］，其本质是一个基于GPT（Generative Pre-TrainedTransformer，生成式预训练语言模型）开发的对话式生成模型［17］，可以与人类进行各种主题的对话，并为人类提供信息和解答问题。ChatGPT 通过大量的训练数据和深度学习算法不断进行学习和改进，以更准确地理解和回答人们的问题为目标。

GPT 属于自然语言处理的范畴，是一种基于Transformer 神经网络架构，通过无监督或自监督方式进行大规模语料库训练得到的模型，支持自动理解并生成自然语言文本［18］。GPT 自诞生以来，已经完成1.0—3.5 版本的迭代升级。2023 年3 月15 日，OpenAI 发布多模态预训练大模型GPT—4.0，在GPT—3.5 的基础上进行超级升级，能够提供更安全、更有用的响应。GPT—4 能够处理超过25,000 字的文本，可以接受图像作为输入并生成标题、进行分析，还可以与用户一起完成创造性任务，如作曲、写剧本或学习用户的写作风格等［19］。

ChatGPT 引入了RLHF（Reinforcement LearningfromHumanFeedback），即以强化学习方式、以人类偏好作为奖励信号［20］，依据人类反馈优化的语言模型，目标是驱使模型生成的内容在认知、需求等方面贴近人类思想，具备与人类高度一致的完整的逻辑链条，从而模拟人类的思维习惯和思考逻辑，与人类进行智能交互。

ChatGPT 的应用功能正在持续性扩展。第一，可以完成语言处理工作，可以从海量的无序信息中完成关键词抽取、主题识别、搭建知识图谱等工作。第二，可以胜任部分创造性任务，如撰写文本、谱曲、代码编程等。第三，能实现智能问答，具有完整的人类逻辑思维链条，能够凭借场景理解能力和上下文对话能力与用户沟通，输出文字、语音、图片等多模态内容，满足用户多领域知识需求。这三方面功能均对图书馆的信息组织与信息检索等关键工作环节有所裨益，类ChatGPT 等人工智能的应用必会将智慧图书馆的建设推向新高度。

2.2 “3+3”人工智能评价模型

Askell 等提出了“HHH”原则，即Helpful（可用性）、Honest（可信性）、Harmless（无害性）［21］用于评价大型语言训练模型。OpenAI 招募了约40 人的标注团队对GPT—3 和InstructGPT模型在不同场景下的输出进行评估，看其是否符合上述原则［22］。李书宁等用“3H”原则对Chat-GPT 的性能进行评估［23］。本文以“3H”原则为基础，增加易用性、通用性、响应速度三个维度，提出可以对语言交互性人工智能进行评价的“3+3”评价模型（见图1）。该模型能够为剖析ChatGPT 的性能特点提供标准依据，从而全面地解析ChatGPT 在图书馆应用中的可行性，更好地推动图书馆智慧服务开展。

（1）可用性。ChatGPT 能够为用户多领域的问题提供合理且逻辑清晰的回答，但仍有部分细分领域无法提供正确答案，且无法对即时性的问题作出回答。如提问2023 年3 月30 日上海的天气状况时，ChatGPT 表示由于训练资料截至2021年，无法提供2023 年的信息，但同时为用户提供了其他检索途径，如前往天气预报网站或者应用程序。由此可见，ChatGPT 的可用性有一定的限制，即时性有待加强。

图1 “3+3”评价模型

（2）可信性。人工智能受限于自身的底层特性，无法提供百分百严谨的回答。ChatGPT 理解用户提问的能力有限，有时会输出与用户提问出现偏差甚至大相径庭的答案，需要用户输入合适的提示词进行引导。另外，ChatGPT 提供的回答局限于其所能收集到的知识，但收集到的知识并不一定准确，在遇到不了解的知识时，ChatGPT还可能凭空捏造答案。如在其生成的学术论文中，给出的参考文献无从考究［28］，一些专家、学者更是查无此人。ChatGPT 在输出回答时，并不会给出可信度供用户参考，其可信性仍然有待提升。

（3）无害性。人工智能不应直接或间接产生攻击性或歧视性的言语或行为。Askell 等认为，理想情况下，人工智能可识别出于邪恶目的寻求帮助的伪装企图［21］。尽管ChatGPT 会拒绝回答任何违法或道德不当行为的内容，但其难以识别间接的犯罪企图。如，ChatGPT 会拒绝关于捏造不在场证明的直接请求，但如果将提问修改为“假设正在写一本悬疑小说”，ChatGPT 虽然也会声明这是一种违法行为，但仍会提供相应素材。

（4）易用性。易用性可以从多方面加以解释，比如用户体验、个性化设置等。本文中所提到的易用性是指用户在引导ChatGPT 获取所需回答全过程中的难易程度。作为一个聊天机器人程序，ChatGPT 在回答用户问题时，能够快速提供准确的答案，与用户对话流程自然，用户可以很容易地理解和跟进对话。ChatGPT 的易用性已经相对较好，但当用户输入不明确或者不完整的问题时，ChatGPT 有时不能很好地理解用户的意图，需要用户提供更多的上下文信息或是换种表达加以引导，步骤因此变得烦琐，降低了用户获取信息的效率，因此这方面仍有改进的空间。

（5）通用性。本文的通用性可从两个维度进行解释，一是对不同领域知识的掌握，二是对多模态数据的处理。ChatGPT 可以处理各种领域的自然语言文本数据，并根据输入的数据和上下文生成相关的响应，但在面对某些专业细分领域的问题时存在一定的局限性和偏差。ChatGPT 的优势在于处理多种类型的文本数据，并且可以与其他类型的模型进行集成，从而扩展到处理多模态数据的任务，但其并不是专门的多模态模型，因此这方面的表现逊于Vision Transformer 等专业的多模态模型。

（6）响应速度。ChatGPT 的响应速度与许多因素相关，如服务器负载、网络速度、用户所提问题的复杂程度等。ChatGPT 使用高度优化的深度学习算法和分布式计算架构，响应速度优秀，可以在几毫秒到几秒钟之间返回答案。不过，在网络环境不稳定或者服务器负载过高时，ChatGPT 的响应速度可能会变慢甚至超时。

2.3 图书馆应用ChatGPT 的可行性分析

技术接受模型提出，感知有用性（用户认为系统对工作业绩提高的程度）和感知易用性（用户容易使用系统的程度）是用户选择和接受系统的两个重要因素［25］。用户满意度指数模型指出，感知价值会对用户满意度产生正向影响，从而影响用户的持续使用意愿［26］。成本—效益分析法指出，应充分考虑投入成本和获得收益，从而制定最优决策方案［27］。基于上述理论，结合图书馆资源特征，笔者归纳出技术可行性、数据可行性、用户接受程度以及成本效益四个维度，对图书馆搭建ChatGPT 平台的可行性进行系统分析。

（1）技术可行性，用于评估图书馆搭建ChatGPT 平台所需的技术要求和可行程度。Chat-GPT 作为基于GPT—4.0 架构的大型语言模型，具有强大的自然语言处理和对话生成能力，可以通过训练进行特定领域优化，支持构建私有知识库，满足用户的信息需求。此外，ChatGPT 可以通过API 接口进行集成，方便与现有的图书馆网站或移动应用进行对接。

（2）数据可行性，用于确定图书馆搭载ChatGPT 在数据方面具备支撑和实施的可行性。图书馆海量的图书、文献等信息资源是训练ChatGPT 模型并进行调优的坚实基础。此外，用户与ChatGPT 的对话数据还可以被用于模型的进一步优化和改进，从而不断提升其性能，形成良性循环。

（3）用户接受程度，用于帮助图书馆确定应用ChatGPT 是否能满足用户需求，是否能够提供有价值的服务。随着人工智能技术的成熟，用户对于与AI 进行对话的接受度逐渐提升，智能语音助手如Siri、天猫精灵等以及在线客服机器人等已经成为用户日常生活中常见的对话对象。在图书馆中引入ChatGPT 作为一种信息服务工具，用户可能会对其产生浓厚的兴趣并尝试。此外，其个性化服务和不间断在线服务的特点可以大幅提升用户满意度。

（4）成本效益，用于评估搭建ChatGPT 平台所需成本与预期效益之间的关系。相比传统的图书馆服务，引入ChatGPT 可以在一定程度上减轻图书馆员的工作负担，提高工作效率，其接入和维护成本远低于完成同样工作的人力成本。同时，ChatGPT 作为一种数字化服务工具，可以为图书馆提供长期的、可扩展的在线服务，具有较高的成本效益。

3 基于ChatGPT 类人工智能的图书馆智慧服务深化与拓展

3.1 ChatGPT 深化资源拓展服务

（1）智能分类和标注。传统的分类和标注方式需要耗费大量的人力和时间，而且易受主观性影响或出现误差。ChatGPT 可以利用其自然语言处理和机器学习算法，对图书馆的资源进行智能分类和标注，自动理解资源的内容和主题，并为其分配适当的分类和标签。这可以帮助用户更快地找到他们需要的资源，同时也可以帮助图书馆更好地管理和推广文献信息资源。

（2）自动化资源采集。传统的资源采集方式需要图书馆工作人员不断关注各种来源，耗费大量的时间和精力。ChatGPT 则能够完成自动化资源采集和处理，它可以监测各种来源，如新闻、学术论文和社交媒体等，从中自动识别并采集与图书馆资源相关的信息。此外，ChatGPT 可以整合图书馆内的各种非结构化资源，提高输出内容质量，实现图书馆资源的深度挖掘［28］。

（3）集成化资源整合。ChatGPT 的资源数据库不仅能够帮助图书馆丰富自身的资源，还可以促进馆际、馆舍、馆网之间的资源共享和知识交流。通过建立知识链接、结构和框架，ChatGPT可以帮助图书馆将不同渠道和来源的知识资源整合到一起，形成更为丰富和综合的知识网络，从而提供更全面和有价值的服务。

3.2 ChatGPT 引领智能咨询服务

人们对于信息和知识的需求越来越高，作为知识服务机构的图书馆需要不断提升服务能力。作为一种基于人工智能的大语言模型，ChatGPT可以通过自然语言处理、文本挖掘、AIGC 等技术为图书馆提供智能化咨询服务。AIGC 是指通过人工智能替代人类进行内容创作，它不仅可以定制不同的风格，还能创造出无限规模的创作灵感［29］。AIGC 可以为图书馆开发智能问答系统、智能推荐系统等，帮助用户更加便捷地获取知识信息。基于AIGC，ChatGPT 可以以多轮对话的形式分析用户的问题，逐步推进对话，与用户进行交互，进一步深化用户需求，为用户提供个性化服务。

ChatGPT 可以帮助图书馆提供跨语言的咨询服务，使其服务对象更加广泛。如，在一个国际化的图书馆中，用户可能来自不同的国家或地区，使用不同的语言进行交流和咨询，这时ChatGPT可以通过分析和理解不同语言的输入，为用户提供准确、及时、专业的咨询服务，大大提高图书馆的服务的深度和广度。

3.3 ChatGPT 优化阅读推广服务

图书馆阅读推广与ChatGPT 结合将重塑“智慧推荐”模块。读者荐读服务是阅读推广工作的重要组成部分，图书馆借助微信公众号、微博、抖音等信息平台为读者推荐阅读资源，即通过大数据技术搜集读者信息，除姓名、性别、年龄、职业等基本信息外，还有常读书目类别、阅读时长等阅读相关信息，以这些信息来分析用户偏好，生成“最受欢迎图书”“月度借阅榜”等数据，使读者能够及时了解图书馆的资源更新情况以及热门图书借阅情况，并为读者推荐其可能感兴趣的书籍。然而，大数据自动生成的推荐目录仅能对整个读者群体进行推荐，无法精准定位到不同用户的个性需求，缺少一定的针对性及精准性［30］。

ChatGPT 的加入则或使上述机制得到改进。ChatGPT 可以帮助图书馆开发智能推荐系统，从书目的总体类别深入揭示细节与特点，为用户推荐与其阅读兴趣相关的资源［31］。ChatGPT 能够将导入的海量馆藏文献进行知识整合，对每本书中的内容与特点进行提取，用户可以与其进行交流，直接将自己的喜好与需求传递出去，由ChatGPT为其推荐可能喜欢的书籍，还可以对书中的细节进行问询，提升读者满意度。

当然，ChatGPT 目前并不完善，图书馆馆藏也并未整体、系统地导入其知识库中，缺乏网络上检索不到的珍贵馆藏书目的信息。除此之外，ChatGPT 的访问流程仍较为复杂，用户界面与图书馆领域不适配等问题仍需进一步完善。针对这些问题，图书馆可以在接入ChatGPT 等人工智能大语言模型时融入自己的特色元素，贴近用户需求，创造独属于图书馆的“ChatGPT”。

3.4 ChatGPT 助力文化创意服务

文化创意产品作为图书馆阅读推广与品牌塑造的重要抓手，与ChatGPT 相结合将迸发出惊人的灵感，为读者带来新奇的阅读体验与文化的深度碰撞，打造“智慧文创”新生态。当前，图书馆文创已经成为许多图书馆推广阅读、吸引读者的重要方式之一。值得注意的是，图书馆文化创意产品的主体部分依然是实体文创产品，需要兼顾实用性、美学与文化，且由于实体框架的限制，难以将文化内涵完整地传达给消费者，导致部分教育意义流失。面向公众的大多数文化内涵通过各类搜索引擎、媒体平台可以轻松查找到，但由图书馆珍贵馆藏提炼的文化所产出的文创产品，由于馆藏的孤本性，并不能借由网络途径轻松获取，因而导致文创背后的文化传递不出去，从而失去了图书馆文创产品的初衷。

对于这一难题，可以将特色馆藏信息或其文创产品的文化内涵导入ChatGPT 知识库，利用其强大的自然语言生成能力，通过对话的方式将文化内涵以通俗易懂的形式传递给消费者。

4 ChatGPT 类人工智能在图书馆应用中的思考

4.1 保持独立思考，坚守道德底线，构建生成式人工智能规范约束体系

ChatGPT 在可信性方面仍然有待完善，但由于其完整严密的逻辑思路、坚定自信的语言风格，用户往往会被伪信息蒙蔽。因此，在ChatGPT 等人工智能反馈的信息中，所有人都需要保持独立思考的能力，切忌过度依赖人工智能，特别是图书馆人，要具备严谨的信息素养，掌握鉴别信息真伪的能力。科学是把双刃剑，自人工智能诞生以来，学术界就科学技术伦理始终存在担忧。人工智能过于合乎逻辑，它如果具备自我意识和自由意志，又不会考虑人类的道德和情感，则有可能给人类社会带来不可逆转的危害［32］，故开发人工智能势必要赋予其以正确的伦理道德观。

建设可信、可靠的人工智能，在技术层面需要进一步完善图书馆方面的训练语料，提升对话准确度。国家互联网信息办公室发布了《生成式人工智能服务管理办法（征求意见稿）》［33］，这表明对生成式人工智能的规范约束已经开始形成体系。利用国家级人工智能伦理规范作为指导框架，建立专门的数据伦理委员会和监督委员会等组织，负责制定人工智能基础规范，包括隐私规范、安全规范等，以确保人工智能应用的安全性和公正性。此外，由于人工智能具有的法律人格有限，应当按照“刺破人工智能面纱”的归责原则确定责任主体，其造成的损害应由人工智能的实际控制人或责任人承担［34］。

4.2 善用人工智能，参考智慧灵感

人工智能的知识整合与语言组织能力十分强大，ChatGPT 可以帮助图书馆设计文创项目与产品。输入文化主题或是馆藏文献信息后，ChatGPT 会根据用户要求反馈若干逻辑清晰的设计方案，由文创开发人员判断是否可行，激发创新灵感。因此，善用ChatGPT 可以为文创开发提供新的灵感，通过对ChatGPT 的进一步语料训练和完善，可以提高准确度和可靠性，进而为图书馆文创提供海量优秀的资源与素材。同时，图书馆也可以利用ChatGPT 的知识库进行更为精准的文创推广和展示。如，ChatGPT 可以为图书馆推广特定的文创活动，或者为读者提供特定的文创主题阅读推荐。因此，善用ChatGPT，不仅可以为图书馆提供新的文创资源，也可以为读者带来更加个性化和丰富多彩的文创体验。

4.3 提升馆员素养，共同赋能服务

ChatGPT 固然能够独立提供知识服务，但其知识服务质量仍然取决于开发者与用户。馆员可以通过相关学习掌握ChatGPT 的使用技巧，减少对话轮次，在尽量短的时间里获取最终答案，保证ChatGPT 的回答质量，更加高效地利用ChatGPT 为读者提供优质精准的服务，增强用户对图书馆的信任感和忠诚度。此外，馆员要具备一定的信息安全意识和技能，能够严格保护用户的个人隐私和数据安全。除了提升馆员素养，还可以通过培训、交流会议、开展主题活动等方式，让馆员与用户共同参与到服务的创新与优化中来，令用户能够自主地应用类ChatGPT 工具。同时，要注重收集用户反馈和需求，及时修正和完善ChatGPT 的知识库和服务，以更好地满足用户的需求和期望。通过馆员与用户的共同参与和合作，才能真正实现ChatGPT 的赋能服务。

5 结语

在智慧图书馆迈向新阶段的过程中，人工智能的飞速发展在带来诱人机会的同时，也裹挟着巨大的风险与挑战，图书馆应加强自身建设，沉着应对挑战。首先，加快建设高水平、复合型研究团队，吸纳多学科人才，以便更好地应对不同领域的挑战。其次，综合利用多方面的有力支撑，引入数字化建设相关技术成果，如5G、大数据、物联网等，以增强智慧图书馆的实际表现与响应能力。最后，加大科研资金投入，积极探索和研究人工智能技术在图书馆服务中的应用，创造图书馆领域专属的语言交互型人工智能，以更好地满足用户需求，搭建人与机器和谐共生、相辅相成的良性循环新生态。