大语言模型技术赋能高校图书馆智慧服务探讨

2023-12-31 16:43徐国兰朱和立郭凤娇
关键词:知识库智慧图书馆

徐国兰,朱和立,郭凤娇

(1.山东理工大学图书馆,山东 淄博 255000;2.齐鲁师范学院图书馆,山东 济南 250200;3.山东理工大学信息管理研究院,山东 淄博 255000)

引言

在信息爆炸式增长时代,高校图书馆的传统服务方式已经无法满足高校师生日益增长的信息需求。 近年来,基于人工智能的对话系统、智能推荐等技术在图书馆领域逐步落地,人工智能的发展促使人们对智慧图书馆服务寄予更高要求和期待。 2022 年11 月30 日,美国OpenAI 公司推出了一款基于人工智能的自然语言交互模型——ChatGPT,它能够理解上下文语句含义、支持多种语言、提供个性化服务,为用户提供高质量的信息检索、智能问答、个性化推荐等服务,可以广泛地应用于各行业,提高用户的生活、工作效率。 2023 年2 月7 日,微软发布采用了ChatGPT 技术的新版Bing 搜索引擎。 此后,人工智能界以“天”为维度推出新技术、新产品。 3月14 日,OpenAI 推出GPT-4,成为目前最强的生成式AI 产品;3 月16 日,百度正式发布“文心一言”;4 月,阿里“通义千问”问世;5 月,谷歌发布其最新的大语言模型PaLM2,同时宣布接入Chrome 浏览器,等等。 各种大语言模型产品相继推出,被应用于各行各业。 以GPT-4 为代表的大语言模型技术创新为高校图书馆的信息服务带来新的契机。 通过研究大语言模型技术在高校图书馆智慧服务中的应用,可以挖掘这一技术在知识获取、信息咨询、个性化推荐等服务中的有效性和潜力,为高校图书馆实现个性化服务、提高工作效率、提升图书馆用户满意度提供实践参考。 这也将有助于推动图书馆领域智慧服务的改革与创新,提升其在教育领域的现代化水平。

新一轮的人工智能革命已经引起了图书馆界的密切关注,美国职业图书馆网站[1]、我国图林网上社区圖人堂[2]就ChatGPT 对图书馆的影响开展了相关讨论。 大语言模型技术对智慧图书馆影响的研究也陆续开展。 段荟等人通过访谈信息资源管理领域科研人员对ChatGPT 的态度与认知,发现科研人员对ChatGPT 技术理念和价值有着积极的态度和较高的认可度,并从数据管理、人工智能素养、信息资源管理学科体系等方面提出应对策略,以消除ChatGPT 为代表的人工智能生成技术带来的负面影响[3]。 张智雄等人通过对ChatGPT 核心技术创新态势的分析,从图书馆管理、检索、推荐、问答等方面探索智慧图书馆的应用[4]。 张晓林提出应利用Chat-GPT 技术重塑感知型知识服务能力,构建决策性知识服务能力,以及以知识服务支持AI 赋能科学研究[5]。 郭亚军等人从内容生产方式角度分析了ChatGPT 在语言翻译、场景转移、信息传播和任务处理四个方面的应用,并构建了图书馆服务应用场景框架图[6]。 宋小康等人则重点分析了AI 赋能的替代信息搜索的内涵和特征,基于社会技术系统范式从技术、信息、用户和社会文化四个层面探讨构建了AI 赋能的替代信息搜索理论框架[7]。 赵杨等人以武汉大学图书馆机器人智能问答服务为实证对象,应用注意力机制和LSTM 算法构建了多模态情感分析模型,用以揭示影响用户情感体验的关键因素,为图书馆智能服务的情感化设计和优化提供依据[8]。 潘家芳构建了人机智能协同的图书馆精准服务模型,通过机器与专家的协同决策形成问题确定、服务映射、服务实施、效果检验闭环来实现图书馆精准服务[9]。

当前,图书情报界关于大语言模型技术对智慧图书馆的影响和应用研究还处于初步探索阶段,且主要集中在以ChatGPT 为代表的相关技术给智慧图书馆带来的挑战与启示的探讨,尚缺乏对大语言模型技术在智慧图书馆的应用场景的系统研究。 鉴于此,本文以GPT-4 为例,分析大语言模型技术的关键技术,对大语言模型技术在知识库构建、信息检索、个性化推荐、科研支持等服务方面的运用进行深入探讨,以为我国高校图书馆发展智慧服务提供相关支持和借鉴。

一、大语言模型的关键技术

GPT-4 是基于Transformer 结构的强大的自然语言处理(NLP)模型,通过自回归训练方法进行预训练,是一种用于NLP 模型的预训练方法,能够使模型在各种NLP 任务上都有出色的表现。 本文则以GPT-4(Generative Pre-trained Transformer 4)为例说明大语言模型所依赖的关键技术。

(一)Transformer 架构

GPT-4 使用Transformer 架构作为基础模型[10]。 通过计算不同语义之间的关联度来生成具有最高概率的语义反馈。 Transformer 采用多头注意力进行快速并行计算,其最大的优势是可以捕捉输入序列中远距离依赖关系。 由于消除了循环神经网络(RNN)或长短时记忆网络(LSTM)中的循环序列操作,使其并行性和训练速度有了大幅度提高。 多头自注意力机制模块是Transformer 的核心组件,多头机制不是只计算一次注意力,而是并行运行缩放点积注意力算法。 随着Transformer 技术的不断发展,Transformer 还被应用在计算机视觉领域,形成了Vision Transformer(ViT)技术。

(二)自回归训练方法

GPT-4 模型采用自回归训练方法进行预训练,通过捕捉和建模序列数据中的依赖关系来预测下一个词。 与掩码语言模型(MLM)略有不同,自回归训练更关注文本中词之间的顺序依赖性。 自回归训练方法在NLP 领域具有较广泛应用。 模型的基本假设是每个词的出现都受到之前词的影响。 因此,通过学习文本序列中的依赖关系,自回归模型可以更好地捕捉句子中的连贯性、语法结构以及语义信息。 GPT-4 采用自回归训练方法进行预训练,使其在各种NLP 任务上具有很高的泛化能力。

(三)并行处理与硬件资源优化

以GPT 系列为例,每一代模型在网络规模、计算能力、Transformer 层数和参数数量上都有所提高,使得能够处理更为复杂的文本序列,提升性能和泛化能力。 为提高计算效率,GPT-4 以并行方式处理大规模数据集,并且对硬件资源(如GPU、TPU 等)进行优化。 这使得模型能够在处理海量文本数据和复杂任务时保持高速性能。

二、以GPT-4 为代表的大语言模型技术对高校图书馆服务工作的影响

传统图书馆服务在提供的服务内容和服务方式上较为有限,并且在服务手段上主要依赖人工服务和一些辅助性的自动化设备。 人工智能和大语言模型技术的发展应用对高校图书馆服务内容和方式都产生了很大影响。 大语言模型技术是自然语言处理领域的一种新技术,使用大规模语料库进行训练,能够帮助图书馆实现智慧化服务,使图书馆服务从信息到知识、从被动到互动、从单一到多元逐渐推进。 图书馆服务变得更加便捷高效、个性化和多样化,从而实现高校图书馆服务的转型和创新。

(一)服务内容

图书馆服务的技术从Web1.0 到Web2.0,逐步向Web3.0 发展,目前处在Web2.0 和Web3.0之间的发展状态。 图书馆服务从单向传播式到双向交互式,逐渐向用户参与式扩展的趋势发展,推动图书馆发展为用户互动、分享并参与建设的智慧图书馆。 在图书馆服务技术的发展过程中,图书馆资源也从由专业从业人员创作、编辑、发行的纸质文献、音频、视频等内容,发展到由网络资源创作与组织方式产生的数字资源。目前正逐步发展到由人工智能生成的多样化资源,这时候图书馆资源不仅有数字资源,还包括数字藏品、3D 立体模型等[11]。 GPT-4 人机交互的出现加速了这一演化进程。 GPT-4 类大语言模型具有颠覆性的多源多模态信息聚合和生成能力,能够覆盖海量知识资源和具备全域数据融合和推理能力的信息源,推动了信息资源建设。此外,ChatGPT 类大模型还提供了强大的数据关联、任务解决和内容生成能力,推动了人类生成内容和AI 生成内容共生的新型信息环境的形成[12]。

(二)服务方式

技术的变革使得图书馆的服务方式也在不断改变,从传统图书馆以“资源”为中心,进化为依托Web2.0 技术的“用户”服务,在Web3.0 时代,图书馆的服务模式是以用户、资源、空间三元融合交互的智慧化服务。 大语言模型技术有助于图书馆服务方式的集成化。 传统图书馆的借阅模式是读者需要来到图书馆内,才能借阅到需要的书籍或资料。 而大语言模型技术的出现,无须实体馆藏,读者只需要在网上输入需要查询的内容,大语言模型就可以通过自然语言理解、知识图谱等多种技术,为读者提供需要的答案或相关资料。 传统图书馆通过图书分类、目录等方式为读者提供信息服务,而大语言模型技术的应用,使得图书馆的信息更加直观,易于理解。GPT-4 技术还可以通过对读者的行为、兴趣等方面的分析,提供个性化的信息服务。 例如通过分析读者的借阅历史,大语言模型可以向读者推荐他们可能感兴趣的书籍或资料。 而传统图书馆则难以实现这种个性化推荐,因为它们无法跟踪读者的阅读习惯和兴趣。 另外,传统图书馆只提供图书借阅及查阅服务,难以引导读者进入到一个开放式的学习环境,而大语言模型技术通过提供互动式、智能化的学习环境,可以促进读者之间的交流、共享,提高学习效率。

以GPT-4 为代表的大语言模型技术的出现为传统图书馆工作提供了新思路和方法,可以更加全面、高效地为读者提供信息服务,同时也能促进图书馆及相关服务的数字化转型。

三、基于大语言模型技术构建高校图书馆智慧服务系统

《国际图联趋势报告2021 新进展》提出,年轻一代图书馆用户希望得到最新技术和服务,如果图书馆无法满足他们的期望,那他们很有可能会弃之而去其他类型的资源[13]。 因此,提高图书馆服务的智慧化程度是留住图书馆用户的必要选择。 大语言模型技术与高校图书馆的智慧服务具有很高的契合度,我们可以利用大语言模型技术构建高校图书馆智慧服务系统,促进图书馆的服务转型,运用自然语言处理和深度学习算法,为用户提供高效、准确的智慧化服务。 我们构建的高校图书馆智慧服务系统框架如图1所示。

图1 基于大语言模型技术的高校图书馆智慧服务系统

(一)知识库实时更新系统

图书馆资源是图书馆提供服务的物质基础,知识库是智慧图书馆的重要组成部分。 基于大语言模型技术构建出实时更新的知识库可以对资源内容进行有效组织和管理,形成完善的知识结构,实现智慧化、个性化的用户检索需求。

1.知识库构建

知识库的构建需要通过数据采集、整合、元数据标注和构建知识图谱等流程来完成。 图书、期刊、论文、报告、会议记录、多媒体等信息资源是构建知识库的基础。 这些资源既可以从图书馆自身馆藏获取,也可以通过与其他图书馆、数据库、出版商合作采集。 将采集到的信息资源进行整合,消除重复内容,形成完整的知识体系。还可以引入外部引用和链接,实现信息资源之间的关联。 根据行业数据标准和分类体系(如MARC、Dublin Core、SKOS 等)对信息资源进行详细描述、分类和标注。 为每个资源分配唯一的标识符,记录资源的作者、出版时间、主题等元数据信息。 通过机器学习和自然语言处理技术构建知识图谱,实现概念、事实、实体之间的关系挖掘和表达,帮助用户快速了解某一主题的基本知识结构,提高检索效率;同时,知识库需具备社交互动功能,通过为用户提供在线讨论、评论、问答等社交互动功能,促进知识库内容的传播和分享,使知识库不断丰富和完善。

2.知识库实时更新

大语言模型技术可以实现知识库的实时更新与扩展,确保用户能够查询到最新资源,及时满足读者不断变化的知识需求。 系统实时准确挖掘与高校图书馆相关的各类数据源,包括图书、期刊、论文、行业动态、网络资源等,这些数据源是知识更新和扩展的基础。 从各类数据源中提取的资料需要经过清洗、去重、分词等预处理,再通过自然语言处理技术提取关键词、主题、分类等信息,便于后续的分析和知识融合。 完成对新收集数据的处理和分析后,将其与原有的图书馆知识库进行融合。 系统需要找出新旧知识之间的联系,避免冗余,并及时更新原有知识库。大语言模型需要通过持续学习的方式,自动获取和驾驭新知识,包括对新数据进行训练,不断调整和优化模型,以便更好地理解新知识和处理用户请求,同时还要收集用户反馈,帮助优化模型效果。

(二)聊天式检索系统

信息检索是图书馆的关键服务之一。 传统的关键词搜索对于某些用户可能太过复杂或不直观,而且筛选分析海量的检索结果对于用户来说也是一件费时费力的事情。 大语言模型本身是一个知识库和搜索引擎的结合体,将GPT-4技术融合进图书馆检索系统,通过对图书馆知识库系统的资源进行检索,自动生成检索结果。 检索系统支持用户自然语言检索、多模态检索,以对话聊天框形式呈现。 检索系统以上文图1 所构建的实时更新知识库为基础,为大语言模型预训练提供所需要语料集,保证图书馆检索系统提供检索服务的专业性、真实性和时效性。

相较于传统检索系统,聊天式检索系统能理解自然语言输入。 当用户以自然语言进行查询时,大语言模型使用NLP 技术对输入内容进行分析,捕捉关键词、实体、概念和关系,然后将识别到的关键信息与知识库进行匹配,检索出与之相关的资源,进而根据一定的标准(如资源的相关度、热门程度、引用次数等)对搜索结果进行排序。 最终,大语言模型将从检索结果中提取关键数据,以自然语言生成(NLG)技术向用户呈现一段友好的回复。 在聊天式检索方式下,用户无须具备专业背景知识,只需用自然语言描述需求,便可快速、准确地获得所需信息。 这不仅提高了检索效率和准确率,也极大改善了用户的检索体验。

(三)个性化推荐系统

以用户为中心提供精准个性化服务内容,将是图书馆强化知识服务主体地位的有效途径,以用户为中心也是智慧图书馆的发展理念[11]。 基于对用户的历史借阅记录、研究领域和兴趣爱好,大语言模型可以帮助提供个性化的资源推荐,确保用户能获取最相关的图书、期刊、论文等相关信息。

大语言模型通过用户画像构建、资源元数据分析、推荐算法、生成推荐列表、展示推荐结果及评估反馈等流程实现高校图书馆智慧服务的个性化推荐功能。 首先,大语言模型通过分析用户的借阅历史、搜索记录、在线行为等数据,为每个用户创建一个详细的画像,包括兴趣爱好、专业领域、阅读习惯等信息。 其次,大语言模型对图书馆资源进行元数据分析,为每个资源分配相应的标签、分类和关键词,以此帮助系统更准确地找到与用户画像匹配的资源内容。 最后,大语言模型根据用户画像和资源元数据分析的结果,利用推荐算法匹配用户兴趣点和相关资源。 推荐算法可以采用协同过滤、矩阵分解等算法,或综合多种算法形成混合推荐。 根据推荐算法的结果,生成个性化的推荐资源清单,并将推荐资源以清单或摘要的形式展示给用户;同时,收集用户对推荐结果的反馈(如点击、收藏、评分等),用以不断优化算法和提高推荐精度。

个性化推荐有助于引导用户发现与其需求、兴趣相符的资源,提高阅读和学习效率;同时,这种推荐方式还能增加图书馆资源的使用率,让更多优质资源得到充分利用。

(四)知识服务系统

图书馆的“智慧”不能仅局限于技术的智慧,而应将重心放在提供智慧化的“知识服务”[14]。 大语言模型基于Transformer,通过生成式预训练,具有语言生成能力,能够遵循提示词生成补全提示词的句子;上下文学习能力,能够遵循给定任务的示例,为新的测试用例生成解决方案;世界知识获取能力[15]。 利用这些能力,GPT-4 技术能在学术研究过程中,尤其是在文献整理与筛选、跨学科资源整合、研究趋势分析与预测、编写辅助等文献处理方面,发挥重要的科研辅助作用,可以将科研人员从海量文献中解放出来,提高研究者的工作效率和研究能力,促进研究领域不断发展与创新。

1.文献检索与筛选。 大语言模型可以根据研究人员的关键词、主题或问题,从图书馆知识库中检索出相关文献,包括图书、期刊论文、会议论文等。 还能根据摘要或全文内容对文献进行评估,筛选出最相关的资源,包含最新研究论文、顶级会议收录论文等并提交给研究人员。

2.跨学科资源整合。 GPT-4 可以实现跨学科资源的整合,帮助研究者发掘不同学科之间的潜在联系,激发创新思路。 例如研究人员想通过计算机模拟技术预测蛋白质结构,大语言模型可以从计算机科学、生物学等多个领域推荐合适的资源,辅助研究者整合不同学科的信息。

3.研究趋势分析与预测。 大语言模型可以从大量文献资料中分析某一领域的研究现状、趋势以及未来发展方向,以帮助研究者了解研究热点并作出有针对性的研究计划。

4.编写辅助。 大语言模型可以通过语言生成能力为研究者在论文写作阶段提供支持,比如生成摘要、参考文献格式化、论文润色等,提高研究者的工作效率。

(五)智能阅读辅助系统

GPT-4 类大语言模型技术可以应用在智能化的阅读辅助上,它可以自动将文献内容进行提炼和总结,生成摘要或者关键词标签,帮助用户更快地理解文献内容;同时,大语言模型技术可以利用自然语言生成技术,将摘要内容进行自然语言转换,让读者有一种面对书本的畅快感,缩短阅读时间,同时提高理解程度。

(六)智能问答系统

大语言模型可用于创建智能问答系统,教师、学生和其他用户通过问答系统能够快速获取关于图书馆资源、服务、设施或规章制度的信息。大语言模型利用自然语言处理来理解问题,并与内部知识库或数据库进行匹配,以实现智能问答服务。 这种服务能够有效地解决高校图书馆中常见的问题,包括但不限于图书馆设施、借阅规定、活动安排等各种信息。 通过智能问答系统,用户可以即时获取所需信息,大大提高咨询效率;同时,这也降低了图书馆工作人员的负担,让他们能够更好地专注于其他需要专业处理的任务。

目前国内已有图书馆把大语言模型应用于智慧问答。 2023 年5 月28 日,广州越秀图书馆AI 机器人亮相,这是全国首款基于大语言模型的图书馆AI 机器人,该机器人可为读者提供AI写诗、诗词问题解答等服务[16]。

四、结语

以GPT-4 为代表的大语言模型技术通过自然语言理解和生成,为高校图书馆智慧服务提供技术支持,将大语言模型技术应用在图书馆的各个环节,可以让用户获得更加智能化、个性化的服务,提升用户和图书馆交流互动的体验,提高图书馆服务质量和服务效率。

今后我们会继续探索基于GPT-4 类大语言模型的寻求问答机制,将大语言模型技术与创新的硬件设备相结合,进一步提升高校图书馆智慧服务水平;同时图书馆应在大语言模型技术的推广和应用中加强对人机交互、隐私保护、数据安全等方面的关注和探索。 在未来,随着大语言模型技术的不断发展和拓展,大语言模型的对话交互能力,自动问答机器人的智能化程度将会不断提高,其在高校图书馆智慧服务中的应用也将不断创新和完善。

猜你喜欢
知识库智慧图书馆
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
图书馆
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
有智慧的羊
去图书馆
智慧派
位置与方向测试题
智慧决定成败
智慧往前冲,统计百分百(1)