高校图书馆大模型的构建与探索

2024-12-05 00:00王日花屈海涛
河南图书馆学刊 2024年11期

摘 要:人工智能和大模型是当今世界最重要的技术之一,是国家在科技自立自强领域取胜的关键赛道。高校作为科技创新的重要力量之一,也都在加强对人工智能和大模型的研究和建设。文章探讨了大模型和图书馆相结合的发展趋势、技术架构和应用场景,对图书馆大模型的落地实施和安全问题进行了探索,通过对图书馆大模型的全面剖析更好地理解大模型对社会、经济、科学等多个领域的深远影响,并提出了图书馆大模型的应对策略。

关键词:人工智能;大模型;图书馆;科技创新;智能化

中图分类号:G258.6 文献标识码:A 文章编号:1003-1588(2024)11-0087-04

1 背景

人工智能(AI)是推动数字经济发展的核心技术,大模型是人工智能的基础,在语言理解、图像识别、自动驾驶等领域应用广泛[1,2]。大模型采用深度学习技术,通过数十亿甚至数万亿参数的网络结构,模拟人脑的复杂神经网络,实现对庞大数据集的高效学习与推理,大模型是“大数据+大算力+强算法”结合的产物。在金融领域,大模型被应用于风险管理、个性化金融服务和反欺诈,以提高风险评估的准确性和客户满hk5vYMscGuW/nVSrk6S8Sg==意度,保障资金安全;在医疗领域,大模型助力医学影像诊断、老年患者管理和医学研究,提高诊断精度、个性化医疗和新药研发效率;在制造领域,大模型实现了智能化生产计划、优化质量管理和预测设备故障,提高生产计划的准确性、产品质量和设备可靠性。大模型的迅猛发展也伴随一系列挑战和问题,如数据隐私、算法公正性、技术透明性等。

图书馆作为高校的重要服务窗口,如何借助大模型的能力为广大师生提供更好的服务,是摆在馆员面前的重要问题。本研究结合中国传媒大学图书馆的业务特色,从需求分析、模型构建、实施落地、模型安全等维度,提出了图书馆大模型的构建策略。

2 图书馆大模型目标

中国传媒大学图书馆设置综合办公室、资源建设部、学科服务部、空间及技术保障部、借阅服务部、特藏建设部等六个部门。图书馆以读者需求为导向、以学科建设为引领,资源建设和空间建设双核驱动,使资源建设特色更鲜明、用户服务保障更智能、服务学科建设更精准、技术体系保障更有力、学习空间塑造更人文、馆员队伍建设更专业[3,4]。但是,图书馆在信息化和智能化方面仍有待提升,检索系统的便捷性和标准化程度不高,现有系统缺乏高效的智能推荐和个性化定制功能;缺乏大模型等智能化工具,深度学习和数据挖掘技术的普及度不高,难以实现对用户行为和需求的精准分析和个性化服务[5-7]

图书馆利用大模型技术可实现自动化的文件管理和信息整合,提高办公效率;开发智能助手系统,为工作人员提供信息查询、日程安排等服务;对图书馆馆藏进行深度挖掘和分析,发现馆藏的潜在价值和研究热点,开发智能化的图书推荐系统;开展学科文献分析和知识发现,为研究者提供更全面的学科服务支持;开发基于大模型的学科问答系统,为用户提供学科咨询和解答服务;进行数字化馆藏建设,实现对文献的自动扫描、数字化处理和元数据录入;对图书馆空间进行优化,提出空间布局和服务改进建议;开发图书馆空间导航系统。

图书馆大模型应用的总体架构主要包括两类,分别为“智慧图书馆+大模型”和“大模型+智慧图书馆”。“智慧图书馆+大模型”是围绕图书馆业务嵌入大模型技术,以图书馆业务场景为核心,面向馆员打造大模型应用场景。“大模型+智慧图书馆”则是以图书馆大模型为核心,调用知识库等外部系统提高智能处理和认知推理能力,面向读者打造统一服务入口,提供咨询问答、检索推荐、新型阅读等多元服务。图书馆大模型正在由“+大模型”向“大模型+”范式转变[8,9]

3 图书馆大模型构建

3.1 总体架构

图书馆大模型架构设计涉及数据、算法和算力,底层要有基础的大模型,往上建设传媒大模型。传媒大模型往上迭代图书馆大模型的应用层,图书馆大模型的三层总体架构见图1。底层的通用大模型通过选择业界的主流产品可获得,中间的传媒大模型通过加入图书馆数据进行模型微调,上层的落地场景满足了图书馆实现智能化应用的目标。

3.2 应用场景

3.2.1 信息咨询智能问答。智能问答系统主要通过对大量文献数据、图书馆服务相关信息的学习和分析,建立庞大而完备的知识库。系统能够利用先进的自然语言处理技术,对问题进行理解和分析,并从知识库中找到最匹配的答案。

3.2.2 图书馆智能导航。图书馆通过对馆藏信息、服务流程、空间布局等进行全面的数据整合和分析,构建完整而丰富的图书馆知识库,对用户提出的导航请求进行深度理解和分析,准确识别用户需求,并给出相应的导航方案,如:图书馆根据用户的学科背景、研究兴趣等因素,为用户推荐相关的书籍、期刊和数据库资源。系统能够提供多维度的导航服务,包括空间导航、资源导航、服务导航等,用户可以通过系统快速定位所需资源的位置,了解相关的服务信息和使用规则;图书馆能够及时更新最新信息和变化,保持导航数据的准确性和实用性,用户可以随时通过系统获取最新的馆藏信息、活动通知等。

3.2.3 图书馆馆藏智能检索。图书馆能够通过对馆藏、学术文献、服务流程等大量数据的分析和处理,结合用户的查询需求和偏好,实现智能化的信息检索和推荐功能,主要包括数据采集、数据处理、信息检索和结果展示等。图书馆要收集和整理的各类资源数据包括图书、期刊、论文、数据库等,对采集到的数据进行处理,提取其中的关键信息和特征,建立索引和词典等数据结构,以便后续的检索和查询操作。

3.2.4 图书馆数字馆员。数字馆员对馆藏资源进行全面、精准的管理,能够实现对馆藏的智能化分类、标注、整理和更新,使图书馆的资源管理更加高效、准确。数字馆员可以对用户的需求和兴趣进行深度分析,为用户提供个性化的信息推荐、学术指导、参考咨询等服务。数字馆员可以为用户解答相关问题,解决用户在使用图书馆资源过程中遇到的各种问题。数字馆员参与图书馆的运营决策和管理,为图书馆管理者提供决策支持,帮助其更好地了解用户需求,优化资源配置,改进服务流程。

3.2.5 图书馆学科服务。学科服务是指为不同学科领域的用户提供个性化、智能化的服务支持,满足其在学术研究、教学和学习过程中的信息需求和知识获取需求,涵盖了对学科资源的整合、学科专业化服务的提供、学科研究支持等。学科服务可以对图书馆的学科资源进行全面、精准的整合和管理,能够实现对学科领域的学术期刊、学位论文、专著、研究报告等各类资源的智能化分类、标注、整理和更新;对学科领域的研究热点、前沿动态等进行实时监测和分析,为学科研究者提供学科趋势分析、文献检索、学术交流等支持,促进学科研究的开展和成果的交流。学科服务系统可以为教师和学生提供丰富多样的学科教学资源、课程辅助资料、学科学习指导等服务。

3.2.6 图书馆智能答疑。图书馆要整合各类资源和服务信息,实现智能化的问题解答和服务支持,深入理解用户提问的含义,识别其中的关键词和信息,更准确地理解用户的需求。图书馆要结合资源和服务信息,为用户提供丰富、准确的答案和解决方案;通过搜索图书馆馆藏、学术文献、数据库等资源,找到与用户提问相关的答案,并根据其相关度和权威性进行排序和推荐。

3.2.7 馆藏好书速读。图书馆要帮助用户在繁杂的信息中快速找到优质的读物,分析用户的阅读历史、偏好和兴趣,智能推荐契合用户需求的优质读物:一是快速浏览,通过对文本内容的摘要、关键词提取和重点标注,帮助用户快速把握文章的核心内容和要点。二是智能摘要,自动生成文章的精炼摘要,为用户提供阅读参考。摘要不仅能够准确概括文章的主要内容,还能突出文章的重点和亮点。三是关键词标注,对文章进行关键词标注,将文章中的重要术语、名词和短语进行标注和解释,帮助用户理解文章的专业术语和概念。四是个性化定制,根据用户的阅读偏好和需求,设置阅读速度、阅读模式、关注领域等参数,定制个性化的阅读体验,并根据用户的反馈和行为数据,不断优化推荐算法和阅读体验。五是学习记录和评估,记录用户的阅读历史和行为数据,分析用户的阅读习惯和兴趣偏好,提供个性化的学习建议和评估。

3.2.8 图书馆书友圈。图书馆可结合人工智能技术与图书馆资源的社交平台,为读者提供交流、分享和学习的场所;分析用户的阅读历史、兴趣偏好等数据,为用户推荐个性化的阅读书单;书目推荐不仅要基于用户过去的阅读行为,还要考虑图书馆馆藏、热门书籍和学术资源等因素,为用户提供更加精准、多样化的阅读建议。

4 图书馆大模型实施

4.1 通用大模型选型

在图书馆大模型实施阶段,通用大模型的选型至关重要,直接关系到智能化平台的效率、可行性和长期可维护性。首先,图书馆需要考虑馆藏的规模和类型、用户的使用模式、数字资源的多样性等;其次,图书馆要兼顾现有的系统,如数字图书馆系统(DLS)和智能化资源管理系统(DRMS)的现状和对接条件等。

大模型算力准备直接关系到智能化过程的质量、效率和可持续性。除常规的GPU、CPU等计算资源外,存储设备的选择也极为重要,选择高容量、高性能的存储设备安全有效地保存数据资源,涉及服务器、网络存储设备或云存储解决方案的选用。云存储的优势在于能够提供灵活的存储空间,使用户能够在不同地点、不同设备上访问智能化资源。

4.2 图书馆大模型数据

图书馆的结构化数据较多,要利用知识图谱(Knowledge Graph)进行知识表达和处理,并和大模型进行配合使用,赋能图书馆的智能化服务。知识图谱采用实体、属性、关系三元组构建知识,尤其适合图书馆结构化的数据处理,是知识表达的重要方式,可以和大模型结合使用,即用知识图谱构建的数据是图书馆大模型的数据输入源之一[10]。在构建方案中,图书馆梳理好业务知识图谱后,抽离现实世界中的实体与实体、实体与属性之间的关系,通过三元体结构进行表达,构建完成图谱概念树、概念属性及关系管理。图谱关系构建完成后,图书馆可添加实体数据,大模型提供不同数据的处理方式;对于结构化数据通过知识映射快速导入数据,支持用户手动创建导入;对于非结构化数据提供阅读理解模型,可抽取非结构化数据中的实体、关系及实体属性值。

5 图书馆大模型推广价值

首先是提高资源的可访问性,将馆藏文献转化为数字形式,拓展用户获取信息的途径,为读者、研究者、学生等提供便捷和广泛的获取途径。图书馆大模型将文献资源从实体形态转化为数字形态,使用户能够利用先进的搜索引擎和检索工具,高效定位所需信息;提高检索效率,为用户提供更丰富的信息资源,包括文本、图像、音频等多媒体形式。其次是推动信息共享和协作。图书馆大模型重新定义了图书馆的角色,促进不同机构、学者和社群之间更广泛、更深入的合作,构建知识共享网络;使图书馆成为信息枢纽,为用户提供一个共享和交流的空间;为图书馆构建了开放的知识共享平台,通过数字资源的开放获取和共享促进了全球范围内的学术合作。再次是个性化服务和学习支持。图书馆大模型为用户提供了更全面、即时的学术咨询和指导,用户可以通过数字平台获取包括文献检索、学术写作、数据分析等个性化学术支持,成为学术生涯中不可或缺的智能化学术伙伴。

参考文献:

[1] 梁迎丽,张梦梦.AI大模型推动教育发展的理论诉求与实践路径[J/OL].南京邮电大学学报(社会科学版),1-6[2024-03-21].https://doi.org/10.14132/j.cnki.nysk.20240321.001.

[2] 邬贺铨.大模型融入云平台,信息化走向数智化[J].重庆邮电大学学报(自然科学版),2024(1):1-8.

[3] 武林娜,宋恺,王淞鹤.生成式人工智能对个人信息安全的挑战及应对策略[J].信息通信技术与政策,2024(1):13-18.

[4] 洪永淼,汪寿阳.ChatGPT与大模型将对经济学研究范式产生什么影响[J].计量经济学报,2024(1):1-25.

[5] 卢仕严.图书馆智能化的规划、目标和实现[J].图书馆学研究,2000(5):43-45.

[6] 马慧萍.图书馆的智能化研究:我国智慧图书馆标准体系构建探讨[J].科学咨询(科技·管理),2020(2):66-67.

[7] 贾君枝,张贵香.智慧图书馆建设视角下馆员元数据核心能力构建[J/OL].中国图书馆学报,1-16[2024-03-21].http://kns.cnki.net/kcms/detail/11.2746.G2.20240311.1832.006.html.

[8] 杨晓雯.ChatGPT驱动下的图书馆变革:构建智慧图书馆的新路径[J].大学图书情报学刊,2024(2):46-52,89.

[9] 杜艳艳.数字化转型背景下智慧图书馆产品的价值意蕴、实践逻辑和推进路径[J/OL].图书馆,1-7[2024-03-21].http://kns.cnki.net/kcms/detail/43.1031.G2.20240208.2122.004.html.

[10] 王娟,曹树金,王志红,等.面向探索式搜索的领域知识图谱构建及实验探索[J].图书情报工作,2024(3):105-116.

(编校:崔萌)