付娆
摘 要:随着大数据技术与智能技术的迅猛发展,多模态数据赋能的智慧化服务模式是图书馆转型升级的重要路径。文章将智慧图书馆的多模态数据分为馆藏数据、开放数据和用户数据,从数据采集层、处理层、融合层、服务应用层四个层面构建了多模态数据赋能的智慧图书馆技术架构,从知识服务整体性角度探讨了智慧图书馆的服务模式,以期促进图书馆的转型升级。
关键词:多模态数据;智慧图书馆;技术架构;智慧服务
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2024)05-0092-04
1 背景
大数据时代,如何把数据与图书馆业务结合起来,充分挖掘数据价值,已成为图书馆开展智慧服务的重点任务[1]。多模态数据的出现为图书馆优化智慧服务模式提供了可能[2],一方面图书馆通过数据融合、数据关联技术对多模态数据进行整合,建立资源与资源间、用户与资源间的关联关系,为用户提供价值高、精准化、个性化的知识服务内容;另一方面图书馆通过分析多模态数据,深入挖掘用户特征,加强与用户的交流互动,不断优化服务模式,提高服务效能。
目前,关于多模态数据赋能智慧图书馆的研究主要集中在阅读推广服务、个性化推荐服务、智慧空间服务等方面,部分学者从整体性角度分析了多模态数据赋能下智慧图书馆的服务内容[3],如:林翠萍探讨了数据赋能下阅读推广的应用场景、系统架构、服务体系[4],金佳丽等认为智能、高效的个性化推荐服务是智慧图书馆转型升级的关键[5],安源等重点阐述了大数据和信息技术协同赋能下图书馆智慧空间的架构及其各层次功能[6]。因此,笔者在分析智慧图书馆多模态数据类型的基础上,构建了多模态数据赋能的智慧图书馆技术架构,从整体性知识服务的角度探析了多模态数据赋能的智慧图书馆服务模式,以期为智慧图书馆高效开展知识服务提供参考和借鉴。
2 相关概念概述
2.1 智慧图书馆
目前,学者们从不同角度对智慧图书馆进行定义:一是从技术角度,智慧图书馆是指利用大数据、5G、数字孪生等技术开展智能信息服务的图书馆;二是从业务管理角度,智慧图书馆是指先对馆藏资源进行加工、清洗、聚合,再将知识转化为智慧信息并传递给用户的图书馆[7];三是从服务理念角度,智慧图书馆是指通过一种高效、智能的服务模式,充分满足用户需求的图书馆[8]。
智慧图书馆包含智能技术、专业馆员和管理系统三大元素[9],其中智能技术是开展智慧服务的工具,专业馆员是智慧图书馆的重要组成部分,管理系统是开展智慧服务的基础条件。智慧图书馆具有泛在、共享、高效、绿色发展等特点[10]。目前,关于智慧图书馆的研究主要集中在建设路径、案例分析、评价体系等方面,如:陈丽冰从技术、人员、数据和隐私安全等角度提出了未来智慧图书馆的优化路径[11];刘哲以深圳图书馆北馆为例,探讨了图书馆文献智能仓储系统[12];马祥涛将“全评价”体系融入智慧图书馆建设评价中,从形式、内容、效用三个维度建立了评价体系[13]。
2.2 多模态数据
多模态数据是指将两种或两种以上模态的数据通过一定的工具和方法组合在一起的数据[14]。多模态数据融合方式包括基于模型的融合方法(如神经网络方法等)和非模型的融合方法(如特征融合、决策层融合、混合融合等)[15]。多模态数据在图情领域的应用研究主要集中在评论有用性识别、热点发现、维权系统等方面,如:马超等根据在线评论多模态数据,构建了评论有用性识别模型[16];崔金栋等对主流融媒体多模态数据进行融合,借助NLP技术和算法模型实现了多模态数据归集和热点发现的目标[17];司徒凌云等基于多模态知识图谱,构建了南海疆维权证据链系统,为维权实践工作提供了帮助[18]。
3 智慧图书馆的多模态数据类型分析
多模态数据能够为图书馆开展智慧服务提供丰富的数据支撑,目前运用于智慧图书馆建设的多模态数据主要包括馆藏数据、开放数据和用户数据。馆藏数据是指智慧图书馆收集、购买及储存的各类文献资料的总和,类型多样,具有分布异构性。图书馆需要综合利用这些馆藏数据,为用户提供精准化、个性化的知识服务。除图书馆自建和购买的数据库外,开放数据也是图书馆的重要数据来源。开放数据是指可以被任何人自由获取、不受版权等机制限制的数据,具有数据量大、内容复杂等特点。图书馆多模态开放数据主要包括普通开放型数据和授权开放型数据,图书馆可将这些开放型数据集成到目录检索系统中,为科研成员提供更高效的数据服务。图书馆开展智慧服务的目的是为用户提供智能化、精准化的信息服务,因此用户数据是图书馆的关键数据。用户数据包括用户基本信息、行为数据和偏好数据,图书馆可通过后台监测、日志、问卷调查等方式获取用户数据。
4 多模态数据赋能的智慧图书馆技术架构构建
笔者从四个层面构建了多模态数据赋能的智慧图书馆技术架构(见图1),其中数据采集层的作用是采集不同数据库数据平台的多模态数据,如馆藏数据、开放数据和用户数据;数据处理层的作用是转换、清洗多模态数据,并将这些数据存储到数据仓库;数据融合层通过数据关联、可视化工具等建立数据间的联系,挖掘用户的显性和隐性需求,为智慧图书馆服务开展奠定基础;服务应用层主要为用户提供智能推送、知识可视化、智能检索、智慧空间等应用服务。
4.1 数据采集层
自建数据库、借阅数据库、商业数据库、开放数据平台等是智慧图书馆多模态数据的重要来源,智慧图书馆主要从这些数据库中采集文本、音频、影像等格式的数据。由于数据采集层的数据量庞大,智慧图书馆在数据采集过程中要注意用户隐私保护和馆藏资源安全保护,加强数据监管,及时发现安全漏洞,防止数据泄露。
4.2 数据处理层
数据处理层的作用是对多模态数据进行抽取、转换、清洗,统一数据内容和结构,为后续数据应用奠定基础。数据处理是智慧图书馆提高服务效能的关键步骤,智慧图书馆可从多模态数据集中抽取数据,建立数据统一标准,并对数据格式进行转换、清洗,去除重复、冗杂内容,将处理好的数据存储到数据仓库。
4.3 数据融合层
图书馆借助数据分析、关联工具对数据进行融合、关联、匹配。一方面,智慧图书馆可借助数据挖掘、深度学习和认知计算等技术对馆藏资源和开放数据资源进行信息融合、演绎推论,为用户提供智能化、精准化、个性化的信息服务;另一方面,智慧图书馆可绘制用户画像,深入挖掘用户特征和感知用户需求,借助数据关联、匹配工具建立信息资源与用户需求间的关联关系,为后续服务开展奠定基础。
4.4 服务应用层
服务应用层是多模态数据赋能的智慧图书馆技术架构的顶层交互层,智慧图书馆聚焦智慧服务,集中体现在交互互联、可视化服务、知识增值、沉浸式体验等方面,即为用户提供智能推送、知识可视化、智能检索和智慧空间服务。多模态数据赋能智慧图书馆的实现需要依赖信息技术应用,信息技术的先进性、稳定性、安全性、可靠性,专业馆员的专业知识、对多模态数据的处理能力及对新兴技术的熟练和敏感程度均会影响智慧图书馆的智慧化水平。
5 多模态数据赋能的智慧图书馆服务模式探析
5.1 多模态数据赋能的智慧图书馆服务流程
多模态数据赋能的智慧图书馆服务流程包括以下四个步骤:一是分析用户需求,智慧图书馆对用户数据进行分析,建立用户画像分析模型,挖掘用户的显性和隐性信息需求。二是需求、资源的融合与匹配,智慧图书馆利用数据关联等工具建立起开放数据资源、馆藏数据资源与用户需求间的联系。三是方案制订,智慧图书馆根据数据融合匹配结果,制订服务方案与具体实施措施。四是智慧服务,智慧图书馆为用户提供个性化推送、技术前沿预测、热点跟踪、培训讲座等信息服务内容,以支持用户的学习与工作实践。
5.2 多模态数据赋能的智慧图书馆服务内容
多模态数据赋能的智慧图书馆服务内容分为智能推送、知识可视化、智能检索、智慧空间服务,智能推送包括精准推送、情境推送、个性化推送等服务,知识可视化包括文献分析、学科评价、公共情报等服务,智能检索包括语义检索、联想输入、智能问答等服务,智慧空间服务包括智慧课堂、创客空间、学术交流等服务。
5.2.1 智能推送。智慧图书馆可根据用户数据,深度分析用户特征,挖掘用户需求,识别和预测用户可能感兴趣的信息,从而针对性地向用户推送阅读资源,开展精准推送、情境推送和个性化推送服务。一方面,智慧图书馆可根据用户的下载、评论和收藏行为,分析用户的信息需求特征,利用数据关联技术建立用户需求与馆藏资源的匹配关系,主动向用户推送科普信息、专业知识;另一方面,智慧图书馆可通过智能感知系统获取用户的位置和登录时间等信息,根据用户所处的情境为其推送不同的信息知识,以提高用户的体验感。
5.2.2 知识可视化。智慧图书馆可利用SPSS等数据统计分析软件和CiteSpace等可视化分析软件,为用户提供文献分析、学科评价、公共情报等服务。其中,文献分析包括关键词共现网络、作者合作网络、文献互引网络、专利地图等内容;学科评价包括学科影响力评价、学科发展态势、学科贡献度、学科人才质量评价等报告;公共情报包括科技简报、政策总结、城市研究、焦点跟踪等报告。
5.2.3 智能检索。智能检索是指智慧图书馆综合利用自然语言处理、深度学习等技术,以实现信息与需求的语义层面的匹配,包括语义检索、联想输入、智能问答等。语义检索是指结合用户特征数据准确捕捉到用户的真实意图,为用户提供匹配的检索结果。联想输入是指结合用户行为数据自动推荐候选的字或词,提高用户的检索效率。智能问答是指一对一的问答模式,包括专业馆员基于专业知识的实时解答模式、图书馆系统的智能问答模式。
5.2.4 智慧空间。多模态数据赋能的智慧图书馆可不受时空限制,借助元宇宙等新兴技术构建虚实结合的服务模式,开展特色空间服务,如智慧课堂、创客空间、学术交流等服务。智慧图书馆可根据用户在智慧空间的互动数据进一步完善用户画像,调整馆藏资源结构,从而为用户提供精准的知识服务。智慧课堂是智慧图书馆为用户量身打造的课程服务,用户既可随时随地进行课程学习,也可参与直播课堂,与教师进行实时互动。创客空间是智慧图书馆为用户打造的集创意交流、技术体验、创新实践于一体的服务空间,用户可在此空间进行情境化阅读、3D打印服务体验、机器人搭建等实操、模拟活动。学术交流是智慧图书馆为用户打造的交流平台,目的是拓宽用户的社交渠道。
参考文献:
[1] 赵丽杰.多源数据协同赋能的图书馆智慧化知识服务模式研究[J].高校图书馆工作,2022(6):70-74.
[2] 赵杨,杨彬,董姝仪,等.多源大数据驱动的移动图书馆个性化推荐系统设计与实现[J].图书馆学研究,2021(11):20-31.
[3] 王春迎,苏超萍,宋宁远.多源数据驱动下的图书馆智慧服务研究[J].图书馆学研究,2021(22):49-55.
[4] 林翠萍.数据赋能的图书馆智慧阅读推广服务的实践与探索:以深圳市龙岗区图书馆为例[J].图书馆界,2023(1):81-85.
[5] 金佳丽,卢盈蕾,陈雪梅,等.基于大数据的个性化推荐:思路与实践[J].图书馆杂志,2023(5):63-70.
[6] 安源,李广明.“数智”赋能下图书馆智慧型服务空间的构建[J].大学图书情报学刊,2023(3):32-38.
[7] 刘丽斌.智慧图书馆探析[J].图书馆建设,2013(3):87-89.
[8] 洪亮,周莉娜,陈珑绮.大数据驱动的图书馆智慧信息服务体系构建研究[J].图书与情报,2018(2):8-15.
[9] 初景利,任娇菡,王译晗.从数字图书馆到智慧图书馆[J].大学图书馆学报,2022(2):52-58.
[10] 钱丹丹,刘洋,胡姗姗,等.智慧图书馆知识服务构成要素及服务架构研究[J].情报科学,2019(12):52-56.
[11] 陈丽冰.智慧图书馆:价值内涵、主要困境与优化路径[J].图书馆,2023(2):19-25.
[12] 刘哲.智慧图书馆视域下新一代图书馆文献智能仓储系统研究:以深圳图书馆北馆为例[J].图书馆,2023(2):26-32.
[13] 马祥涛.“全评价”视角下智慧图书馆建设评价研究[J].图书馆理论与实践,2023(3):103-109.
[14] 赵亮.多模态数据融合算法研究[D].大连:大连理工大学,2018.
[15] 任泽裕,王振超,柯尊旺,等.多模态数据融合综述[J].计算机工程与应用,2021(18):49-64.
[16] 马超,李纲,陈思菁,等.基于多模态数据语义融合的旅游在线评论有用性识别研究[J].情报学报,2020(2):199-207.
[17] 崔金栋,李晨雨,李菲菲.大数据背景下主流融媒体热点发现机制研究[J].情报科学,2021(12):72-79.
[18] 司徒凌云,石进,杨海平,等.基于多模态知识图谱的南海疆维权证据链系统构建[J].情报杂志,2021(12):23-29.