刘海鸥 李 凯 姜 波
(1.燕山大学经济管理学院 河北秦皇岛 066004;2. 燕山大学图书馆 河北秦皇岛 066004)
随着大数据技术的兴起,移动图书馆用户的信息资源需求呈现出大数据化、动态化与场景化等特点,这就导致传统的图书馆信息资源服务模式难以适应用户的智能化、个性化、创新化推荐服务需求[1]。如何从海量数据中挖掘出与移动用户需求精准匹配的图书馆信息资源成为大数据时代个性化服务领域亟待解决的新课题[2]。作为一种新兴的用户行为分析工具,用户画像通过提取大量数据化标签刻画出用户的行为特征,进而完成资源的精确推送[3-4]。基于海量数据构建移动图书馆用户画像和图书资源画像,并对二者进行情境化融合,可进一步有效挖掘读者在不同情境下的知识服务需求,因此能为移动图书馆的情境化、即时化、智能化推荐服务提供新的思路。
关于用户画像的研究较多,国外学者Costas(2013)[5]、Lei Li(2014)[6]、Ravi(2016)[7]、Pablo[8]等 都 对 用 户画像在个性化推荐系统中的构建和应用进行了分析和探讨。我国的陈添源(2018)[9]、毕达天(2018)[10]、佟林杰(2019)[11]、王英(2020)[12]、张莉曼(2020)[13]等学者也对图书馆推荐系统中用户画像的数据获取、画像建模和用户特征等进行了分析和验证,通过画像模型对用户行为数据进行深入剖析,并结合用户的情境信息为其推送适合的图书资源。资源画像是在用户画像的思想和构建原理的基础上,对图书资源的各种信息数据进行挖掘和处理,从而生成关于图书资源的画像模型。相比之下,关于资源画像的研究成果较少。杨帆(2018)[14]提出采集ALEPH书目系统、文津书目搜索系统和读者门户系统“资源”相关数据,构建资源画像模型的标签体系,但未采集文献数据库并动态利用数据。王庆(2018)[15]、李雅(2018)[16]通过构建读者和图书资源画像模型搭建了图书馆大数据平台,将之应用于图书馆精细化读者服务领域,致力于向不同用户群体实施精准营销、进行精准推荐。郭俭等(2019)[17]基于苏州线上教育中心的学习行为数据,同时融合了用户行为数据的挖掘结果,由此提出一套资源画像的构建方法,从而为优化学生的学习决策提供服务。毕强(2019)[18]在研究中首先确定了图书馆画像的数据来源,然后遴选了用户画像与资源画像的事实标签,通过画像构建来进行数字图书馆资源的个性化推荐。徐海玲等(2019)[19]借鉴领域本体的方法,通过对数据的深层次挖掘,利用资源聚合的原理,构建了基于资源画像的社交媒体内部资源聚合模型和外部资源聚合模型。研究结果表明,资源画像能为社交媒体的资源聚合提供新的思路。通过对图书馆数据进行梳理,刘芳等(2020)[20]探索了资源画像和读者画像的构建步骤,并分析了画像的具体表现方式及其在图书馆中的应用,从而为图书馆资源建设、读者个性化服务提供数据决策支撑。
通过文献分析可以看出,用户画像在图书馆领域内的研究大多关注如何构建和使用用户画像,而关于资源画像的研究则相对较少,相关文献也多单独构建和使用资源画像,缺乏对用户画像和资源画像深度融合方面的研究,也没有深入研究图书馆推荐系统中的用户画像与资源画像情境化的融合问题。鉴于此,文章在借鉴前人研究成果的基础上,构建出移动图书馆的用户画像和资源画像模型,然后从维度、层次和路径三个方面对移动图书馆用户画像和资源画像进行情境化融合。用户画像和资源画像的深度融合可以优化移动图书馆推荐系统的服务方式,并为当前移动图书馆的情境化推荐系统研究提供参考。
融合就是将用户画像和资源画像融为一体,有机结合,组合成为一个整体。用户画像所描述的是读者的基本信息、阅读偏好、阅读风格和社交互动等数据信息,资源画像所描述的是图书资源的基本信息、资源类型、媒体类型和资源热度等数据信息。因此,移动图书馆画像的情境化融合,就是将用户画像和资源画像所描述的各种读者数据信息和图书资源数据信息融为一体的过程,旨在画像融合的基础上将读者和图书资源的各种信息标签、主题进行有机结合,实现移动图书馆推荐系统在技术、平台和服务上的创新。此外,移动图书馆与传统图书馆最大的不同在于其移动性,因此需全面考虑用户所处情境的变换和对用户需求的影响。这就要求移动图书馆要为用户提供不同情境下的知识需求服务[21]。用户画像和资源画像的情境化融合能够将用户和资源进行更精准地匹配,构建出能与用户期望相符的情境化推荐系统,极大提升情境导向推荐系统的推送功能和服务效果,将合适的图书馆服务资源推送给读者,满足不同情境下的用户需求。
2.2.1 数据融合
数字化时代下,随着云计算和互联网技术的发展,读者和图书资源的各种信息都以数字化信息的形式存在,并逐渐从数字化转向为数据化。数据化是指将各种类型的数字信息,转变为结构化、标准化的数据信息,同时根据数据信息的形式和种类,对数据信息进行不同的研究和应用。数据融合就是将各种数据信息根据类型和形态进行融合,形成完整的大数据,从而能够对数据进行集中处理,并从中发现有价值的信息,使数据得到最大化利用。画像模型是挖掘和处理读者和图书资源的数据之后所呈现的标签集合,因此,用户画像和资源画像可以被视为读者和图书资源数据信息的代表。读者和图书资源的数据融合可以通过用户画像和资源画像的情境化融合来完成,生成完整的移动图书馆大数据。同时,也能够发现和挖掘读者数据和图书资源数据之间存在的关联,实现读者和图书资源数据的有机结合,从而让数据能够发挥作用、创造价值。
2.2.2 关联挖掘
关联挖掘就是在用户画像和资源画像所代表的读者和图书资源数据信息中进行挖掘,发现数据当中的关联关系。移动图书馆画像情境化融合是对用户画像和资源画像的标签、主题和情境等数据信息集合进行关联的过程,发现读者和图书资源之间的相关关系,使画像能够更好地进行融合,从而提升推荐系统的精准度。如可以挖掘读者的文献查阅、下载和收藏等行为数据与图书资源的分布和服务数据中的相关关系,从而发现用户和图书资源的关联,实现图书资源的精准推送。除此之外,移动图书馆画像情境化融合还能挖掘用户和用户、资源和资源中的关联。对读者间进行关联挖掘可以发现不同读者的相同点,如都喜欢同一个作者、喜欢同一种类型的图书等,为读者推送具有相同爱好的伙伴,使其能够充分讨论和交流,还能将兴趣、偏好相似的用户进行聚类,由此建立准确、全面的读者画像模型。通过关联挖掘能对特征相似、关联度高的资源进行聚类,挖掘出信息资源中的隐性关联,进而发现复杂数据集的隐性知识,最终为读者推送更为匹配的资源。
2.2.3 知识发现
知识发现是通过各种技术在各类型信息中发现和获取有价值的隐性知识的过程。移动图书馆画像融合就是在融合读者和图书资源的大量数据信息后,通过大数据技术和数据挖掘技术,发现读者和图书资源中有价值的信息,并转化为有用的知识并应用到移动图书馆的推荐系统之中。在云计算和互联网技术的基础上,大量的读者和图书资源信息可以被移动图书馆收集和梳理,以此构建出大量的读者和图书资源信息库,然后通过用户画像和资源画像对读者和图书资源数据信息进行处理和研究。最后,在考虑情境要素的基础上进一步融合用户画像和资源画像模型,从读者和图书资源的各种信息中提取潜藏知识,以更好地满足读者的知识需要。
数据获取与处理是建立用户画像和资源画像模型的第一步。用户数据的收集主要是对读者的基本情况、阅读偏好和社交互动等数据进行收集;图书资源数据的收集主要是对图书资源的基本信息、内容梗概和资源热度等数据进行收集。这些数据描绘的是读者和图书资源的主要属性,主要通过图书馆相关数据库,相关平台数据库进行获取和处理。如从图书馆平台可以获取读者的姓名、年龄、性别、教育背景、地区、从事工作、检索记录、借阅历史、借阅记录等基本信息:通过图书馆后台数据库中提取出图书资源的作者、类别、所属出版社、出版年份、媒介类型、语种、内容等数据;读者在图书馆中点赞、转发和下载的资源内容及其次数和频率,还有读者对图书资源的评论和读者之间的交流互动等数据,都可以通过图书馆社交网站获取。由于移动图书馆是一种线上的应用方式,因此,在收集数据时,数据的出处不同,数据格式更是多种多样,这就需要对收集来的数据进行预处理。鉴于所获取数据的结构不一致,为了便于用户画像和资源画像的深度融合,需要将所有的数据都转换为结构一致的数据。文章通过集成、规约和转化等数据预处理方法将获取的数据转化为同一结构的数据格式。需要指出的是,采集数据时要尽量保证准确、及时、完整,这样构建出的画像模型更为准确有效,且易于实现读者画像与资源画像的相互匹配。
在对用户和图书资源数据进行提取和处理后,为了构建出精准的画像模型,需要对用户和图书资源进行标签提取,构建标签体系。由于用户和资源画像是多元化、多维度的,传统的标签提取方式不能深入挖掘用户和图书资源画像特征,致使用户画像和资源画像的标签标注不够准确,标签体系也不够全面,导致用户画像和图书资源的描绘不够精准。因此,根据所提取的信息数据,从多维度来提取图书用户和图书资源的标签,构建较为完善的标签体系。
对于用户标签的提取,文章根据所收集到的用户基本信息数据、阅读偏好数据、阅读风格和社交互动数据三个维度的具体数据,从三个方面提取标签,构建标签体系。其主要包括基本信息标签、知识偏好标签和社交互动标签。基本信息标签主要描述用户的姓名、性别、年龄、职业、教育背景和联系方式等信息,由于图书馆数据库中用户的基本信息较为精练,很多可以直接作为标签。阅读偏好标签主要描述的是用户群体系统信息检索、页面浏览、内容下载等行为,在进行提取时,可以将用户检索内容、页面浏览的关键词作为知识偏好标签。但由于用户的知识偏好不是一成不变的,在进行权重计算时要综合考虑场景变化的影响。阅读风格标签主要描述的是用户阅读时长、阅读时段等,此类标签可以通过图书馆门禁系统和借阅记录提取。社交互动标签主要描述的是用户阅读过程中产生的分享、评论和收藏等,此类标签是从移动阅读网络平台上的评论、讨论数据中提取。在进行标签提取时,可将用户评论、交流的话题关键词作为标签进行提取,通过用户间连线的粗细程度表示用户互动行为发生的强弱关系。
对于图书资源的标签提取,文章主要从基本属性数据、媒体类型数据、内容属性数据和资源热度数据四方面信息数据中进行标签提取,由此构建出相对应的四维度标签体系,具体包括基本信息标签、媒体类型标签、内容属性标签和资源热度标签。其中,基本属性标签主要描述的是图书资源的作者、出版社、出版时间、资源分布等数据信息。媒体类型标签主要描述的是图书资源的媒体类型,如文本、图片、音频和视频等数据信息,在提取标签时,可以将图书资源所属的媒体类型作为标签。内容属性标签描写的是图书资源的主要内容、知识主题和研究领域等数据,在进行标签提取时,可以将图书资源的知识主题作为标签进行提取。资源热度标签主要描述的是图书资源被用户检索、浏览、下载次数等数据。在进行标签提取时,用节点表示图书资源,节点大小表示图书资源被访问的次数。由于图书资源的热度是会随着环境和时间发生改变的,因此在进行权重计算时,可以通过综合偏好权重和衰减权重进行体现。
在构建完成多维度的标签体系后,以用户和图书资源的标签体系为依据,对读者和图书资源的相关特征进行分析。通过特征和标签的匹配,将相应的标签粘贴回到读者和图书资源上,实现读者和图书资源的标签化,从而构建出读者和图书资源的画像模型。在对用户画像和资源画像构建完成后,参考各标签不同的权重,使用tagCloud、Wordle、Tagul等将画像标签进行可视化表示,并采用语义分析技术进一步挖掘读者和图书资源间的隐性关系。最后,聚类用户画像与资源画像的各类标签,实现类似属性特征的用户和图书资源的聚集,由此得到群体用户画像和对应的资源画像。
移动图书馆用户画像与资源画像的情境化融合既要分析读者在不同情境下的知识需求,也要使图书资源的知识主题符合用户所处的情境。因此,移动图书馆用户画像与资源画像的情境化融合要从多个维度进行分析。
4.1.1 需求维度
移动图书馆画像情境化融合的目的是通过画像融合来实现用户和资源的精准匹配,以此来满足读者的需求,而且移动图书馆推荐系统的发展也离不开用户需求的驱动。但当前用户的需求变得越来越复杂,且会根据情境的不同发生改变。因此,移动图书馆画像的情境化融合要从用户需求的维度上入手,全面考虑用户在不同情境下的需求变化趋势,深度剖析用户画像的各维度标签信息,找出不同情境下用户需求的差别,归纳出用户在每一情境下的阅读需求,使移动图书馆的情境化推荐系统成为能够满足用户不同需求、功能多元、方便快捷的推荐系统,突出情境化融合的优势。
4.1.2 主题维度
移动图书馆画像的情境化融合不仅要考虑用户的需求,还要考虑图书资源所表达的知识主题是否与用户的需求一致,这样才能达到最佳的推送效果。因此,情境化融合要将图书资源所表达的知识主题与用户不同情境下的知识需求进行精准匹配,使移动图书馆的情境化推荐系统能够将图书资源进行更为精准有效的推送,满足用户的知识需求。具体而言,通过对图书资源的基础信息和主题信息进行深度挖掘,构建图书资源的主题词汇;融合用户画像中用户所检索的知识主题与资源画像所表达的知识主题,实现图书资源知识主题与用户需求的匹配,从而促成用户画像和资源画像充分融合,提高用户与图书资源匹配的准确率。
4.1.3 情境维度
除了考虑用户的需求和图书资源的主题之外,还要对用户所处的情境和移动图书馆推荐系统服务方式之间的融合进行全面考虑。用户所需求的服务是与自己所处情境相宜的服务,因此要构建出推送服务和推送时间均能满足用户不同场景需求的情境化推荐系统。移动图书馆画像的情境化融合要从用户画像的各种行为数据信息中分析出用户可能所处的情境信息;然后根据情境信息对资源画像进行分析,在图书资源中搜寻出与该情境适合的图书资源;最后根据用户所处的情境要素,从情境维度对适合每种情境的服务方式进行选择,从而实现用户情境与移动图书馆推荐系统服务方式有机融合的目的,在适当时间为读者提供更合适的推送服务。
从用户画像与资源画像情境化融合的层次来看,可以分为标签融合、主题融合、情境融合和服务融合。
4.2.1 标签融合
标签融合是用户画像和资源画像情境化融合的起点。标签是建立画像模型的核心所在,因此,用户画像和资源画像的融合首先需要从标签上进行融合。同时,标签又具有语义化和短文本的特点,在融合时会更加便捷。标签所代表的是读者和图书资源的各种数据信息,因此可以根据标签所代表的数据信息重要性来计算标签的权重大小,提取权重较大的标签作为中心标签。其次,根据聚类算法汇聚中心标签形成聚类中心,计算用户画像和资源画像各类标签和中心标签的相关度,聚合关联性最大的标签,形成新的聚类中心,如此循环往复直至每个标签与聚类中心之间的相关性不再变化,这样就完成了标签的聚类,并将聚类的标签进行融合。最后,通过标签的融合将相似的用户和图书资源进行汇总,使其成为用户画像和资源画像融合的基础部分。
4.2.2 主题融合
主题融合是用户画像和资源画像进行情境化融合的中间部分,主题是图书资源主要内容和用户需求的简洁表述,用户复杂的需求可以通过几个简单的主题词进行表达,而图书资源的主要内容和中心思想也可以用几个简单的主题词进行表述。因此,要想使画像融合更加深入细致,就要将读者需求主题和图书资源主题进行融合,发现和挖掘标签中潜在的和有用的用户需求主题和图书资源主题,并分析两者之间的关联性,将关联度大的主题进行融合。具体而言,首先需要挖掘用户画像中的阅读偏好和社交互动标签体系中的各类标签,获取用户搜索行为和讨论行为的主题;其次对图书资源的主题标签进行分析,提取出图书资源的主题词,运用词库匹配扩展主题词;然后运用关联规则的知识发现方法,对用户画像和图书资源画像主题之间存在的知识关联进行挖掘,并对两者之间的知识关联度进行计算,融合主题关联度较高的用户画像和资源画像;最后,根据整体规划对各个类型的主题词进行有效优化与融合,构建出多样化、分布式的融合主题词库。
4.2.3 情境融合
情境融合是用户画像和资源画像情境化融合的关键部分,情境是指用户在一定时间内所处的境况。情境融合就是将画像中所隐藏的情境信息与移动图书馆服务方式进行融合,使推荐系统所提供的服务方式能更进一步进行组织和优化。依据用户画像中的阅读偏好标签和社交互动标签,分析出其中隐藏的情境信息,进而对读者可能所处的情境进行猜测。根据用户所处的不同情境,得出用户在该情境下的需求主题,结合用户需求主题和图书资源主题在图书资源中找出合适的服务资源。此外,情境融合还要选择适合用户当前情境的服务方式,将当前情境、知识主题和服务方式进行有效融合,构建全面、多样、体验式的情境化推荐系统。
4.2.4 服务融合
服务融合是融合的最终目的,画像融合的最终目标是构建出精准的移动图书馆情境化推荐系统,通过对各个情境要素的有机融合和主题凝练,将情境化推荐系统所提供的全部推送服务和推送时间根据用户情境进行有效融合,构建出适合情境、用户满意的移动图书馆推荐系统,形成移动图书馆即时、以人为本、情境导向的个性化服务内容和服务模式。
移动图书馆用户画像与资源画像的情境化融合要按照“需求分析—资源主题—情境融合—服务优化—推荐效果—效果反馈”的路径循环发展,实现有机融合。
4.3.1 需求分析
用户的需求一直是移动图书馆个性化推荐系统的关注方向,图书馆只有从用户的角度出发,在全面考虑用户需求的基础上进行科学设计,才能充分体现“用户第一,以人为本”的理念[22]。用户需求可通过四个方式进行获取:一是从用户画像中的基础信息数据中获取,根据用户的基础信息,分析出用户可能所需的图书资源,以此在图书资源中进行筛选,如对用户的学历、职业进行分析,找出适合用户的图书、文献等资源;二是对用户画像中的阅读偏好进行分析,根据用户所喜好的作者、内容进行分析,如某个用户经常借阅“计算机”类的书籍,就可以将与“计算机”有关的图书资源推送给该用户;三是用户行为分析,根据用户搜索历史、下载内容分析用户的知识需求,如某位用户在移动图书馆平台上经常搜索和下载关于武侠小说的内容,就为其推送有关武侠小说的图书资源;四是用户需求反馈,根据用户反馈对画像进行监测及修正,改进推荐系统的精准度,并在服务平台上进行更新与展示,如此循环最终形成一个良性的情境化推荐生态系统。
4.3.2 资源主题
移动图书馆内图书资源的数量较多,怎样从海量的资源寻找出满足用户需求的资源至关重要。为解决这个问题,可以通过生成一系列资源主题来刻画图书资源的内容特征,根据主题词将合适的图书资源推送给用户。具体而言,建立资源主题是从所构建的图书资源画像各类标签系统中挖掘出图书资源所包含的各个方面主题词,将这些主题词进行汇总,然后根据用户的查阅、阅览和下载等行为得出用户目标资源的主题词,最后将与该主题词相关的服务资源推送给用户。移动阅读环境下,动态主题画像能及时反映移动阅读主题的发展变化过程,可利用贪婪算法随着移动阅读情境的变化对资源主题不断修正,实现资源主题的动态更新。
4.3.3 情境融合
移动图书馆的便捷性使用户能随时随地浏览查阅图书馆资源,但用户情境具有多变性,且用户需求会根据情境的不同而发生改变。因此,需要系统分析用户的情境要素,以此来对移动图书馆的服务方式进行调整,从而满足用户随情境变化而转变的需求。具体而言,可根据读者在用户画像中的行为信息得出读者所处情境,将情境信息映射为用户需求内容偏好和对资源内容的限定性条件,分析当前情境下的读者需求并建立基于情境的用户偏好模型,围绕情境变化、融合情境与用户需求、情境化服务三个方面逐一计算其与待推荐信息的相似度,以此全面、合理、细致地挖掘用户的情境要素,挑选合适的图书资源,以实现对移动图书馆画像的情境化融合。
4.3.4 服务优化
移动图书馆的服务方式主要是为用户推送合适的相关资源的形式。对于服务的优化,需要把握好情境融合的层次,对用户画像标签与资源画像标签、用户需求和资源主题、情境与推荐服务的融合等进行合理详细的考虑,从满足用户情境化需求、融通推荐系统虚实空间、嵌入式实时服务、服务成本合理控制四个维度进行综合考量,科学布局、合理优化移动图书馆服务方式,及时调整推送策略、推送方式与推送时间,以全面满足用户需求。
4.3.5 推荐效果
推荐效果是衡量移动图书馆用户画像与资源画像情境化融合效果的标准。推荐系统所提供的服务只有能够满足用户的需求,能使用户更加便捷迅速地找到自己所需的图书资源,才能说明画像融合有了效果,因此推荐效果就是对融合效果的检验。移动图书馆情境化推荐效果包括推荐系统情境的利用度、所提供服务的用户满意度、用户体验度、推送的精准度、成本效益度等指标。以上指标均能实现,推荐系统才能得到用户的肯定。
4.3.6 效果反馈
移动图书馆的推荐系统不是一成不变的,须进行不定期的优化和改善,以满足用户多变的需求。用户是移动图书馆推荐系统的使用者,其反馈对推荐系统和服务方式的改善和优化十分重要。因此,接受用户反馈并加以利用,处理好移动图书馆情境化推荐与用户反馈结果之间的辨证关系,通过试错改进不足,不断完善推荐机制。具体而言,要依据用户反馈对画像模型进行修正,做好推荐系统情境要素的斟酌与比选,将与移动图书馆用户接受期望不符的情境要素删除,保持情境融合与用户接受期望方向的一致性和供需的平衡性,优化和改善移动图书馆推荐系统所提供的服务和功能,使移动图书馆推荐系统能够适应和满足用户多变的需求,进而提高用户的满意度。
在互联网时代背景下,移动图书馆推荐系统中的用户画像与资源画像融合是对馆藏资源进行高效利用的重要途径,并能提高移动图书馆推荐系统的服务质量。文章将用户画像方法引用到移动图书馆的推荐系统中,基于用户画像的思想对移动图书馆的读者和图书资源构建用户画像和资源画像,接着从维度、层次和路径三个方面对用户画像和资源画像的融合进行分析,并据此提出画像情境化融合在移动图书馆推荐系统中的应用,为当前移动图书馆推荐系统实现精准推送和个性化服务提供参考。然而,文章只是从理论上对用户画像和资源画像的情境化融合进行研究,并没有从数据和算法等方面来对用户画像和资源画像的情境融合进行实证分析。未来,期待学界针对数据挖掘和深度学习等技术开展进一步探索,以促进本领域研究的不断深入。
(来稿时间:2020年12月)