基于用户画像的高校图书馆智慧服务研究

2024-01-12 05:38:10陈如进
大众文艺 2023年24期
关键词:画像标签个性化

陈如进

(南京晓庄学院,江苏南京 211171)

随着大数据、云计算、物联网以及各种智能设备的普及和运用,人们面临的信息和知识的种类和形式日渐丰富,海量数据程爆炸式增长。大数据时代,数据更能准确地描述人的需求和想法,高校图书馆的各类数据呈现多来源、海量化、异构化、变化快的特点。图书馆的数字资源大数据、业务运行大数据、读者阅读行为大数据,统一构成了图书馆大数据,这些数据成了为读者提供服务的最核心的支撑。如何使用这些大数据,挖掘读者的真实需求,为读者提供智慧服务,是近几年图书馆行业研究的新热点。近几年智慧图书馆建设被提上日程,与传统的图书馆相比,智慧图书馆可以为用户提供更精准的、个性化服务。

大数据技术环境下,互联网公司聚焦于为用户提供精准营销,用户画像技术被广泛地研究和应用。用户画像是一个互联网上的虚拟数据模型,是将一个人的基本属性以及在在互联网上的用户行为、用户偏好等主要信息数据进行提取,虚拟化出的一个标签模型,这个“画像”能概括的描述出一个人的信息全貌,可以快速地、准确地了解用户,进一步对用户开展精准营销、信息推送等个性化服务。

一、用户画像概述

AlanCooper被称为“交互设计之父”,他最早提出了用户画像的概念[1],他认为用户画像(Persona)是真实用户的虚拟表示。随着互联网各项技术的发展,现在研究者们所说的用户画像通常是与大数据分析、数据挖掘相关的,被称之为“UserProfile”。在图书情报领域,运用数据画像技术可以对读者的各项数据进行挖掘分析和展示,实现智慧服务。根据用户对数字资源的使用情况,如搜索、浏览、下载等行为,对读者进行用户画像,帮助图书馆员更全面了解用户需求。在用户画像的基础上,运用推荐算法,为用户提供有针对性的、个性化服务,实现精准服务。根据读者的数据行为特征,通过个体画像,关联规则分析,个性化推荐,向用户推荐“你感兴趣”“学者动态”“同行推荐”“最新资源”等,实现对不同学科用户的个性化服务。通过群体画像,数据挖掘和聚类分析把学科用户分为具有相似需求的群体,对图书馆的用户进行有效的分类,能挖掘出各类用户的真实需求。将用户画像应用于“个性化服务”和“智能推荐”等系统,是实现图书馆智慧服务的重要途径。

很多学者对用户画像进行了研究,有学者指出用户画像就是挖掘用户的人口属性、行为属性、社交网络、心理特征和兴趣爱好等数据,经过叠加更新抽象出完整的信息标签,组合搭建出立体的用户模型。陈丹、柳益君等着重从阅读推广、知识服务、主动定制、场景推荐等几个方面提出了基于用户画像的个性化智慧服务策略[2]。孙守强通过用户画像与智慧图书馆特点分析,探索基于本体的用户画像构建过程[3]。刘速以天津图书馆为例,从多个方面阐述了用户画像的构建和分析方法[4]。王庆和赵发珍从单用户和多用户角度提出了基于用户画像的馆藏资源推荐模式[5]。文章提出了基于用户画像的高校图书馆智慧服务模型构架,构建读者用户画像模型,并预测读者的兴趣和需求,以便为读者提供智慧检索、智能推送、个性化定制等服务。

二、用户画像构建流程

用户画像的研究最早出现在美国,是通过用户调研,采用统计学的方法对用户进行描述和概括。随着互联网和大数据技术的发展,人们通过采集用户在互联网上的各种行为数据预测用户的隐性信息需求,并以此来构建用户画像,建立用户完整信息描述的可视化表示。用户画像构建的流程分为数据采集、行为建模和用户画像构建三个步骤,基本流程如图1所示。

图1 用户画像构建流程

数据采集是用户画像的基础,数据越完整构建画像越能反映用户的真实状态和需求。用户画像的目的不同,数据采集的侧重点不同,这里主要列出用户的属性数据、用户行为数据和用户偏好数据。用户属性数据指用户的姓名、性别、年龄、爱好、专业特长等基本信息,可以从用户注册的信息中获得。用户行为数据指用户在互联网的页面访问、浏览、下载情况等,可以从互联网的访问日志中分析获得。用户偏好数据指用户的行为习惯或用户评论、订阅、收藏等相关内容数据,可以通过网络爬虫并通过特征提取和数据分析获得。行为建模是构建用户画像的核心,对第一阶段采集到的数据进行挖掘整理,利用机器学习算法对用户行为、偏好等进行相关的分析和预测。用户画像行为建模的核心是对用户潜在的意图和兴趣进行表示和存储,根据用户的基础信息、视频信息、访问信息、行为偏好,以及隐式兴趣等归纳出可读取、可计算的用户模型。通俗地来说,用户画像建模往往就是用户信息的标签化,以便为后面的智慧服务提供更加精准的数据模型。

三、基于用户画像的高校图书馆智慧服务模型

随着高校智慧校园的建设和发展,高校读者的用户信息与行为轨迹信息更加容易获取[6]。高校图书馆可以以读者需求为向导,在读者用户画像的分析和挖掘的基础上,结合个性化推荐技术构建高校图书馆的智慧服务系统。图2展示了基于用户画像的高校图书馆智慧服务模型构架。模型以读者为中心,通过读者数据的采集和预处理、用户行为建模和用户画像构建、智慧服务模型算法、向用户开展智慧服务。

图2 基于用户画像的高校图书馆智慧服务模型

1.数据采集和预处理

数据的采集阶段通过各种途径搜集读者的各方面的数据,包括读者的基本属性数据、数字资源平台行为数据、移动互联网数据、社交网络数据、终端感知数据等。用户属性数据可以直接从各管理系统如科研管理系统数据、教务系统数据、馆藏资源管理系统等直接获取,并进行数据关联。采集数据包括显式信息和隐式信息。显式信息中图书馆读者的基础信息主要指姓名、性别、工号、部门、人员类别(教学、科研、管理)等,读者学科信息主要包括学历、所学专业、专业技术职称、学科门类、学科专业。隐式信息中读者行为信息主要是收集读者的登陆、浏览、下载等行为信息,包括检索主题词、下载主题词、浏览主题词等,读者偏好数据包括常用数据库、订阅主题词、收藏主题词、登录次数、下载次数等。显式信息会通过信息采集接口直接从管理系统进行信息采集,隐式信息通过对数据资源系统、微信、APP等平台的用户访问日志进行提取,数据采集后汇总到后台服务器进行分析和存储。数据处理和存储阶段,将采集到的各种数据进行预处理,包括特征选择、数据转换和分词处理等。

2.行为建模和用户画像构建

高校图书馆读者用户画像的构建主要是将采集到的读者各类数据进行整合、挖掘分析、特征提取、聚类等,将用户的信息映射到一定的标签体系中,构建全方位的单个用户的画像。行为建模是对用户的行为特征有效的表示和存储,将采集到的用户信息数据表示成可读取、可计算的用户模型。用户行为建模依赖于对用户数据的挖掘户外分析,利用聚类分析、关联分析等手段,对海量的不同类型的数据进行有效的整合,挖掘出用户的信息需求特征。

行为建模的过程可以理解为用户信息的标签化过程。不同的标签体现了描述用户的不同视角,而用户画像是一个整体,各个维度、标签之间的联系密切。陈臣将读者标签分为7个标签类别,分别是读者基本特征、读者的阅读行为、阅读场景、阅读社会关系、阅读兴趣与爱好、阅读满意度、读者价值评估。陈丹、柳益君等在对用户画像进行建模时,将用户标签分为事实标签和预测标签。事实标签通过对读者个人信息和读者的借阅、收藏、下载等行为进行统计分析得到。预测标签通过智能分析技术,结合各种推荐算法,分析和预测用户特征、兴趣和需求等获得。本文提出从基本属性、行为属性、偏好属性三个维度对高校图书馆读者建立标签识别体系。用户属性是对用户基础特征的描述,如姓名、性别、学号(工号)、专业、院系等。行为属性是指读者对各种系统的行为操作信息,如数据库的登陆、信息浏览、论文下载等等。偏好属性是读者的潜在兴趣描述,如常用数据库、订阅主题词、收藏主题词等。

3.智慧服务模型算法

用户画像的构建是用户信息的完整描述和可视化表示,实现对读者挖掘信息的精炼概括。从可视化的角度来看,用户画像将会开启一个以用户为核心的呈现模式。

当用户画像在应用于推荐系统等个性化服务时,由于系统开销等原因,系统不会对每个用户进行设计,这时需要用到群体画像。群体画像代表了某一类用户的信息化特征,通过聚类算法将具有相似特征的用户群分为一类,按照各个类别用户的特征有侧重点的开展服务。群体画像还可以发现核心用户群的特征,在后面智慧服务阶段,可以优先考虑核心用户的需求。

智慧服务模型算法构建阶段,采用相应的数据挖掘算法,根据用户的兴趣偏好和用户行为特征建立兴趣模型,根据用户画像模型,分析和预测用户的资源需求和行为偏好,然后通过有效的途径将有价值的资源和信息推荐给用户。图书资源的推荐先根据读者的历史行为数据构建读者用户画像,对图书馆藏的资源的内容特征数据进行挖掘和分析,最终构建基于用户画像和图书资源的智能推荐模型,对每个使用的读者计算推荐列表,定期发送给读者。最常用的推荐算法是基于内容的推荐算法,是根据用户的偏好和拟推荐内容的匹配程度向用户提供推荐列表。

4.开展智慧服务

用户画像能够隐式的追踪和定位读者的兴趣爱好,通过分析读者的行为轨迹数据,建立读者兴趣模型,构建读者画像,为读者提供智慧检索、智能推送、个性化定制等智慧服务。

(1)智慧检索。通过采集读者的属性信息和用户行为信息,构建用户画像,当读者进行信息检索时,根据读者输入的搜索关键字和构建的用户画像,猜测读者可能需要的信息,并根据读者的潜在需求对检索结果进行排序,将用户最可能需要的信息排在最前面,从而提高读者的检索体验。可以利用IP、位置等定位信息建立不同规则的设置,为不同需求的读者提供不同的检索结果。

(2)智能推送。采用数据挖掘技术对用户行为进行分析,协同过滤推荐机制,找到与其有相似需求的读者,从而进行关联推荐。根据近期的搜索或浏览记录,采集基于内容的推荐机制,展示给用户一个综合推荐列表。例如豆瓣,以图书、音乐、电影为服务内容,通过“看过”和“想看”列表,同时结合用户评论来获得用户的偏好信息,形成用户的推荐列表。可以用群体画像,将具有相似需求的读者分为一类,为需求不同的读者推荐不同类别的信息。

(3)个性化定制服务。开展个性化阅读,如新闻客户端利用用户画像,根据读者的行为习惯和阅读经历为其定制新闻内容,最大程度的满足读者的个性化阅读需求。这种机制还可以根据用户的实际行为反馈进行调整,用户还可以根据实际需求自行调整定制内容,从而根据用户的兴趣变化动态更新定制内容。

猜你喜欢
画像标签个性化
威猛的画像
“00后”画像
画像
坚持个性化的写作
文苑(2020年4期)2020-05-30 12:35:12
新闻的个性化写作
新闻传播(2018年12期)2018-09-19 06:27:10
无惧标签 Alfa Romeo Giulia 200HP
车迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉标签的人,都活出了真正的漂亮
海峡姐妹(2018年3期)2018-05-09 08:21:02
上汽大通:C2B个性化定制未来
标签化伤害了谁
基于多进制查询树的多标签识别方法
计算机工程(2015年8期)2015-07-03 12:20:27