图书馆用户画像设计与应用研究

2020-01-01 01:10杨彦荣
数字通信世界 2020年2期
关键词:画像标签个性化

杨彦荣,张 莹

(1.西北农林科技大学网络与教育技术中心,杨凌 712100;2.西北农林科技大学图书馆,杨凌 712100)

0 引言

随着互联网和新一代信息技术的飞速发展,当前人类社会已经从信息时代步入数据时代,大数据已经成为新时期信息技术和产业发展的重要方向。在大数据时代的背景下,用户画像作为描述目标用户特征,洞察用户兴趣需求,实现用户个性化服务的重要工具,目前已广泛应用于各种电商平台以及个性化的信息服务推送领域,尤其是在电商平台,用户画像能精准了解和预测用户需求以及定位客户群体,受到商家和企业的日益关注。随着网络技术的进步和信息化的推进,数字资源得到了迅速发展,高校图书馆的资源数据量呈爆炸式增长,浩瀚如烟的数字资源使得用户产出了信息迷航。鉴于此,图书馆可通过用户画像技术了解用户的需求,洞察用户兴趣以及个性化偏好等,以此为用户提供个性化、精细化服务,实现图书馆从信息服务向知识服务转型。

1 用户画像及研究现状

1.1 用户画像的内涵

交互设计鼻祖Alan Cooper在研究中最早提出用户画像并对这一概念给出了定义,他指出用户画像是通过不同的呈现方式对用户真实数据的刻画,是建立在一系列真实数据之上的目标用户模型[1]。简言之,利用各种数据挖掘技术采集并清洗用户的社会属性、生活习惯和消费行为等信息,并通过标签映射的方式抽象出用户画像模型。文献[2]等将用户画像描述为一种刻画用户需求和兴趣偏好的形象集合。余孟杰[3]认为用户画像是从对海量用户数据中挖取出特定的,潜在的用户信息,并以标签化的形式呈现出用户全貌,用户画像是用户信息面貌的虚拟刻画,其目标是实现精准服务。随着互联网和大数据理念的深入,如何利用大数据实现精准服务已成为企业日益关注的焦点,用户画像作为一种了解和预测客户、精准定位客户群体的有效工具,被广泛应用于社交网络、金融、电子商务等领域。

David Travis认为一个令人信服、全面、精准化的用户画像应具有基本性(Primary research)、真实性(Realistic)、目标性(Objectives)、独特性(Singular)、移情性(Empathy)、数量(Number)和应用性(Applicable)7个基本条件[4]。文献[5]认为图书馆领域在以数据驱动的主路线下,用户画像应该满足6个条件:时效性、可迭代性、交互性、区隔性、知识性以及聚类性。

1.2 国内外研究现状

随着人工智能、大数据领域的悄然兴起,围绕用户画像的相关研究也相继展开,并逐步成为众多学者关注的热点。用户画像研究在国外图书馆领域开展较早,在20世纪80年代,英国国家书目和Blaise-line通过对用户地使用情况进行相关性分析,并以此为依据对其服务进行优化[6]。用户画像技术算法是国外学者主要的研究方向,如统计分析、聚类分析算法、加权算法、分类算法、朴素贝叶斯网络、深度学习方法等受到学者们的关注,不同的研究采用取不同的算法构建用户画像模型,从而刻画用户显性的特征和潜在的特征。

国内图书馆领域对用户画像研究还起步发展阶段,相关研究成果较少,并且大多研究还停留在理论阶段。陈慧香[7]等人详细阐述了用户画像的概念、特性以及作用,并深入分析了用户画像建模的相关算法与技术、框架模型设计及构建流程,为图书馆基于用户画像的服务重新研究奠定了基础。刘速[8]详细阐述了天津图书馆用户画像构建的具体方法和步骤,并对常用的用户画像分析方法,如用户关系图谱、多维度交叉分析、可视化统计描述等方法进行了比较。潘宇光[9]将用户画像理论融入到构建智慧图书馆的过程中,从图书馆的智慧构建和智慧服务角度,提出用户画像的构架与实现途径。

2 用户画像设计与实现

2.1 数据收集

用户画像在海量的用户数据中产生和形成的,构建用户画像是为了还原用户信息,数据来源于所有用户相关的数据,因此数据源是构建用户画像的基础。随着大数据技术的发展和应用,图书馆各信息资源系统之间实现了互通互联,尤其是统一身份认证的应用,以及移动终端的普及,给用户带来方便的同时,也产生了异构化、立体化和多样化的数据,丰富了用数据类型,拓展了用户数据的来源。高校图书馆构建用户画像的首要工作是确定数据源,图书管理系统、书目检索系统、图书馆网站、移动图书馆等都是用户数据的主要来源,用户数据可分为相对稳定的静态信息数据和变化较快的动态信息数据两类。

2.2 标签建模

标签是基于用户数据分析后人为规定的高度精炼的用户特征标识,人能很方便地理解每个标签含义,使模糊的用户立体化、形象化。为用户建立标签模型是构建用户画像的核心工作和首要任务,用户标签建模就是对用户的静态信息数据和动态信息数据进行分析以及语义化抽象出,从而形成短文本化标签,再逐级分类形成基本信息、内容偏好、行为特征、心理特征和社交网络标签模型。

2.3 模型构建

用户画像构建一般包含数据整合层、数据标签层以及画像应用层。数据整合层又可以分为数据采集和数据处理,通过对图书馆各种来源数据进行采集,再进行集成、转换、归约、清洗等预处理操作后形成原始数据库文件。用户画像构建的关键是数据标签层,通过对用户信息进行统计、分类、聚类分析等技术,将用户信息语义化和短文本化,以标签的形式呈现立体化的用户形象。画像应用层是在建模结果分析的基础上,采用不同的可视化技术,将用户各个维度的标签呈现出来。

3 用户画像应用研究

3.1 个性化内容精准推荐

高校图书馆个性化推荐服务已获得了令人瞩目的成绩,在提升资源推荐服务质量及资源利用率方面已取得良好的效果。但在用户需求感知方面,依然以传统的用户需求调研为主,以分析小体量结构化数据分析用户需求,难以精准、全面刻画用户需求,因而可能导致个性化信息服务质量差、效率低等问题。随着大数据技术的深入发展,在用户描述与建模上用户画像具有天然巨大有优势,因而在分析用户信息需求时,通过构建用户画像完成对用户个人习惯以及兴趣等内在需求信息的刻画,从而构建起通往用户兴趣的桥梁,为个性化推荐服务提高数据基础。

3.2 用户信用评价管理

盗窃图书、恶意下载资源、图书超期、破坏公共环境及书刊污染等不良用户行为时有发生,针对这些严重的用户失信行为,图书馆往往采用警告或轻微罚款方式,其效果不是甚好,起不来威慑失信用户的作用。用户信用管理是抑制用户失信现象的有效途径之一,通过收集用户数据,分析用户信用数据,将用户信用纳入个人征信记录,对高校图书馆不同层次用户进行信用评分分级,建立用户信用分级管理。对图书馆不同信用评分的用户,赋予不同权限,并给予一定的奖励和处罚,可以优化用户管理,灵活服务,促进馆藏资源利用。

3.3 优化资源配置、指导发展趋势

高校图书馆可利用用户画像来了解用户的整体兴趣和需求走向,根据用户使用图书馆资源的行为习惯,设计或调整图书馆资源的配置、空间布局、科学管理。高校图书馆管理层可借助用户画像技术及时发现用户的特征信息和兴趣偏好,掌握用户需求的变化,从而为决策制定的科学合理性、高效性提供可靠的数据支持。

猜你喜欢
画像标签个性化
威猛的画像
一种融合PageRank和PersonalRank的多层个性化推荐算法
“00后”画像
画像
坚持个性化的写作
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
上汽大通:C2B个性化定制未来
让衣柜摆脱“杂乱无章”的标签
科学家的标签