大数据视域下智慧图书馆用户画像研究*

2020-07-03 03:08廖运平卢明芳杨思洛
国家图书馆学刊 2020年3期
关键词:画像智慧图书馆

廖运平 卢明芳 杨思洛

用户研究一直是图书情报领域的重要研究内容之一,不同专家学者从用户需求[1,2]、用户感知[3,4]、用户素养[5]、用户体验[6,7]、用户心理[8]、用户行为[9,10]等多个视角进行了深入的研究探讨。然而,由于技术条件的制约和数据的缺失,在实际的用户服务中图书馆难以对用户进行细粒度的刻画,无法准确掌握用户的真实需求,以致很多研究成果只能停留在理念和思想层面。但随着大数据时代的到来,智能终端、5G网络、大数据技术、人工智能等高新技术与设备为图书馆领域的用户研究带来了新的内容,提供了新的机遇。用户画像即是大数据时代用户研究的有力工具之一,可以将用户的心理、行为、实时状态、场景需求等有效融入到图书馆服务中。用户画像在图书馆领域的应用,为智慧图书馆的到来提供了必要的技术支撑,也为图书馆提供精准化、个性化服务创造了条件。

1 相关研究回顾

1.1 从用户画像到自动用户画像

(1)用户画像的概念。关于用户画像,最通俗的解读就是“真实用户的虚拟代表”,此概念起源于交互设计领域。交互设计之父Alan Cooper[11]认为,用户画像(Personas)并不是真实的人群,但它们基于人们真实的行为和动机,并且在整个设计过程中代表着真实的人群,是在实际用户行为数据基础上形成的综合原型(Composite Archetype)。Djilali等[12]将用户画像定义为包含用户特征、目标和需求等信息的用户描述模型。Jisun等[13]认为,用户画像是有着共同行为特征的用户群的虚拟代表。宋美琦等[14]认为,用户画像的实质是标签化的用户全貌。余传明等[15]认为,用户画像是根据用户人口统计学信息(Demographic Data)、社交关系(Social Network Relationships)和行为模式(Behavioral Patterns)等信息而总结、抽象和挖掘出来的标签化用户模型。

关于用户画像的定义,不同时期不同学者有着各自不同的表述方式,但从以上几个比较典型的定义可以看出,其内涵基本上是一致的。所谓用户画像,就是基于用户真实数据抽象出来的用户模型。与用户画像应用之初不同的是,在大数据时代,可供采集和挖掘的用户数据维度更多、数量更大,目标用户的特征更具体,生成的用户画像也更清晰真实。

(2)Personas与User Profile的关系。用户画像对应的英文为Personas或User Profile,国内许多学者将两者等同起来,如南京大学的陈慧香、邵波[16],吉林大学的张海涛[17]等等。但严格来讲,二者存在着一定的差别。首先,Personas来自交互设计领域,而User Profile来自营销领域;其次,Personas的主要使用对象是人(给人看的),而User Profile的主要使用对象是机器(给机器看的)。当然,二者虽有区别,但也存在着相辅相成的关系,二者的结合运用有利于从设计和营销两个层面为用户提供好的产品与服务。对图书馆而言,首先基于Personas来设计、开发和组织信息产品与服务,然后再基于User Profile将信息产品与服务推荐或提供给合适的用户。

(3)用户画像的应用。目前,用户画像已经广泛应用于广告、电子商务、系统开发、产品设计、社交媒体、市场营销和教育等领域。这些领域利用用户画像对市场进行细分,深入了解用户需求、偏好,以更有效地与用户互动。如,Jisun等[18]开发了一种基于社交媒体受众行为和人口统计数据自动创建用户画像的方法;再如社会化问答平台[19]、社会化问答社区的用户画像构建[20],以及用户画像技术在视频推荐中的应用[21]等。

近年来,图书馆领域对用户画像的研究也开始增多。例如,许鹏程等[22]对数字图书馆用户画像模型的构建进行了研究;杨帆[23]介绍了用户画像技术在国家图书馆数据管理与分析平台项目中的应用情况,提出了基于读者画像与资源画像的图书馆大数据平台的构建方法;张锐[24]提出了基于动态精准画像的图书馆个性化推荐系统;陈慧香、邵波[16]从定义、算法与技术、模型构建、实践应用、问题与策略等方面介绍了国外图书馆领域用户画像的研究状况。

(4)自动用户画像。自动用户画像(Automatic Persona Generation,APG)是基于用户海量且定期更新的数据自动生成的,相较于以访谈、焦点小组等方式创建用户画像的方法前进了一大步,近乎实时生成且更加客观准确。如卡塔尔航空公司(Qatar Airways)在应用APG后,机票预订额上升了16.34%[25]。在大数据环境下,自动用户画像有着更广阔的应用前景。

1.2 从藏书楼到智慧图书馆

“图书馆是一个生长着的有机体”,阮冈纳赞(Ranganathan)在其著名的《图书馆学五定律》中如是说。事实证明,图书馆的每一次发展都离不开技术的革新与参与。印刷术与造纸术的不断进步,让图书不再是少数人的专利,传统藏书楼被现代意义上的图书馆所取代;数字技术、计算机科学和互联网技术的普及,让传统图书馆迈入了数字图书馆时代;而今,大数据技术、第五代移动通信技术、智能终端、云计算等高新技术与设备为业界不断孵化出新工具、新手段,为我们开启了智慧图书馆的大门。随着大数据时代的到来,“每个读者有其书”“每本书有其读者”“节省读者的时间”这三条定律才算找到了真正落地的技术条件。不同技术环境下图书馆“读者”与“书”的对应关系如表1所示。

表1 不同技术环境下图书馆“读者”与“书”的对应关系

图书馆形态藏书楼传统图书馆数字图书馆智慧图书馆读者少数人特定读者群授权用户授权用户书珍稀、收藏为主普通、开架阅览纸质与电子、开架与在线知识单元、个性化服务

曹树金等提出智慧图书馆的建设应该以读者需求的精准识别为起点[26]。用户画像正是实现读者需求精准识别的关键技术与有力工具。通过基于大数据的用户画像,智慧图书馆可以精准把握读者特点、洞察读者需求、引导读者体验、提高服务效率和效能,实现智慧图书馆的个性化、精准化服务[27]。用户画像已在精准营销、广告投放、产品设计等领域发挥着日益重要的作用,在图书馆领域用户画像可以应用到需求分析、用户统计、战略规划、服务创新、产品定制、效果评估、精准营销等诸多方面。

2 智慧图书馆用户画像的创建

通过文献梳理发现,国内图书馆界对用户画像的研究侧重其营销功能,而忽视其产品设计的功能。其实,用户画像起源于交互设计领域,以产品设计与开发为目的;兴盛于电子商务、精准营销领域,以营销推广为目的。两个领域的用户画像既有区别又有相同之处,相同之处在于都需要知道用户需要什么;区别在于前者解决为用户提供什么的问题,要根据用户需求设计出好的产品;后者解决用户与产品的匹配问题,将对的产品提供给对的用户。基于不同的出发点和应用方向,我们可以将用户画像划分为面向设计的用户画像和面向营销的用户画像。相应地,智慧图书馆用户画像可以划分为面向设计的图书馆用户画像和面向营销的图书馆用户画像两大类型。

2.1 面向设计的图书馆用户画像

2.1.1 内涵、特征、层级与功能

面向设计的图书馆用户画像是虚构出来的典型用户,借助用户的行为、目标和动机来分析用户的真实诉求,利用定性、定量或定性定量结合等方法创建。面向设计的图书馆用户画像的内涵、特征、层级、功能及原则如表2所示。本文将面向设计的图书馆用户画像的应用场景划分为三个层级。首先,从宏观层面上,将用户画像应用到智慧图书馆的空间布局、功能与服务的整体设计中。该类用户画像适用时间长,更新周期也长,所涉及的设计方案往往成本高,要求具有较高的前瞻性与科学性。比如将用户画像应用到新馆的设计与建造中,至少要求根据用户画像所设计的新馆能基本适应未来若干年内的读者需求。其次,从中观层面上,将用户画像应用到智慧图书馆的服务战略与业务规划中,该类用户画像适用时间与更新周期适中。最后,从微观层面上,将用户画像应用到智慧图书馆具体服务项目或信息产品的开发与设计中。该类用户画像适用时间与更新周期较短,随着具体项目或产品的生命周期的终结就不再有效。当然,在智慧图书馆某一项具体的设计任务当中,需要创建多个用户画像以代表不同的用户类型。比如美国北卡罗来纳州立大学图书馆在其新馆设计时成功地塑造了10个用户画像(4名教员、2名研究生、4名本科生),并以此作为未来新馆不同类型用户的虚拟代表[28]。

表2 面向设计的图书馆用户画像的内涵、特征、层级、功能及原则

内涵特征层级功能原则基于用户真实诉求虚构的典型用户关注用户行为、目标、动机;注重Why层面的信息宏观:空间布局、整体设计等;中观:服务战略、业务规划等;微观:服务项目、信息产品等产品定义的假设、假设验证;具象化目标用户;招募用户调研对象;图书馆员快速了解目标用户;……以用户为中心(User-cen-tered);目标导向型(Goal-driven)

如表2所示,面向设计的图书馆用户画像具有以下功能。首先,用户画像是智慧图书馆空间、服务或产品设计的前提和基础,在解构、聚类用户需求之后能对相应产品或服务有更清晰的认识,完成产品定义的假设及假设验证。其次,面向设计的图书馆用户画像是为产品的开发和设计服务的,好的用户画像往往取决于数据(Data)、移情(Empathy)与洞见(Instinct)的完美结合,离不开丰富的用户行为数据和设计人员的移情与洞察力,用户画像与数据、移情、洞见的关系如图1所示。好的用户画像的移情作用,有助于图书馆管理人员、技术人员等就目标用户的需求达成共识,降低团队协作的复杂度。其三,用户画像是对目标用户的具象化,将用户特征植入独特的人物角色,有利于馆员快速了解目标用户,并愿意采取额外的努力,来开发对目标用户有用的产品,而这些是抽象复杂的统计术语和泛化描述所做不到的[29]。其四,图书馆用户画像可以作为招募用户调研对象的参考,并作为衡量智慧图书馆相关产品或服务设计效率和可用性测试的工具。其五,用户画像有利于智慧图书馆后续精准服务工作的推进。

图1 用户画像与数据、移情、洞见的关系

2.1.2 需求分析

大数据环境下,智慧图书馆的建设需要利用面向设计的图书馆用户画像技术来识别用户需求,并辅助完成图书馆在空间、功能、服务等方面的相应设计。智慧图书馆的建筑样式、空间布局、功能设计、服务内容、服务方式等并不是由智慧图书馆本身决定的,应由图书馆和用户所构成的系统一起来决定。比如,用户对图书馆提出智能化的诉求,要求馆内设计智能通风、智能照明、智能桌椅等,这些都需要在准确识别每类用户的需求之后,再设计出相应的产品和功能。新时代图书馆用户需求趋向个性化、多元化、极致化,这些日益增长变化的需求已经在倒逼和加速智慧图书馆的早日破茧成蝶。智慧图书馆只有对用户有了清晰而全面的认识,才能根据用户的需求设计出最好形态,同时主动适应用户需求的变化提供精准的服务和创造良好的用户体验。

2.1.3 创建方法

国内学者将用户画像的构建方法划分为基于本体的构建法、基于概念的构建法、基于主题的构建法、基于话题的构建法、基于用户行为的构建法、基于日志的构建法、基于多维的构建法和基于融合的构建法等[30]。在对这些方法进行深入了解之后,从用户信息的获取和分析方法来看,我们可以将创建面向设计的图书馆用户画像的方法分为三类,如表3所示。通过对比可以发现,定性用户画像比较快速省力,是在时间和资金投入有限的情况下可以优先选择的方法,但要注意规避其缺少数据支持所带来的风险;经定量验证的定性用户画像融入了定量研究方法,有一定的数据验证,适用于时间和资金比较充足的情形;定量用户画像最严谨科学,需要进行大量专业深入的定量研究,适合在时间、资金充足的情况下选择使用。因此图书馆在选择用户画像的创建方法时,需要依据项目的实际需求而定。

表3 面向设计的图书馆用户画像创建方法及归类

类型创建方法优点缺点定性用户画像访谈、小组座谈、阶省时省力主观因素太强、缺少梯法、透射法等定性数据支持研究访谈、小组座谈、阶经定量验证的梯法、透射法等定性有一定数据验证、费时费力、成本较高定性用户画像研究、定量验证、更可靠数据建模定性研究、定量验证、定量用户画像统计分析、机器学习等大数据支撑、更科学专业性、成本高

2.1.4 创建步骤

在设计领域,来自世界知名交互设计公司的艾伦·库伯(Alan Cooper)、罗伯特·瑞宁(Robert Reimann)和大卫·克洛林(David Cronin)提出了目标导向设计的方法,Lene Nielsen提出了“十步用户画像法”(10 Steps to Personas)[31,32]。在此,以“十步用户画像法”为例,介绍其包括的数据采集、形成假设、验证假设、用户建模、构建画像、情形分析、组织认可、传播知识、创设场景和持续更新等10个步骤,如图2所示。(1)数据采集(Finding the Users)。通过定量数据采集明确用户对象,这些数据可以来源于访谈、观察、二手信息、问卷、报告、调查等方面。(2)形成假设(Building a Hypothesis)。通过数据分析对用户进行细分,初步设定目标用户群的特征。(3)验证假设(Verification)。再次审视用户偏好、需求、价值观以及图书馆规划与目标等方面的数据,验证这些数据是否支持前面所形成的假设。(4)用户建模(Finding Patterns)。经过聚类分析,建立用户模型。(5)构建画像(Constructing Personas)。画像描述需要包含5个方面的内容:照片、心理、背景、态度和个性。在画像创建的过程中,应该让全体馆员了解画像是如何创建的以及为何创建。(6)情形分析(Defining Situations)。明确用户使用产品和服务的情形。(7)组织认可(Validation and Buy-in)。用户画像方法被视为向开发人员和其他人传达用户需求的一种手段,应确保所有馆员对用户画像与场景的描述达成一致,争取尽可能多的馆员参与用户画像的构建过程。(8)传播知识(Dissemination of Knowledge)。将用户画像及相关的底层数据传递给所有馆员。(9)创设场景(Creating Scenarios)。离开具体的应用场景,用户画像毫无价值。因此,要为用户画像创设相关的行为、目标和时空场景,让用户画像更趋于真实,逼真的用户画像可以为设计团队培养同理心。(10)持续更新(Ongoing Development)。用户画像本身具有一定的生命周期,图书馆需要随着环境变化适时对其进行迭代调整[32]。

通过以上10个步骤的分析可以看出,用户画像的创建过程是用户数据、团队协同、目标导向共同作用下的产物,也是目标用户和理想产品不断具象化的过程。通过以上步骤,图书馆可以更加深入地了解用户对产品设计的不同取向,如用户喜欢和不喜欢什么,他们的价值观是什么,他们对产品的态度如何,他们将在什么样的场景下使用图书馆所设计的产品,对于诸如此类的问题图书馆都将获得更加清晰而全面的认识,从而为接下来的设计工作打下坚实的基础。随着用户画像研究的深入及相关实践的发展,一些公司借助相关的数据分析技术与工具可以实现用户画像的快速生成与优化。比如,一些互联网公司在产品设计前期会使用Google Analytics提取用户信息,高效制作用户画像,并通过持续提取和分析线上行为数据对其加以完善[33]。

图2 十步用户画像创建法

2.1.5 相关案例

由于真正意义上的智慧图书馆尚未成型,所以还没有用户画像在智慧图书馆中的应用实践。但将用户画像技术应用于图书馆服务设计的案例早已有之,如美国的斯坦福大学、利伯堤大学、北卡罗来纳州立大学都将用户画像引入到图书馆中[34]。其中,北卡罗来纳州立大学更是提供了用户画像应用的详细过程信息,便于我们学习和借鉴。北卡罗来纳州立大学在其新馆设计时成功地塑造了10个用户画像(4名教员、2名研究生、4名本科生),在设计过程中,该馆首先明确定位了自身的需求,提出要打造21世纪的研究型图书馆和国内最佳学习协作空间,同时也认识到所面临的挑战,即要以前所未有的空间和技术在全新的学习环境中提供服务。然后,通过数据采集、用户假设、假设验证、聚类分析、画像创建、画像应用等步骤该馆顺利地完成了图书馆用户画像创建工作,并将这些用户画像应用到新馆的空间与服务设计中[28]。建成后的新馆以绿色环保、空间独特、理念超前、设备先进而著称,被誉为未来图书馆的发展方向[35]。可见,面向设计的用户画像在图书馆中有着较高的应用价值。

2.2 面向营销的图书馆用户画像

2.2.1 内涵、特征与功能

面向营销的用户画像在本质上是定量的,是用户属性、行为特征的集合,广泛应用于电子商务、广告、精准营销等领域。面向营销的图书馆用户画像的内涵、特征、功能与原则如表4所示。在大数据环境下,面向营销的图书馆用户画像,更注重于对用户借阅、浏览、预约、位置等各类历史行为数据的获取,所获取的数据量越大,也就越能深入了解用户需求,为用户的标签化、向量化提供更多的数据支撑。在标签化、向量化的基础上,通过机器学习、数据挖掘等技术的参与,可以对不同场景下图书馆用户的行为进行准确预测,从而为图书馆的精准营销、服务提升和效果评估等提供可靠的数据参考。目前国内图书情报领域对用户画像的研究,基本上属于面向营销的用户画像这一范畴。

表4 面向营销的图书馆用户画像的内涵、特征、功能及原则

内涵特征功能原则用户属性、行为特征的 关注用户行为、行为预测;用户行为标签化、向量化;集合,标签化、向量化 注重What层面的信息用户行为预测;以用户为中心精准营销;(User-centered);服务提升;目标导向型效果评估;(Goal-driven)……

图3 面向营销的图书馆用户画像创建流程

2.2.2 创建流程

在大数据时代,面对多维度、异构化、海量级的用户数据,图书馆将用户画像的创建交由机器来处理,不仅可以大大提高数据处理效率,还可对目标用户进行更多层次的粒度刻画,无限接近真实用户的需求,甚至比用户自身更了解用户,从而为用户精准匹配最合适的服务与产品。在数据为王的时代背景下,面向营销的图书馆用户画像的创建流程,可以分为数据采集、数据处理、数据应用三个阶段,如图3所示。

(1)数据采集。图书馆用户的数据一般可以分为静态数据、动态数据两大类。静态数据主要包括用户的人口统计属性,如姓名、性别、出生日期、身份证号、通讯地址、电子邮件、电话号码、工作单位、职称、职务、所学专业、文化程度等等,这些数据一般通过图书馆用户注册信息可以采集到。随着信息技术的发展以及各种智能设备的普及,图书馆用户的线上、线下行为等动态数据更多地被记录下来,诸如用户的位置、使用语言、网站浏览频率、回访频率、互动度、终端品牌型号、浏览器、操作系统、来源和媒介、链接通道等用户特征与行为细节,都会毫无保留地暴露在采集系统面前,为图书馆用户数据的采集提供了极大便利。

(2)数据处理。图书馆用户注册信息中的人口统计学信息,如年龄、性别、专业等原始数据在进行预处理、清洗之后,就可以直接作为用户画像的描述数据。而用户庞杂的历史行为数据,则需要使用多种算法进行深入挖掘,如使用聚类算法进行用户分群,使用TF-IDF、LDA、Topic Model等算法进行文本挖掘,使用机器学习、推荐算法完成行为建模,通过机器学习、回归预测等方法对用户行为进行预测,为用户侧的标签化做准备[36]。

(3)数据应用。面向营销的图书馆用户画像的实质在于完成用户与内容的精确匹配,最终可以归结为与推荐算法有效结合的问题。经过数据采集、数据处理之后形成的用户标签体系,为推荐算法提供了用户侧的特征集合。在推荐算法中,常用函数Y=F(Xi,Xu,Xc)来表达不同环境下用户对内容的满意度。其中,Xi指内容(Item)变量,如图书、期刊、论文、图片、视频等内容在关键词、分类和主题等方面的特征;Xu指用户(User)变量,如用户的年龄、性别、专业等特征,刻画出用户不同的兴趣取向;Xc指环境(Context)变量,在不同场景下用户需求会有所偏移,如同一个用户在旅游的时候喜欢看攻略,在考试前会偏向于查阅试题集。因此,环境特征是推荐算法要考虑的一个重要维度,可通过以上三个变量来预测用户在某一场景下对推荐内容的需求程度。此外,推荐算法还会引入热度特征与相似性特征来应对冷启动与算法越推推窄的问题[37]。

2.2.3 相关案例

国内图书馆界关于面向营销的用户画像的研究已经颇多,其中也不乏实证类的研究成果,然而多停留在用户画像构建的模型和方法层面,真正意义上的应用实践还不多见,甚至有学者认为国内图书馆领域用户画像的真正实践尚未开启,还没有用户画像真正投入实践的图书馆案例[38]。其实,国内关于用户画像的实践已有尝试,如国家图书馆就在用户画像的实践应用方面进行了有益探索,给我们提供了许多宝贵的经验。国家图书馆在其大数据项目中,通过ALEPH系统、文津搜索系统和门禁管理系统等对资源元数据、读者属性、行为数据进行采集;经过数据清洗、迭代分析和数据关联等进行数据处理,构建标签化体系,最终生成读者画像和资源画像并应用到图书馆的服务优化和服务评估当中。该项目的顺利实施验证了用户画像方法的应用价值,也为国内图书馆界用户画像的实践提供了有益参考[23]。

3 结语

及时、有效、精准、智慧地为读者服务,并提高读者满意度,是大数据时代图书馆发展的核心价值,更是智慧图书馆区别于以往图书馆形态的根本特征,其前提是充分了解读者及其需求,而大数据视域下的用户画像不仅能将用户属性、行为、目标和动机等特征展现无遗且实时更新,还能在设计层面为图书馆的信息组织开发、业务规划等提供依循[39]。面向设计的智慧图书馆用户画像将用户特征植入独特的人物角色,并使团队成员愿意付出额外的努力来开发对实际用户有用的产品,能够切实做到“每个读者有其书”,而这些是常用的统计术语和泛化描述所做不到的[29]。大数据时代,信息过载和选择障碍困扰着每一位图书馆用户,去伪存真、去粗取精、“节省读者的时间”正是用户画像在智慧图书馆应用的价值所在。

猜你喜欢
画像智慧图书馆
威猛的画像
“00后”画像
画像
图书馆
有智慧的羊
去图书馆
潜行与画像
智慧派
智慧决定成败
智慧往前冲,统计百分百(1)