面向群组用户画像的图书馆精准服务体系构建

2020-12-16 07:38
图书馆论坛 2020年12期
关键词:群组画像服务体系

董 宁

0 前言

随着科技发展,针对用户数据的挖掘分析和精准化服务在各行业发挥着重要作用,其中基于用户偏好特征数据关联的用户画像技术已被广泛应用于精准营销[1]、智能推荐[2]、产品研发[3]等领域。作为信息服务的主体,图书馆引入用户画像概念,通过分析用户偏好特征数据,构建用户数据与自身资源、服务数据间的关联性,创建用户画像档案,进而预测用户需求,提供精准化服务。“用户画像”(User Profile)的广义概念之一是通过引入数据挖掘、统计分析,描述用户行为与需求偏好特征,为用户建立独特的画像档案。学者从不同视角展开利用User Profile方法构建用户画像的理论研究[4-9]。与此同时,学者们开展精确描述多元化用户需求和提升精准服务研究[10-14]。纵观学界对用户画像和精准服务的研究成果,主要侧重于运用大数据分析、计算方法构建用户画像模型的理论研究,罕见针对图书馆小型数据和群组用户偏好特征的实证分析成果;中小型图书馆的精准服务探讨较少。本研究立足实践,在缺乏大数据分析体系的情况下,提出运用User Profile的研究方法分析目标用户多维数据,通过关联用户偏好特征标签,构建适用于地方高校图书馆的群组用户画像模型和图书馆精准服务体系。

1 研究方法及体系构建

1.1 研究思路

图书馆挖掘用户数据、构建群组用户画像、实施精准服务,是转变服务模式的战略重构。鉴于本研究所在图书馆技术及人员条件有限,对用户数据的挖掘分析、画像绘制、精准服务探索采取分步骤、分层次的方法。作为初期研究,以图书馆年接待量最高、资源利用效能最好的主要用户:本科生、研究生、教学科研人员(含专业技术类人员)为研究对象。通过挖掘多维用户数据,关联数据中隐含的用户行为偏好特征,绘制群组用户画像,并基于此构建图书馆精准服务体系框架。在后续研究中,通过调研精准服务效能数据及用户反馈,验证画像及服务体系的有效性;并逐渐扩展用户画像研究范围(如引入行政管理人员、后勤职工、离退休人员、校外读者等用户类型)和丰富精准服务内涵。

图1 群组用户画像建模流程

1.2 数据挖掘

完整的群组用户画像建模(数据重构)过程,包括如图1所示的用户数据挖掘、数据分析、建立用户标签化体系、绘制群组用户画像等步骤。

用户数据的多元挖掘是构建画像的基础。数据挖掘包含挖掘用户的静态数据、动态数据、社交网络数据、心理特征数据等。多维度数据交叉形成立体动态画像,对于每一个维度数据挖掘越多,构建的画像像素越高,图书馆越能提供精准服务。鉴于此,本研究用户数据从以下数据源获取。

(1)图书馆后台数据。图书馆后台数据包括图书馆门户网站数据、书目检索平台(OPAC)统计数据、图书馆数据库网络日志数据、移动阅读终端统计数据、门禁系统数据、预约选座后台数据、互动社交平台和APP日志数据。

图书馆门户网站数据中储存了用户静态数据(如姓名、性别、年龄、学科专业、班级、教育层次、注册信息等);书目检索平台(OPAC)记录了用户的动态行为与心理偏好数据(如借阅信息、阅读偏好、订阅与收藏、检索偏好与途径、图书荐购、活跃程度、评论等);图书馆数据库网络日志数据(如各类数据库登录次数、检索途径与频次、使用偏好、下载频次、主题类型等)客观体现不同用户的学习途径、学科需求和兴趣偏好;移动阅读终端则统计用户的阅读需求和心理特征(如登录次数、主题类型、下载次数、订阅类型、评分、分享等);门禁系统数据(如到馆频次、时间、地点)记录用户到馆频次信息;预约选座后台数据(如选座频次、时间、地点、位置、个人偏好)提供用户利用图书馆空间和个人学习习惯特征;互动社交平台、APP日志数据则动态体现读者的资源信息、服务获取需求、主题偏好等。

(2)主题调查问卷数据和访谈数据。主题调查问卷和访谈是图书馆有针对性地获取目标用户资源利用和需求信息的途径。通过设计问卷、开展访谈所获取的数据可以直观洞悉用户的学习层次、学科需求、动态行为特征和心理偏好,有助于刻画精准的用户画像。此类数据具有多维度、主题相关性强的特点,规避了繁杂无用信息的干扰。

1.3 用户数据处理

首先,对各类数据进行清洗、去重合等预处理操作。这一过程通过语义分析,包括网站、数据库后台的机器识别(自然语言处理技术)和人工识别,即人工提取数据中隐含信息、去重合、分类筛选。其次,对筛选信息进行关联性统计分析。利用统计分析工具绘制易识别图谱用于揭示数据中隐含的信息关联,建立不同类型用户的特征标签映射。

1.4 绘制图书馆群组用户画像

梳理关联分析数据信息,按特征形成用户标签体系。该步骤是绘制用户画像的核心工作,即为各群组用户建立匹配其特征(如学习特征、学科需求、行为特征、心理及兴趣偏好等)的用户标签映射关系。通过区分群组的相似背景、行为特征、心理需求和行为模式等,绘制不同类型的群组用户画像,根据每组用户共性需求提供精准服务。

1.5 基于群组用户画像的图书馆精准服务体系

根据群组用户画像模型,图书馆预测不同类别用户的知识(包括资源、服务)需求,精准推送满足用户兴趣的资源与个性化服务。本研究设计的精准服务体系架构包括二要素、三步骤。

1.5.1 精准服务体系的二要素

(1)核心要素:用户。用户是图书馆重构精准服务的中心元素。图书馆以用户为中心,预测用户潜在需求,为图书馆服务设计提供决策依据。同时,让用户参与图书馆服务的设计与优化过程,使之与用户诉求精确匹配,这是实现精准服务的基础。

(2)主导要素:图书馆。作为构建用户画像和提供精准服务的主体,图书馆在决策管理、体系构架、用户数据挖掘与分析、需求匹配、服务执行、信息反馈各环节承担主导作用。

1.5.2 精准服务体系的三步骤

(1)群组用户需求提取。构建群组用户画像模型后,图书馆要深入分析目标用户的现实需求、潜在需求,引入时间序列预测未来需求的走向;掌握不同类型群组用户和同一组群内用户的共有化和差异化需求;将需求内容关键词按出现频次序列化提取,形成不同群组用户的需求清单。

(2)匹配形成精准服务。图书馆依据需求清单,定量测算不同类型用户的需求偏好权重,结合时间阙值,确定需求特征元数据。需求特征元数据包含资源需求元数据、服务需求元数据。针对资源需求元数据,首先匹配馆藏资源库内部数据,如匹配成功,将馆藏资源数据信息及时推送至需求用户;如需求元数据与馆藏内容数据不匹配,直接通过荐购平台订购需求资源并反馈用户。针对服务需求元数据,匹配图书馆各类服务,精准推荐需求用户。图书馆应厘清用户的短期需求、长期需求、规律性需求、共性需求等,依据现有服务区块中服务的时间序列特性,预测用户的周期性服务需求,制定服务项目时序计划,主动提供满足不同时间序列特征的主题定制服务。同时,图书馆还需为活跃用户、代表性用户提供订制化的服务和定期推送专题信息服务等。

(3)体系维护与更新。用户需求、图书馆资源层、服务区块都是动态变化的。用户的需求与行为模式随时间、心理情绪、外部环境、资源服务的变动相应变化。图书馆应定期监测,更新群组用户画像模型,进而优化整个精准服务体系。通过与用户建立双向沟通机制,图书馆了解新的用户需求反馈,定期采集、过滤、分析新的用户数据,更新群组用户画像,循环维护整个精准服务体系的良性运转。

2 实证分析

本研究以山东工商学院图书馆的三类主要用户为分析目标,结合前文所构建的“群组用户画像模型”和“基于群组用户画像的图书馆精准服务体系”进行实证分析。

2.1 数据来源

2.1.1 图书馆后台数据

图书馆后台数据包含2019年度图书馆用户各类统计日志数据。数据采集利用“校园一卡通”账号作为数据来源的登录端口。表1为本研究各类型的后台统计数据。

表1 各类型后台统计数据

2.1.2 主题调查问卷数据

本研究使用“问卷星”为调查问卷设计平台,设计《基于用户画像的图书馆精准服务需求调查问卷》。问卷设计大纲如表2所示。问卷综合采用结构型(提前设定选择项)、非结构型(开放式问卷)问题设计,部分内容采用李克特五级量表方法设计。主题因素涉及用户的“基本信息”“到馆目的”“图书借阅情况”“数字资源利用及需求”“图书馆微信公众号利用及需求”“学科服务用户需求因素”“图书馆空间利用服务”共7部分37项问题,旨在全面了解用户需求。

表2 《基于用户画像的图书馆精准服务需求调查问卷》设计大纲

调查问卷设计后,采用SPSS25.0对问卷的信度和效度进行检测。将VOL量表纳入SPSS25.0信度分析,得到Cronbach’s Alpha值为0.917,说明本问卷设置各变量信度较高。效度分析包括内容效度分析、建构效度分析。其中,本问卷的主题因素、变量问题设计均覆盖到调研目标领域(图书馆资源、服务利用与需求、用户画像),认为本次调查具备良好的内容效度。建构效度指能测量出理论的特质或概念的程度[15]。本问卷量表经SPSS处理后得到的分析结果为:KMO值为0.702,题项变量间关系适中;Bartlett球形检验的近似卡方分布为1323.637,自由度为513,显著性概率值p=0.000<0.05,达到显著水平,因此认定该问卷变量效度合适。

调查问卷以微信、网页链接形式同时发布。发放对象为本校本科生、研究生、教师(包括教学科研人员、部分专业技术人员)。发放时间共30天,共发放问卷1,000份,回收问卷986份。回收样本经问卷星后台统计与人工筛选,得到有效问卷923份,回收有效率达92.3%。样本数符合麦克莱夫[16]样本数量与指标变量比例建议。其中本科生填写532份,研究生填写186份,教师用户填写205份。

2.1.3 访谈数据

本研究对山东工商学院6个学院(经济学院、管理科学与工程学院、工商管理学院、会计学院、计算机科学学院、人文与传播学院)的98名教师(年龄28~56岁、均为硕士以上学历)进行面对面访谈,内容涉及学科专业资源需求、图书馆资源建设满意度与需求意见、图书馆学科服务满意度与需求意见、学科信息推送满意度、个性化需求等。图书馆调研团队整理上述访问内容文本,依需求排序形成用户需求标签信息。

2.2 数据处理

2.2.1 数据预处理

后台统计数据经机器语言识别、清洗、去重合处理,再由人工整合形成有价值信息文本条目。在线问卷调查数据,经平台自动统计排序、人工去重、筛选形成分类信息。访谈内容文本信息则经人工汇总、提炼相关主题和影响因素关联信息。综合提取上述三类数据中隐含的用户行为与需求信息高频词,经去重合筛选形成用户的“资源利用行为”“服务利用行为”变量集群;并将通过变量标签与用户类型关联性分析,揭示各群组用户的显著行为数据与组群用户需求的对应特征关系。

2.2.2 群组用户行为特征关联分析

为分析不同群组用户的需求与行为特征是否存在关联性,本研究提出以下假设:

H1:群组用户类型与资源利用行为数据特征相关。

H2:群组用户类型与服务利用行为数据特征相关。

为验证上述假设,本研究将预处理后的后台与问卷行为排序数据导入SPSS25.0分析不同群组用户需求(主题)与行为特征(变量数据)间的关联性。假设内容及对应分析运算结果如表3所示。

表3 群组用户需求行为特征关联假设与对应分析结果

经卡方检验,上述假设的伴随概率P值均小于0.05,假设均通过验证,主题与相关变量之间具有较高相关度。同时,对应分析经因子降维处理,绘制二维散点图揭示各群组用户需求与行为特征之间的亲疏关系。

图2 群组用户与资源利用行为对应分析结果

图2是描述群组用户类型与行为特征的对应分析结果。由图2可见,从右上区域经顺时针依次分为1-4象限,位于不同象限的变量距离主题(用户)的距离越近,说明关联性越强,反之则关联性越弱。不同群组用户利用图书馆资源行为特型有显著差异。其中处于第1象限的“教学科研人员”与“中外文期刊数据库、教学案例资源、学科评价数据库、学术核心期刊、专业图书、事实数值数据库、教参类图书、统计年鉴”等资源关系最密切,说明该类型用户利用图书馆资源主要为满足教学、科研需求。位于第1象限的研究生群组用户对中外文数字期刊资源、学科专业图书、核心期刊的利用较好,说明他们的专业学习、学术科研需求较高。与前两组用户存在较大差异的是本科生群组用户,此类型用户的主要行为变量位于第2象限,主要以阅读文学图书、各类考试、职业规划与社科休闲类图书为主;对图书馆数字资源的利用倾向于语言学习、考试资源、公开课视频、艺术鉴赏类资源。

各群组用户利用图书馆提供的服务行为同样存在差异。

如图3中第1象限的教学科研人员经常参与图书馆服务包括利用图书馆数字资源库、学科图书借阅、代查代检、原文传递、学术不端检测服务,参与专业数字资源与学科评价资源讲座等,对于学科定题信息推送、课题申报讲座等定制化服务有较强需求。同象限的研究生用户则在利用数字资源、学科专业图书的同时,注重学术论文写作、课题申报等知识的获取。位于第2象限的本科生用户对于图书馆服务利用则主要体现在预约选座、利用空间自习、文学图书借阅、参与图书馆资源讲座、新书推荐服务等;其中,高年级本科生关注毕业论文写作、考研及公务员考试、职业规划类讲座,而新生则多参与新生入馆培训、读书沙龙活动等。

图3 群组用户与服务利用行为对应分析结果

图4 本科生群组用户画像

图5 研究生群组用户画像

图6 教学科研人员群组用户画像

2.3 群组用户画像绘制

依据上述群组用户的行为与需求关联特征,归类标签,形成各类型群组用户的学习特征、行为特征、心理及兴趣偏好等标签映射关系。根据用户标签映射,绘制图4~6所示的本科生群组用户画像、研究生群组用户画像,以及教学科研人员用户画像。可视化标签直观体现三类群组用户行为模式和需求偏好的差别。其中,本校本科生用户对文学、社科类、技能考试类纸质图书最为关注,他们到图书馆主要目的是自习、阅览期刊和图书借阅;对于数字资源,特别是学术论文撰写的需求还未形成;只有高年级本科生有获取毕业论文学术规范的需求。研究生群组关注图书馆数字资源对其提供的课程资源、学科专业、研究工具等的掌握,图书借阅以学科专业类为主,开始尝试研究生创新创业项目申报,有学术论文写作和投稿技巧的需求。教学和科研人员主要关注自身授课的教学方法,科研项目、成果受奖、职称晋升、学科相关信息、资源和研究方法。行政管理人员关注其工作领域相关的政策、法规、新闻动态、会议资源等。

2.4 基于群组用户画像的图书馆精准服务体系实证

2.4.1 精准服务体系实施内涵

在绘制群组用户画像的基础上,本研究依据前文“基于群组用户画像的图书馆精准服务体系”理论架构,构建如图7所示的精准服务体系实施流程图。精准服务体系的核心为不同类型群组用户。图书馆通过分析各群组用户的动态行为特征、学习阶段特性、兴趣偏好等因素,为目标用户精准推送资源与服务。本科生群体是纸质图书借阅的主力军,图书馆可以向此类用户推荐符合其阅读偏好和学科领域的优秀图书;定期通过微信推送新书信息,开展主题读书沙龙等活动;有针对性开展适合本科生的图书馆基础服务知识、信息获取与评价、优秀公开课、综合素质提升类讲座、毕业论文撰写系列讲座。针对研究生用户的学术资源和写作需求,图书馆为不同专业研究生推荐学科领域经典资源、最新资源,开设嵌入式研究方法和学术论文写作、课题申报基础培训。教学科研用户的需求具有较强学科性,图书馆应根据用户需求与建议,完善资源库;发挥图书馆情报信息领域优势,为目标用户,特别是活跃核心用户定制学科个性化服务,如定题信息推送、专利检索服务、投稿指南等;努力参与科研人员的科研信息采集、评价、管理等学科服务;针对教师的科研、立项需求,图书馆可以邀请学科专家为用户开展科学评价、课题申报主题讲座。

图7 基于群组用户画像的高校图书馆精准服务体系

2.4.2 精准服务体系更新运转

本研究架构的精准服务体系强调用户与图书馆二要素间的双向互动,图书馆通过与用户建立双向沟通机制促进精准服务体系的更新运转。一方面图书馆采取灵活的实时服务评价方法,如借鉴餐饮业、电商平台的实时服务评分问卷,获取群组用户的满意度。同时定期与用户互动,如学科馆员走访二级学院,发放主题问卷,组织“我为图书馆谏言”师生互动沙龙,微信留言板等方法,了解用户需求与建议,补短板、促使图书馆自身升级资源储备、优化服务内涵。另一方面,图书馆分析用户动态数据,如动态评估用户需求,更新用户画像模型,进而调整精准服务策略,促使整个生态系统在供需平衡中保持活力。

3 结语

本研究引入用户画像(User Profile)的研究方法,通过对目标用户多维数据与需求的挖掘、关联性分析,建立群组用户标签映射,绘制群组用户画像模型,并以此为基础架构基于群组用户画像的图书馆精准服务体系。经实证分析,检验了图书馆通过绘制群组用户画像实施精准服务的可操作性。为维持服务体系的有效运转,图书馆应建立图书馆与用户间的互动机制,通过实时反馈沟通,保障用户画像模型和精准服务体系的有效性和生命力。研究基于山东工商学院图书馆目标用户构建的初期实证设计,其群组用户画像的范围、画像构建的准确性、科学性及精准服务效能将通过后续研究和用户调研反馈来验证、改进。本研究的不足有:目标群组用户的区分粒度过粗,仅从本科生、研究生、教学科研人员三方面论证,难以全面定义群组用户和精准服务,后续将扩展补充行政人员、离退休人员、后勤职工、校外读者等用户;实证分析中的问卷调查、访谈数据难以避免设计者的主观性和表述偏差,后续研究将尽量减少人为因素;基于用户画像的技术算法运用有待丰富,后续将引入k-means等聚类算法处理用户数据。

猜你喜欢
群组画像服务体系
智慧出行,智绘未来——新一代出行服务体系构建与实践探讨
威猛的画像
“00后”画像
画像
“三效合一”构建现代农业服务体系
Boids算法在Unity3D开发平台中模拟生物群组行为中的应用研究
建好公共法律服务体系“最后一公里”
公共文化服务体系的四大特征
潜行与画像