基于读者需求行为数据分析的图书馆精准服务研究

2022-08-22 01:30:36
高校图书馆工作 2022年4期
关键词:读者群画像标签

●张 新

(集美大学 福建厦门 361021)

近年来,随着大数据时代的来临,大数据所具备的功能已经备受人们的关注,如从海量数据中预测趋势、总结规律等。图书馆拥有海量的业务数据、读者数据等,通过对这些数据进行分析,图书馆能够针对读者的差异化需求开展资源配置科学、服务针对性强的数据服务,利用大数据开展精准服务已经成为高校图书馆的大趋势。本文以读者需求行为数据为基础,通过对读者需求行为数据的特征,以及数据获取、分析、体系构建、预测等进行讨论分析,旨在探索一条利用数据推动精准服务的图书馆与信息技术相融合发展的道路,以适应数据化、智能化、个性化的时代发展趋势[1]。

1 读者需求行为数据分析的必要性

图书馆服务的目标之一是希望读者进入图书馆后就会爱上图书馆,享受图书馆提供的各项服务。要实现该目标就要及时掌握读者需求,特别是暂时无法满足的读者需求,对这些需求应及时反馈、及时改进。读者需求行为分析、绘制读者群画像是实现该目标的基本手段。

1.1 读者需求行为的五个要素

读者需求行为由时间、地点、人物、交互方式、交互内容等五个要素组成。对读者需求行为进行分析时可将其转换为各种事件。例如,读者在什么时间搜索文献?在什么平台或数据库上搜索?在哪一个ID上搜索?搜索的内容是什么?

有了这样的事件数据以后,就可以把读者需求行为串联起来进行分析。例如,读者首次进入图书馆网站或进入一个数据库后就是一个新用户,他可能要注册,新生还要先进行入馆测试,那么其注册或入馆测试行为就是一个事件。注册或入馆测试要填写个人信息,随后读者可以搜索文献,浏览阅读文献,所有这些都是读者需求行为的一个事件。

1.2 绘制图书馆读者群画像,匹配读者需求形成精准服务

对读者需求行为进行分析后才能知道读者在图书馆网站上的各种搜索、浏览、点击等行为,并由此知晓其搜索的最终目标,绘制读者群画像。其中,在读者需求行为的分析中,重点关注读者借阅、下载、浏览等。在图书流通方面,读者需求行为分析能帮助图书馆了解读者如何流失,为何流失,在哪里流失,例如,某位读者一个简单的搜索行为:在某个ID上何时搜索了关键词?浏览了哪几页?在哪个时间办理了图书借阅手续?读者的这一整个行为都有分析价值。如果读者对搜索结果不满意,他会再次搜索,且更换关键词,然后才能搜索到他要的结果。图书馆可以以个体读者为中心,通过对读者的行为数据集合进行分析和归纳整理,绘制不同类型的读者群画像,以推断其相关群体的需求;对不同类别读者群体的需求采取差异化配置,从而实现整体需求的覆盖。优质的图书馆服务要能真正为读者找到满足其需求的、有价值的图书资料,实现图书资源与读者的精确匹配,使“每位读者有其书”“每本书有其读者”[2],从而有效实现图书资源和读者的双向匹配。

1.3 服务更精准,读者体验更佳

读者需求行为分析,无限接近真实读者。当拥有了众多读者需求行为数据之后,图书馆可以把读者需求行为数据做成一个按小时、按天,或者按读者级别、事件级别拆分而形成的结构化数据,从中可以了解不少相关信息,如哪些是图书馆忠实的“粉丝”,哪些是即将可能流失的读者,为什么会流失,有哪些需求是当前无法满足的,这些需求能否及时解决。通过读者点击查看浏览详情、搜索行为、点击关注等行为,以及需求行为触发的时间、频次,知道读者最近在关注什么,对哪类图书感兴趣,对哪类文章感兴趣。

从这些信息中对读者的需求进行轻重缓急的划分后,可及时推送给图书馆相关职能部门。由此,图书馆对读者的需求评估判断将更加准确,并根据读者的需求快速制定个性化的推送嵌入服务模式,实现服务更精准,读者体验更佳。

2 读者需求行为特征

2.1 读者需求行为呈现多元化、个性化

首先,读者的需求是多方面的,由于读者的注册信息、性别、年龄、学科专业、民族和阅读习惯,以及所处的社会地位及文化素养层次等不同,自然会有多种多样的兴趣和心理偏好,因而对图书馆文献资源的需求也千差万别,这种多元化的读者需求特征还表现在以下三个方面:第一,读者类型多样,如高校图书馆的读者有教师、研究生、本科生、实验室人员、机关行政人员、后勤物业人员等;第二,同一类型读者对图书馆文献资源的需求差异也较大;第三,大数据环境下,读者希望从图书馆获得的服务也不尽相同,如有的希望获得参考咨询服务,有的希望获得学科馆员服务,有的希望获得个性化的定制或推送嵌入服务等[3]。

其次,读者希望能不受时间与空间的限制,随时随地查阅或搜索文献信息资源,并可能会根据自身需求和偏好对图书馆提出个性化的意见。为此,图书馆需要依据读者的个性化意见进行调整并为其提供个性化的信息服务。但图书馆提供的个性化服务内容也容易出现杂乱无章、缺乏针对性的现象。图书馆需要依靠数据挖掘技术对读者需求行为进行分析,从而准确预测读者需求。

2.2 读者需求行为呈现碎片化、涣散化

媒介技术的变革与创新把我们带入了信息碎片化时代,读者需求行为方式也随之发生了翻天覆地的碎片式变化。全媒体环境下超链接、吸引眼球的大标题、各类信息干扰和信息噪音等分散着人们的注意力;海量的信息和快速的更新,也导致了读者的注意力多数情况下是片刻的、转瞬即逝的,常常被下一个能刺激其神经的信息所吸引,所以读者的信息获取行为也是碎片化的。此外,碎片化时间也造成了读者需求行为的碎片化。读者在获取知识和搜索文献时,有的是在图书馆,有的是在家里,有的是“信息偶遇”;有的是运用搜索引擎,有的是通过网站进行浏览,有的是使用移动终端;有的是快餐式阅读,有的是移动阅读,有的是随机性阅读,碎片化表现尤为严重。读者需求行为不仅明显呈现碎片化与涣散化,而且特征日益突出[4]。

3 读者需求行为数据获取

3.1 捕捉正确的“场景”,找到对的“人”

图书馆拥有海量的业务数据、读者数据,要实现精准服务,首先要对图书馆拥有的大数据进行梳理,选择合适的数据来源,尤其是针对描述读者使用文献资源行为的查询、浏览、点击、下载、借阅等数据,通过技术手段予以采集记录;其次将采集的数据通过清洗、算法分类、聚类、关联等数据预处理,将采集的读者数据标签化,并通过高度精练的特征标识,抽象出读者的行为标签、场景标签、属性标签、兴趣偏好标签、定制化标签等,以建立读者群组画像,形成可操作的读者需求集,即捕捉正确的“场景”,找到对的“人”,最后针对可操作的读者需求,快速地提供信息推送、资源订购、专题分析等多种互动性强、个性化强的“点对点”服务,并在图书馆业务服务中予以反馈,进一步引导开发形成新的标签,追踪读者需求的演变,形成图书馆精准服务可持续发展的现实路径。

3.2 数据获取

读者数据的采集、挖掘是构建读者群组画像的基础。图1是基于读者需求行为数据的图书馆精准服务流程图。在数据采集阶段,应针对图书馆各类数据(业务数据、读者数据)制定数据采集标准与处理标准,并依据标准对数据进行格式化和规范化。图书馆的读者数据主要包括静态数据和动态数据[5]。这些数据均可以从图书馆的后台数据中获取。图书馆的后台数据包括图书馆门户网站数据、书目检索平台(OPAC)统计数据、图书馆数据库网络日志数据、移动阅读终端统计数据、门禁系统数据、互动社交平台和微信日志数据等。图书馆门户网站数据中存储了读者的静态数据,如姓名、性别、年龄、学科专业、注册信息等;书目检索平台(OPAC)统计数据记录了读者的动态行为与兴趣偏好数据,如借阅信息、检索偏好与途径、订阅与收藏、图书荐购等;图书馆数据库网络日志数据记录了读者登录数据库次数、检索途径与频次、下载频次、使用偏好、学科主题等。这些数据客观体现了读者的学科需求和兴趣偏好。移动终端统计数据记录了读者的登录次数、主题类型、订阅类型、评论与分享等,体现了读者的阅读需求和兴趣偏好;门禁系统数据记录了读者到馆的地点、时间、频次信息,以及参加的培训讲座;互动社交平台和微信日志数据则体现了读者的资源需求信息、服务获取需求、主题偏好等[6]。通过挖掘这些数据,能够分析出读者的需求行为特征,进而对读者进行分类、贴标签,帮助馆员充分发挥图书馆资源为读者提供更加有针对性、精准性更高的“一对一”或“点对点”的服务。

图1 基于读者需求行为数据的图书馆精准服务流程图

3.3 数据处理

采集读者数据后,需要进行数据清洗、文本预处理、聚类分析等,数据只有经过加工处理后才能被利用[7]。在数据挖掘与处理阶段,根据数据格式规范读者数据、业务数据、管理数据,并从中提取读者特征数据,通过关联识别、梳理、融合等构建读者标签体系。不同读者在被细分之后即被差异化标签描述。标签对读者身份数据和行为数据进行语义化分类分级,是人为概括、高度精练的特征标识。画像的标签内容和对应权值决定着每个细分群体的差异程度,并展示读者个体特征和群体特征。

3.4 读者群组画像绘制

读者行为标签、场景标签、属性标签、兴趣偏好标签、定制化标签等构成了读者的基本画像,馆员可对标签进行层次分析,系统、多元地对读者画像进行描述。读者画像的构建是随着读者数据动态调整、逐步完善的过程,应结合图书馆实际应用场景将所有标签综合起来,不断完善形成读者的标签建模,最终勾画出读者的个体画像[8],再通过聚类分析读者群组,勾画出读者群组画像。我们的最终目的不是处理数据,而是理解、使用这些数据挖掘的结果。对读者数据的标签化能让馆员快速了解读者的需求,从而方便馆员理解和使用数据,更好地为读者提供精准服务。

4 构建精准服务运行体系

4.1 完善图书馆管理系统和业务系统,形成有效的大数据来源

当前,图书馆都已经组建了管理系统、图书流通系统、电子资源数据库、移动图书馆等管理和业务系统,但传统的管理和业务系统的目标主要是保证管理和业务工作的正常运转,而不是针对管理和业务数据进行分析、以提高精准服务水平为目标,这些系统对管理和业务过程产生的数据基本只是临时保存,更谈不上有序地组织和管理。因此,为了应用大数据技术实现精准服务,要对现有的管理和业务系统进行完善,主要是对系统运行过程产生的过程数据进行接收、整理,形成大数据仓库。

4.2 构建大数据分析系统,提取读者群组需求清单

图书馆利用形成的大数据仓库,通过分类、聚类、关联等数据分析与挖掘方法对数据内容贴标签,再深入绘制读者群画像。在绘制读者群组画像后,分析读者的现实需求、潜在需求,并预测其未来需求趋势,掌握不同类型读者群组和同一读者群组的共同需求和差异化需求,将这些需求内容按关键词出现的频次序列化提取出来,形成各类读者群组的需求清单。

该大数据分析系统是构建精准服务体系的核心,在根据历史数据形成判别规则之后,要及时根据新数据,定期提供分类需求信息,例如,短期需求、中期需求、长期需求,公共需求、群组需求、个别需求等,并能区分需求的轻重缓急。

4.3 构建需求反馈系统,匹配需求形成精准服务

发现需求的目的是形成资源建设和提供服务。在构建读者群画像、提取读者群需求之后,要建立需求反馈系统,依据读者需求清单,定量测算各类读者的需求偏好权重,结合时间阈值,确定需求特征元数据。读者需求特征元数据包含资源需求元数据、服务需求元数据。

资源需求元数据。根据资源需求元数据,来匹配馆藏资源库数据。若匹配成功,则将相匹配的馆藏资源数据信息及时推送给相关读者或读者群。若匹配不成功,则直接通过荐购平台荐购需求资源,并自动提供全面需求信息,包括相应需求群体的规模、比重、需求的时间特征等,一旦荐购成功,随即完成新的资源建设系统自动反馈、推荐给相关读者群。此外,反馈系统还要能够实现现实需求与现有馆藏资源的定期比对,为优化馆藏资源提供建议。目前,国内不少图书馆看似有很多馆藏资源,实际上有相当多的馆藏资源是“零”需求,这部分“零”需求馆藏资源已经成为图书馆的包袱。资源需求元数据不仅可使图书馆避免订购“零”需求资源,还能够根据馆藏资源的实际使用情况提供优化建议。例如,定期提供二线、三线、淘汰资源的分类建议;让馆藏资源形成建设、使用、淘汰的良性循环,减少“零”需求馆藏的空间和资金资源占用。

服务需求元数据。针对服务需求元数据,反馈系统要能够匹配图书馆的各类服务,精准推荐给具有相关需求的读者。一方面要依据读者的短期需求、长期需求、共性需求、个性需求等,结合图书馆现有的各类服务特性,预测读者的周期性服务需求和潜在需求,提供有针对性的服务方案建议;另一方面由相关服务部门及时提供满足不同时间特征的主题定制服务,对活跃读者、代表性读者等提供定制化的服务和定期推送专题信息服务等。

基于大数据的图书馆精准服务体系通过数据分析读者行为、预测读者需求,实现从过去经验认知模式向基于数据的认知模式转变,更直观地、及时地掌握图书馆服务与读者需求之间的差距,更深入地发掘读者真实需求,为图书馆管理和服务决策提供了科学的参考依据,能有效促进图书馆服务的精确性和科学性。但图书馆的精准服务最终是由馆员、读者、数据以及服务联结而成的一个具有适应性反馈的闭环系统[9],在这个系统中,馆员始终是主体,虽然软件系统在很多方面已经能够替代馆员的工作,但它始终只能是个辅助系统,特别是这个系统中的贴标签、资源建设和优化决策、最终的服务内容更新都需要一批掌握图书馆服务知识且有经验的资深图书馆馆员参与,也需要一线馆员的耐心、温心服务,才能形成一个良性运转的精准服务体系。

猜你喜欢
读者群画像标签
威猛的画像
“00后”画像
画像
从《新晚社区报》看读者群顶层设计思路
新闻传播(2018年7期)2018-12-06 08:57:54
无惧标签 Alfa Romeo Giulia 200HP
车迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉标签的人,都活出了真正的漂亮
海峡姐妹(2018年3期)2018-05-09 08:21:02
标签化伤害了谁
基于多进制查询树的多标签识别方法
计算机工程(2015年8期)2015-07-03 12:20:27
读者群
编辑如何挖掘特殊读者群?
出版广角(2014年7期)2014-05-29 23:57:29