基于小数据决策支持的公共图书馆个性化精准服务研究*

2024-01-17 02:56白忠睿
图书馆研究与工作 2023年10期
关键词:个性化图书馆服务

白忠睿

(甘肃省图书馆 甘肃兰州 730000)

1 引言

大数据时代的来临是信息化社会高速发展的必然结果,步入大数据时代的图书馆迎来了前所未有的机遇与挑战,也正在经历着广泛而深刻的变革。大数据成为了当前图书馆研究与应用的热点,而面对利用大数据技术存在的应用成本高、操作难度大、隐私外泄和服务针对性不强等问题,以微观世界为中心的小数据展现出的优势引起了学界的关注,小数据应用于图书馆领域的研究应运而生,并成为了近年来图书馆界的一个热门研究方向。

2 小数据与图书馆小数据

2.1 小数据概念的产生

大多数学者将美国的德波哈尔·艾斯汀教授视为第一位认识到“小数据”重要性的研究者,然而经查阅相关资料,发现在此之前已有学者涉足“小数据”研究的领域。但不可否认的是,“小数据”开始引起学界普遍关注,走进大众视野,的确是归功于艾斯汀教授。2012年,布莱恩·普罗菲特就提出了“小数据”的概念,预言了“小数据运动”的兴起[1]。马丁·林斯特龙也在2012年就意识到小数据的重要性,并将小数据思维付诸实践,为获得“Small Data”走访77个不同国家的2 000多个家庭进行调查[2]。另外,有资料显示一个名为“small data group”的知识社区里相继发现数十篇探讨“小数据”的文章,时间主要集中于2012—2013年[3]。

直至2013年年底,艾斯汀教授在一场国际会议上作了题为“Small Data,Where n= me”的报告,由此掀起了“小数据”研究与应用的热潮。她对小数据的定义是“全部有关于‘我’的数据”[4](small data where n=me),并指出每一个人在上网时或使用各种移动设备过程中都产生了大量的“数据面包屑痕迹”(Trail of Data Breadcrumbs),这些数量巨大来源于不同应用的用户个体数据的总体构成了用户小数据,为揭示人类行为模式规律提供了有针对性的依据,这些在线行为数据被称为大数据时代的“小数据”。

2.2 图书馆小数据

简言之,小数据是指以个人为中心的全方位的数据集合。这里小数据的“小”并不是指数据总量小,而是强调以用户为中心,重点在于对个体的深度挖掘和精确画像。

我国学者基本达成共识,把小数据看作是针对个体用户的全方位、多层次行为模式和情景感知的全部数据集合,进而图书馆小数据就可以定义为读者在阅读活动中和图书馆个性化服务过程中产生的,以读者为核心的用户相关数据。数据内容包括读者的个体特征、社会关系、阅读情景、阅读行为(现时+历史)、阅读需求、涉猎领域、兴趣变化等相关信息,是图书馆发现读者个性化阅读需求和阅读模式变化趋势,制定、完善读者个性化阅读服务策略的重要依据。

随着可穿戴设备、个人移动终端设备、传感器网络和视频监控系统等的快速发展与日益成熟,公共图书馆可以实时、便捷地完成对读者相关个人数据的监控和采集,为公共图书馆发现读者的阅读需求提供了直接依据,为保障个性化服务提供了根本遵循。小数据为公共图书馆智慧服务体系和个性化服务模式的构建提供科学的决策支持,为读者提供“量身定制”的智慧化服务,充分体现公共图书馆“以人为本”的精神理念,完全吻合“书是为了用的”的第一定律,并促进“每个读者有其书”“每本书有其读者”的实现,完成资源和用户的双向选择。因此,搭乘小数据的“东风”,为公共图书馆实现精准服务提供了良好契机。

3 基于小数据决策支持的公共图书馆个性化服务模式构建

本文基于小数据决策支持的公共图书馆个性化服务模式定位“三中心”架构,即存储中心、管理中心和服务中心。存储中心是基础,集中采集和存储完整、多维度的读者小数据;管理中心是关键,通过对数据有效整合与管理,提升读者小数据的科学性、价值密度和可用性,进而实现数据的共享与利用;服务中心是成效,挖掘数据价值,驱动个性化读者服务,让读者享受到更好的服务体验。

3.1 存储中心

基于小数据决策支持的公共图书馆个性化服务是建立在全面、真实、准确的读者小数据基础之上,因此,存储中心要保证所采集的小数据以读者为中心,通过应用互联网、人工智能、大数据等技术手段,分析读者个性特征、专业背景、兴趣爱好、行为方式等属性,以针对性地服务满足读者个性化需求。

小数据的采集内容主要来自于基本特征、阅读兴趣、阅读情景、阅读行为、社会关系、服务反馈六个方面,采集途径和来源方式多样,需要多渠道协同。其中读者的基本特征,相关小数据为读者的性别、年龄、专业、学历等特征数据,来源包括图书馆读者管理系统、开展线上和线下服务时采集的用户基本信息。读者的阅读兴趣,相关小数据为读者阅读的内容、方式、时间区间以及阅读兴趣变化的趋势等,来源包括可穿戴设备、无线传感器、第三方增值服务商等。读者的阅读情景,相关小数据为阅读活动的方式、时间、个体位置、移动路径、内容等阅读的动态情景数据,来源包括图书馆内部服务监控系统、通讯运营商、WiFi、GPS等。读者的阅读行为,相关小数据为读者搜索、阅读、评论等阅读活动相关的行为数据,来源包括图书馆阅读终端、线上用户网络搜索、浏览图书资料信息。读者的社会关系,相关小数据为读者的阅读群体,以及和其他读者的交流与反馈数据,来源包括第三方社交平台如微信、抖音、微博、百度等产生的数据。读者的服务反馈,相关小数据为读者的服务满意度评价、服务需求反馈、开展阅读活动的愉悦感数据,来源包括图书馆进行的主动回访、问卷调查、读者留言反馈。

3.2 管理中心

美国统计学家纳特·西尔弗在其著作《信号与噪声》中指出:“如果信息的数量以每天250兆亿字节的速度增长,其中有用的信息肯定接近于零。大部分信息都只是噪声而已,而且噪声的增长速度要比信号快得多。”[5]在图书馆对读者小数据进行全覆盖、高频率、深层次和不间断的采集时,小数据总量指数级快速增长,导致有效数据隐匿和混杂在噪声中。因此,需要通过对小数据的噪声过滤与整合,提升小数据的科学性与可用性。

当前,读者小数据资源分布广泛,结构复杂(结构化、半结构化和非结构化),来源于不同的应用系统和数据库,数据类型和维度呈现多样性,信息分散、数据散落,数据之间相关性较弱,信息不能共享,形成信息孤岛,给基于小数据的决策支持带来了较大挑战。

管理中心是基于小数据决策支持的公共图书馆个性化服务模式构建的关键步骤,主要目的有两个,一是对数据清洗整理,让数据可用;二是让数据变得更适合为后续工作提供支持。

管理中心将多源数据进行统一管理,主要应用于数据清洗、数据质量管理两个领域,提供小数据一致性,从而提升用户小数据的价值密度和可用性,最终实现跨机构信息共享、跨系统数据集成、跨库网深度融合。在数据清洗领域,针对不完整数据、无效数据、错误数据、不一致数据、不统一数据、重复数据等,从数据的准确性、完整性、一致性、唯一性、适时性、有效性等方面入手,完成缺失值清洗、格式内容清洗、逻辑错误清洗、非必要数据清洗、关联性验证等步骤。在数据质量管理领域,主要是解决数据质量与集成问题,从数据质量角度出发,对数据正确性进行检查并提高数据质量,采用提取、聚合、过滤、选择、转换等方式,对数据进行修剪、归一化、标准化处理,生成满足数据质量要求的数据。依赖丰富高质量的读者小数据为公共图书馆个性化服务提供依据,确保能够精确、高效、快速和经济地应用数据,辅助科学决策。

3.3 服务中心

服务中心,主要是通过管理中心对于读者小数据的集成、分析和挖掘,甄别个性化阅读需求,洞悉读者阅读心理,促进个性化服务模式从主观经验引导向基于小数据决策支持的个性化服务的转变,实现一种“信息找人”的服务模式。

服务中心主要思想可概括为八个字:千人千面、投其所好,主要方法包括基于协同过滤、基于内容、混合推荐等,主要思路为个体特征、集体智慧、共现关系和近邻推荐。通过分析相关读者小数据,制定合理的服务模式,明确服务目标群体,在不打扰读者的前提下,以恰当的时间、适合的方式、匹配的内容完成个性化服务推送。如基于借阅和浏览小数据的分析挖掘,判断读者阅读倾向,借助读书会、讲座、书目推荐等多种形式,有效激发读者的阅读需求、培养读者阅读兴趣,实现图书资源精准推荐。基于读者阅读场景与行为的分析挖掘,实现对馆藏载体、馆藏结构、馆藏数据、馆藏内容的优化调整,以及对数字资源的整合和数字馆藏体系的规划完善。基于阅读兴趣和服务反馈的分析挖掘,明确读者服务需求、服务模式、服务产品、服务满意度和收集反馈意见、建议等。

最后,通过对服务中心有效性的评估,实现服务过程的动态优化与完善。基于小数据的精准服务模式,给读者呈现出智能化、主动化、个性化和持续化的服务,同时通过对“三中心”模式的不断优化,提升图书馆服务总成效,让用户享受到更好的服务体验。从“借”到“荐”,从“纸”到“智”,不断适应读者的阅读热情与需求,进一步提高读者的阅读率,让广大读者最大限度地享受个性化的图书资源,推动数字阅读的快速发展,实现读者忠诚度及图书馆服务成效的双提升。

4 基于小数据决策支持的个性化服务模式构建中应注意的问题

4.1 把握适度原则

度是唯物辩证法的一个重要范畴,适度原则是唯物辩证法的一个基本方法论原则。公共图书馆在基于小数据决策为读者提供个性化精准服务的实践中,也需要遵循适度原则。

公共图书馆利用小数据决策可以准确预测读者的阅读需求和发现读者阅读的动态发展规律,通过建立与读者之间的即时沟通关系,进行实时推送,完成读者个性化定制服务。然而过于频繁的推送通知容易造成对读者日常生活的打扰,使读者拥有不良的情绪体验,甚至产生负面影响。因此,要把握好精确投放服务的度,摆脱公共图书馆传统的被动服务,也不要陷入过度服务的圈囿,找到被动服务和过度服务之间的平衡点,在用户真正最需要的时候提供主动的合时宜的信息服务,即在恰当的时间、恰当的地点以最恰当的方式,为读者提供精准的阅读广告推送和个性化导读服务,从而达到提高读者满意度、增强公共图书馆服务市场竞争力的目的。

4.2 加强数据安全防护措施

小数据的安全管理问题是关系到读者满意度和公共图书馆服务可持续发展的关键。因此,图书馆对以读者为中心的小数据安全、隐私保护,应坚持从小数据结构特点与读者个性化服务模式出发,制定可靠的数据安全管理与应用策略,不断提高小数据资源的安全性[6]。

首先,公共图书馆应依据国家相关法律法规,对读者小数据的采集、存储、分析、共享和决策过程进行规范,读者也可依据法律规定与图书馆签署相应的小数据安全使用合同或协议。其次,公共图书馆应始终将读者放在小数据资源安全管理的核心地位,将小数据的管理权限交付读者。在读者认为个人隐私受到侵犯或不希望被打扰时,读者有中断小数据采集与共享、限制数据应用范围和删除隐私数据的决定权。再次,针对用户小数据安全防护问题,可以通过数据敏感信息过滤、脱敏技术(失真技术、加密技术、匿名化限制发布技术)等,在不影响小数据决策科学性和可用性的前提下,删除、隐匿和替换与图书馆读者个性化服务不相关的用户隐私数据[7]。最后,公共图书馆应构建读者小数据敏感度评估和分级别安全保护制度,通过使用前安全评估、使用时安全管理、使用后保密存储与销毁,实现小数据全生命周期的安全管理[8]。

4.3 注重大数据与小数据的互相融合

英国数学家托马斯·克伦普在《数字人类学》一书中指出:“数据的本质是人,分析数据就是在分析人类族群自身,数据产生于人类社会的各种活动,其价值也在于服务人类社会,让生活变得更加美好。”[9]因此,公共图书馆不管是基于小数据决策,还是利用大数据分析,目的都是为了更好地服务于读者,只是两者之间的侧重点和处理方式不同而已。小数据和大数据并不是对立的,基于小数据的精准服务不是厚此薄彼,也不是完全与大数据剥离开来。在大数据概念出现之前也并不存在小数据的概念,小数据是大数据的组成、延伸和补充。如果说为宏观服务做支撑是大数据的擅长领域,那么为微观服务做精确的数据支持方面小数据则更有优势,即大数据负责“画龙”,小数据则起到“点睛”的作用。

一方面,大数据虽然以一个独特的视角为用户提供服务,但是这个方法还不完善,需要小数据的完善和补充,把大数据和小数据结合起来,结合事物的发展趋势并从个体角度出发,观察和梳理微小的线索,才能更快找出用户的真实需求[10]。另一方面,小数据的分析很多时候都需要大数据的支持,就如在基于小数据的图书馆精准化服务模式中优化层级时,就需要嵌入大数据的统计分析来向用户反馈数据。所以,小数据和大数据是相互依存、融合共生的,只有两者协同作用,才能实现“1+1>2”的数据增量,才能更好地推进公共图书馆的精准化服务工作。

4.4 运用“二八定律”

“二八定律”指出,图书馆服务收益的80%来自占据读者总数20%的高端用户, 而占据读者总数80%的普通读者只为图书馆贡献了20%的服务收益[6]。因此,基于小数据决策支持的公共图书馆个性化服务应重点关注高端用户,提升精品服务意识。

公共图书馆通过对读者小数据的跟踪、采样、分析和判断,可根据用户价值对读者进行细分,将其分为高价值读者和低价值读者,并实行差异化管理,按照价值最优化原则调整服务资源的分配。基于小数据的公共图书馆个性化服务在保障全体读者服务质量的前提下,要特别关注高价值读者的阅读需求,仔细研究高价值读者的阅读模式,为其“私人定制”具有个性化特征的特色服务和产品,确保为高价值读者提供的个性化服务在阅读时间、地点、内容、模式和综合收益方面评估最优,最终实现公共图书馆阅读服务的综合收益率的大幅度提升和最优化表现。

公共图书馆个性化服务运用“二八定律”时还有一个问题亟需关注,即高价值读者和低价值读者是动态变化的,两者在一定条件下可以相互转化。低价值读者具有发展为高价值读者的潜能,高价值读者也有转为低价值读者的可能。因此,公共图书馆基于小数据的决策对读者群的划分必须注重动态生成,需依据读者的阅读内容、时间、模式、终端设备、移动路径、阅读心理与生理变化、反馈评价等小数据构建全方位的读者画像,并据此动态分配服务系统资源,在获取较高服务收益的同时不断提升读者的价值和忠诚度[8]。

5 结语

个性化精准服务是一种辅导阅读、引导需求和文献领航的服务,是读者服务工作向更深层次发展的必然结果,也是现代图书馆读者服务工作水平的重要体现。公共图书馆基于小数据决策的支持,以有效的服务手段提供高质量的信息服务,最大限度地满足用户需求,从而实现公共图书馆价值的最大化。

小数据的本质特征是“以读者为中心”,公共图书馆对小数据的重视和利用旨在为读者提供更贴心、更实际、更个性的精细化服务,给予读者更多、更细致、更有温度的人文关怀,这恰与公共图书馆“以人为本”的宗旨和理念高度契合;也为“每个读者有其书”“每本书有其读者”“节省读者和馆员的时间”添砖加瓦[11]。

如何安全、高效、经济、快捷地采集、处理和分析小数据,进一步准确地对读者进行个体或群体画像,实现读者个性化定制服务,最终形成一个读者与服务品牌共存的可持续发展模式,充当一个贴身阅读指导和终身学习伴侣的角色,对于新时代、新目标、新征程下的公共图书馆而言,具有重大的研究价值和实践意义。

猜你喜欢
个性化图书馆服务
坚持个性化的写作
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
新闻的个性化写作
图书馆
招行30年:从“满意服务”到“感动服务”
上汽大通:C2B个性化定制未来
满足群众的个性化需求
去图书馆