基于小数据决策支持的图书馆读者个性化服务定制与动态推送系统研究

2022-03-24 08:46兰州财经大学信息工程学院
图书馆理论与实践 2022年2期
关键词:个性化决策价值

陈 臣(兰州财经大学信息工程学院)

1 前言

当前,随着传感器网络技术、云计算技术、大数据技术、集成电路技术和高速无线传输网络的快速发展与应用普及,图书馆在提升大数据采集、传输、存储、即时分析和智慧决策流程效率的同时,大幅降低了数据采集、存储、传输、处理和分析设备上的成本支出。因此,数据采集、存储、分析与决策活动中的成本支出,已不是影响图书馆数据决策应用的主要因素。在数据智慧决策中,图书馆如何确保所采集的数据具有高价值密度、低数据总量和强读者相关性,并与阅读场景和读者阅读习惯强关联,能够全面解释读者阅读需求、阅读行为、阅读收益和满意度之间的因果关系,有效降低图书馆数据决策系统的资源需求和提升数据决策的相关性、时效性,是确保图书馆基于数据决策支持的读者个性化智慧阅读服务安全、高效、实时、动态、经济和满意的关键。康奈尔大学计算机科学教授艾斯汀指出,从用户上网和使用各种移动设备过程中产生的大量用户行为轨迹数据中提取出的个体数据,可以为揭示人类行为模式规律提供依据,这些个体数据即为大数据时代的小数据[1]。大数据虽然能够全面、快速、精准地发现事物之间隐匿的相关性与内在规律,并为图书馆在未来发展方向、服务模式构建、服务系统安全高效运行和用户服务质量保障上提供科学的决策支持,但其海量、低价值密度、低读者相关性和不重视事物因果关系的特点,会导致在读者个性化服务决策中具有较高的系统资源损耗和决策时延、较低的决策结果准确性和读者个性化匹配度,最终导致大数据个性化服务决策千人一面,不能满足读者阅读活动实时、动态和定制的个性化需求。因此,图书馆必须依靠轻量、高质、多维和强相关的用户小数据集构建读者个性化智慧服务体系,满足读者的个性化阅读需求。

2 图书馆小数据的内容与决策价值

2.1 图书馆小数据的定义与内容

图书馆用户小数据可以定义为读者在阅读活动中和图书馆个性化服务过程中产生的,以读者为核心的用户相关数据,该数据具有多层次、多维度和强用户相关性,具有较小的数据总量和较高的价值密度,能够发现以读者为中心的读者、图书馆、用户服务三要素之间的因果关系和规律,能够精确描述服务情景和精准读者画像,可为图书馆读者提供个性化服务定制和推送,为读者满意度评估与反馈优化提供精确、实时的小数据科学决策支持。图书馆小数据主要从图书馆服务器监控设备、视频监控器、管理信息系统、网络监控器、传感器网络、读者阅读终端、用户可穿戴智能设备等采集而来,此外,第三方数据增值服务商所采集的用户数据也是图书馆小数据的重要来源。依据小数据采集方式和获取情景的不同,读者小数据可分为读者个体特征数据、阅读行为数据、阅读情景数据、阅读关系数据、用户服务监控数据、阅读心理数据等(见表1)。

表1 读者小数据的内容与来源方式

图书馆只有全方位、不间断地采集、处理、整合、分析以读者为中心的小数据,才能发现蕴藏在数据中的知识与事物之间的因果关系,从而精准地识别读者在阅读喜好、需求、模式、习惯、终端和社会关系等方面的区别,实现个性化阅读服务内容、模式、推送时间等的动态定制,保证读者获得较高的阅读收益,提升读者对图书馆个性化服务的满意度[2]。

2.2 图书馆小数据的价值与决策优势

2.2.1 小数据具有更高的价值密度

读者小数据是图书馆以读者为中心,在读者个性化服务内容推送、服务质量保证、服务满意度反馈与内容优化、读者阅读活动相关情景中所采集的全方位、多维度、完全特征的用户全部数据。以读者为中心的多维度小数据由读者个体特征、阅读行为、位置信息、社交媒体、监控视频、文字评述、语音、图片、阅读终端设备信息、传感器感知数据等组成,小数据在数据体量和数据总量增长速度上远远小于大数据,且与大数据同样具有多样性、高速性、真实性和高价值的数据特征。

①小数据是围绕读者个体而采集的用户服务和阅读行为数据,具有强用户相关性、低冗余度和低噪声比例的特点,价值信息不容易被干扰,数据的价值密度较高。②图书馆对读者小数据的采集具有全情景、多维度、深层次、不间断的特点。就单一用户而言,小数据采集的总量有限、种类单一,是针对单一读者在阅读活动全时段、全方位、全流程、全场景的采集,能够真实解释读者的阅读行为、需求、心理和个性特征,在读者个性化服务决策中相比大数据具有更高的相关性和决策优势[3]。③大数据是相关图书馆所有业务、对象和服务的数据集合,数据采集具有极强的广泛性和低用户相关性。而小数据则仅限于以读者为中心的相关数据,是对读者阅读活动和相关服务数据的深度采集、处理与挖掘,具有用户相关性强和知识挖掘更彻底、深入的优点。④与大数据相比,小数据较低的数据噪声大幅提升了图书馆数据知识发现和智慧决策的效率与科学性。

2.2.2 小数据具有较低的决策系统性能要求和资源消耗

(1)从数据获取来源看,大数据的样本采集范围为图书馆全对象、全系统、全情景和全时段的数据,大数据对处理、存储、分析和决策系统的性能要求较高,且大数据以指数级快速增长,要求图书馆数据应用系统具有较高的性能冗余和可扩展性。而小数据是以读者为中心的用户个体相关数据,具有较小的数据体量和低增长速度,对图书馆数据应用系统构建的性能和可扩展性要求较低。

(2)图书馆采集的小数据具有较强的针对性和目的性,虽然所采集的小数据也具有类型多样化特点(包含结构化、半结构化和非结构化数据),但半结构化和非结构化数据较少,因此,在数据处理、分析和决策过程中对决策系统的要求较低。

(3)大数据采集具有海量、全方位和全样本的特点,所以只有数据标准化才能保证大数据采集的效率、规模和实时性,也就是说,大数据只有对海量、弱相关性的数据进行快速、实时分析,才能发现数据中隐藏的事物关系特征,具有较高的系统资源需求与损耗。而小数据是以单个读者为中心而开展的全方位、不间断的数据采集与挖掘,因此,小数据不需要对全体数据进行处理和响应,只需对单一读者特定时间与背景的数据进行针对性深度挖掘,具有较小的数据体量、高精确度和强相关性,对图书馆系统资源的需求与应用损耗较低[4]。

2.2.3 小数据可完美诠释以读者为中心事物的因果关系

因果关系是一个事件和第二个事件之间的作用关系,后一事件是前一事件的结果,而相关性是两种或两种以上事物之间的相互关系。也就是说,两个事物存在因果关系,那么它们一定存在相关关系;但存在相关关系的两个事物却不一定是因果关系。大数据着眼于数据之间表层相关性描述,不探究影响数据相关性的深层原因,而小数据不仅关注数据相关性表现,也注重揭示数据相关关系的驱动因素[5]。大数据这种着眼于数据之间表层相关性描述而不探究事物之间的因果关系的原因,是由大数据海量、处理高速、类型多样和高价值的特性决定的,适用于图书馆服务模式预测与变革、服务系统构建与运营、服务满意度综合评估与优化、客户等级评估与关系管理等宏观战略决策方面。而小数据围绕读者个体数据的采集、处理与深度挖掘,能够明确读者行为、需求、心理、情景背后存在的内在因果关系和驱动因素,通过小数据价值提取、挖掘强相关核心数据、响应读者个性化服务定制需求、服务的优化与满意度管理等四个步骤,实现了科学、高效的读者价值管理,保证了读者对于图书馆服务的满意度。

2.2.4 小数据可实现读者个性化服务的精准定制与推送

(1)大数据采集的是图书馆对全对象、全范围、多类型和全时段的数据,在用户数据分析与服务决策过程中,大数据通常更关注对读者大群体的描述、定义、划分与服务定制。小数据的采集是以读者为中心展开的,从读者特征、思想、行为、心理、生理、情景等方面对单一个体进行全方位精准画像,进而完成对个体用户服务的定制、推送、反馈、评估与完善。对于以读者为中心的用户精准画像、个性化服务定制、用户关系管理与价值提升、读者满意度保证等而言,小数据更能准确还原以读者为中心的事物因果关系,高效、精准、实时和经济地为读者提供优质个性化服务。

(2)图书馆采集小数据的价值密度、精确性和实时性要远高于大数据,小数据在提示读者个体阅读需求与服务模式变化等用户微观层面的有效性也远强于大数据。小数据从读者行为、生理、思想、情景等细节数据上真实地描绘与表现读者,以个体读者为唯一决策对象具有决策内容更精准、深刻、实时和动态及个性化服务针对性强等特点。

(3)大数据分析是在海量、低相关的数据中寻找事物的规律与相关性,而小数据则是从总量有限和高用户相关性的个体数据中寻找事物的因果关系,更关注读者阅读活动背后存在的事物内在的机制与因果关系,对读者阅读需求、服务有效性、用户满意度和服务系统运行科学性有较强的可解释性,是图书馆个性化阅读服务定制与服务质量保证的重要决策依据[6]。

3 基于小数据的图书馆个性化服务动态决策系统的构建与应用

3.1 基于小数据的图书馆个性化服务动态决策系统的构建

与大数据海量、数据结构复杂、低价值密度和低读者相关性相比,小数据具有数据总量有限、数据标准化、高价值密度和强用户相关性特点,是基于读者阅读场景、阅读心理、阅读需求、阅读模式等微观层面对读者的系统画像与描述,可以准确阐述读者阅读行为、心理、场景、情绪、习惯、文化和社会背景之间的因果关系。本文设计的基于小数据的图书馆个性化服务动态决策系统具有决策精准、个性化定制、实时推送和动态优化的优点,其系统组织结构见图1。

图1 基于小数据决策支持的图书馆个性化服务动态决策系统

系统的底层为数据存储层,主要存储图书馆原有读者小数据、网络监控读者行为数据、视频监控读者行为数据、读者阅读终端数据、管理信息系统数据、可穿戴设备用户采集数据和第三方共享用户小数据等。数据存储层具有数据存储量大、读写速度快和安全性高的优点。

系统的第二层为小数据管理层,主要负责数据处理前的高速二级存储、数据标准化处理、数据过滤与去噪、数据价值提取,以及实现数据采集、存储、过滤、去噪、价值提取、访问、决策、价值评估和删除等全数据生命周期流程的管理[7]。

系统的第三层为数据决策层,主要依据读者个性化阅读需求动态构建数据决策模型,以及对决策模式进行动态评估、决策模型管理、决策场景的设计和决策应用。数据决策层基于读者高价值、全方位和强相关性的读者小数据支持,准确发现读者阅读活动与图书馆个性化服务要素之间的因果关系,通过实时、动态的个性化服务推送,来满足读者不断变化的阅读需求。

决策应用层是动态决策系统的最高层,基于底层功能模块的支持,主要负责读者阅读情景预测与定制、读者阅读模式预测与匹配、用户服务质量评估与优化、个性化阅读服务定制与推送、读者关系管理与价值提升等功能。图书馆基于小数据决策应用的精准性、实时性、个性化程度与经济性,不但与系统底层小数据的价值总量、个性化程度、可用性和数据决策科学性紧密相关,而且读者的阅读方法、图书馆用户服务模式、科技支撑能力和图书馆业服务变革发展也是影响小数据决策有效性的重要因素。因此,图书馆基于小数据的个性化服务动态决策必须随着上述要素的变化而动态调整。

3.2 图书馆小数据决策应重点关注的问题

(1)避免小数据应用误差。图书馆采集读者小数据的精确度、相关性、实时性和可用性,是保证小数据决策科学性和图书馆个性化服务有效性的关键。①读者阅读行为小数据与阅读活动所处的地理位置、阅读场景及读者的生理特征、心理特征、阅读社会关系、阅读需求变化等有极强相关性,因此,图书馆所采集的小数据必须涉及众多强相关性变量,小数据采集系统也应具备一定的机器智慧学习能力,并通过数据决策有效性评估结果优化小数据采集模式。②噪声数据是图书馆小数据决策面临的一个无法避免且影响巨大的问题。图书馆可采用分箱、聚类、计算机和人工检查相结合等方法将噪声对图书馆小数据的决策影响降至最低点[8]。③图书馆通过读者的阅读内容、阅读文献目录查询、论坛浏览及发言来采集用户小数据时,易受到阅读论坛上相似读者群语言、情绪、爱好和社交网络结构的影响。因此,图书馆必须通过小数据相关性分析与数据关系因果判断选取出正确的小数据。

(2)小数据决策应坚持全数据的原则。精确、全面、多维度、多层次和全时段地对读者进行画像,真实揭示读者与阅读情景之间的因果关系,是图书馆确保小数据决策科学、高效的必要条件。①小数据采集应包括读者的基本特征数据、阅读情境数据、阅读行为数据、传感网络采集数据、阅读心理与生理数据、读者位置与移动路径信息数据、阅读时的天气与环境信息等数据,在数据的分析与决策过程中要融合多源数据,实现小数据中蕴藏知识的完全挖掘与发现。②图书馆应构建多样性的小数据生态系统,在确保读者隐私数据安全性的前提下,实现多终端设备数据、第三方小数据平台数据、读者相关大数据的共享与融合。③在小数据决策中,应关注读者独特的行为数据痕迹,如读者阅读满意度反馈与评论内容语言风格的变化、照片与视频肢体语言的特征、阅读生理数据的变化、阅读时场景与位置变化等,从情境、习惯、效仿、激励、一致性、易理解性等方面分析读者小数据,实现读者阅读个性化需求的精准发现和服务有效性的合理评估[9]。

(3)小数据决策应重点关注高价值读者。依据二八定律可知,占据读者总人数20%的高端读者群可为图书馆带来80%的服务收益,占据着80%的图书馆系统服务资源,也拥有着影响读者个性化阅读体验和满意度的图书馆80%投诉[10]。因此,必须根据用户价值对读者群进行细分和差异化管理,依据读者价值和阅读需求进行服务资源的分配与调度,才能确保读者阅读收益与图书馆服务收益最优。①图书馆应根据读者历史小数据精准预测读者的阅读需求、模式、行为和结果,并依据读者价值最优化原则分配系统资源和服务时间。②在划分高价值读者群时,要紧密结合高价值读者的个性化阅读需求与阅读模式,确保高价值读者个性化服务推送在阅读时间、地点、内容、模式和综合收益方面评估最优。③高价值读者的价值需求和阅读需求是动态变化的,低价值读者也具有发展为高价值读者的潜能。因此,图书馆需依据读者的阅读内容、时间、模式、终端设备、移动路径、阅读心理与生理变化、反馈评价等小数据构建全方位的读者画像,并据此动态分配服务系统资源,在获取较高服务收益的同时不断提升读者的价值和忠诚度。

(4)小数据决策应保护读者隐私安全。小数据的安全管理既是关系图书馆小数据决策可用性的关键,又是关系读者个性化阅读活动可靠性的重要因素。①图书馆在以读者为核心开展小数据的采集、处理、分析和应用时,应确保读者对小数据的采集、共享、使用、决策的范围与深度具有知情权、所有权、编辑管理权和删除决定权。在读者认为小数据侵犯了个人隐私时,读者有对敏感小数据停止采集与共享、限制数据应用范围和删除样本的决定权。②图书馆对小数据的融合和分析等操作在发现小数据所蕴藏知识的同时,可能会导致读者隐私被侵犯[11]。因此,图书馆在小数据应用中应坚持决策适度和风险可控的原则,不要过量、过度地采集和使用小数据。同时,可利用数据脱敏、数据清洗和数据重构技术过滤读者隐私数据,在确保小数据决策科学的前提下防范读者隐私被侵犯。③图书馆应构建读者小数据敏感度评估和分级别安全保护制度,通过使用前安全评估、使用时安全管理、使用后保密存储与销毁,实现小数据全生命周期的安全管理。

4 结语

在图书馆数据决策中,小数据是以读者为中心全方位采集的数据,包括读者的阅读习惯、阅读社会关系、阅读模式、阅读行为、读者位置与移动路径、阅读生理与心理、阅读评价反馈、阅读终端等,它具有数据量有限、标准化结构、高价值密度、对读者个体全方位全天候地深度挖掘的特点。因此,在图书馆读者个性化服务中,与大数据相比,小数据较具有数据总量有限、系统资源损耗低、数据决策对象单一、决策结果实时精准的优点,能够解释以读者个性化服务为核心的众多事物之间的因果关系,实现了读者个性化阅读服务在内容定制、服务时效、系统资源损耗、读者价值量提升、服务质量与读者满意度保证等方面的综合评估最优。①图书馆在读者个性化服务数据决策中,应依据读者个性化阅读实际,坚持小数据为主、大数据为辅的原则,利用大数据寻求影响读者个性化阅读体验因素间的规律,再用小数据匹配读者的阅读活动场景,从而精确制定出科学、高效、个性化、经济和动态的读者个性化服务策略。②图书馆在小数据决策中,应根据不同读者对个性化阅读服务在精确度、时效性、经济性和阅读成本上的特殊需求,不断增强决策系统数据应用算法的科学性,确保决策结果最优。③在小数据决策中,图书馆应对小数据实施标准化处理、噪声信号过滤和敏感数据保护等,在提升数据可靠性、可用性和安全性的同时,注意不能对小数据过度清洗、重组、挖掘和删除,实现小数据决策效率和读者个性化阅读收益的最优结合[12]。

猜你喜欢
个性化决策价值
为可持续决策提供依据
坚持个性化的写作
决策为什么失误了
一粒米的价值
上汽大通:C2B个性化定制未来
“给”的价值
同桌宝贝
满足群众的个性化需求
小黑羊的价值
放大你的价值