基于小数据决策支持的图书馆个性化服务

2015-11-21 02:07陈臣
图书与情报 2015年1期
关键词:决策个性化图书馆

陈臣

(兰州商学院信息中心 甘肃兰州 730020)

基于小数据决策支持的图书馆个性化服务

陈臣

(兰州商学院信息中心 甘肃兰州 730020)

文章在对大数据和小数据关系进行研究的基础上,分析了小数据对图书馆个性化服务的影响,并对图书馆个性化服务QOS保证、服务成本问题、用户隐私等关键问题展开讨论,设计了一种基于小数据决策支持的图书馆个性化服务模式。该个性化服务模式可实现资源和服务的高度融合,并以用户需求为主导,为读者提供个性化阅读服务。

小数据;大数据;决策支持;图书馆;个性化服务

1 前言

当前,图书馆已进入大数据时代。图书馆大数据环境具有数据Volume(海量)、Velocity(处理高速)、Variety(类型多样)和Value(高价值)的4V特性。随着图书馆大数据总量和数据类型的快速增长,其数据环境将更加复杂、多变,大数据的采集、处理、分析和决策过程将消耗更多的系统资源和成本。此外,图书馆在立足大数据构建用户服务体系、优化服务资源管理与分配策略、变革读者服务模式和为读者提供个性化服务时,常因大数据结构多样、数据处理庞大和复杂、个性化服务针对性不强和大数据应用成本过高等原因,影响了图书馆读者个性化服务系统构建与服务保障的效率、可用性、经济性和可控性。

随着通信技术、云计算和互联网的发展,互联网与传感器网络已大幅度缩小了企业和用户的距离。以“小数据”决策为基础的用户个性化服务保障,已成为这个时代亟需研究与发展的课题,并广泛应用于以用户为中心,以及个性化服务水平要求高的医疗、营销和图书馆服务等行业。大数据反映规律,小数据体现个性。小数据是企业要获取、处理与合成大数据,进行产品细分和准确市场定位,保证服务更加高效、个性化和经济的前提。此外,小数据立足于微观世界,在有限数据样本空间下解决读者的个性化服务需求和服务等问题,可在较小数据采集、存储、分析和决策成本投入的前提下,大幅提升读者的个性化阅读愉悦感和服务满意度。因此,如何在“小数据”中获得更多无法预知或与直觉相左的信息、知识,是大数据时代图书馆提高自身服务能力和读者个性化服务QOS保证应重点关注的问题。

2 小数据概念的产生及其与大数据的关系

2.1 小数据概念的产生

“小数据”是指以个人为中心的全方位数据,包括数据被采集对象实时的生活习惯、身体状况、社交、财务、喜好、情绪、行为等数据。通过对分析对象全部小数据资源的收集、利用和分析,可对外形成一个富有个人色彩的数据系统,能够实现对个人特性、社会关系、需求和行为的精确分析与预测。第一个意识到“小数据”重要性的是美国康奈尔大学教授德波哈尔·艾斯汀。早在他父亲去世之前几个月,他就注意到他父亲在数字社会脉动中的细微变化。父亲不再发送电子邮件和不去超市买菜,散步的距离也越来越短。而这种逐渐衰弱的状态,无论在医院通过测脉搏、查病历、心电图或者全面体检,都不能获得这个90岁老人的身体异常表现。但通过跟踪老人的实时个体化数据,就可以发现他的生活状况已与平时明显不同。这启发艾斯汀开始研究小数据,从日常生活的小数据之中寻找异常之处,并把它当作一种新的医学证据。

大数据时代,随着监控设备、传感器设备、可穿戴设备和个人阅读终端设备的发展与成熟,图书馆可以安全、高效、持续和保密地采集读者个人数据,所采集的小数据与读者个体相匹配,直接表现了读者阅读需求、行为、关系和方式随时间变化的规律,是图书馆发现读者阅读需求和为读者提供个性化服务的直接依据。其次,与大数据资源结构和应用模式相比,读者是图书馆小数据资源唯一的采集对象,是图书馆对读者阅读需求、活动和模式全方位、不间断的深度挖掘,传统的大数据应用模式和决策方法已不适用于小数据环境。第三,小数据是图书馆大数据应用的必要完善与补充,是在图书馆大数据宏观决策的基础上,对读者阅读需求的个性化定制和QOS(Quality of Service,服务质量)的可靠保障。

2.2 小数据与大数据的关系

2.2.1 小数据与大数据的组织结构和数据类型不同

首先,从数据组织结构上分析,大数据具有海量、多类型、快速处理和高价值等4V特性,且非结构化数据占据大数据总量的75%以上。为了提高数据在采集、处理、存储和分析过程的效率可控性,大数据对数据组织结构和数据类型的标准化要求较高。小数据并不是指数据总量而言小,而是指图书馆依据读者阅读和个性化服务QOS要求,以读者为中心进行的全方位、不间断的用户个性化数据采集、存储、分析与决策活动。小数据以读者作为数据采集、处理、决策和应用中心,具有易收集、易处理和易操作的特点,能够满足读者个性化阅读服务高效、实时、可视和快捷的需求。其次,小数据具有更小的数据总量和更强的数据应用针对性,因此,在数据的采集、处理、分析和决策中,对大数据系统的系统性能和资源配置需求较低,可在较低成本投入情况下获取较高的读者个性化服务决策收益。第三,大数据往往是反映图书馆在用户服务模式与方法、服务系统构建、服务市场竞争环境和读者整体需求等方面的大规律,具有覆盖面广、内容繁多、分析深度有限和针对性不强的特点。而小数据则以读者个性化阅读需求和服务为中心,能够对用户服务的内容、模式、方法和产品进行深度细分,对用户服务市场、对象和内容的定位更加精确。因此,小数据是大数据决策的必要优化与完善。

2.2.2 小数据决策与应用具有较高的难度

与大数据相比,图书馆小数据具有数据量偏小、数据模式不规范、数据信号微弱、数据出现频率低和数据噪音过大的缺点,导致小数据价值易被过滤和忽视。同时,图书馆小数据系统具有美国圣塔菲研究所罗列的复杂系统多变量、相互作用、同时发生三个典型特征。因此,图书馆小数据系统具有较高的系统结构与数据应用复杂度。其次,与读者相关小数据具有数据总量小和快速决策需求低的特点,图书馆往往更加注重非结构化数据的之间的关联,以及对与读者个体相关数据的深度采集与挖掘。因此,通过对小数据集应用方向的分析可得出,小数据不是大数据集合的精简与提炼,而是对大数据应用与决策的必要补充和延伸。第三,满足读者需求和加强CRM管理是图书馆小数据应用的重点与核心。作为数据资源库的重要组成部分,小数据可以在大数据宏观分析、决策的基础上,更加深入、细致地挖掘读者行为特征、个体需求、CRM管理有效性和用户群结构科学性,通过对读者个体的精准分析更加精确地了解读者,并与读者群建立稳定、良好的关系,为读者提供基于小数据的精准个性化阅读推送服务。

2.2.3 小数据偏重于对读者个体数据的深度分析

对于数据的处理与分析过程,大数据往往侧重于数据的全面性和广阔度,对与图书馆读者服务过程相关的数据,进行大规模、全方位的采集、存储、计算与分析,希望通过全面、系统的分析,来准确发现读者的阅读需求和图书馆服务的规律、未来发展趋势。大数据应用存在着数据海量、类型复杂、应用范围广和数据噪音多的问题,因此,要求大数据类型、应用模式具有较高的一致性和标准化水平。小数据是以读者个体作为唯一数据采集、处理、分析和决策的对象,小数据决策对数据的精准性、针对性、个性化和隐私性要求较高,所涉及的内容包括读者的社会关系、工作与生活环境、阅读需求和爱好,以及读者个体所处的地理位置、移动路径和阅读内容等隐私数据,是图书馆用户服务决策和实施过程从摆脱传统的主观经验性主义,向“以客户为中心”理念的指导下的小数据客观性决策转变的重要依据。

2.2.4 小数据比大数据有更苛刻的安全环境要求

小数据模式下,读者个体数据是图书馆发现读者阅读需求、明确读者阅读模式变化趋势、有效评估读者个性化阅读QOS保障有效性、优化用户服务策略的重要依据。

为了保证图书馆能够全面、精确和不间断地采集读者相关数据,图书馆必须全面构建以视频监控系统、传感器网络系统、IT服务系统监控设备、用户阅读终端数据采集系统等为核心的读者数据采集系统,有效结合通信运营商、增值服务商等第三方协作服务商的共享数据,才能实现对读者阅读行为、个人行动轨迹、阅读思想需求和变化、阅读社会关系等数据的全面、无缝采集。因此,小数据模式下读者处于个人行为和隐私完全暴露的环境中,如何通过法律、科技和行业规范来保护读者隐私,使读者能够完全控制自身相关数据采集的内容与数量、存储与使用权、作用对象和应用方向,是图书馆小数据分析应重点关注的内容。其次,大数据应用模式是以图书馆用户服务为中心的海量数据全面采集、存储、分析与应用过程,读者相关数据在大数据总量中占据较小的比例,且数据的处理、分析也不是以读者个体为核心。而小数据的采集、存储、分析和决策都是以读者为中心,所以应注重读者在小数据决策隐私保护中的核心地位和作用。第三,读者是小数据资源的生产者和决策作用对象,小数据资源具有较强的读者个体属性特征。因此,如何将数据安全保护技术与小数据个体属性特征相结合,是确保图书馆小数据安全和数据隐私保护技术应用高效、经济的前提。

3 基于小数据决策支持的图书馆个性化服务模式构建

3.1 图书馆小数据的组织结构与数据特征

图书馆小数据是以读者为中心采集的用户相关数据,数据内容涉及读者的个体特征、阅读行为与需求、社会关系、用户地理位置及移动路径等相关信息,是图书馆发现读者个性化阅读需求和阅读模式变化趋势,制定、完善和优化读者个性化阅读服务策略的重要依据。从数据的价值总量、密度、可靠性和可用性划分,图书馆小数据可划分为读者个体特征数据、读者行为监控数据、第三方共享数据和外围社会化数据4个层次的内容(见图1)。

图1 图书馆小数据组织结构与数据特征图

读者个体特征数据是小数据的核心数据,主要由读者特征数据库记录数据、读者社会关系数据、读者满意度评估与服务需求反馈数据等组成。读者个体特征数据具有较高的科学性、真实性、高价值密度和决策可用性,是图书馆描述读者个体特征和明确用户需求的主要数据依据。但是,读者个体特征数据也具有数据总量偏小、数据价值可挖掘潜力小和数据更新缓慢的缺点。读者行为监控数据位于小数据库的第二层,主要由视频监控设备、传感器网络、阅读终端监控器和服务器监控设备采集数据组成,主要实现对读者的阅读行为、个体位置与移动路径、社会关系交往等数据的采集与存储。该类型数据对实时性和数据全面、完整性有较高的要求,是图书馆判定读者阅读需求、服务模式和方法的重要依据。小数据第三层为第三方共享数据,主要由通信运营商和其它第三方增值服务商共享数据组成。该类型数据能够全面、完整的覆盖读者阅读活动相关信息,但具有较低的隐私安全性、可靠性和可控性,因此,图书馆在小数据分析中应加强对该层数据的过滤、挖掘和价值发现。外围社会化数据是图书馆小数据的第四层数据,图书馆可通过开放API(应用程序界面)和百度、脸谱等合约数据提供商获得共享数据,在对数据进行整理、去噪后运用于小数据分析。外围社会化数据具有较强的数据价值发现与挖掘潜能,为图书馆小数据决策提供必要的支持和补充。从第一层读者个体特征数据至第四层外围社会化数据,小数据的价值密度、数据安全需求、数据可控性和数据可用性逐层递减,而小数据的数据总量、数据噪声和数据可获取性则呈现逐层递增现象。

3.2 基于小数据分析的图书馆用户个性化服务体系构建

3.2.1 制定科学的小数据采集、过滤标准

小数据应用是以读者为核心的数据采集、处理、分析和决策过程,因此,图书馆要注重小数据的读者个性化特征,数据的采集、存储、分析和应用一定要摆脱大数据的全面、海量、多类型和快速处理特征,通过制定、实施科学的小数据采集、过滤、处理和应用标准,才能为读者个性化阅读服务提供可靠的小数据决策支持。

监控技术和传感器网络技术的发展,使图书馆可对读者个体的位置信息、移动路径、社会交往、阅读行为、阅读浏览量、网站停留时间和阅读满意度反馈等相关数据,实现全方位、不间断的采集、存储、分析和决策。但是,随着图书馆小数据资源采集范围、种类和深度的持续快速增长,过于庞大的小数据会导致图书馆数据决策过程对系统资源的需求量,以及决策活动的复杂度快速增长,并大幅降低小数据决策的可靠性和可用性。因此,图书馆在小数据资源采集、过滤、处理和应用标准的制定中,应坚持数据标准化、高价值密度和多样性的原则,避免因过度追求数据的同源性和一致性而使数据过度过滤,导致数据的价值和可用性下降。此外,小数据的采集、过滤应坚持读者需求和个性化服务相关性的原则,通过对采集的小数据资源进行噪声过滤、类型分类和样本选择,提高小数据决策的精确度、针对性、可靠性和可用性,为读者提供基于小数据的读者个性化定制服务。

3.2.2 为读者提供基于小数据的个性化阅读服务

小数据是图书馆发现读者阅读需求、爱好和习惯,判断阅读服务QOS标准、读者阅读收益和用户满意度,将读者科学划分为不同读者群的直接依据。

个性化服务定制和推送有效性是决定读者阅读活动满意度和忠诚度的重要因素。因此,图书馆应通过小数据应用系统的分析、决策,智能、高效地将读者划分为若干个服务需求和QOS保障标准不同的用户群,在为群客户整体提供无差异服务保障的前提下,依据每一个读者的小数据指标分析结果,为读者提供量身订制的个性化服务,一方面可以增加读者的阅读满意度和忠诚度,另一方面又不会因个性化服务水平的大幅提升而导致图书馆服务成本上涨。其次,图书馆在保证读者小数据隐私安全的前提下,可将小数据整体作为大数据库的重要补充和完善,避免了大数据库对读者个人数据的重复采集、过滤和决策,可有效提高大数据决策的效率和精确度。第三,智慧阅读和个性化服务是未来图书馆发展的一个重要方向,而小数据则为图书馆智慧服务体系和个性化服务模式的构建提供科学的数据决策支持。图书馆可通过对读者个人小数据接口的查询,提前预测未来读者的阅读需求、阅读内容、阅读方式和阅读时间,可在最精确时间以最经济的服务模式,为读者提供精准的个性化定制服务,避免因无目标的广告投放而影响读者的阅读愉悦感。第四,随着图书馆用户服务模式的变革和服务方法的发展,大数据呈现出多数据来源、海量、多类型和离散化的现状。此外,大数据的整合、重组过程也会导致数据复杂度和价值挖掘难度增大。在图书馆服务系统构建和用户服务推送中,大数据作为实时动态指数,可实现对图书馆宏观科学决策和未来发展趋势的科学预测。而小数据则是通过对读者历史数据的分析与判断,为读者提供动态、可定制的个性化服务。因此,图书馆在小数据决策过程中应加强与大数据应用的结合和共享。

3.2.3 实现基于小数据的图书馆CRM精确管理

图书馆小数据资源是以读者为中心的数据集合,小数据应用应注重不同数据之间的紧密相关性、数据价值可释性和实用性。对基于小数据的读者个性化服务而言,如何科学采集一个具有较小数据总量、较高价值密度和精确表述读者个性化特征的小数据集,是图书馆完成读者服务个性化定制和改善用户服务细节,实现基于商业智能(Business Intelligence,BI)自动化精准营销服务的必要保证。

首先,小数据是读者、图书馆和用户服务之间的联系桥梁。小数据的本质特征就是以读者为中心,图书馆借助小数据分析可以明确读者的服务需求、服务满意度反馈、所希望的服务产品和服务模式等。图书馆可基于对读者小数据库资源的发现和挖掘,建立图书馆与读者之间的即时沟通关系,完成读者个性化定制服务的实时推送、反馈、修改和完善,最终建立一个读者与服务品牌共存的关系。其次,二八定律指出,图书馆服务收益的80%来自占据读者总数20%的高端用户,而占据读者总数80%的普通读者只为图书馆贡献了20%的服务收益。因此,图书馆通过对小数据资源的整合与分析,可从读者的行为、思想和社会关系中发现读者的价值,在满足全体读者QOS的前提下,为高价值读者定制具有个性化特征的特色服务和产品,通过进一步提高高价值客户的服务依赖性和阅读忠诚度,大幅度提升图书馆阅读服务的综合收益率。第三,基于小数据资源的支撑,图书馆可构建科学的读者识别模型、读者价值评价模型、读者服务满意度评估模型、读者阅读需求预测模型、服务产品关联分析模型、客户CRM(客户关系管理)管理模型等,在有效降低服务风险和提升客户需求洞察的前提下,提升图书馆读者服务市场的综合竞争力。

3.2.4 利用小数据分析保护读者隐私安全

与大数据海量、多类型、快速和高价值的4V特性相比,小数据具有以读者为中心、数据总量可控、数据处理即时性要求低、数据价值密度高的特点。因此,图书馆对以读者为中心的小数据安全、隐私保护,应坚持从小数据结构特点与读者个性化服务模式出发,制定可靠的数据安全管理与应用策略,不断提高小数据资源的安全性。

图书馆小数据是以读者为中心的个人数据集合。因此,图书馆在对其拥有的小数据资源管理中,应结合小数据的安全性需求,对图书馆内不同部门和馆外第三方共享方设定相应的数据共享、使用权限,通过预先设定的小数据使用授权程序,严格控制小数据的阅读、传输、下载和存储,保证数据不被第三方非法获得和使用。其次,小数据资源是图书馆大数据库重要的组成部分,图书馆对大数据资源进行分析、决策的过程中,往往会因为对数据的过度分析而导致读者隐私泄露。为了在不影响大数据决策有效性的前提下保护小数据安全,图书馆应严格控制大数据分析系统对小数据资源的随意访问、下载和共享,而应将所需分析的内容传输给小数据分析系统,当小数据分析系统完成数据分析后,直接将分析结果传输给大数据决策系统即可,而不是将包含读者隐私数据的小数据原始资源传输给大数据库。第三,图书馆应将读者放在小数据资源安全管理的核心地位,由读者决定与自身相关小数据内容的采集、共享和使用。当图书馆需要对读者相关小数据资源采集时,应对读者小数据资源采集的内容、方式和使用对象进行告知,由读者决定小数据资源采集、应用、共享、传播的范围、内容、程度、时限和对象,并对与自身相关小数据进行生命周期的全程监控。此外,读者还应拥有图书馆监控系统和传感器网络系统对自身小数据采集的控制权,可通过监控系统对读者帐号、密码的认证,暂停图书馆对自身小数据的采集。

4 结语

目前,“以客户为中心”和“读者个性化服务定制”的理念,已成为图书馆服务系统构建和服务模式变革的核心内容,也是图书馆提高读者阅读满意度和增强服务市场竞争力的重要依据。因此,如何通过海量数据的分析、预测和判断,准确把握读者阅读需求和阅读模式变化,成为关系图书馆个性服务QOS保证的重要因素。

与大数据决策模式相比,小数据决策以读者为中心,具有更高的决策针对性、准确性、可靠性、可用性和实时性。同时,具有比大数据分析系统更低的系统配置和资源消耗需求,是图书馆个性化服务质量的可靠保证和大数据决策必要的组成部分。为了增强小数据决策有效性,图书馆应以读者个性化服务需求和阅读满意度保证为中心,加强小数据决策的精细化管理和差异化保障,不断提升小数据分析、决策的深度和个性化水平,才能确保图书馆服务的有效性、可预测性和针对性,才能为读者提供安全、高效、经济和便捷的小数据个性化阅读服务。

[1]马晓亭.大数据时代图书馆数据可用性:价值、挑战和保障[J].图书馆理论与实践,2014(10):5-8.

[2]高永梅,琚春华,鲍福光.基于大数据的电信领域用户服务模型与数据融合策略研究[J].电信科学,2014(7):62-69.

[3]马晓亭.基于用户服务价值的图书馆大数据价值分析与服务质量保证研究[J].图书馆,2014(5):95-98.

[4]任磊,杜一,马帅,等.大数据可视分析综述[J].软件学报,2014,25(9):1909-1936.

[5]方艾,金铎,徐雄,等.电信运营商能耗优化的大数据分析模型研究[J].电信科学,2014(10):38-42.

[6]漆晨曦.立足小数据基础的电信企业大数据分析应用发展策略[J].电信科学,2014(10):15-20.

[7]Jiang D,Chen G,Ooi B C,et al.epiC:an Extensible and Scalable System for Processing Big Data[J].Proceedings of the VLDB Endowment,2014,7(7):1-12.

[8]马晓亭.大数据时代图书馆客户关系管理研究[J].图书馆工作与研究,2014(6):49-52.

[9]McAfee A,Brynjolfsson E.Big Data:The Management Revolution[J].Harvard Business Review,2012(October):61-68.

[10]Data centers efficiency how others can do it[EB/OL].[2014-12-18].http://www.google.com/about/datacenters/efficiency/external.htm.

[11]代双凤,董继阳,薛健.科学计算中大数据可视化分析与应用[J].工程研究-跨学科视野中的工程,2014,6(3):275-281.

[12]王忠,赵惠.大数据时代个人数据的隐私顾虑研究[J].情报理论与实践,2014,37(11):26-29.

[13]马晓亭.基于个性化服务需求的图书馆大数据分析平台构建研究[J].新世纪图书馆,2014(6):20-23.

Study of Personal Services Mode for Library Based on Small Data Decision Support

Based on the study of the relationship between big data and small data,this article analyzed the influence of small data on personalized services of library,discussed the key issues in personalized services for library like QOS guarantee of personal services,service costs and users privacy,and then designed a personal services mode for library based on small data decision support.The personal services mode can make its resources and services highly fused and integrated,and the core concept of the personal services mode is user demand-led,because it can provides personalized reading services for readers.

small data;big data;decision support;library;personalized services

G252.62

A

10.11968/tsygb.1003-6938.2015014

陈臣(1974-),男,兰州商学院信息中心工程师。

2015-01-20;责任编辑:刘全根

猜你喜欢
决策个性化图书馆
为小学英语个性化合作学习单做加法
做决策也有最佳时间段
决策大数据
诸葛亮隆中决策
图书馆
同桌宝贝
《管理就是决策:第一次就把决策做对》
去图书馆
校本课程开发的个性化问题探讨
呼唤雕塑家创作的个性化