莫扬海
(广东轻工职业技术学院 广东广州 510300)
在智慧图书馆提供的各种服务项目中,阅读推荐服务是目前图书馆用户最需要、也是最常见的智慧服务之一[1]。机理则是为实现特定功能、系统结构组成要素之间的工作方式,以及各要素在一定环境条件下相互联系、共同作用的运行规则与原理[2]。具体到智慧图书馆阅读推荐服务运行机理,就是指图书馆在开展阅读推荐服务的过程中,阅读推荐服务系统各组成要素之间的运行规则、运转原理与作用方式。而从数据驱动视角对其运行机制展开研究,目的是为了基于方法认知论明确智慧图书馆阅读推荐服务的实际运行状态,探讨适合目前大数据环境中智慧图书馆阅读推荐服务的创新途径,让整个智慧图书馆的运行过程趋向稳定,打造具有自我成长性的智慧图书馆阅读推荐服务生态系统。
数据驱动视角下智慧图书馆阅读推荐服务是图书馆在传统阅读推荐服务的基础上提供的一种创新工作,其本质就是信息服务。根据信息生态学的观点[3],数据驱动视角下智慧图书馆阅读推荐服务运行组成要素可由三部分组成,分别是阅读推荐服务主体、阅读推荐服务本体、阅读推荐服务环境:①阅读推荐服务主体,即阅读推荐服务相关人员,包括阅读推荐服务的提供者和消费者。其中,阅读推荐服务的消费者是决定阅读推荐服务是否需要开展、服务是否有价值的最关键主体,也是系统运行中用户行为感知数据的来源。②阅读推荐服务本体,即阅读推荐服务内容本身。按照构建层次与运行内容,可分为阅读推荐内容的资源建设与阅读推荐内容的组织建设。③阅读推荐服务环境,则可分为包含阅读推荐服务相关网络环境、个人隐私等宏观层面的外部环境和图书馆开展阅读推荐服务所需要的软硬件条件等微观层面的内部环境。阅读推荐服务主体、阅读推荐服务本体、阅读推荐服务环境,三个组成要素可以在用户行为感知、阅读资源数据、阅读知识组织、阅读推荐服务四大功能中为实现智慧图书馆阅读推荐服务总目标构建起相互联系、相互作用的具有生态关系的运行规则(见图1)。
图1 数据驱动视角下智慧图书馆阅读推荐服务运行规则图
系统要正常运转,必须遵守一定的运转原理。数据驱动视角下智慧图书馆阅读推荐服务运行机理,前文已分析其运行规则具有生态性,所以生态学中的生命周期也适应于本运行机制。根据生命周期理论[4],智慧图书馆阅读推荐服务运转需要历经四个阶段,分别是萌芽期、成长期、成熟期、衰退期:①萌芽期。图书馆开展探索数据驱动对于阅读推荐服务的具体工作模式,智慧图书馆阅读推荐服务初具雏形。②成长期。在读者需求增长的推动下,阅读推荐服务呈现快速增长的势头,智慧图书馆阅读推荐服务与图书馆服务工作制度化、规范化的结合越来越紧密。③成熟期。智慧图书馆阅读推荐服务已具有各自图书馆的特色服务路径,智慧图书馆阅读推荐服务体系健全,能够完全满足读者的需求。④衰退期。读者需求发生质的变化,智慧图书馆阅读推荐服务不能满足读者需求,服务面临转型升级。数据驱动视角下智慧图书馆阅读推荐服务,随着生命周期的运转,运行机理可以逐步健全并优化。
统一的标准化检索入口是数据驱动视角下智慧图书馆阅读推荐服务的技术基础[5]。基于标准化的检索入口,阅读推荐服务系统才能够对相关阅读资源数据进行分析处理,才能发挥数据驱动的优势,高效、快捷的处理海量阅读资源数据,将其转化为结构化的阅读知识体系。在这个过程,数据驱动贯穿着始终,阅读资源数据从数据驱动力作用的起点——阅读知识元到数据驱动力作用的终点——阅读知识体系,形成了一股正向作用的数据流,并将数据驱动阅读推荐服务的最终结果以可视化的方式呈现(如图2所示)。
图2 数据驱动视角下智慧图书馆阅读推荐服务作用方式图
如图2所示,数据驱动的作用就是将数据从整个服务过程的起点一直作用到服务过程的终点。在这期间,数据一直处于正向流动。而阅读资源数据在这个过程中的具体流动途径如下:以API接口为基础对阅读资源数据进行调用和提取,结合读者需求完成阅读元数据的索引准备工作,然后借助数据抽取、映射及导入技术对阅读元数据进行聚合处理,使其转变为读者需求的阅读资源数据内容与格式进行反馈输出,最终以可视化的形式供读者了解和掌握;在必要时可结合其他数据处理技术对阅读资源数据进行加工处理,将阅读资源数据转化为面向不同读者的形式进行输出,以此保证阅读推荐服务的针对性与有效性。数据驱动视角下智慧图书馆阅读推荐服务通过其数据驱动的正向数据流作用力实现阅读资源数据的高效处理与综合利用,以此保证阅读推荐服务的质量。
在智慧图书馆阅读推荐服务过程中,数据驱动着阅读资源数据的流动,其目的就是为了将阅读资源数据以揭示其内在知识价值为目标推送给读者,以满足读者潜在阅读需求,引导读者阅读以及利用图书馆资源。所以,数据驱动视角下智慧图书馆阅读推荐服务创新途径,可以从技术服务的数据流、内容服务的知识发现、读者服务的可视化三方面展开。
从数据流这个技术层面来看,数据驱动视角下智慧图书馆阅读推荐服务,可以创新传统阅读推广服务模式,使其转换成为一种更加开放、友好、安全的阅读资源数据网络,在确保相关数据安全性与可靠性的基础上实现阅读资源数据的高度共享、高效传播与有效利用,最终形成特定的阅读知识生态系统,满足读者个性化的阅读信息需求。在这一过程中,充分发挥相关数据处理技术的优势,借助数据解构、数据整合等技术对数据流进行科学管理,以保证阅读推荐服务的智能化与智慧化,实现阅读资源数据由原始资源数据向知识资源数据的转化与流动,推动智慧图书馆阅读推荐服务的创新发展。
基于数据流创新智慧图书馆阅读推荐技术服务过程,主要包括确定分析对象、信息分类模型、分析手段、分析数据结构表达模型四个部分。其中,分析数据结构表达模型是工作重点。对于智慧图书馆阅读推荐技术服务来说,就是指阅读资源数据的整理。根据数据驱动的智慧图书馆阅读推荐服务模式数据情景化、数据索引性、数据目录化、数据集成性的特征,可选取单指标推动力结构模型[6]为智慧图书馆阅读推荐服务数据结构表达模型。通过运用这个模型进行阅读资源数据分析与阅读资源数据可视化前的数据建模。在具体建模过程中,可将阅读资源数据整理的指标按照每一位读者设为阅读资源数据总量、阅读资源数据推动力、阅读资源数据增速、阅读类目百分比四类。利用单指标推动力结构模型对其进行数据建模,将阅读资源数据总量及推动力指标按照维度进行分解,将主节点的增速分解到从节点的推动力、增速与百分比上(见表1),通过阅读资源数据总量与分解后的一级维度和二级维度进行叠加制定建模方案(见表2)。
表1 阅读资源数据总量及推动力结构按维度分解图
表2 阅读资源数据流分析数据结构表达模型建模方案
面向单指标视角的阅读资源数据流分析数据结构表达模型建模方案的设计,其实质就是以推动力结构模型为基础,对某一主题的阅读资源数据开展定量逻辑梳理,形成满足阅读推荐服务目的的数据结构,为数据挖掘与可视化设计提供量化指标。基于数据流的阅读推荐技术服务,能够有效克服传统分析工具的缺陷和不足,根据读者需求针对性地采取最佳方式完成阅读资源数据整理工作。
数据挖掘等现代数据驱动思维的科学运用加快了智慧图书馆服务的创新发展速度。从数据驱动智慧图书馆阅读推荐服务过程中可以发现,阅读资源数据在服务过程中的起点以知识元的形式存在,在服务过程中以知识链、知识库的形式发生价值传递,在服务过程的后期以知识体系、知识图谱的形式对外呈现。整个服务过程中,通过数据驱动,阅读资源数据实现了价值的增值,形成了能引导读者阅读行为走向或对读者有决策参考作用的阅读知识。这是一种阅读推荐内容服务方向从传统推荐阅读图书向推荐阅读知识的转变。
在数据驱动下,可以基于知识发现研究分析读者数据,对读者潜在需求、使用偏好、兴趣习惯等进行深度挖掘,通过建立用户画像对其阅读需求进行预测,以此作为阅读推荐服务开展的依据,提高读者使用智慧图书馆阅读推荐服务的满意度。同时,利用知识发现中的分析、评价等技术手段对阅读资源数据进行收集、处理,将知识发现服务与阅读推荐服务进行融合,实现图书馆馆藏资源的深度加工、深层挖掘,升华图书馆现有资源的阅读价值,提升阅读推荐服务的层次。
具体操作中,可以分为三个部分进行:①建立起目标数据与查询数据之间的数据流转过程。将待查询数据与目标数据库进行连接,通过服务平台将待查询数据与本地数据库、远程数据库进行精确匹配,依据相关分析技术完成从非结构化数据到结构化知识的阅读资源数据收集、处理。②搭建起服务平台与其他数据库之间的数据协作渠道。将服务平台与图书馆基础数据库、机构知识库、专家学者库、科研人员库、学科馆员库等数据库之间实现跨库协同,将不同数据库进行关联,进而完成深度挖掘,实现数据升华到知识。③开发服务平台与读者服务使用终端之间的数据智能技术。从用户角度出发,丰富数据收集方式;从分析角度出发,强化数据挖掘技术;从服务角度出发,优化数据评价模式;从环境角度出发,完善服务软硬件条件。
在大数据的环境下,智慧图书馆阅读推荐服务的创新发展需要充分发挥数据驱动的作用力,才能够对规模庞大、结构复杂的原始阅读资源数据进行加工处理,将其转化为具有特定结构特征的阅读资源数据,向读者提供可以满足特定应用需求的阅读推荐服务。在服务过程中,为了让读者更加直观、简便、准确地了解和把握相关推荐的阅读资源,除了注重内容服务的个性化外,服务方式的选择也决定了读者的接受程度。
通过可视化,可以从本质上解决智慧图书馆阅读推荐服务中遇到的推荐数据庞大且关系复杂的问题。可视化方案的设计可以提升阅读推荐服务的效率和质量。目前,可视化系统设计的最基本形式为静态显示与动态显示。通常情况下,静态数据显示具体表现为基于可视化系统模型,结合视觉编码技术工具以图元①的形式对数据处理过程及结果进行输出展示;而动态显示输出则采取一种交互式的数据处理和输出方式,针对大规模、复杂数据系统开展研究分析,可以更加全面、准确地显示即时数据信息,充分满足读者对阅读资源数据时效性、可靠性的需求,以此提升读者使用推荐服务的满意度。
就具体的智慧图书馆阅读推荐服务可视化方案设计来说,可选择将静态数据以多视图关联交互为主要呈现方案。以单指标推动力结构模型分解为基础,集合前文阅读资源数据流分析数据结构表达模型建模方案,设计好数据表结构以后,即可展示相应的可视化方案。而读者与图书馆之间交互的含义具体表现为:单个阅读资源数据之间读者可以与之直接信息交互;面对多个阅读资源数据彼此关联的页面交互行为时,需要对任一阅读资源数据的操作行为设置为可以影响所有对应的阅读信息数据;而来源自同一阅读资源数据的不同显示内容时,可以在多视图关联操作时完成数据筛选,从而呈现出根据读者操作行为引起的特定交互推荐阅读资源数据的变化。
可视化技术的应用可以将复杂的数据信息以简单、直观的形式进行显示输出,显著提升阅读资源数据的可读性。同时,能够发挥智能标签技术的优势,根据读者的阅读需求、个性偏好对阅读资源数据进行选择性的呈现与重要程度的排列。让读者在日常的阅读浏览行为中,潜移默化地接受图书馆的阅读推荐服务内容;帮助图书馆将阅读推广服务目前硬性框架化的宣传与按部就班的活动,润物细无声地转变为引导读者阅读行为的改善,最终提升图书馆阅读推荐服务的精准性与科学性。
伴随着大数据技术的逐渐成熟,智慧图书馆在提供阅读推荐服务时面临着更多的发展机遇。从智慧图书馆阅读推荐服务的实际运行机理中可以发现,基于数据驱动,可以激活智慧图书馆阅读推荐服务对于馆藏资源数据深度挖掘的生态性。具体到运行操作层面,可以通过技术服务的数据流、内容服务的知识发现、读者服务的可视化三个途径,对智慧图书馆阅读推荐服务进行创新。本文将数据驱动与阅读推荐服务进行结合,为数据驱动视角下智慧图书馆阅读推荐服务创新提供理论与应用参考。
注释:
① 图元:一般指基本图形元素,是任何一个图形表达都是由若干不同的点线、面图案或相同的图案循环组合而成的,这些点、线、面图案即为基本图形元素。