大数据技术在图书馆智能图书采编业务中的应用研究

2022-04-13 06:42
漯河职业技术学院学报 2022年1期
关键词:编目智能化图书

李 伟

(河南科技大学 应用工程学院,河南 三门峡 472000)

近年来,我国信息技术飞速发展,各类信息数据呈现几何级增长态势,形成海量信息数据。大数据技术作为一种综合的信息数据处理工具,能够分析结构化、半结构化及异构化的信息数据,具有精准和高效的特性,已经广泛应用于信息处理和数据分析领域[1]。图书馆是图书信息采集、存储、传播、服务的主要场所,是图书信息的集散地,随着图书馆信息化建设的不断加强,其管理和服务业务都逐步走向了智能化[2]。具体到图书采编业务领域,由于电子信息资源的大量涌入,图书采编对象早已不再局限于单一的纸质文献,而是融入了包括音像产品、机读文件、电子文献、网络文献等数字资源,并且其占比在逐年增长。采编对象的多样化,迫切需要采编方式、采编途径的多元化,以及采编目录的自动化、规范化、标准化,这样才能满足读者的多样化阅读需求,保证图书馆的工作效率和服务水平[3,4]。这些数量巨大、种类多样的电子信息资源,靠人工采编是无法完成的,而大数据技术具有快速获取数据、有效分析数据、标准化处理数据的优势,使用大数据技术进行图书智能化采编,可以轻松实现多样化的图书信息采集并对其数据加以高效分析,提高采编效率[5]。因此,对大数据场域中的图书馆智能采编模式进行研究具有重要的应用价值和现实意义。

一、大数据技术及智能图书采编业务

(一)大数据技术

大数据技术,简单而言,就是从多种类型的数据中快速获取有价值的信息的技术。目前,科学技术高度发达,人与人、人与物、物与物之间的交流越来越密切,所产生的信息量巨大,在这些巨量的信息数据面前,人们需要快速有效、简单准确地挖掘出其中“有用”的信息,以获取海量数据中有利于自己使用的有价值的数据,由此而产生的数据处理技术就是大数据技术[6]。由此可见,大数据技术的实质就是对繁杂的海量数据中潜藏的有价值的数据进行提炼的数据处理技术,其核心是通过多种形式的数据挖掘来帮助人们更好地分析数据、理解数据、应用数据,有利于人们做出科学的有针对性的决策判断。经过近年来的快速发展,大数据技术不断涌现出新的技术模式,逐步形成了完善的技术体系,已经渗透到国民经济的各个领域,成为数据采集、存储、处理和展现的有力武器。

(二)智能图书采编业务

传统图书采编工作主要针对大量的纸质印刷型文献资源及少量的如音像制品等电子文献资源,采编对象结构相对简单,文献资料的分类采集、编目储存等工作主要通过机器设备辅助人工操作来完成,虽然其组织形式相对简单,但其内容却既繁琐又复杂,采编人员需要付出大量的时间和精力,工作压力较大[7]。随着计算机网络技术的快速发展,图书采编内容发生了很大变化,电子信息资源的采编业务量增幅较大,促使图书馆加强采编业务的信息化建设力度,将数字化信息技术应用于图书采编业务领域,实现图书采编业务的智能化。图书智能化采编与传统图书采编相比,具有以下优势:采编人员可以更方便地采编电子文献资源,丰富馆藏电子资源数量;拓宽图书采编渠道,实现图书的网上采编;便于图书馆之间采编业务的交流合作,实现信息资源共享[8]。基于以上优势可知,智能图书采编业务能够顺应信息化时代图书馆工作的发展变化,满足人们日益增长的电子文献阅读需求,提高图书馆的服务效率和服务质量。

二、以大数据技术构建智能图书采编系统

采用大数据采集及处理技术,借助PLC、人工智能技术,构建图书采编的智能化解决方案,加强图书资源供给端和用户服务端信息数据的分析、分类标签和建模[9],在采编系统和采编流程层面控制成本、提升效率。

(一)智能采编系统的整体架构设计

基于大数据技术的智能图书采编系统的整体架构如图1所示,主要由硬件层、逻辑层、应用层构成,各层间相互作用,共同完成图书采编功能[10]。其中,硬件层主要完成图书数据分析系统、电子书架及终端设备的信号传送网络架设,为整个采编系统提供硬件支持;逻辑层具有定位引擎功能,对硬件层提供所需逻辑服务内容,通过转换、校验、筛选等功能实现对输入输出信息的管理;应用层主要实现采编系统与馆员、读者的交互接口,满足图书管理人员及读者的需要,实现图书馆的个性化、多样化服务,同时为数据库提供安全保障。

图1 智能图书采编系统架构

(二)智能采编作业系统的构建

传统的图书采编过程,从图书拆包、验收、加工、编目、分拣、上架等操作,需要大量人工处理,而智能采编作业系统以自动化、智能化、可视化方式实现自动采编,可以解决图书积压问题,缩短采编周期;同时,大部分馆员可以脱离重复的琐碎的采编流程,把主要精力投入到资源建设、馆藏建设中去,以丰富馆藏、创新服务。

智能采编作业系统主要由验收加工、自动编目、分拣上架、可视化管理模块组成(图2)。其中,验收加工模块代替人工实现图书的验收和加工,包括拆包分送、验收贴码、封面扫描、打码盖章等子系统,通过PLC技术串联同步运行;自动编目模块基于OCR技术,通过对大量已校对编目书目数据的机器学习,准确地完成自动编目任务;分拣上架模块借鉴比较成熟的物流自动分拣系统[14],实现图书贴索书号、覆膜、分拣、上架功能;可视化管理模块搭建了智能图书采编作业流程控制中心,对整条作业流水线进行实时监督、控制。

图2 智能图书采编作业流程

三、大数据技术在图书智能采编业务中的价值体现

(一)在图书信息智能化采集方面的价值

利用大数据技术强大的数据处理及数据分析能力,构建智能化的图书信息采集系统,实现图书馆采编业务流程的智能化管理。图书馆数据收集及图书分类工作的业务量巨大,传统的信息处理系统不仅工作效率较低,而且很容易出错。而智能化采集作业实现了图书信息采集业务的智能化新业态,在图书信息识别、分类编目、典藏加工等环节更加突出自动化和规范化操作,打造了全新的图书信息采集流程和一体化的智能作业模式,能显著提高图书采编业务的综合效率,有很高的经济价值和社会价值。

(二)在采编数据智能化控制方面的价值

电子数据资源不同于单一的纸质文献,其数据量巨大且种类繁杂,进行整理和分类的难度很大,极易出现数据名称不符、数据信息不匹配、数据存储不合理等问题,对图书馆的信息管理和读者的信息查询都会造成很多困扰。而基于大数据技术的智能采编系统能够实现数据信息的智能化控制,在数据审核、信息分类、图书编目等环节帮助图书管理员进行智能化控制、标准化处理,能够高效完成数据调整和更新,提高图书馆的新型服务能力,满足读者多方位的阅读需求,给读者更好的服务体验,体现图书馆有效服务社会的价值。

(三)在采编智能化管理方面的价值

图书馆信息资源管理的效率,在很大程度上取决于信息采编业务的效率。采编业务一般包括图书预订、图书审核、图书入库等环节,现阶段,电子图书资源的融入,给图书管理人员带来了巨大的工作压力,在一定程度上影响了图书采编效率,也使采编管理工作显得尤为重要。利用大数据技术强大的数据分析能力,可以使管理人员对图书采选进行个性化设置,根据个性需求选择高质量的、适合本馆的书目;可以根据出版社、作者知名度、发行数量、市场反响等数据多维度考量,辅助分析是否值得购买;可以对采编人员的业务量和工作质量进行统计并反馈评估信息,辅助提高馆员的业务能力。因此,基于大数据技术的图书采编智能化管理,能极大地提高采编工作效率。

基于大数据技术的智能图书采编系统,通过采编作业的自动化模式,把馆员从重复繁琐的采编业务中彻底解放出来,既降低了图书加工编目的成本,也提高了工作效率。未来,随着大数据技术的进一步发展,图书自动编目、分类标引等相关数据处理的效率、准确率会越来越高,图书馆采编业务和读者服务工作的智能化管理也会更加高效,为图书馆带来良好的社会效益和经济效益。

猜你喜欢
编目智能化图书
智能化战争多维透视
国家图书馆藏四种古籍编目志疑
印刷智能化,下一站……
图书推荐
欢迎来到图书借阅角
粤剧编目整理之回顾与展望
班里有个图书角
基于“物联网+”的智能化站所初探
CALIS联机合作编目中的授权影印书规范著录
图书馆集成管理系统在藏文图书编目中的比较研究——以ILASII和GDLIS为例