吴莹莹
关键词:大数据;图书馆;资源整合
摘 要:在科技力量的推动下,各级图书馆纷纷走上了数字化发展的道路。在大数据环境下,图书馆应创新信息资源管理模式,这也是图书馆未来的发展趋势。文章分析了大数据环境下图书馆信息资源管理模式的创新方式,以期为未来图书馆信息资源整合工作的开展提供借鉴。
中图分类号:G250文献标识码:A文章编号:1003-1588(2020)02-0135-02
1 大数据环境的产生以及图书馆信息资源整合重要性分析
1.1 大数据环境的产生
2012年之后,大数据越来越多地被人们所提及,并被广泛应用到各个领域中。《纽约时报》《华尔街日报》等知名报纸都刊登过与大数据有关的报道。互联网和物联网的出现产生了大量的数据信息,这些信息数据决定了某个领域的未来发展。今天的人们都处于大数据环境下,虽然真正的大数据意识还没有成型,但已成为共识。大数据(Big Data)是指多个领域中的数据迅速膨胀、变大所产生的新型海量数据信息,而真正的大数据概念并不是表面的海量数据,而是对海量数据进行的数据挖掘,从中获取更为重要的信息。
1.2 图书馆信息资源整合的重要性
信息资源整合是对所有信息资源进行聚合、融合的意思,将看似无关、实则有实际联系的数据信息整理成一个有机整体的过程和结果,最终形成一个有效的系统。信息资源整合可以被理解为是将信息资源进行优化组合的一种动态概念。图书馆的信息资源构成是将图书馆的信息进行收集、加工、利用和传播,如图书馆MARC格式目录的资源整合、图书馆自建学位论文数据库的资源整合、图书馆购买使用权的数据或视频监控数据整合、图书馆文件管理库信息资源整合以及图书馆网络虚拟馆藏信息资源等。由于图书馆各种信息的载体不同、类型不同,所涉及的资源检索程序也不同,图书馆需要把些看似无关实则有实际联系的数据整合为一个有机整体,并通过不同的使用权限,为图书馆的读者利用带来更多的便利。
2 图书馆信息资源整合的类型和模式
2.1 图书馆区域信息资源整合
图书馆的馆藏信息大体上是按照馆藏区域进行划分的,区域划分又可分为地理划分、主体划分和个体划分。
地理划分是按照不同国家的文献资源整合,这是一种宏观的信息数据,涉及全球范围内各个图书馆的信息,这种宏观信息资源整合需要保证各个环节的标准统一、协调性统一,实现全球数据信息的互通有无和资源共享。目前,“中国知网”作为我国第一大图书馆网络虚拟数据库,就是集合了多个国家文献信息的一个网络图书馆平台。“CAIJS全国高校文献保障体系”的联合编目系统通过执行Z39.50協议,也是集合了不同平台的异构OPAC数据库,建设了全国书目整合系统。
主体划分是指对不同图书馆的信息资源进行整合,对集合的信息开展信息内容发布和信息服务的工作。例如,在上海交通大学图书馆、北京大学图书馆的书目信息数据库,读者只需通过图书馆主体划分方式就能检索到图书馆馆藏数据[1]。目前,主体划分方式需要在图书馆信息平台的基础上进行数据整合,但我国很多偏远地区图书馆的网络系统比较松散,且资源利用程度不高,处于相对独立的局面,已成为制约图书馆在信息资源管理过程中采用主体划分方式的一个主要因素。
单体划分是指将某一个图书馆的多种信息数据进行整合,这种整合方式具体表现为该馆的图书内容检索、学科检索、馆员检索、跨数据库检索等。目前,大部分图书馆都采用这种划分方式,便于馆员及读者的管理和使用。
2.2 馆藏信息层次划分资源整合
按照馆藏信息层次划分是指将图书馆的数据信息进行资源层次划分后再进行检索的行为。浅度信息是指馆藏的基本信息,对信息数据并没有进行深加工,如馆藏书目、数量、分布等。层次划分的优势是查询界面简洁易懂,即使出现重复数据也很容易被分辨出来,但其缺点是数据信息整合能力弱,没有进行深度融合。
中度信息是指将馆藏的数据信息进行重复信息排除整合,提供给用户的不仅是查询界面,而且是不重复的高质量信息[2]。目前,“Web of Knowledge学术资源体系”就是采用了中度信息整合方式,提供了多个数据库的交叉检索,并且会对检索数据进行查重处理,节省了用户对海量数据重复内容的排除时间。
深度信息是指将图书馆的知识管理理念深入读者服务中,打破了每个数据库资源的分割现状,按照知识单元体的形式提供给用户。这种形式下的检索效率更快,并且融合的数据更多。
从以上分析可以看出,信息整合的层次越深,证明信息资源整合的效果越好,读者吸收和利用信息的效率越高。
3 大数据背景下图书馆信息资源管理模式创新方式
3.1 形成数据挖掘理念,扩大区域信息整合
在大数据环境下,图书馆一定要保证信息整合效率,采用数据挖掘技术,最大限度地满足读者的需求[3]。首先,图书馆要合理借鉴国外经验。在全球市场发展的环境下,图书馆作为社会文化提升的主要场所,是每个国家对外发展的文化资源和财富。图书馆要积极借鉴、吸纳、汲取国外先进的信息资源整合理念,采用信息技术和信息手段,对图书馆信息资源进行合理的开发,实现图书馆信息资源的整合。其次,图书馆要重视发挥信息资源整合的优势。目前,图书馆的优势是能够结合网络信息资源构建网络数据库,减少不必要的重复建设[4]。因此,图书馆信息资源整合要抓住资源和技术的特点,将有关联的信息进行收集、鉴别、剖析和总结,进而形成一个专题数据库,并从该数据库中提取数据挖掘技术所要用到的数据信息,便于开展今后的信息整合工作。
3.2 结合数据挖掘技术,进行深度信息整合
为了扩大区域信息整合,图书馆不仅要处理好单体划分,将本馆信息进行深入融合,还要将主体划分方式、地理划分方式融合到一起。为此,图书馆要树立数据挖掘理念,学习数据挖掘技术,提高数据整合能力。
地理划分是将全球图书馆的信息综合起来形成一个数据库,或将其他图书馆的数据平台链接到本馆的一种方式,因此图书馆要应用统计分析类数据挖掘技术。目前,有许多统计类数据的挖掘工具软件可供图书馆使用,在使用统计类数据挖掘技术时,图书馆要明确挖掘对象,针对挖掘对象进行数据统计,并选择合适的统计模型,进行分析处理和分析结果的分步验证[5]。目前,图书馆应用最广泛的就是SPSS统计分析软件,该软件通过ODBC数据库接口与图书馆的各种数据信息文件相连,并将其转换为SPSS文件形式进行数据统计,利用回归分析、相关分析、统计分析的挖掘形式对图书馆馆藏数据、使用周期、文献资源建设、借阅趋势等进行分析和判断。对于主体划分方式,图书馆要结合我国现有的信息平台,利用知识类数据挖掘技术,选择常用的关联规则、神经网络、遗传算法等技术手段[6]。关联规则是对主体图书馆的数据进行分析,让读者了解图书馆信息产生的因果关系,有助于读者从源头上选择资源内容和个体图书馆。神经网络是一种预测型模型,该模型对图书馆的读者群体进行分类,按照主题划分形式,根据不同读者群体的特点和阅读习惯等各项指标建立神经网络模型。图书馆利用神经网络模型能够更加快速地对信息进行整合处理,从中提取出相关信息,并将有用的信息提供给管理人员和读者。目前,大部分图书馆都能对自身信息进行整合,且效果较好[7]。但是,为了深度融合个体信息数据,图书馆要采用多种手段解决本馆的不确定问题,在处理过程中无需对以往数据整合内容进行技术处理和信息挖掘,而要针对某些问题找出其内在規律,用于文献资源建设、各项决策分析及知识发现。
4 结语
综上所述,信息资源整合是大数据背景下出现的一种工作需要,图书馆要根据不同信息类型、不同信息形态对相关信息进行整合。图书馆要从宏观和微观的角度规范信息资源整合的行为,宏观方面是构建全球图书馆的信息数据平台,从中汲取大量有用数据,丰富图书馆的数据信息;微观方面是图书馆的自身数据整合。大数据背景下的图书馆信息资源整合是一项系统工程,既要保证整体的战略发展方向,还要顾及局部信息的重叠。因此,图书馆不仅要重视信息资源整合模式,还要研究具体的应用技术,更好地促进图书馆信息资源整合工作的开展。
参考文献:
[1] 汤德强.图书馆馆藏数字资源安全管理措施研究[J].传媒论坛,2019(24):147-148.
[2] 张娟,邓菲.大数据环境下图书馆信息组织对策分析[J].四川图书馆学报,2019(6):11-14.
[3] 陈诗莲.新信息环境下高校图书馆资源采访优化策略[J].中国管理信息化,2019(24):157-158.
[4] 何望枝.大数据背景下数字图书馆建设面临的问题及解决[J].中外企业家,2019(36):105.
[5] 廖宇峰.基于云计算的图书馆大数据创新服务探析[J].内蒙古科技与经济,2019(22):150-151,153.
[6] 李晨,魏墨济,李宪毅.浅析大数据时代下的智慧图书馆建设[J].内蒙古科技与经济,2019(22):158,160.
[7] 王慧娜.大数据时代图书馆信息资源建设策略研究[J].智库时代,2019(47):104-105.
(编校:崔 萌)