大数据生态系统在图书馆中的应用分析

2017-12-29 08:34刘思诗
移动信息 2017年1期
关键词:数据量储存检索

叶 函 章 迪 刘思诗 周 盼



大数据生态系统在图书馆中的应用分析

叶 函 章 迪 刘思诗 周 盼

武汉东湖学院,湖北 武汉 430000

近年来,随着信息技术的不断发展,图书馆的数据信息管理面临着越来越多的挑战。从现状来看,大数据问题日益成为制约图书馆进一步发挥其功能的重要问题。基于此,对大数据给图书馆带来的挑战进行了分析,并对大数据生态系统在图书馆中的应用进行了探讨。

大数据;生态系统;图书馆

随着大数据在全球知识服务体系中的作用越来越凸显,大数据问题成为人类社会经济发展的瓶颈。要进一步推动人类社会经济的发展,就需要推动大数据的发展,解决大数据问题。在图书馆发挥其知识服务职能的过程中,随着图书馆数字化进程的加快,大数据问题给图书馆带来的压力越来越大。面对大数据问题,图书馆需要建立大数据生态系统,借助大数据生态系统,实现对大数据的有效管理,以此促进图书馆职能的进一步发挥。

1 大数据给图书馆带来的挑战

1.1 数据量的增多给图书馆现有的计算能力带来挑战

随着图书馆数据量的不断增长,数据类型的不断增多,对图书馆现有的技术能力、储存能力带来了挑战。首先,在图书馆的储存能力方面,图书馆的储存设备总量是固定的,并且图书馆储存设备以及储存容量的增加速度,远落后于数据量的增加速度,这就会使得图书馆陷入储存问题的困境。随着数据储存复杂度的不断增加以及数据类型的不断增加,现有计算机的计算能力越来越无法满足如此多与复杂的数据计算需求。其次,随着物联网、互联网等网络信息交流的便捷程度不断增加,图书馆的数据交换、读取变得越来越频繁,而数据的交换需要占用图书馆一定的储存空间,并且大量的数据交换还需要有强大的计算能力作为支撑,这进一步提高了对图书馆计算能力的要求[1]。此外,随着数据量的不断提升,数据的可信度越来越难以判别,这就对图书馆的数据分析技术以及数据检索技术提出了更高的要求。并且,随着高校图书馆职工作用的弱化,图书馆对计算机系统的依赖程度进一步加深,这使得图书馆计算能力面临的压力越来越大。

1.2 给图书馆基础设施带来挑战

数据量的飞速增长,给图书馆的基础设施带来巨大的挑战。在许多图书馆基础设施的建设中,对软硬件资源的建设从高端服务设施转向了集群化服务,并且随着数据储存结构的转变,要求图书馆的硬件储存设备以及软件系统也需要有相应的转变,这就给图书馆现有的硬件储存设备与软件系统带来较大的压力。图书馆需要根据实际的数据储存需要,建设网络基础设施与数据储存设施,通过分布式基础设施的建设,建立更加高效与灵活的组网方式与信息储存方式。大数据问题给图书馆带来的挑战还包括人员方面的挑战,大数据引起的数据储存方式的变革,以及数据处理系统上的变革,要求图书馆管理员具备信息系统以及数据管理方面的专业知识,并且还要求图书管理员具有更广的知识面,以及更高的专业技能水平[2]。

2 大数据生态系统在图书馆中的应用

2.1 大数据生态系统的应用特点

图书馆的大数据生态系统具有高度的灵活性与可拓展性,可以储存、读取PB级的数据,可以更快速地进行数据的储存与读取。在大数据生态系统中,采用的是云计算技术,可以快速地将大数据转换为单一的数据,并将这一术数据作为大数据生态系统检索的节点,同时依据这一数据节点,可以进行数据的检索与分析。利用大数据生态系统,可以解决传统系统无法处理结构化数据与非结构化数据的问题,实现图书馆储存结构的转变以及读取方式的转变,从而增加图书馆数据储存类型以及处理类型,拓展图书馆的数据处理与数据服务能力[3]。应用在图书馆中的大数据生态系统,使得结构数据与非结构数据相结合,实现了新旧系统以及新旧数据的兼容,实现了结构数据向非结构数据的转变。并且,大数据生态系统借助云计算,可以实现可视化数据查询。在数据查询中,不需要使用到本地终端,节省了图书馆的数据储存空间。

2.2 大数据生态系统软硬件结合的解决方案

2.2.1获取阶段

在图书馆应用的大数据生态系统中,实现了图书馆软硬件资源的结合,使得图书馆资源得到了更加高效的利用。在大数据生态系统获取数据的阶段,当前常用的数据检索方法为:从信息资源角度获取数据。这一数据检索方式与当前大数据的检索情况不符,在大数据生态系统中,是以用户的需求进行数据获取操作,在数据获取中,利用云计算进行数据的检索以及构建操作[4]。大数据生态系统可以判断用户的数据需求,根据用户的数据需求,自动对数据进行检索。同时,在用户检索的过程中,大数据生态系统会自动记录用户的信息获取途径以及用户的信息获取偏好,同时自助式的展开数据的收集以及显示操作,在数据获取中,也会考虑到结构数据与非结构数据的检索,并计算用户获取数据突发性与易变性的可能。

2.2.2储存与组织阶段

大数据生态系统采用了低成本集群储存方式,储存性能高,读取速度快,并且可拓展,成本低,实现了关系型数据库与云储存方式的有机结合。在大数据生态系统采用的是MapReduce并行计算模型,实现对了非结构新数据的处理,其最早适用于网络数据处理。但是在大数据的处理过程中,MapReduce并行计算模型不需要对数据进行抓取处理,在数据处理过程中,对非结构性数据进行移动计算。大数据生态系统借助强大的数据处理能力,实现数据的横向处理,数据处理效率相比于竖向处理有了极大的提高。

3 结语

随着大数据时代的到来,图书馆现有软硬件设施面临着巨大的压力,数据量的增多也给图书馆现有的计算能力带来挑战。而通过大数据生态系统在图书馆中的应用,可以在很大程度上提升图书馆的数据服务效率,并且对传统的知识服务模式也是一种创新。信息技术带给我们的机会是转瞬即逝的,我们需要站在更高的高度上,进行大数据系统的研发,从而推动人类社会经济的发展。

[1]刘健,张海涛,张连峰.图书馆知识生态系统的虚拟化封装模型构建及技术方法研究[J].情报科学,2015(2):121-125.

[2]刘小锋.大数据环境下图书馆跨边界知识自组织促进知识转移方法[J].图书馆学研究,2014(13):45-52.

[3]李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J/OL].图书情报知识,2016(2):60-68.

[4]钟静.读者购借在馆藏建设中的策略探讨与制定——以“重庆图书馆大数据分析试验系统”子项目为例[J/OL].农业图书情报学刊,2016(8):18-21.

Big data analysis of application of ecological system in the

Library

College of Wuhan East Lake,Hubei Wuhan 430000

In recent years,with the continuous development of information technology,the library data information management is facing more and more challenges.From the point of view of the current situation, the problem of big data has become an important problem that restricts the further development of the library.This paper will analyze the challenges brought by the big data to the library,and discuss the application of the big data ecosystem in the library.

big data;ecosystem;library

G250.7

A

1009-6434(2017)01-0107-02

猜你喜欢
数据量储存检索
基于大数据量的初至层析成像算法优化
冬季养羊这样储存草料
高刷新率不容易显示器需求与接口标准带宽
宽带信号采集与大数据量传输系统设计与研究
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
危险物品储存和运输安全
松鼠怎样储存食物
固定资产管理系统对物流管理的促进和发展