大数据背景下数字图书馆面临的机遇与挑战分析

2017-11-28 15:54张侠
卷宗 2017年32期
关键词:知识服务大数据图书馆

摘 要:现下图书馆表现出大数据的特性。大数据于图书管相关服务方面发挥着协助功能,但同时也暴露出一定的不足。图书馆需要聚焦知识服务的发展形势,通过全新技术的应用完成大数据解读,避免以往知识服务的不足,相对可观地获得深层次的大数据内容,使得图书馆服务实现进一步开拓。

关键词:大数据;图书馆;知识服务

1 引言

最近几年由于互联网蓬勃成长而出现了各式的数据形态,既存在以往类型的结构化数据,还包括众多半结构化以及非结构化数据。种种迹象显示出了大数据的来临,其代表的是海量数据涌入人们的生活,而从内容方面来看更是异常丰富,属于海量数据的拓展。处于这一背景之下,图书馆资源表现出了大数据的特性,基于数据的相关知识服务既获得了机会,同时也迎来了挑战。图书馆需要尽可能明确大数据的长处以及特征,解读目前知识服务暴露出的问题,研究制定全新的服务措施,帮助读者获得更贴合需求的服务。

2 大数据为图书馆知识服务再拓展提供可能

知识服务的概念为:依照用户的要求,有目的的由多类或是显性或是隐含的资源内获取整合知识,同时基于此处理用户提出的深层次问题的整个环节。 [1] 根据统计学来看,追求精准的成果就要获取更多的数据,利用优化运算的方式可以探索到全新的内容。图书馆经过多年的沉积,现已展示出大数据特征。大数据让图书馆涉及内容更加多彩,同时在运算方面速度更快,而投入量相对降低,这些均导致数据量的大幅增加。

除此以外,大数据使得数据的处理相对合理精准。移动服务大面积推广使得图书馆数据丰富,特别是非结构化数据。尽管伴随数据呈现出愈加复杂的势头,但是涉及数据类别的丰富,数据处理成果的交叉验证随之提升,因此有助于数据处理合理程度以及精准水平的提升。[2]

3 大数据时代图书馆知识服务面临的挑战

3.1 数据平台与安全技术

图书馆大多涉及的是关系数据库平台,而在常用的RDBMS之中,由新技术拓展的非结构化数据处于弱势地位,倘若继续使用RDBMS的手法控制非结构化数据,将导致存储模块的流失,过量的数据内容汇聚于同一数据库同样使得数据库读写不顺畅。现下大部分图书馆为追求便利的数据储存,因而使用了集中存储的手段,这将便于图书馆方面明确每一块工作的落实状况,还有读者使用服务项目的效果。然而由安全方面入手,此类手法暴露出不足之處。目前图书馆数据与个体的隐私以及知识产权息息相关,同时集中存储时常发生系统漏洞或者不安全因素的产生。同时,大数据涉及到的非关系数据的提升表现出非线性特点,但是现下图书馆采取的措施大多面向的是线性扩增的数据。

3.2 分析引擎与知识发现

大数据分析对实时性提出了严苛的态度,读者使用的顺畅程度会作用于图书馆服务的水平,而图书馆以往数据分析水平不足。伴随图书馆网络系统的大规模推广以及和读者越来越多的互动,动态交互数据激增。由于同时登录的读者数目增加让数据仓库处理状况不良,改善服务器缓存效果同样无法有效地舒缓此方面压力。图书馆各代知识服务在更新换代之后均将造成知识库数据源涉及单位的扩增,使得其结构愈加复杂。所以以往的查询功能朝着多表查询以及数据处理结合的方面过渡,进而数据结构于横向伸缩特性方面达到需要。而现下的图书馆信息服务网络不具备这一效果。

4 大数据时代图书馆知识服务解决方案

4.1 大数据物理存储平台

它属于图书馆大数据知识服务构造的前提,依照不同的要求解读数据储存措施还有划分数据节点。由于图书馆涉及的数据量以及类别范围的广阔使得不能通过一致的标准来实现物理存储。除去增量方面投入非关系构造HDFS以外,其他部分继续保持以往关系型构造,这属于一类相对优越的手段。关系型架构通过以往的服务器还有磁盘阵列模式组建而成,再利用RAID加以数据重建,把数据各自存储于磁盘阵列内部,同时通过SAN协议实现计算机以及存储装备二者的信息交互。此类手法已经充当图书馆以往信息服务手法实施已久,表现出相对优秀的稳定程度自己安全水平。非关系型架构HDFS对照RAID表现出一些差距,其属于一类分布型文件系统,它的中心环节NaneNode 用于控制文件系统涉及的元数据,以及控制不同数据节点DataNode ,每一DataNode就属于一个 机架,不同的DataNode利用交换机加以连通,NameNode把数据文件划分放入许多不同的DataNode内, 同时于用户涉及此方面时把DataNode下的信息汇合在一起呈递于用户。HDFS通过TCP/IP协议实现具体的连通,此类构造手段能够可观地通过集群的效果实现便捷的存储以及迅速的计算,可以面向超大数据集加以科学、可行的分布型处理。

4.2 大数据采集平台

采集平台依照图书馆使用人员反馈的需要,明确涉及的大数据源构造同时进行探究,遵循数据挑取的规则,通过专门的语言由数据库内获得目标数据,同时面向搜集的数据加以深入的处理,最终把获得的数据实现转换,依照读者提出的条件进行相关搜索以显现相关数据。

4.3 大数据组织平台

大数据组织平台囊括了关系型数据库以及非关系型数据库二者。RDBMS具有保障数据稳定、投入量有限的特点,而且其应用的比重相对较高。另一方面,当处于非结构化类型时,NOSQL数据库表现出绝佳的存储以及管理能力。由于刨除了关系型数据库涉及的关系性,因此这类数据库构造便捷,能够任意时间设置数据结构。

5 结语

由于信息技术于全球范围没推广,多种数据形态如同雨后春笋一般涌现出来。图书馆作为知识以及信息的保存以及传输的机构,处于这一时代背景之下,同样显示出了大数据的迹象。大数据时代的来临推动了图书馆持续地实现自我发展,但同时也带来了相应的问题。以往的图书馆服务手段无法与日益增长的读者需求相对等,本文由此切入,解读了将大数据投入于图书馆服务的可行性还有问题,并由此着手构筑相应平台,为图书馆的持续进步做好铺垫。

参考文献

[1]肖强,朱庆华.Hadoop环境下的分布式协同过滤算法设计与实现[J]现代图书情报技术,2013(1):83-89.

[2]李广建,杨林.大数据视角下情报研究与情报研究技术[J].图书与情报,2012(6):42-44.

作者简介

张侠(1969-),女,河南南阳人,研究生,馆员,陕西省延安市委党校图书馆,研究方向:图书管理。endprint

猜你喜欢
知识服务大数据图书馆
图书馆
从西方国家保护消费者权益政策看用户信息消费的安全管理