韩佳雪
摘要:大数据在当前管理实践中的应用不但改变人们的思维模式,而且促使管理实践水平有了空前的提高,人们工作的思路和方法发生了明显的转变。在图书馆档案管理中运用大数据技术,对图书馆档案管理质量的提升和效率的提高起到了重要作用。本文对大数据对图书馆管理影响及应用进行分析,以供参考。
关键词:大数据;图书馆管理;应用
一、大数据特征
1.数量Volume
第一个特征也是最重要的,大数据描述的是大批量数据,数据量级一般可以达到PB(1024TB)级规模,根据互联网数据中心(IDC)的监测,全球在2010年正式进入ZB(10243TB)时代,2011年全球数据量将达到1.8ZB,预计到2020年,全球将总共拥有35ZB的数据量。日益庞大的数据量使得人们对数据的有效利用日益重视,从而衍生了大数据概念。大数据需要处理的是各类统计、用户行为等数据,如企业的经营交易信息、商品物流信息、社会网络交流信息、位置信息等,数据规模极为庞大,有着自己独特的处理方案。
2.多样性Variety
大数据种类繁多,在编码方式、数据格式、应用特征等多个方面存在差异性,多信息源并发形成了大量的异构数据,因此不能再用处理结构化数据的方法来进行处理。
3.速度Velocity
大数据对数据实时处理有着极高的要求,需要实时反馈结果,捕捉、分析、处理每一个瞬时出现的数据,因此通过传统数据库查询方式得到的当前结果很可能已经没有了价值。
4.真实性Veracity
大数据策略可以提供更为真实的数据,通过对大量数据的分析,在用户行为、数据总结和未来预测方面做出准确的判断,为政府、企业、科研决策提供了真实可靠的依据。
二、大数据对图书馆管理的影响和挑战
(一)海量数据处理考验图书馆计算能力
大数据时代背景下,各类数据量迅速增长,数据产生的方式、范围发生前所未有的变化,人们在社会中的各类行为都产生了大量的信息数据,信息数据的组成结构、格式类型、存在形态等都更加复杂。图书馆要对上述复杂的数据进行应用、存储,将具有很强的挑战性,不仅仅涉及云计算、大数量级数据存储等技术问题,还可能促发图书馆服务模式、资源建设模式、管理模式与发展模式的转变。
(二)数据分析方式转变带来的挑战
随着图书馆信息化程度的提高,以互联网信息搜索、查询为基础的知识服务逐渐被更多的图书馆所采用。但不管是简单的信息服务,还是结合了信息检索、组织、分析等高级业务服务,都可归纳为就数据而进行的服务。大数据时代背景下要求图书馆不仅需要通过结构化数据了解客户需求,也需要大量的非结构化数据、半结构化数据去挖掘、预测和分析当前和未来的用户需求,社会大众的需求也将随着不断变化的个性化的高满意度服务出现而对图书馆的服务呈现出明确和迫切的需求。满足用户的需求,提供复杂数据的处理也将成为大数据时代图书馆的发展方向,如何处理好数据分析,将直接影响图书馆的生存与发展。
(三)大数据对图书馆基础设施提出更高的要求
半结构化及非结构化数据的迅速增加,导致数据存储、计算规模越来越大,其成本急剧上升。很多知识服务机构出于成本的考虑将应用由高端服务器转向中低端硬件构成的大规模计算机集群,从而对支持非结构化数据存储及分析的基础设施提出了很高的要求。
三、圖书馆应用“大数据”的策略建议
1.对大数据的存贮、分析、处理能力应提高
其实数据不一定非要用阿拉伯数字来记录,如:文字、音频、视频都是其常见格式。图书馆的大量数据应分为两部分存储,一部分考虑到光盘存储对数据存储本身而言具备离线存储功能,稳定,不易遭到破坏与攻击,以光盘的形式存储;另外考虑到硬盘存储速度更快、联网更方便,以硬盘形式存储。以往,图书馆的数据处理牵涉的大部分是结构化的数据信息,可供分析的数据比例不大,要想从中挖掘出十分有价值的信息难度较大。大数据时代的到来,它的特征与优势促使读者的信息化需求发生变化,用户迫切需要图书馆提供智能化、个性化的服务。图书馆应及时改变数据处理范围和方式,利用现有条件挖掘潜力,对读者的借阅记录、信息行为、微博等各类数据进行深入分析,挖掘出有价值的信息。改善基础设施,提高服务方案,提高对大数据的分析和处理能力,提高服务效率。
2.图书馆面临硬件基础设施和技术人才的挑战
大数据时代,图书馆需要拥有经济、高效的存储和计算能力来存储和分析各类读者用户的信息,这需要建立在拥有较先进、完备的硬件基础设施和信息技术人才的基础之上。
3.图书馆应用大数据存在的隐私问题及解决办法
随着互联网的发展,读者在不同的地点会留下越来越多的数据痕迹。既要提倡数据共享,又要防数据被滥用。虽然全国人大已经通过加强网络信息保护的决定,使大数据的挖掘与利用有法可依。但还是希望早日出台“信息公开法”以适应大数据时代界定数据挖掘、利用的权限和范围;另一方面图书馆员自身应该树立良好的职业道德,在工作中高度关注和重视大数据的隐私问题,坚决维护用户的隐私权,这样才可以使读者的个人信息在合理、合法的范围内有效传播,以达到在充分发挥大数据优势的同时,又不侵犯用户隐私的共赢目的。
4.应用大数据图书馆应构建网络安全整体架构
Web服务作为图书馆数字化的重要组成部分,它为最终用户提供了访问图书馆资源的重要接口。但是由于安全定位不同,使得传统的IPS或防火墙无法真正做到完全理解HTTP,不能有效地保护Web应用业务安全。图书馆应采用专业级的Web防火墙对Web网站进行Web应用安全防护,来阻断如SQL注入、远程文件包含、脚本……,schema中毒、cookie中毒、以及其他Web应用攻击的威胁,保护这个重要的入口。这样就可以保证Web应用程序安全性的同时还可防止敏感的数据库内容外泄,为图书馆Web应用提供了专业级的应用安全防护。
结束语
随着大数据时代发展,传统图书馆模式的转变,管理的内容和方式不再局限于大量的人力物力财力在纸质图书的收藏、分类、整理、借阅等等方面的工作,而是更多的转向了提升管理者的职业素质,提高管理者的科研能力,转变管理者的管理思路和管理方式,使更多科研人员可以随时随地、多手段、多方式的获得各种数据和信息,并且使得信息数据易读取易存储等特点,图书管理的发展改革必将随着大数据时代的发展进入一个更光明的时代。
参考文献:
[1]尹全勤.基于大数据的高校智慧图书馆建设研究[J].科技传播,2019,11(12):163-164.
[2]肖玉.大数据处理在高校图书馆信息化管理中的应用探析[J].现代信息科技,2019,3(11):117-118+122.
[3]王迪,陈妍.浅谈油田图书馆管理系统[J].兰台内外,2019(16):52-53+76.