大数据与图书馆发展的研究

2015-12-10 15:10王筱娟
教育教学论坛 2015年32期
关键词:信息服务数据分析数据挖掘

王筱娟

摘要:大数据是近几年IT界最为流行的关键词,也是学术界的研究重点。大数据的出现,使图书馆面临着新的发展机遇。本文从大数据的概念入手,总结了图书馆中的大数据,分析了大数据对图书馆的影响,最后探讨了大数据时代图书馆面临的机遇和挑战。

关键词:大数据;图书馆;信息服务;数据分析;数据挖掘

中图分类号:G25 文献标志码:A 文章编号:1674-9324(2015)32-0210-02

一、引言

目前,大数据已经获得各行各业的青睐,各界人士已开始研究并应用大数据技术,而与大数据密切相关的图书馆的发展也受到越来越多人的关注。同时,大数据的崛起也驱动着图书馆采取措施进行积极应对。图书馆作为储存知识、传播信息和提供服务的资源库,如何采集各种载体的数据资源,并从中分析、挖掘出读者行为中隐含的结构化、非结构化数据信息,找出读者的隐性需求,继而改善图书馆的服务质量,已成为大数据时代下图书馆提高信息服务质量和改进制度建设的机遇。本文在对大数据的概念和特点认识的基础上,重点分析了大数据对图书馆的影响、机遇和挑战。

二、大数据

1.大数据的概念。大数据的概念并没有一个统一定义,只要是具备数据量庞大和数据形式多样,并且是非结构化的数据,即为大数据。大数据通常具有以下几个特点:数据量大(Volume)、种类多(Variety)、速度快(Velocity)的特点。

2.大数据的特点及技术。对于大数据的特点,业界通常用4个“V”来概括,即Volume、Variety、Value、Velocity。Volume:数据量巨大。经济的发展使各种活动及设备产生了越来越大的数据量,已从TB级别跃升到PB级别。Variety:种类繁多。数据的种类不止是结构化的,现已出现了非结构化的数据,如图书馆中读者的行为信息数据等。Value:价值密度低。价值密度与数据量密切相关,密度的大小与数据量的多少成反比。如何从海量的数据中提取出有价值的数据是数据挖掘的研究重点。Velocity:处理速度快。这是大数据与传统数据挖掘不同的最显著的特征。大数据技术主要包括数据分析、数据处理、数据挖掘、数据服务等。

3.图书馆的大数据。图书馆的业务通常包括图书的搜集、整理、管理和书刊的利用,具体包括采购、归类编目、数据安全保障、网络建设、信息咨询、图书和数字化资料借阅、多媒体服务等方面。因此图书馆每天都会产生大量的数据。现今,随着图书资源中类的多样化及图书馆新服务的开展,图书馆的大数据不只局限于结构化的数据,还包含大量的非结构化数据,例如图书馆与读者的交互信息、图书馆工作人员的工作动态以及读者对图书馆的各种信息行为都会被记录,因此就形成了图书馆大数据。

三、大数据对图书馆的影响

1.大数据将对图书馆的建设产生影响。为了满足用户需求,顺应时代的发展,数字图书馆应运而生,增加了图书资源的来源,使图书信息数据量越来越大,原始的图书馆数据管理机制已不能适应海量数据的管理需求,为此,图书馆需要重建良好的数据库体系和高质量的索引,从而可以提高读者检索数据资料的效率,并根据读者需求,利用大数据技术中的数据分析技术从海量数据中提取出有用数据。因此,图书馆应增加数据分析、数据挖掘等数据分析技术功能,从海量数据中挖掘出有用数据,提高读者的检索效率。

2.大数据对图书馆的数据存取能力提出挑战。“大”是大数据的一个重要特征,此外,大数据具有海量的数据规模、快速的数据流转和动态的数据体系、多样的数据类型、巨大的数据价值等特征。因此,如何在多样的或者大量的数据中,迅速获取信息,并对这些数据进行存储和管理成为图书馆急需解决的问题。

3.数据挖掘将成为图书馆的重要服务目标。图书馆应该面向各种学科和研究方向中不同层次的用户,应该为来自各种层面的社会群体提供服务。这也就要求图书馆可以提供更加全面而且个性化的服务,因此,图书馆应该包含各个领域的数据,并从各类数据中分析并挖掘出对读者有用的、感兴趣的数据信息,并且不断地更新服务类型,以满足用户多样化的需求。数据的搜集、存储和分析处理将成为图书馆资源建设的重要内容。

四、大数据时代图书馆面临的机遇和挑战

1.大数据对图书馆的机遇。大数据具有在多样的或者大量的数据中,迅速获取信息的能力。图书馆大数据除了馆藏资源,还包括用户的行为信息,如读者借取的书目类型、范畴、方向等。图书馆可以利用大数据的相关技术,如数据分析、数据挖掘等技术手段,分析并整合出读者近期关注的热点研究方向,为图书部门决策者提供更加有用的信息,使他们能够更快、更准确地掌握相关研究领域其他科研人员的研究进展。同时,利用数据分析和数据挖掘技术,对读者平时的检索访问历史进行搜集、分析和处理,并挖掘出有用信息,从而预测出读者的各种需求,使图书馆能够更好地为读者提供服务。

2.大数据对图书馆的挑战。大数据给图书馆带来的挑战表现在以下几个方面:(1)图书馆面临着如何应对大数据的挑战。大数据具有多样性,包括非结构化和结构化的数据,其中绝大多数数据是大小、内容、格式、用途完全不同的难以处理的非结构化的数据。图书馆面对大数据的到来,首先应该具有大数据的思维和意识,其次才能判断图书馆的发展趋势和选择应对策略,最后才谈得上技术实现的问题。大数据既不等于数据挖掘也不等于统计分析,但是这些技术和算法都需要大数据的支持。图书馆应正确认识大数据,才能对大数据的到来做好准备。(2)大数据对图书馆的数据整合、处理能力及图书馆的各种技术开发、服务提出了挑战。随着海量数据的出现,为了顺应时代发展,图书馆的改进不能仅仅停留在硬件改进的层面上,还要提出一套具体数据的分析、处理和挖掘的方法和体系,以提高全面把握和综合深入的能力。(3)数据安全、知识产权、商业利益、公共安全受损的威胁增大。大数据的发展,信息开放度加大,新的信息采集、数据分析、数据挖掘技术以及海量数据存储技术和设备将不断涌现,云计算将更加普及,这将对数据的安全构成很大的风险。

五、大数据时代图书馆的应对策略

大数据不仅仅是一项技术,更是思维方式、发展战略和商业模式。以海量的非结构化数据为代表的大量数据的产生是大数据时代的一个重要特点。对海量的、非结构化的数据进行处理,一方面需要大量的计算资源,另一方面需要专门的数据处理技能,它的到来使图书馆面临着前所未有的机遇和挑战,为此,图书馆不仅要具有大数据的思维和意识,认真分析自身现状及发展需求,还要正确认识大数据的来源和发展方向,以提高图书馆未来的发展方向,并在大数据的支撑下为读者提供更好的、人性化的服务。本文将图书馆的应对策略总结如下:大数据的获取。数据资源的获取来源包括数字数据、传统图书馆的馆藏资源和读者行为数据。现今,数字图书馆已经实现了资源的数字化和对数字资源的获取,图书馆加强了对读者行为数据的获取策略,从而分析出读者的喜好和需求,提高信息服务质量。(1)大数据的存储和分析。数据量的急剧增加,对图书馆资源的存储空间和计算能力提出了巨大的挑战,图书馆需要一些低廉而又高效的存储和计算设备,而云计算为海量数据存储和计算带来了希望,图书馆可利用云计算技术解决这一问题。(2)加强大数据的建设。为了积极应对大数据的到来,图书馆应该提高大数据建设水平,规划好一个完整的大数据处理流程。同时,图书馆应该以读者需求为导向,不断推出新服务模式,提高图书馆的个性化服务。(3)技术和管理人员培养。高技术人员和管理团队能够提高大数据的处理水平,以便更好得为读者提供服务。因此,图书馆应该为管理人员提供定期的培训,提高管理人员的专业水平。

六、结语

大数据时代的到来深刻影响着图书馆的发展,使传统图书馆面临变革,同时也是对图书馆的机遇和挑战。大数据为图书馆提供了新的视角,不仅能更细致、准确地洞察用户,而且能更深入地剖析业务工作,引导图书馆向更人性化、专业化的层面发展。即使目前还无法预测大数据在实际工作中将会产生何种具体的效用,但其独特的魅力和理念将吸引研究者进行更多的探索。

参考文献:

[1]郝志刚.大数据、云计算与图书馆[J].新世纪图书馆,2014,(6):36-39.

[2]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012,(5):37-40.

[3]李恬.大数据理念与图书馆大数据[J].新世纪图书馆,2014,(6):24-27.

[4]周加艺.大数据与图书馆服务创新[J].情报探索,2014,(6):114-116.

[5]许玲.大数据时代图书馆发展趋势分析[J].内蒙古科技与经济,2014,(10):117-119.

[6]陆静.我国图书馆界大数据研究评述与展望[J].图书馆杂志,2014,(1):20-25.

猜你喜欢
信息服务数据分析数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
公共图书馆科技创新服务探析
农业高校图书馆专利信息服务研究
基于价值共创共享的信息服务生态系统协同机制研究
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
微信公众平台在高校图书馆信息服务中的应用研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究