大数据在图书馆资源建设中的应用

2018-10-24 08:49杨晓燕
卷宗 2018年19期
关键词:数字图书馆大数据

摘 要:随着物联网,云计算等信息技术的发展,数据爆炸式增长,大数据时代到来。大数据时代的到来,对数字图书馆的信息服务产生了巨大的影响。本文在图书馆进行了大数据技术的应用研究,着重论述了如何将大数据技术融入数字图书馆信息服务。

关键词:大数据 数字图书馆 信息服务方式

基金项目:《基于大数据的民族地区文献数据挖掘分析研究》,项目编号:2017NDC131,级别:内蒙古哲学社会科学规划的青年项目

自2012年以来,大数据的概念受到了热烈的反响,它甚至比物联网和云计算还要热。有大量迹象表明大数据时代即将到来。所谓大数据,是指大数据集合,人们无法使用原有的技术来实现数据集的高效处理,可称为大数据。如何有效地从大数据中挖掘有价值的信息是研究的重点。如何将大数据技术应用于大数据时代的数据库,为用户提供更满意的服务已成为图书馆面临的首要问题。本文探讨如何将大数据技术整合到数字图书馆信息服务中,为用户提供更加满意的个性化信息服务。

一、数字图书馆信息服务体系

1)数字图书馆信息服务的概述。什么是数字图书馆信息服务?数字图书馆信息服务是搜索,收集,组织,查询和传播信息和资源,以获取各种所需信息,并生成各种多媒体资料,如数据库,因特网和电子版本。信息收集和整合活动中,用户可以获得两篇或全部文献。

2)数字图书馆信息服务的模式。数字图书馆主要将图书馆的图书转换为电子数据并提供图书检索服务。现在,每个图书馆都可以建立一个图书馆。来自不同地区不同国家的图书馆可以共同建立图书馆。这两种方法的实质是通过数据集的信息共享来共享图书馆资源。针对以上两种不同的数字图书馆建设和信息服务方式,数字图书馆管理模式可分为单一数字图书馆服务模式和多种数字圖书馆联合服务模式。

3)基于大数据的数字图书馆信息服务内容。资源发现的目标是找到更多满足用户需求的数字信息资源。在大数据环境下,通过大量技术提供用户对海量数字资源满意的数字信息资源。资源发现的内容是图书馆信息资源和用户信息资源的数字化收集。在大数据背景下,数字图书馆不仅可以提供单一的信息资源集合(包括文献数字资源,图书数字资源和视听数字资源),还可以提供用户信息资源(包括用户行为信息资源用户需要信息资源)。资源发现的方法根据发现的内容而变化。用户行为发现和用户信息需求是信息资源发现的两个主要方面。结果的差异是不同的。当然,发现的模式是不一样的。用户的行为通过各种网站的注册信息,雨用户的实时通信以及各种在线问卷调查发现。对用户信息需求的调查包括元数据存储资源的发现,基于用户数据挖掘和分析的数字资源的发现以及基于大数据决策的信息资源的发现。这些是发现用户信息的模式并被广泛使用。

二、 基于大数据的数字图书馆信息存储

在大数据时代,数字信息的容量呈指数级增长。存储的信息不再是简单书目等基本信息,而是文献的一些内部内容。数据量从MB增加到TB,甚至到PB的水平。对于数字图书馆如此庞大的数据量,如果能够高效准确地获取必要的数据资源,数字图书馆在大数据时代就必须解决这个问题。目前,现有文件存储系统的文件存储方法和检索方法尚未能适应如此庞大的数据管理要求。同时,在大数据时代,数字图书馆除了存储图书馆藏书和资源信息外,还需要存储大量的用户个人行为信息以满足用户的特定需求。这也涉及数据结构问题和大数据时代的数据。该结构呈现出多维趋势,可分为结构化数据,半结构化数据和不同结构的非结构化数据。如果解决了不同结构数据的合理存储,融合,分析和处理,图书馆在大数据时代需要解决的一个亟待解决的问题。有相关技术可以解决上述问题,包括Map Reduce技术,Hadoop技术,No SQL和云计算。

基于大数据的数字图书馆信息资源组织。数字图书馆作为一个可复用提供检索服务的庞大信息管理系统,它是大规模、分布式、有组织的和具有资源共享的数据库和知识库的集合体。对于用户而言,其并不关心数字图书馆中数字资源的具体存在形式,其只关心获取的信息是否满足自己的检索需要。为了实现用户需求和检索结果匹配的精确性,就需要两者之间具有某种“默契”。一致性匹配方式是在数字图书馆中,为了更好的为用户提供信息服务,就需要首先针对数字图书馆的馆藏资源进行科学准确合理的描述和组织,进而形成一致的、充分的、有效的、有序的和准确的组织信息,并且为用户提供可检索和可操作的交互接口,最终实现对数字图书馆数字资源充分利用的效果。同时在大数据环境下,数字图书馆的信息资源表现为数量大、结构形式多样化和数据存储分布化的特点,在这种环境下,对数字图书馆的数字资源进行一致化资源组织就尤为重要,大数据信息资源的组织流程图。

三、基于大数据的数字图书馆的信息检索

随着大数据的出现,数字图书馆主要为用户提供图书搜索服务。在大数据时代,数据更新更快。如果这些更改的数据处理得很快,则会向用户提供最新信息。检索信息是基于大数据的数字图书馆信息检索的难点和重点。

在大数据环境下,数字图书馆服务的核心是用户,需要为用户提供个性化的信息检索服务。在大数据背景下,数字图书馆的检索功能主要表现在以下几个方面:。

1)个性化搜索。数字图书馆信息检索基于对用户信息收集的分析。用户信息不仅包括用户的个人信息,还包括用户过去的行为信息。通过对用户信息的数据挖掘,可以准确定位用户的实际信息需求,并且借助现有的信息推送技术,用户可以推送所需的信息。同时,数字图书馆的搜索引擎应具备一定的智能性。根据用户输入的搜索关键词,通过智能分析,可以为用户提供按关联度排列的搜索结果,并在保证信息检索准确性的前提下改善信息。准确率。

2)实时优化需求。在大数据的背景下,数据以多维,海量化和其他特征呈现,而数字图书馆必须提供高检索率,而数字图书馆中的大量数据表示结构包括结构化数据和半结构化数据。数据和非结构化数据,到今天为止,数字图书馆中的非结构化数据的比例越来越大,大大提高了数据更新的速度。鉴于上述情况,图书馆应根据用户搜索要求和数据环境变化的变化,实时优化搜索引擎。

3)移动性需求。随着信息技术的发展,用户获取信息的方式也呈现出多样化的趋势。用户对数据采集的期望不受时间,空间和方法的限制。为了满足用户的实际需要,同时针对移动智能终端的特点,数字图书馆应该能够为移动终端提供数据检索服务。

4)智能化需求。在大数据时代,数字图书馆数据检索服务需要能够准确定位实际的信息检索需求,并能够快速选择信息检索策略,并将检索结果快速返回给用户。这需要大数据时代。图书馆搜索引擎是智能的。首先,数字图书馆的搜索引擎应该具备“机器学习”的智能功能。其次,搜索引擎应该能够通过“机器学习”过程为用户提供多样化的数据检索服务;最后,搜索引擎应该有实时更新。。

4 结束语

近年来,随着信息技术的飞速发展,数字图书馆的数据量急剧增加,数据的存储成本和处理成本大大降低,数据挖掘技术迅速发展。面对这一现实,如何正确面对信息时代的“热门话题”不能简单地得到尊重,反而需要“安静的思考”,准确地分析其利弊。引入大数据不仅是一个巨大的机会,它可能是一个巨大的挑战。可以说,大数据时代极大地提高了人们对数据的控制能力,同时也为海量数据的处理提供了新的方法和策略。到目前为止,大数据淹没了人们的日常生活。针对这一现实,图书馆如何正确合理地利用大数据技术改变图书馆原有的信息服务模式,为用户提供更好的信息检索服务,是图书馆未来的主要研究方向。

参考文献

[1]李广建,杨林.大数据视角下的情报研究与情报研究技术[J].图书与情报,2012(06):1-8.

[2]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(05):37-40.

[3]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(04):120-122.

作者简介

杨晓燕(1990-),女,汉族,内蒙古包头市人,内蒙古农业大学职业技术学院图书馆,硕士研究生,助理馆员,研究方向:云计算与大数据分析、数据挖掘

猜你喜欢
数字图书馆大数据
浅析“互联网+”时代的图书馆管理
大数据环境下基于移动客户端的传统媒体转型思路