近五年我国图书馆大数据研究综述及展望

2017-03-12 12:47吕晓丽
兰台世界 2017年8期
关键词:图书馆资源服务

吕晓丽

(北京科技大学 北京 100083)

近五年我国图书馆大数据研究综述及展望

吕晓丽

(北京科技大学 北京 100083)

在大数据的推动下,图书馆事业取得突破性进展和业务增长点。学术界围绕大数据与图书馆融合的探索和研究不断涌现,近年来呈明显递增之势。本文基于2012年以来的大量相关文献,从以下三方面对此领域的研究进行梳理:大数据特征及其与图书馆的关系;大数据技术在图书馆各项业务中的应用;其它方面的研究,主要是借鉴国外先进经验及大数据给图书馆带来的新问题及解决方案。

图书馆 大数据 综述

一、引言

大数据的本质,就是对用户行为与特征进行分析,找出数据之间的相关关系,预判事物发展方向,继而采取相应的对策。以大数据作技术支撑,图书馆通过对读者利用馆藏资源的数据分析,从而判断读者偏好,有针对性的服务读者。2008年9月,美国自然杂志首次阐述大数据及其影响,自此,各领域开始关注和研究大数据。与此同时,国内学者开始关注并研究大数据在图书馆的应用。中国期刊网(CNKI)的研究文献显示,自2012年开始,相关学术研究初露端倪。学者普遍认为,大数据对图书馆产生的深远影响,直接表现在图书馆资源保存与整合、技术水平以及服务创新等各个方面。图书馆需要充分利用大数据的优势,主动寻求突破,推动资源整合、拓展服务空间。

二、图书馆大数据研究的阶段性进展

本文主要以中国期刊全文数据库(CNKI)为检索源,参照互联网、万方数据检索结果,检索年度为2012年—2016年,共检索到期刊论文和学位论文共计1000余篇(其中核心期刊论文218篇)。研究方向涉及大数据与图书馆各项业务的融合,包含信息(知识)服务、数据存储、数据挖掘、发展方向等诸多方面。

2012年是大数据与图书馆的学术研究的萌芽期,仅有四篇文献。主要探讨了大数据的内涵、特征及其与图书馆各项业务的关联。其中,樊伟红的“图书馆需要怎样的‘大数据’”[1]63一文,描述了大数据的特征,并与图书馆业务进行关联性分析,开启了相关研究。

2014年相关研究蓬勃发展。共有70篇核心文献。一方面,学者开始考虑大数据、云计算技术与图书馆的关系,以及这些技术如何在图书馆各项业务中充分发挥作用。另一方面,深入探索大数据在知识服务、信息服务、移动服务、资源共享、隐私保护、业务流程等图书馆各项具体业务中应用。2015—2016年是研究的拓展期。涉及大数据与图书馆论文总计为124篇,其中45篇论文均研究大数据带给图书馆的新问题以及如何解决这些问题,同时涉及图书馆运用大数据案例研究,标志着图书馆学者从理论探讨走向联系实际,寻找大数据与图书馆的最优契合方式。

三、大数据与图书馆研究的主要类别和内容

1. 大数据特征及其与图书馆的关系的研究。基于大数据特征及与图书馆关系的研究,这在2012、2013年的文献中较为多见。多位学者均从大数据的4V特征出发建立与图书馆的联系。图书馆的数据特征与有诸多相通之处,图书馆的数据类型多(读者信息;资源信息;阅读、浏览及检索记录等)、总量大(各类电子及纸质资源)、增速快且变化频繁(几乎每时每刻都在增加)。在大数据技术支持下,图书馆一方面要提取大量文献资源等结构化信息;另一方面跟踪不断变化的读者资源使用记录等非结构化信息,从而预测读者的资源偏好,提供特色化服务。计量学是图书馆研究的重要方法,传统计量学侧重于描述性研究,在大数据技术支持下,“计量”的侧重点在于对事务进行评估和预判[2]15。与此同时,图书馆也面临诸多技术问题,包括信息数据组成结构、类型格式、不断变化的存在形式等,从而导致数据存贮和数据应用愈加复杂,带来的社会问题包括解决上述问题过程中会引起图书馆服务模式、资源建设模式、管理模式与发展模式的转变[3]37。

2. 大数据技术在图书馆各项业务中应用的研究。

(1)关于信息服务的研究。信息服务是图书馆服务的重要项目。长期以来,国内图书馆提供的是以“短平快”为特征的信息服务。大数据背景下,读者需求推动图书馆提供“放长线捞大鱼”的预测性深度信息服务。2012—2016年有60余篇论文主要探讨大数据时代的信息服务。从数据的特征上看,图书馆提供的资源推介、数据检索、学科评估等各项服务,其数据类型是结构化数据,属于数据的“过去式”。在大数据技术的推动下,图书馆需要利用读者浏览资源偏好、使用资源倾向性、阅读时间、地点等诸多非结构化和半结构化数据,要提取的是数据的“未来式”。因此可以预测,未来的图书馆信息服务首先会更加注重对读者研究及交互数据,在深度分析读者数据的基础上建立数学模型,开展“精准”服务;其次,通过数据信息变化,对图书馆与读者的交互关系进行数据挖掘,预判可能发生的信息行为,开展“预测”服务;再次,图书馆之间的开放性、合作性更强,数字资源整合的力度更大,利用大数据提取高质量信息的需求会更旺盛[4]14。

(2)关于资源建设的研究。资源是图书馆的核心,资源建设永远是图书馆发展中不可回避的话题。在图书馆资源建设中大数据将发挥不可或缺的作用:大数据为读者参与资源采购提供决策性支持,大数据推动各种类型的资源整合,大数据促进资源的高效率管理等。有学者认为图书馆资源建设和利用的理论和经验已经相当成熟,大数据资源与馆藏纸质资源具有相似特点。因此,大数据资源的存储利用可以参照图书馆资源建设的共建共享模式,其核心仍旧是资源整合[5]165。还有学者预测,大数据时代的图书馆必将建立超大型元数据仓储,超大型元数据仓储相当于可以共享的大型数据库,进行资源存储与整合,建立一站式数字资源平台。同时,云服务、大数据等技术的结合能够有效构建“资源—读者”关系模型,实现资源的数字化,从而满足用户不断增长的需求[6]138。

(3)关于技术层面的研究。信息技术显然已成为影响图书馆变革的核心因素。传统图书馆的数据处理以关系型数据为主,属于“静态”分析,大数据技术下图书馆的数据处理是从大量变化的数据中挖掘核心价值的信息,属于“动态”预测,因此传统的信息技术已经不能适应这种变化。32篇论文探讨了图书馆信息技术如何与大数据同步,如何将结构化、半结构化的数据进行安全有效的存储,如何将数学模型与信息提取结合,实现工作效率的提升。图书馆信息技术与大数据的同步主要解决的是异构数据处理和集成的问题。学者提出了多种方法,有的基于NoSQL构建中间件模型[7]30;有的将非结构化数据再次细分,通过对非结构化数据融合分析进行数据挖掘和管理[8]31;有的对差异性大、数据量大的数据进行统一的格式处理,还有的把云计算、大数据、智慧图书馆、网络动态联合起来综合分析,开展图书馆服务评估。学者分别在不同层面上提供了图书馆如何存储、整合异构数据的方法,解决了部分信息技术问题,是图书馆与大数据融合的过程中取得的进步[9]89。

(4)关于图书馆管理的研究。主要包含大数据背景下的智慧图书馆管理、图书馆员管理、基于某种理论的管理等方面。①智慧图书馆管理方面,基于大数据的智慧图书馆服务方式和服务内容更具有针对性。首先对读者进行个性化服务需求分析,了解所需,对症下药,达到服务对象、管理人员、服务内容的协同一致,实现高效分析和科学决策[10]70。②人员管理方面,图书馆员是图书馆的能动因素,图书馆取得的任何进步都离不开图书馆员的努力,因此,对图书馆员进行有效管理是推动图书馆发展的前提。大数据是技术、是文化、是工作方式。一是提高图书馆员的技术水平,让他们了解什么是大数据,大数据在具体工作的应用。二是进行文化氛围引导,图书馆员的思维要转型,实现从小数据思维到大数据思维的过渡。三是加大图书馆员的业务培训,如何实现工作方式的转型,如何在资源层面、读者需求层面体现大数据优势,从实质上提升大数据时代图书馆员的素质[11]49。③基于某种理论的管理方面,有学者从自组织的角度出发,认为自组织在数据、技术、获取信息等方面给图书馆组织带来了挑战和发展机遇[12]44。有两篇论文以生命周期为视角探讨图书馆服务的周期,并基于生命周期理论构建了大数据监护系统、图书馆与读者关系的管理系统,可增强个性化服务过程中对读者的认知度,实现资源与读者关系的深度监护[13]91。

3. 其它方面的研究。主要是借鉴国外先进经验以及大数据给图书馆带来的新问题及解决方案。

(1)是借鉴国外先进经验的研究。国外图书馆对读者使用数据的研究以及资源推送等服务开展的较早,也比较系统。2007年,图书馆提供一项LTFL(LibraryThing forLibraries)服务,LTFL是LibraryThing通过存储在LibraryThing中的数据,实现读者阅读关联,提供资源导读和资源推送等服务。通过标签实现阅读的社会化关联,并获得导读与推荐服务。2000年,美国Exlibris公司推出了SFX,可以实现不同类型的数据及其与OPAC的资源整合与挖掘,实现针对读者的个性化服务[14]107。

(2)大数据给图书馆带来新问题及解决方案。大数据在发挥其优势的同时也带来了新问题,引起学者的广泛关注和探索。信息的迅猛增加会形成新的信息不对称。不同国家、地区、社会机构在收集、整理、挖掘、分析数据时在不同程度上形成了新的信息壁垒或信息差距,导致新的信息所有权的不对等。但目前对生态图书馆的危害和防范措施研究尚不深入[15]92。

四、思考和启示

近年来,大数据与图书馆的研究深度不断拓展,研究内容由理论到实践过渡,研究方法由单一向多样化发展。由此预见,一段时期内在这个领域的研究仍将会延续以下几个特征。

1. 研究深度进一步拓展。图书馆与大数据的融合是一个以技术为关键引导的非常专业的领域。在图书馆数据存储方式、数据挖掘方法、与其它信息技术的联合、具体业务融合等方面,还需要做更深入地研究和探讨。纵观图书馆各项业务,资源整合依旧是未来研究的热点。图书馆进行资源整合不仅依托于大数据技术,更重要的是以资源现状为基本条件,通过异构资源的聚类、重组,达到无缝衔接,实现传统图书馆业务与大数据背景下图书馆业务的高度融合。

2. 研究内容贴近具体业务。伴随着大数据、云计算等技术的结合,图书馆服务项目需要进一步贴近读者实际需求,贴近技术前沿、贴近图书馆具体事务。通过大数据追踪分析读者行为,图书馆将更主动地向读者推荐资源,并依托互联网、通信网、物联网进行传播,借助微信公众号、微博等即时通讯手段,达到手机、电脑等多终端接收数据,信息资源无障碍推送。相关研究如果与实践脱节,将失去其存在价值。因此,针对解决具体问题、优秀案例分析、能够实际发挥作用的研究会越来越多并成为主流。

3. 研究视野进一步国际化。2015年以前借鉴国外图书馆经验的文章较少。截止到2016年12月,有两篇文章对国外图书馆应用大数据技术进行专门介绍,提出值得我国图书馆与大数据融合方面可借鉴之处。德国卡尔斯鲁厄大学图书馆的Bibtip推荐系统是一个很好的借鉴,其实质是在OPAC系统中应用重复购买理论,对用户的浏览记录进行统计、分析检索行为。随着世界经济、文化、网络高度融合,国家之间的交流和沟通越来越多,关于借鉴国外图书馆的先进经验为我所用的研究必将呈上升趋势。

[1]樊伟红,李晨晖,张兴旺,秦晓珠,郭自宽.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11).

[2]张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报, 2012(6).

[3]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5).

[4]吴敏慧.大数据与图书馆信息服务新构想[J].图书馆理论与实践,2015(2).

[5]陈祖琴,蒋勋,苏新宁.图书馆视角下的大数据资源共建共享[J].情报杂志,2015(4).

[6]温浩宇,李京京.大数据时代的数字图书馆异构数据集成研究[J].情报杂志,2013(9).

[7]郭春霞.大数据环境下高校图书馆非结构化数据融合分析[J].图书馆学研究,2015(5).

[8]李浩.云计算、大数据、数字图书馆与智慧图书馆关联研究—用大数据打造智慧图书馆的思考[J].四川图书馆学报,2014(6).

[9]陈臣.基于大数据驱动的图书馆动态网络性能评估和服务质量保证研究[J].图书馆理论与实践,2016(8).

[10]马晓亭.基于移动大数据分析的图书馆个性化服务QOS保证研究[J].图书馆理论与实践,2016(2).

[11]杨万勤,陈霞,徐宏儒.大数据时代的图书馆馆员业务素养研究[J].山西档案,2014(5).

[12]刘小锋.大数据下图书馆知识的自组织机制[J].现代情报,2014(11).

[13]陈双飞.大数据时代图书馆基于服务生命周期的客户关系管理研究[J].现代情报,2014(5).

[14]沈杰.大数据与图书馆信息服务工作的变革[J].图书馆,2015(9).

[15]张四新.生态图书馆系统的人文架构[J].情报杂志,2005(4).

250.76

A

2016-12-14

10.16565/j.cnki.1006-7744.2017.08.26

吕晓丽,北京科技大学党委统战部,研究方向为图书情报,教育管理。

猜你喜欢
图书馆资源服务
基础教育资源展示
一样的资源,不一样的收获
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
资源回收
图书馆
招行30年:从“满意服务”到“感动服务”
资源再生 欢迎订阅
去图书馆