大数据时代智慧图书馆建设路径分析

2014-02-12 10:53张新娜
图书馆研究 2014年1期
关键词:智慧图书馆服务

张新娜

(漯河医学高等专科学校图书馆,河南 漯河 462000)

1 大数据与智慧图书馆

1.1 大数据的含义

目前,学术界对大数据还没有给出标准的定义。维基百科将大数据定义为:大数据又称海量资料,是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营决策更积极目的的资讯[1]。一般认为大数据是一种海量、形式多样化的非结构化数据,通常与Hadoop、NoSQL、数据分析与挖掘、数据仓库、商业智能以及云计算等诸多热点话题联系在一起,具有大量化(Volume)、多样化(Variety)、快速化(Velocity)、真实性(Veracity)或者价值高(Value)的特征。国际数据公司(IDC)发布的《数字宇宙研究报告》称,2012年人类所产生的数据量为2.8ZB,并预测到2020年,全球将拥有40ZB的数据量[2]。大数据是人们获得新的认知、创造新的价值的源泉;大数据是改变市场、组织机构,以及政府与公民关系的方法[3]9。

1.2 智慧图书馆的含义

智慧图书馆是基于智能化信息技术实现以人为本、智慧化管理和服务的图书馆。芬兰奥卢大学图书馆的Aittola等发表题为《智慧图书馆:基于位置感知的移动图书馆服务》论文中提出,“智慧图书馆”(Smart Library)是一个不受空间限制且可被感知的移动图书馆[4]。董晓霞等认为智慧图书馆应该是感知智慧化和数字图书馆服务智慧化的综合,其中感知智慧化包括深刻的感知、更广泛的互联互通和基于感知的智慧化的管理和服务,数字图书馆服务智慧化是通过人和知识的融合,为用户营造一个和谐的知识生态环境,提供更高层次的知识服务[5]。 王世伟[6]对智慧图书馆进行了较为系统的论述:智慧图书馆是以数字化、网络化、智能化的信息技术为基础,以互联、高效、便利为主要特征,以绿色发展和数字惠民为本质追求,是现代图书馆科学发展的理念与实践,是未来图书馆发展的新模式。总之,智慧图书馆是广泛互联和融合共享的图书馆。

1.3 大数据推动智慧图书馆的产生及发展

从图书馆自动化发展史看,几乎每一项新信息技术的出现,都能引起图书馆界的极大关注并推动图书馆的管理与服务升级[7]。大数据的特性将决定图书馆在大数据业务和整个大数据生态系统中收集、分析、管理、存储及分配数据的方式。图书馆历来是信息技术应用的重镇,大数据时代也不例外。在大数据理论研究发面,Auckland[8]、Corral[9]等对图书馆员在大数据环境下的角色和所需专业技能做了调查与设想,认为图书馆可以在大数据时代中承担起数据管理的职责,同时通过细分这些技能并经过实证分析认为目前绝大多数图书馆员并不具备数据科学家必备的素质结构,需要加以改进。Rousseau[10]提出,包括图书馆员在内的信息科学工作者,应该在知识发现、数据挖掘和大数据社区方面发挥作用,减少科学瓶颈,推动创新应用。美国乔治敦法律图书馆在2013年1月召开的“大数据和大挑战法律和法律信息”研讨会[11]、美国顶级图书馆学期刊Library Journal举办的“Future of the Academic Library Symposium:E-Texts,Big Data,and Access”学术研讨会[12]等,讨论如何在大数据时代背景下建设未来图书馆。2012年,我国教育部高校图工委信息技术应用年会专门组织“大数据时代的图书馆知识服务创新研究与探索”的专题报告[13]。 侯经川、方静怡[14]发现,数据引证在当今大数据时代来临以及数据密集型范式兴起的背景下,被赋予了新的内涵与重要性,催生了知识计量学这一新学科。樊伟红等[15]提出,大数据可能给图书馆带来以下变革:建立各类知识服务及业务建设的风险模型、新型知识服务引擎、网络化信息资源智能组合方式,用户流失分析及价值分析、预测资源故障、智能辅助决策等。周杰等[16]将大数据时代的资源建设作为下一代数字图书馆的发展战略性措施之一。

在大数据应用方面,美国奥巴马政府将美国国家医学图书馆作为“大数据研究和发展计划”重要组成部分,并要求其“集成生物学及内部的信息(i2b2),旨在创造能够整合和交换医疗保健和生物医学研究数据的方法和工具。”[17]哈佛大学图书馆已引入大数据服务,并准备将图书大数据公之于众[18]。知名图书公司OverDrive将其长期以来同各类图书馆合作中获得的产品流通状况、读者需求状况、图书馆网站访问的拥堵状况和人口统计学等信息,提供给合作者开放存取以便从海量数据中分析特定的需求[19]。目前,中国国家图书馆正在进行面向全面数字化的一期维修改造,致力于打造大数据时代的数字图书馆[20]。清华大学图书馆在数据集成和数据挖掘两方面进行了探索和实践,尝试在大数据环境下从元数据仓储中提取关键词等信息,分析关键词走向,分析作者与合作者的关系,建立以人为中心的知识关联网络[21]。

大数据在未来会给图书馆带来革命性、持续性和创造性的变化,会对图书馆服务和管理产生重大的影响,为智慧图书馆建设提供了前所未有的机遇。作为未来图书馆的新模式,智慧图书馆将成为图书馆创新发展、转型发展和可持续发展的新理念和新实践。智慧图书馆通过提供融理性智慧、价值智慧和实践智慧为一体的公共智慧服务,从而打造更具魅力的公共文化环境和更大的信息共享空间。而分析应用大数据是获得智慧的关键、是产业创新转型的新路径、是科技创新的新范式,大数据是数字世界的智慧基因[22]。

2 基于大数据的智慧图书馆建设主要构想

2.1 实现基础设施互联、融合和共享

智慧图书馆提供智能、泛在、协同的服务,要求将图书馆、网络、数据库、物体以及广大读者统一在智能的网格中,成为联为一体的互动要素,而有效挖掘、整合和利用各互动要素所产生的海量的结构化、半结构化和非结构化数据是实现这一目标的基础。因此,打造互联、融合和共享基础设施是智慧图书馆建设的基本内容之一。大数据为图书馆重组再造以及相应的数据应用和读者咨询提供了新的发展机遇,对图书馆服务发展中的海量数据进行系统升级,加强学科信息的关联性和数据质量分析,通过海量数据的收集处理,从中获得知识和洞见并提升能力,从数据挖掘中提升图书馆服务的品质,这都将给图书馆迎来一个充满智慧的数据管理、数据服务和数据创新的时代。

2.2 提供可预见的智慧服务

大数据的核心就是预测,它把数学算法运用到海量的数据上来预测事情发生的可能性。此外,随着系统接收到的数据越来越多,它们可以自动搜索最好的信号和模式,并自己改善自己[3]16。图书馆运用大数据可以灵活方便地从已有海量数据资源中抓取有用的知识、关系、模式,建立更加灵活智能的数据资源智能组合方式;可以通过数据了解用户的行为、意愿、业务需求、知识应用能力及知识服务等需求;可以利用数据对用户的科研创新合作过程及合作交互型知识服务过程中进行分析和预测以便提供具有前瞻性服务;即时获取可分析的数据,有利于提高对用户需求预测的实时性。图书馆运用大数据可以提供大数据知识服务,大数据知识服务是在大数据获取、存储、组织、分析和决策过程中产生的,体现了在大数据管理和处理过程中对知识、服务、资源和过程等的知识服务配置和整合的能力,反映了知识服务实体或机构完成相应行业、领域、任务及预期目标的服务水平,包含了大数据知识服务全生命周期过程中所涉及的知识、服务、资源和过程等因素[23]。

2.3 构建高效的智能管理体系

图书馆不同于一般企业,它有着自己的特殊需求、资源构建方式、大数据处理需求及自身的技术条件。基于大数据的智能图书馆管理体系要具有下列特征:高度的可扩展性和灵活性,支持PB级甚至更大规模数据的获取、存储、组织、分析和决策;立基于云计算的存储和计算能力,在靠近数据的云节点上进行大数据的深度分析;有效地解决结构化、半结构化和非结构化数据的需求[24]。在满足上述条件下,图书馆可以:第一,建立各类知识服务及业务建设的风险模型。如利用分析、预测及智能辅助决策技术建立具有自身机构特色的、科学的、实用的风险模型,如数字图书馆数据安全风险评估模型,数据资源采购及应用评估风险模型,出版的收益与风险模型,知识产权风险评估模型等。第二,可以通过分析图书情报机构软件、硬件和数据资源的状况来预测可能的故障,或对于机构资源突然的波动可以帮助图书情报机构制定应对策略,如网络攻击、垃圾资源过滤、资源故障、服务需求障碍和资源波动等。第三,图书馆不仅要通过涉馆数据的整合和分析,而且要通过对实时数据如微博和短信等大量的动态数据流、动态数据、关联数据和社会网络数据等新型数据的整合和分析,及时发现有价值的知识和模式,洞察图书馆发展环境和读者需求,以智能管理助推图书馆智慧服务。

3 大数据时代的智慧图书馆建设路径分析

3.1 理性推进大数据应用,强化图书馆人文关怀

每次重大技术变革,图书馆都受到重大挑战,但每次图书馆都是通过积极运用新的信息技术进行制度创新、文化创新和技术创新。图书馆要正视大数据带来的机遇与挑战,转变思路,熟练掌握各种大数据分析技术,以最快捷的方式提供智慧服务。政府机构、图书馆联合组织、图书情报机构、相关商业机构在关键领域进行政策制定、科研投入与发展转型,通过建设智慧图书馆实现跨越式发展,把图书馆推向全新的发展阶段。

无论是文华图专“智慧与服务”的校训,还是阮冈纳赞的“图书馆学五定律”都浸透着图书馆人文关怀,Gorman提出 “图书馆学新五律”中提出“明智地采用科学技术提高服务质量(Use technology intelligently to enhance service)”[25]体现了信息环境下的图书馆人文关怀。以人为本、数字惠民是智慧图书馆的本质追求。在大数据时代,图书馆要通过倡导社会责任与社会包容的理念,抑制大数据造成的公共权力和商业资本对数据的控制权,从而维护大数据时代的信息公平;要消除大数据将造成文化滞后和社会风险,消除海量数据造成的制度解体和不确定性;要发挥图书馆在隐私权保护中的作用,来保护隐私权和数据安全。

3.2 维护并发展图书馆制度

图书馆特别是公共图书馆不仅是一种社会机构,而且是国家及其政府为了保障公民的知识权利而选择的一种制度安排。它代表的是一种社会用以调节知识或信息分配,以实现社会知识或信息保障的制度[26]。在大数据时代,维护并发展图书馆制度是建设智慧图书馆的制度保证。第一,积极推动政府和相关组织履行图书馆特别是公共图书馆治理中的责任,包括为制度供给的责任、积极回应的责任和适度规制的责任。通过制度来约束、调节和优化政府、图书馆和读者的行为,推动图书馆制度创新。第二,发挥图书馆在隐私权和数据安全保护中的作用。大数据的特性使“早期信息化时代构建的个人信息安全规则体系成了马其诺防线”[3]21,舍恩伯格提出了构建开展“互联网遗忘”运动[27]200的理念来保护隐私权和数据安全。其中,图书馆可能在建立数字隐私权基础设施、打造良性的信息生态和完全的语境化和对数字化记忆设定一个存储期限等对策中发挥重要作用。第三,构建以公共图书馆为主要角色的公共信息制度。公益信息制度是ICT和信息内容在市场领域和政府领域之外的“第三次”分配规则和机制[28]。公共图书馆制度作为官办公益信息机构相关制度,与其他类型的信息慈善捐赠制度等协同发挥作用,保障社会基本信息权益,满足中低阶层的最低信息需求,实现公平信息社会的愿景。第四,推动公共权力、公民社会与公民权利的再平衡,抵制“数据独裁”。舍恩伯格发现大数据造成的数字化记忆是一种全景控制的有效机制,可能巩固并加深现有的(不平等的)信息权力分配,进而导致数据独裁[27]141。公民社会既是沟通政府与公民的重要桥梁,也是影响政府决策的重要因素和推动政府改革的强大动力源。英国卡梅伦政府提出的大数据时代的执政纲领,强调了民间组织和政府共同开展诸如“邮局、图书馆、博物馆”等公共服务,建立“更大、更强、更好”的社会[29]。 在大数据时代,图书馆通过推动政府、公民社会与公民的良性互动从而有效抵制数据独裁,是图书馆制度创新的一个方向。

3.3 培养智慧图书馆员

英国图书馆与信息学专家约翰逊认为,任何“智慧图书馆”都需要“智慧的图书馆员”,“智慧图书馆员”的基本特征是:资质达到一定水准、致力于终身学习、社会及种族多元化、灵活性、创造力、见多识广、思想开放和参与公共生活等[30]。笔者认为,在大数据环境下,智慧图书馆员要具备准确把握用于分析和预测的大数据的范畴、价值、状态和周期的能力,熟练运用人工智能、商业智能、数学算法、自然语言理解、信息技术等多个跨学科领域的技术成果的能力,为服务对象和本机构做基于“投入—回报”的人力、物力、财力及发展张力的发展规划的能力等,最终具备建立集成化的公共智慧获取、存储、组织、分析和决策的大数据综合解决方案的能力。这些能力可以通过政府机构、图书馆联合机构、图书情报机构、相关商业机构和图书馆员的共同努力而获得。

3.4 构建基于大数据的图书馆知识服务平台

智慧图书馆的大数据知识服务平台是一个大数据获取、存储、组织、分析和决策服务资源和服务能力共享、交易和协作的智慧平台。根据智慧图书馆建设的基本要求,本文提出基于大数据技术构建图书馆知识服务平台的体系架构主要包括数据源层、大数据智能感知层、基础支撑层、数据流转层、处理工具层、虚拟服务构件层、知识服务平台层、应用层和网络传输层。构建过程中涉及的主要关键技术包括大数据管理与处理技术如Hadoop和MapReduce,大数据智能识别、传感与适配技术,大数据知识服务模式、体系架构、资源分类及平台标准规范,大数据知识服务全生命周期过程中的数据、知识、资源、能力、服务、过程和任务等资源和能力的虚拟化接入技术,大数据知识服务交易模型研究,大数据知识服务质量评价体系,支持多元化、可视化大数据知识服务终端交互技术等。

4 结语

笔者在梳理相关文献的基础上,对基于大数据的智慧图书馆建设内容进行了描述和分析。在此基础上,提出理性推进大数据应用,强化图书馆人文关怀,维护并发展图书馆制度,培养智慧图书馆员,构建基于大数据的图书馆知识服务平台等路径打造智慧图书馆。由于关于大数据技术的研究和应用只是初露端倪,笔者对基于大数据的智慧图书馆的建设也只是初步的考察,还有待进一步在实践中检验和修正。

[1]维基百科.“大数据”[EB/OL].[2013-10-09].http://zh.wikip edia.org/wiki/%E5%A4%A7%E6%95%B0%E6%8D%AE.

[2] New Digital Universe Study Reveals Big Data Gap[EB/O L].[2013-10-9].http://www.emc.com/about/news/press/2012/20121211-01.htm.

[3]迈尔-舍恩伯格,库克耶.大数据时代[M].盛阳燕,周涛,译.杭州:浙江人民出版社,2013.

[4]AITTOLA M,RYHANEN T,OJALA T.Smart Library:Location-Aware Mobile Library Service[C].International Symposium on Human Computer Interaction with Mobile Devices and Services,2003(5):411-415.

[5]董晓霞,龚向阳,张若林,等.智慧图书馆的定义、设计以及实现[J].现代图书情报技术,2011(2):76-80.

[6]王世伟.未来图书馆的新模式——智慧图书馆[J].图书馆论坛,2011(12):1-5.

[7]胡小菁,范并思.云计算给图书馆管理带来挑战[J].大学图书馆学报,2009(4):7-12.

[8]AUCKLAND M.Reskilling for research:an investigation into the role and skills of subject and liasion librarians required to effectively support the evolving information needs of researchers[M].London:Research Libraries UK,2012.

[9]CORRAL S.Roles and responsibilities:libraries,librarians and data[M]//PRYOR G.Managing research Data.London:Facet Publishing,2012.

[10]ROUSSEAU R.A view on big data and its relation to Informetrics[J].Chinese Journal of Library and Information Science,2012,(3):12-26.

[11]Georgetown Law Library.Georgetown law library symposium in celebration of 125 years:Big data and big challenges for law and legal information[EB/OL].[2013-10-9].http://www.law.georgetown.edu/news/big-data-andbig-challenges-for-law-and-legal-information.cfm.

[12]Library Journal.The third future of the academic library symposium:E-texts,big data,and access[EB/OL].[2013-10-9].http://lj.library journal.com/events/academicsymposium/.

[13]教育部高校图工委.2012年教育部高校图工委信息技术应用年会[EB/OL].[2013-10-09].http://itaam2012.lib.ustc.edu.cn/ITMeeting2012/.

[14]侯经川,方静怡.数据引证研究:进展与展望[J].中国图书馆学报,2013(1):112-118.

[15]樊伟红,李晨辉,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-68,77.

[16]周杰,苏静,曾建勋.下一代数字图书馆的发展思考[J].图书情报工作,2013(8):35-39.

[17]OBAMA ADMINISTRATION UNVEILS “BIG DATA”INITIATIVE:ANNOUNCES$200MILLIONINNEW R&D INVESTMENTS[EB/OL].[2013-10-09].White-House.gov/OSTP.

[18]WATTERS A.Strata Week:Harvard Library releases big data for its books:Harvard offers big data for books,Cloudera’s new Hadoop distribution,Splunk goes public[EB/OL]. [2013-10-09].http://radar.oreilly.com/2012/04/harvard-book-data-cloudera-hadoop-splunk-ipo.html.

[19]SPOLANKA.OverDrive announces a series of “Big Data”reports[EB/OL].[2013-10-9].http://www.libraries.wright.edu/noshelfrequired/2012/04/11/overdrive-announces-aseries-of-big-data-reports/.

[20]许娓玮.国家图书馆:打造大数据时代的数字图书馆[N].中国电脑教育报,2013-2-4(17).

[21]邓景康.大数据环境下清华大学图书馆的实践[N].中国新闻出版报,2013-8-29(005).

[22]曹磊,陈薇娜,缪其浩,等.大数据:数字世界的智慧基因[N].文汇报,2011-11-08(012).

[23]秦晓珠,李晨晖,麦范金.大数据知识服务的内涵、典型特征及概念模型[J].情报资料工作,2013(2):18-22.

[24]郭自宽,张兴旺,麦范金.大数据生态系统在图书馆中的应用[J].情报资料工作,2013(2):23-28.

[25]GORMAN M.Five new laws of librarianship[J].American libraries,1995,(9):784-785.

[26]范并思.公共图书馆精神的时代辩护[J].中国图书馆学报,2004(2):5-11.

[27]迈尔-舍恩伯格.删除:大数据取舍之道[M].袁杰,译,杭州:浙江人民出版社,2013.

[28]赖茂生,闫慧.关于中国公益信息制度的战略思考[J].图书情报工作,2011(8):5-8,61.

[29]涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M].桂林:广西师范大学出版社,2012.

[30]约翰逊,陈旭炎.智慧城市、智慧图书馆与智慧图书馆员[J].图书馆杂志,2013(1):4-7.

猜你喜欢
智慧图书馆服务
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
图书馆
招行30年:从“满意服务”到“感动服务”
有智慧的羊
去图书馆
智慧派
智慧决定成败
智慧往前冲,统计百分百(1)