大数据时代与大学图书馆服务

2016-06-29 03:14王银艳
中国现代教育装备 2016年11期
关键词:大数据数据库

唐 玲 王银艳

荆楚理工学院图书馆 湖北荆门 448000



大数据时代与大学图书馆服务

唐 玲 王银艳

荆楚理工学院图书馆 湖北荆门 448000

摘 要:通过对大数据的概念和特点的分析,概括了大数据形成的三个阶段,说明了大学图书馆应积极应对大数据时代的到来,从而更好地利用大数据为大学图书馆服务。

关键词:大数据;数据库;大学图书馆服务

随着互联网、物联网的不断发展,各种智能设备,移动终端如个人电脑、ultramobile与手机终端的广泛应用,地球上每时每刻都在自动产生数以亿万计的数据,这些数据超越了时空的限制,以结构化、半结构化、异构化的形式存在这些海量的数据通过数据的集成、存取、分析,能为社会生活的方方面面提供有价值的情报,据此做出正确的判断和决策,其准确度达93%,正因为这样,许多发达国家如美国、英国纷纷斥巨资对大数据进行研究,美国率先将大数据上升到国家战略高度,2012年3月29日奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,旨在提升利用大量复杂数据集合获取知识和洞见的能力,并为此投入两亿美元以上的资金[1]。未来大数据将像黄金和石油一样,成为人类发展的一种新资源被人们所重视,谁拥有了大数据,谁就占领了信息服务的制高点,大数据时代必将成为继信息技术革命之后第三次技术革命的浪潮,而每一次技术革命都给图书馆的发展带来深刻的变化。

1 大数据的概念、形成及应用

大数据单从字面上分析它是大规模的数据集,但它又不仅仅是一个简单的数量概念[2]。维克多·迈尔·舍恩伯格在《大数据时代》一书中明确指出:大数据时代最大的转变就是放弃对因果关系的渴求,而取而代之关注相关关系。也就是只需知道“是什么”,而不需要知道“为什么”,它颠覆了人类以前的惯性思维。大数据的特点表现在四个方面:即4V说:Volume(规模性),Variety(多样性)和Velocity(高速性)以及Value(价值性)。大数据的核心就是它的预测性。

1.1 从传统数据库到大数据

传统的数据库是先有模式,然后才有数据,而且数据的形式是一种结构性的,其特征是由元数据和对象数据构成,用SQL语言进行查询,有固定的结构和格式,便于整理,技术运用已经非常成熟。通过二维表结构来逻辑表达数据,多产生于服务器或者个人电脑,设备相对固定,比如图书馆的数字资源,超星数字图书馆,维普数据库等。而大数据是很多难以确定的、数量繁多,复杂的数据,是以移动终端如手机、平板电脑,GPS等设备为代表的结构性、半结构性、异构性的数据,是在数据出现之后,再去找寻解决问题的模式,同时这种模式又是在不断演进地动态之中。数据库里的数据通常以MB为基本单位,而大数据则常常以GB,甚至是TB,PB(1 GB=1 024 MB,1 PB=1 000 TB)为基本单位,其数据规模远远大于传统数据库,就好像一个池塘与大海的关系。在处理对象上,传统数据库是以数据为对象,而大数据是将数据作为一种资源来辅助解决诸多领域的问题,也就是人们常说的数据思维。数据不再是处理对象,而是将数据作为一种资源来协同解决诸多领域的问题,通过收集、整理和分析数据足迹,以便对社会各行各业的活动和决策进行解释、监控、预测和规划[3]。单个的数据可能发现不了事物的真实状况,但很多个数据集串联起来就能够发现问题,从而解决问题,比如证监会利用大数据发现股市老鼠仓的事件,比如企业利用大数据分析实现对采购和合理库存量的管理,了解客户的需求、掌握市场动向,避免因为盲目进货而导致的库存带来的损失。气象部门通过多年的气象资料和当时当地大气物理状况指导农业生产和人们的出行。国家安全部门通过人们一些行为来分析判断危害公共安全的隐患等等。

1.2 大数据的形成及应用

人类历史上没有哪个时期像现在这样如此迅速地产生海量的数据。移动互联网的加速发展,使得地球上每时每刻产生数以亿万计的数据,有资料显示,1998年全球网民月平均使用流量是1 MB,2000年是10 MB,2003年是100 MB,2008年是1 GB,2014年是10 GB,全网流量累计达到1 EB(1 EB=10亿GB)在2001年是一年,2004年是一个月,2007年是一周,2013年仅需一天。我国是世界上网民最多的国家,信息量呈爆炸式的增长,正在超出人们的想象爆发,如何快速高效利用大数据为人类的各行各业服务,就必须了解大数据形成的原因及背景,寻求解决大数据利用的模式和技术难题。大数据的产生及形成经历了三个阶段:第一阶段是以数据库的管理形式的运营式系统阶段,它将数据的管理变得简单易行,数据的产生方式是被动的,比如医院每个病人的病历记载数据,每个商店每条销售记录,每所学校每个学生的学业档案等,都是通过人们记载而产生的数据。第二阶段是互联网的诞生,特别是Web2.0时代为标志的主动创作型系统阶段,人们通过微博、博客记录着自己的随想、随行在互联网上传播,这种原创的、主动型的数据在网上源源不断地产生,在移动网络、智能手机等新型设备的出现之后,使得人们可以随时随地发表自己的意见。第三个阶段是感知式的系统阶段,这个阶段是以智能传感器、物联网为代表的自动数据产生阶段。遍布城市各个角落的摄像设备,对整个社会的运转进行监控,这些设备产生的数据是自动的,人们在网络浏览的足迹等,也是产生大数据的根本原因。也就是说大数据的产生经历了被动、主动和自动三个阶段,这些被动、主动和自动的数据共同构成了大数据的数据来源,其中自动式的数据才是大数据产生的根本原因。这种规模性和多样性的数据又给技术的管理和应用带来挑战和机遇。

2 大数据时代特点

在大数据时代,数据生成、存储、分析、检索、分享、消费共同构成了大数据的生态系统[4]。任何公司和个人都不可能解决大数据运用的全部问题,因此数据的采集、分析、存储、利用必然出现分工和协作。

2.1 大数据时代的分工协作

数据形成的每个过程都有不同的部门和机构来完成。数据的采集是由无数的个人、传感器和摄像头主动或被动形成,这些数据又通过云计算平台进行存储计算。数据中心通过PaaS(平台即服务)模式为数据服务商提供数据接口,而数据服务商组织专业的技术人员开发各种软件,提供解决数据分析的服务模式,并通过云计算SaaS(软件即服务)模式为用户提供服务,企业和个人可以根据自己的需要定制各种服务,获得自己所需要的答案,而不必去问询产生这种服务的各个过程。整个大数据的处理流程可以定义为在合适工具的辅导下,对广泛异构的数据源进行抽取和集成,结果按照一定的标准统一存储。利用合适的数据分析技术对存储的数据进行分析,从中提取有益的知识并利用恰当的方式如可视化技术将结果展现给终端用户。

2.2 数据交换和共享成为主流

数据的价值在于利用,而这种利用又不是孤立的,而是相互联系形成一个庞大的网络系统。孤立的数据价值必然是1+1<2,而联通的数据价值一定是1+1>2[5],数据的交换和共享成为必然趋势,任何个人和组织都不能将数据据为己有,而开放的数据意味着个人隐私的暴露,但这种损失显然小于开放带来的价值,因此许多国家纷纷制定了数据开放服务的规则和规定。美国规定政府必须向民众开放数据,并通过Data.gov网站向民众提供数据服务,英国除了规定向民众开放数据外,还鼓励“私人数据商业化”,将数据像商品和资源一样出售。

2.3 专业化的数据服务公司不断涌现

大数据的产生和发展是建立在互联网和物联网快速发展基础上的,大数据催生出大量的创新产业,相关机构不断涌现。以提供软硬件服务的系统开发商,如英特尔、IBM公司,以硬件+数据+软件提供整体服务供应商,如IBM、微软、惠普等大企业,还有的数据服务企业以直接和间接的数据提供给企业或个人来获取一定的商业价值,如国外的Facebook,Twitter等,目前,大数据的搜索服务、数据库、服务器、数据存储、数据挖掘等核心技术都被国外的IT巨头所垄断,我国的大数据布局远远落后于国外的大公司,目前主要以互联网应用服务为主,如阿里云、腾讯、百度等云计算平台。

3 大数据时代大学图书馆的功能与作用

在如火如荼的大数据时代,人们总是想用最经济的方式获取及时有价值的信息。具体来说,就是人们想在任何时候、任何地方都可以得到全面的、互动的、个性化的,有助于决策的信息服务。图书馆作为保存人类文化知识的地方,一直承担着传递信息和知识的作用。在人类从IT到DT的时代,迅速调整自己的位置,顺应时代的发展,努力从人才培养、信息检索、知识信息的搜集整理方面做好准备,图书馆和图书馆管理人员理应成为大数据时代人们获取有用信息的重要场所和运用大数据的重要帮手,只有这样才能让图书馆立于不败之地。下图是武汉大学陈传夫教授在2012年东莞图书馆年会上展示了大数据时代数字图书馆体系结构图,介绍了大数据对数字图书馆结构的改变。

大数据时代数字图书馆体系结构图

3.1 大学图书馆建成全院信息资料库

大数据时代分工协作的特点显示,任何一个公司不可能完成所有数据存储、分类、检索、清洗、应用技术等各项工作,因此高校图书馆要成为一所院校的信息集散地。高校图书馆一直都是为高校的教学和科研服务,随着互联网的广泛应用,特别是移动互联网和智能手机的出现,人们对图书馆纸质图书的依赖性越来越小,从全国各高校图书借阅率下降情况可以看出,随着公共数据的开放程度越来越大,人们随时随地的可以从互联网上下载阅读,能够不受时间地点的限制,就能够方便地获取知识。但这并不能说图书馆就此消亡,图书馆也有自己的专业优势,可以在情报信息收集、整理、检索上下功夫,成为数据专家的得力助手,建立本地化数据,这是别的单位和个人无法取代的,一方面广泛采集本学院在科研实验中的各种数据加以保存,这是科学研究的最宝贵的第一手资料。另一方面收集全院所有学生的个人信息,包括专业设置、学业状况、就业意向,作为人才储备库加以保存,为社会对人才的需求提供可靠的数据,将学校与社会对接,通过数据的相互交换达到人才培养的优化组合,这也是大数据的专业分工所赋予的责任和义务。

3.2 培训数据整理和保管人员,成为咨询能手

一直以来,图书馆的服务都是以提供一种结构化的数据为主,比如图书馆书目数据的查询、参考咨询服务、图书文献的深加工以及各种科研课题的定题服务等,但在大数据时代,数据的产生是一个动态的过程,这就为图书馆的服务提供了挑战和机遇,人们处于源源不断的数据流之中,如何帮助人们获取准确的信息,即“是什么”,而不是“为什么”,就是目前国外提出的数据策管课题之一,即数据的保存和监管,是一项有策划和策略的管理,是对系统数字进行选择、保存、维护和归档等一系列管理活动[6]。早在2008年Uribe和Macdonald就提出数据监管将得益于图书馆员传统的索引、编目和其他信息组织技术。而Lyon在2007年所提出的大学图书馆员或学科馆员是承担数据监护任务的理想人选的观点也得到了业内广泛的认同,而现有大多数图书馆管理人员显然不具备这方面的能力,需要大力培训这方面的管理和运用人才,图书馆人就必须在大数据时代早做准备,在国外,许多大学开设了相应的管理与培训课程。在国内有条件的大学也在从事这方面的教学和培训工作,只有这样我们才能在大数据时代变革中不至于惊慌失措,无所适从。

3.3 为读者进行准确的信息推送和提供个性化的服务

大数据应重点关注读者个性化阅读需求,为读者提供具有较高精细度和精确度的个性化服务[7]。为读者进行精准的信息推送和个性化的服务,就必须先了解读者的阅读行为,明确用户的阅读需求和阅读习惯。图书馆可以通过大数据中读者浏览足迹,例如浏览的网页和查阅的资料等各类行为,可以细化到一篇文章、一个词,将读者的微行为汇集到数据库,然后根据不同人群的兴趣爱好分层次的准确推送,还可以根据大数据汇制读者阅读兴趣爱好图,预测读者阅读需求表,从而为信息资源建设提供准确而可靠的依据,最终达到真正意义上为读者的需求服务,大大提高图书馆的社会效益。

随着大数据信息时代的到来,图书馆也迎来了大服务时代的到来,图书馆人必须紧跟时代的步伐,全面掌握了解大数据基本技术和原理,努力提高自己的专业能力和水平,树立以读者个性化服务和用户满意度核心价值观,真正意义上实现以人为本的图书馆服务理念。

参考文献

[1]王忠.美国推动大数据技术发展的战略价值及启示[J].中国发展观察,2012(6):44-45.

[2]李广建,杨林.大数据视角下的情报研究与情报研究技术[J].图书与情报,2012(6):1-8.

[3]孟小锋,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.

[4]薛红吉.发展大数据产业:我国能否抢占先机?[EB/OL].[2013-03-26].http://www.china-cloud.com/plus/view.php?aid=17842.

[5]钟辉新.大数据时代信息服务的发展走向以及高校图书馆应对策略[EB/OL].http://www.cnki.net?1994-2014china Academic Journal Electronic Publishing House.All rights reserved.

[6]张晓林,张冬荣.机构知识库内容保存与传播的权利管理[J/ OL].中国图书馆学报,2013-04-26.

[7]马晓亭.大数据时代图书馆数据可用性:价值、挑战和保障[J].图书馆理论与实践,2014(10):5-8.

The Big Data and University Library Services

Tang Ling, Wang Yinyan
Jingchu University of Technology, Jingmen, 448000, China

Abstract:This article generalizes the three periods of formation of big data through analysing comceptions and characteristic of it, which illustrates university libraries should reply the coming of big data actively to make better use of big data to serve university libraries.

Key words:big data; database; university library services

收稿日期:2015-12-24

作者简介:唐玲,本科,馆员。

猜你喜欢
大数据数据库
数据库
数据库
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
数据库
数据库
数据库
数据库