大数据时代图书馆如何实现华丽转身

2015-05-30 17:20覃利
科技资讯 2015年25期
关键词:图书馆服务数据分析大数据

覃利

摘 要:该文简述了大数据的相关知识,列举了网络时代图书馆的危机表现,并在此基础上提出了图书馆应借鉴大数据在其它领域的成功应用,挖掘和利用图书馆用户的非结构化数据以实现个性化的服务,从而提升图书馆的能见度、竞争力和吸引力。

关键词:大数据 数据分析 图书馆服务

中图分类号:G250.7 文献标识码:A 文章编号:1672-3791(2015)09(a)-0174-02

美国数据可视化专家尼古拉斯·费尔顿认为大数据是“超出了传统的数据管理工具处理能力的大型复杂的数据集,并通常被认为是数字时代创造大量的非结构化和半结构化数据”。随着互联网的快速发展和逐步完善,日志、微博、视频、图片、邮件的半结构化和非结构化数据快速增长。根据IDC2011年统计,每两年全球信息将翻倍,仅在2011年一年,全球被创建和被复制的数据总量为1.8ZB。到2020年这一数值估计将增长到35ZB。去年百度每天处理的数据量相当于5000个国家图书馆,阿里集团已经积攒了超过100PB已处理过的数据,等于104857600GB,相当于4万个西雅图中央图书馆,大约580亿本藏书的数据量。

为迎接大数据的挑战,各国政府和相关行业都在积极制定和布局战略规划。2012年3月,美国政府制定了一个大数据研发计划,投资额度为6亿美元,欧盟也有类似的举措。中国于2012年10月成立了以探索大数据科技为核心的大数据专家委员会。腾讯在天津建立了亚洲最大数据中心,百度创建了大数据处理中心,新浪推出了可以提供精准数据分析服务的微博产品。

随着互联网的迅速发展,拥有大量资源和数据的图书馆的使用已出现了下降的趋势,一些欧洲国家的图书馆面临着严峻的挑战。开放的网络资源和原生数字资源使图书馆资源中心地位有逐步被取代的危险;搜索引擎使图书馆书目边缘化,图书馆作为信息门户的地位在下降;类似百度知道的网络百科和咨询服务,使图书馆的参考咨询服务面临挑战;社交网络、移动互联网、电子书的出现使传统图书馆服务日益弱化,图书馆服务模式的改变迫在眉睫;在线学习和开放教育的普及也对传统的学习方式形成冲击。发现中,访问实体图书馆和网上图书馆的人数都在下降,图书馆在线咨询的数量也在减少,图书馆的发展存在着如何聚集人气、留住用户的危机问题。

在大数据时代,数据无时不在,无处不在。每个人都处于一个庞大的数据海洋中,图书馆只是这个庞大数据网络中的一个节点而不再是用户发现信息资源的唯一入口。面对图书馆危机,借鉴大数据在其它领域应用的成功模式,图书馆要积极探索以数据为基础的智能服务模式,促进知识发现,运用信息技术识别、分析并挖掘隐含在用户在利用图书馆的行为中的结构化、半结构化数据信息,了解用户的想法,推断出用户检索及阅读方面的喜好和习惯,制定战略规划,创新和重构图书馆服务体系,促进行业发展,从而在大数据时代实现华丽转身。

1 利用大数据建立“数据找人”的个性化图书馆模式,提升图书馆的能见度

大数据在利用数据找人方面有其独特优势。例如:大数据分析团队曾帮助奥巴马在2012年美国大选中大获全胜。其分析师依据选民的住址、家庭背景、家庭状况等数据分析出选民的性格特征从而有针对性开展竞选游说,以较低的成本获得了大选的成功。在“人找数据”的传统图书馆利用模式中用户往往存在如何查找的困惑。在大数据时代,图书馆是数据资源中心,应注重建设以用户数据研究为核心的个性化图书馆。图书馆应加强用户研究和交互數据的使用,通过分类和聚类、语义网和情感分析等数据处理方式进行跟踪服务、精准服务等;依据用户的喜好和需求建立用户模型,从多渠道切入用户的应用;面向不同用户提供有针对性的服务,改进用户体验,提升个性化服务的水平。努力从传统的以资源为中心的“人找数据”模式转变为以人为中心的“数据找人”模式,不断提高资源的能见度,从而提高图书馆的能见度。

虽然企业的目的是为了赢利,图书馆的目的是为用户提供公益服务,但两者在“以用户为中心”以及“如何满足用户的需求,节省用户费用”两方面具用共同点。因此,大数据也为图书馆管理者更深入、更准确地了解用户行为和图书馆资源利用情况,提高自身服务和管理水平提供了宝贵的数据和手段。例如:分析图书上架后借阅情况的变化,可以看到随着时间的变化一部分图书的流通率很快下降,而另外一部分图书流通率的变化是缓慢的,据此书籍的剔旧年限不应是一刀切而应是有所区分的。对于外借图书进行分类统计,而不只是统计一个总的流通量,可以找到借阅率非常高和非常低的图书种类,采购部门在预订时可以据此增加热门图书采购的品种和数量,减少不受欢迎的图书采购的数量和种类。

2 利用大数据分析用户的行为模式,增强图书馆的核心竞争力

淘宝数据魔方是一款基于淘宝业务数据的数据分析产品,它可以分析淘宝消费者浏览、交易、收藏、搜索等数据和消费者特性,从而掌握消费者的足迹以及消费偏好,有利于分析竞争对手,研究消费者行为,提高销售的针对性。“酷狗音乐”通过相似的用户组推断出每个年龄段用户喜爱哪一首歌,喜欢哪一类电影;“迪卡侬”可以通过其各地商店销售数据准确判断消费者对运动品牌的不同喜好,从而在全国各地智能地调整库存策略;著名的沃尔玛的“啤酒和尿布”案例通过分析消费者行为规律,找出购物之间的相关性,并调整超市商品陈列方式,从而获得销售收入的增长。

图书馆和超市有很多共同点,图书馆应把用户作为消费者看待,通过大量行为数据挖掘以了解用户的行为模式,图书馆应注重收集用户行为日志(包括用户的借阅记录、信息数据库、离线数据等),分析不同用户群体的借阅行为的差异,通过用户的检索记录分析用户的资源需求,利用用户数据库分析用户的研究动向等,以提高图书馆行业的核心竞争力。例如:解析OPAC用户检索,包括关键词的使用频率、检索命中的结果数量、点击了哪些检索结果记录及图书的预约及续借情况等,可以了解读者感兴趣的内容和检索习惯;如果某种书的预约人数较多,这意味着需要增加购买量;有些书被大量续借,则说明需要调整借还时间。

3 利用大数据抓住有效数据赢得用户,提高图书馆的吸引力

在互联网时代,即时通讯、博客、微博、微信、社交网络、搜索引擎等已成为网民使用最多的网络应用,据统计,亚马逊公司销售收入的30%来自“猜你喜欢”推荐引擎,其口号是“最成功的书籍推荐应该只有一本书,就是用户要买的下一本书”;基于社交网络的一家新创建的音乐网站利用用户关系数据,挖掘其朋友圈及音乐喜好,并积极推荐他们可能喜欢的音乐。图书馆用户的社交网络数据和利用图书馆资源的日志数据是图书馆非结构化数据的重要组成部分,在大数据库的时代应重视收集有关用户的数据,在掌握数据的基础上做好有针对性的服务,从而提高图书馆对用户的吸引力。

总而言之,大数据时代为图书馆的发展带来了新的机遇,但是用户需求和选择的多样化使图书馆服务遇到了瓶颈,图书馆应充分利用大数据技术发展的历史机遇,开发更深入、更广泛的资源集成、数据集成、知识集成、服务集成的智能成果,从而实现从资源管理到智能服务的飞跃。

参考文献

[1] 裴昱.大数据时代图书馆用户行为信息的利用方式[J].图书馆学刊,2013(8):44-46.

[2] 迟有雷.大数据如何赚钱.[EB/OL].[2014-03-12].http://www.forbeschina.com/review/201403/0031571.shtml.

[3] 2014大数据热点话题与趋势解读[EB/OL].[2013-11-05].http://www.thebigdata.cn/YeJieDongTai/7189.html.

[4] 杨颖.大数据时代何处掘金[N].经济日报,2013-01-08(6).

猜你喜欢
图书馆服务数据分析大数据
“国际视野中的大学图书馆发展研究高端论坛”综述
浅谈工匠精神在高校图书馆服务中的传承
浅谈阅读推广活动的探索与实践
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于大数据背景下的智慧城市建设研究