大数据环境下高校网络导读服务新走向

2014-12-23 01:54:19王晓美
创新科技 2014年18期
关键词:图书馆服务信息

王晓美

(中原工学院图书馆,河南 郑州 450007)

大数据环境下高校网络导读服务新走向

王晓美

(中原工学院图书馆,河南 郑州 450007)

本文简述了大数据的历史、基本概念、特点、发展方向,探讨了在大数据时代网络导读服务问题面临着巨大的机遇与挑战,最后,提出了大数据时代网络导读如何利用大数据技术进行创新,从而提高图书馆的核心竞争力。

大数据;网络导读

1 大数据概述

1.1 大数据的历史

全球知名咨询公司麦肯锡第一个提出大时代来临,他称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。[1]”生物学、物理学、环境生态学、金融、通讯、军事等领域应用大数据已久,随着互联网的发展壮大,大数据的价值也逐渐被人们关注。大数据是云计算、物联网之后IT行业又一大颠覆性的技术革命。维克托·迈尔·舍恩伯格在《大数据时代》中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。

1.2 大数据的概念

目前大数据作为抽象的概念存在。著云台的分析师团队认为,一个公司创造的大量非结构化和半结构化数据是大数据的表现形式,这些数据需要有强大的硬件、软件、时间、金钱来支撑分析过程。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

互联网时代产生的大数据理解为:互联网公司在日常运营中生成、累积的用户网络行为数据。数据的规模的庞大,不能用G或T来衡量。

1.3 大数据的特点

大数据不仅是数据的庞大,用专业术语来解释共有以下四个特征:

1.3.1 海量数据。大数据的起始计量单位至少是P(1 000个T)、E(100万个T)或Z(10亿个T)[2]。大数据能计算出来吗?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生2940亿封邮件,发出200万个社区帖子(相当于《时代》杂志770年的文字量),全部内容可以刻满1.68亿张DVD。

1.3.2 类型多杂。包括blog、Email、音频、视频、图片、地理位置信息等等,IBM研究称每一天,全世界会上传超过5亿张图片,每分钟就有20小时时长的视频被分享。

1.3.3 利用价值小。如随着云计算、物联网、社交网、车联网、传感网的广泛应用,正常生活已离不开信息,信息量大,但利用价值很小,如何利用强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。

1.3.4 时效性高。这是大数据区的最显著特征。IBM的研究称,整个人类文明数据90%是过去两年内产生。十年后,全世界所产生的数据规模将达到今天的44倍。然而,即使是人们每天创造的全部信息——包括语音通话、电子邮件和信息在内的各种通信,以及上传的全部图片、视频与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。

1.4 大数据的发展方向

我们现在还处于所谓“物联网”的最初级阶段,而随着技术成熟,我们的设备、交通工具和迅速发展的“可穿戴”科技将能互相连接与沟通。科技的进步已经使创造、捕捉和管理信息的成本降至2005年的六分之一,而从2005年起,用在硬件、软件、人才及服务之上的商业投资也增长了整整50%,达到了4 000亿美元。大数据技术与应用逐渐渗透在日常生活的方方面面,不远的将来我们将迎来真正的智能电网、智慧交通、智慧医疗、智慧环保、智慧城市。谷歌通过搜索行为预测流感爆发等例子已经证明了大数据影响社会建设达到了惊人的地步。大数据不仅是美国白宫官网重点新闻报道,也成为互联网主题讲座沙龙中热议对象,被国金证券、国泰君安、银河证券等写进了投资推荐报告。《纽约时报》称,“大数据”时代已经降临,在商业、经济及其他领域中,基于数据和分析将代替经验和直觉。

2 大数据背景下的网络导读服务面临的机遇和挑战

2.1 加快导读服务技术的变革

各类数据的迅速增长对传统的导读服务能力带来了压力,传统的导读服务主要靠图书馆员已有的知识和经验推送服务,面对数量巨大,类型多样的非结构化大数据,导读服务需要依靠设计合理、分级存储能力强大的计算机系统来支撑导读推送的前提准备工作。因此,图书馆建设的硬件成本越来越大,服务设施选择趋向大规模计算机集群,这对支持非结构化数据分析与存储设施提出了很高要求。

2.2 推动导读服务模式创新

导读服务是图书馆服务的创新模式之一,传统的导读是根据馆员的个人喜好推荐一些阅读书目。大数据时代,数据成本的下降造成了数据量的迅猛增长,数据类型和数据来源的多样化加速了非结构化数据的增加,传统的导读服务常用的信息收集、整理、分析与提供利用的服务模式已经不能满足用户需求。数据分析正在向广度、深度发展,信息服务正在向个性化、嵌入式的科研创新合作交互型知识服务模式发展。大数据环境下,导读服务不仅要收集、整理、分析潜在的用户信息和结构,更要时刻关注用户的特征和需求,及时的根据统计数据提供个性化的服务,投其所好使图书馆成为真正为每个人喜欢的知识服务部门。

2.3 促进导读服务能力提高

用户数据是导读服务的重要资产,导读服务不再是提供简单的阅读和信息服务,而是运用大数据技术挖掘信息中的数据和知识内容,为科学研究提供创新所需的数据和知识。大数据时代,数据已经成为各个行业的重要资产,成为盈利和创新发展的重要因素,大数据的运用将成为未来企业竞争和决策与科学研究的重要参考条件,特别是依赖数据分析提供服务的机构,这些数据可以帮助导读服务提供更准确,更新的知识,甚至新的思路并从中获取新的洞察力,从而为用户决策和研究创新提供智力支持。导读服务自身也在大数据的开发与利用中提高了服务能力。

2.4 推动图书馆服务跨界合作

导读服务要运用大数据技术具有很高难度,数据的来源、挖掘、分析、整理、加工、利用需要专业技术人员来实现,支持大数据运行的配套设施也让图书馆无力承担。部分实力雄厚的图书馆可以独立实现这些难题,但是大部分图书馆还是中小型规模,资金、能力、人才有限,有的甚至还没建设导读服务体系,因此,利用外部力量帮助提供数据信息,也是一种实际的方法,就像图书加工外包业务已成熟一样,同社会信息类机构大力合作,整个数据分析和处理需要“云计算”技术平台的支撑和大型数据服务器集群支持,这是任何一个图书馆都无法实现的问题,因此,服务的提升依赖于社会力量的支持,带动了整个信息服务行业的发展。

3 大数据环境网络导读服务建设将如何进行创新

当前图书馆为用户提供丰富的导航条目,但图书馆导读条目局限性很多,如能够丰富这些条目,则需大数据分析结果支撑,抓住问题关键点,不仅能让导读体系更具人性化,还能提高文件检索利用率和读者阅读率。结合一些实际例子,笔者对网络导读体系建设提出如下建议。

3.1 管理格局的变更

图书馆是提供科研文献信息的主要部门,传统的职能部门不能满足大数据时代的要求,因此,成立专门的数据管理部门与机构,制定数据管理政策、统一的标准及共享平台,建立良好的运行机制,加强校内、外各部门的协调工作。如MIT、弗吉尼亚大学及康奈尔大学图书馆成立了专门的研究数据管理服务工作组。负责研究数据知识库的评估、管理、推介、导航服务等。

3.2 导读服务准确定位

图书馆作为信息服务部门必然要对全校师生进行导读[3]。如何准确定位,依赖于大数据环境下发展的新型信息资源媒体,如构建在Web2.0技术上的、允许用户创建交换信息内容的维基百科、博客、微博、社交网站等等,这些媒体依托于网络技术,以用户为中心,是人们信息交流的重要途径,通过大数据分析技术很容易收集和分析公众的喜好、预测未来发展、研究社会现象。因此,重视这类信息的结合能够准确定位导读服务对象喜好,根据喜好建设导读平台,逐级分类推送,进而提高了读者阅读率。

3.3 导读条目准确推送

电影票房高低和导演努力有关,同样导读条目受欢迎程度和导读员推送文献有关,如何提高文献关注度是关键[4]。例如,定期关注百度指数,郭敬明导演《小时代》,票房过亿,在采访中坦言会利用百度指数收集、分析粉丝数据。如分析受众的年龄、性别、教育背景、地域分布等等通过对普通大众的数据采集,郭敬明逐渐找准了观众的需求.痛点,并开始利用到电影拍摄中。

未来图书馆的核心资产也在于对大数据的综合掌握,如利用百度指数搜索《红楼梦》,地域关键词选择河南郑州,就会显示近三十天搜索指数,周六周日显示为搜索高峰点。查看需求图谱会显示需求变化,近三十天中新红楼梦,红楼梦人物、小说下载、打包下载等呈现上升需求。利用这些数据,导读员可根据用户需求来选择何时推送能提高点击率,选择何种版本和何种形式能提高阅读率。

3.4 加快云服务台建设

数字图书馆建设的重点逐渐向云服务方面发展,依托云计算技术的成熟和应用,为读者提供个性化阅读服务将更加便捷。图书馆导读服务的提高依赖于大数据分析结果,大数据分析结果依赖于云计算为基础的数字图书馆服务平台。大数据分析技术与工具的应用对图书馆人才需求提出更高的要求。例如,聚类分析、网络分析、可视化分析、数据集成、数据融合等都是未来研究的重点。

4 结语

IBM执行总裁罗睿兰认为,“数据将成为一切行业当中决定胜负的根本因素,最终数据将成为人类至关重要的自然资源。”一分钟内所产生的10万微博数据及600万社交网络数据堪称石油和黄金。因为当你在微博上抒情或者发议论时,华尔街的敛财高手们却挖掘到了免费的“数据财富”,先人一步用其预判市场走势,而且取得了不俗的收益。例如,华尔街根据民众情绪抛售股票;对冲基金依据购物网站的顾客评论,分析企业产品销售状况;银行根据求职网站的岗位数量,推断就业率;投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;美国疾病控制和预防中心依据网民搜索,分析全球范围内流感等病疫的传播状况;美国总统奥巴马的竞选团队依据选民的微博,实时分析选民对总统竞选人的喜好[5]。

一个智慧型图书馆应该未雨绸缪,为完善网络导读体系做好准备。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”

[1][英]维克托·迈尔-舍恩伯格.大数据时代[M].杭州:浙江人民出版社.2012.

[2]毛晓燕.大数据环境下图书馆信息服务走向分析[J].图书馆工作与研究,2014(3):72.

[3]姜山,王刚.大数据对图书馆的启示[J].图书馆工作与研究,2014(3):54.

[4]刘哲.高校图书馆网络导读服务现状研究[J].图书馆论坛,2013(9):99-100.

[5][英]维克托·迈尔-舍恩伯格.大数据时代[M].杭州,浙江人民出版社.2012.

G258.6

A

1671-0037(2014)09-54-2

王晓美(1982-),女,硕士研究生,助理馆员,研究方向:信息咨询

猜你喜欢
图书馆服务信息
服务在身边 健康每一天
今日农业(2019年12期)2019-08-15 00:56:32
服务在身边 健康每一天
今日农业(2019年10期)2019-01-04 04:28:15
服务在身边 健康每一天
今日农业(2019年16期)2019-01-03 11:39:20
图书馆
小太阳画报(2018年1期)2018-05-14 17:19:25
招行30年:从“满意服务”到“感动服务”
商周刊(2017年9期)2017-08-22 02:57:56
订阅信息
中华手工(2017年2期)2017-06-06 23:00:31
飞跃图书馆
展会信息
中外会展(2014年4期)2014-11-27 07:46:46
去图书馆
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32