大数据对高校图书馆的影响与挑战

2016-03-16 11:30
关键词:服务体系高校图书馆大数据

南   楠

(三门峡职业技术学院 信息传媒学院,河南 三门峡 472000)



大数据对高校图书馆的影响与挑战

南 楠

(三门峡职业技术学院 信息传媒学院,河南 三门峡 472000)

摘要:随着各高校图书馆的逐渐公众化,高校图书馆联盟的建立,大数据的浪潮也渗入其中。高校图书馆将在服务体系的建立,网络安全的保障,数据的存储、分析与挖掘等方面受到影响,面临新的挑战。在大数据的时代背景下,异构化数据的处理将是高校图书馆的重点工作内容,通过大量非结构化数据分析、提取潜在规则,为高校图书馆的发展与未来服务体系的改革提供重要参考依据。

关键词:大数据;异构化数据;服务体系;高校图书馆

网络迅猛的发展使人们的生活进入数字化时代,人们每天都在使用已有数据和产生新的数据。数据以几何倍数的增加与资源日益减少形成强烈对比,然而产生的大量数据中仅有三分之一被利用,剩余数据中有用信息量甚至远高于被使用数据,这就是数据挖掘的意义所在。

高校图书馆的资源公开化,高校图书馆联盟的建立,使其相应的用户和资源都在迅速增长。作为知识的储备库,高校图书馆更面临着巨大的影响和挑战。服务模式的转变,知识体系的重构,网络安全的保障,都需要面对和解决[1]。如何利用大数据去提取、分析、挖掘高校图书馆庞杂的数据信息,为用户提供更具人性化的主推式服务,已成为大数据时代下高校图书馆可持续发展的重要方面。

1大数据时代背景

1.1大数据的特征

最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”大数据并不是简单地指庞大的数据量,与以往时代不同,它具有明显的四大特点:第一,庞大的数量级。大数据的基本计量单位都是从PB开始的,随着各种社交、购物网络的发展,云计算、物联网技术的出现,量级已达ZB[2]。目前,一些高校图书馆的数量级已达PB,并仍在不断攀升。第二,数据种类多,异构化数据占据主导位置。数据不再是单一结构,可能是结构化、非结构化的,也可能是混合模式的,综合时间、空间、传输特性等多种因素的数据将大量存在。第三,价值密度低。单一数据本身价值不一定高,汇聚成一定规模后,其隐含价值远高于本身数据价值。第四,时效性高。大数据要具备高效、实时的处理能力,针对随时产生的数据即刻给予分析、处理,大数据的重点作用就是其预测、创新能力,滞后的分析结果毫无意义。

1.2大数据的处理流程

大数据的处理流程分为三个阶段:收集数据,分析数据,提取规则。

(1)收集数据。如何能充分利用和挖掘大数据的潜在价值,数据的选择非常重要。理想条件下大数据的样本不应该是抽样,而是包含全部数据,但实际中受软硬件的制约,数据在处理前经过了多重筛选,不同数据的选取对结果的影响是巨大的。目前可以使用统计网站流量、关键词控制、外部统计工具等。

(2)分析数据。筛选过滤后的样本数据将进入到分析数据阶段。这个阶段中一般将利用数据挖掘、数理统计、机器学习等技术对样本做出相应处理,同时要兼顾几个方面的问题:①如何选取最优的处理技术。②算法的改进。大数据的实效性使算法不可能永远一样,根据不同数据和用途,对已有算法进行改进,平衡算法的准确率和实时性,提高分析能力。③评价准则。对算法产生的数据结果应有一个评价指标。算法改进是否成功,与原始方法相较是否有优势,在评价指标中都应给出确切显示。

随着甲醛的话题不断被炒作,消费者关注热度的不断提升,部分商家很快嗅到了产品的宣传点和卖点,开始在产品的广告宣传中加入“无醛”或“0醛”等字眼来吸引消费者。消费者在购买产品时,无法识别产品是否环保,在很大程度上会被一些设计精妙的广告宣传所蒙蔽或欺骗。此前,所有商家的无醛宣传都存在同一个问题,就是没有依据,国家层面和行业层面都没有相关的标准规定什么样的产品算是无醛产品。因此,木制品市场和人造板行业都急需一个标准来规范无醛人造板和制品的生产、检测和标识,消费者也在寻求能予证实绿色环保家居建材产品的方法或可信赖的标志。

(3)提取规则。大数据处理结果的显示也是多样化的,不仅局限于传统的数字、文本形式,应具有更形象的展示方式,如指数曲线图、视频、动画演变等可视化技术,使用户更能直观地体验与了解。

2大数据应用范围

大数据时代就应该用大数据的思维去解决问题,首先需要明确的就是大数据能干什么,即大数据的应用范围。在大数据时代,因为互联网的关系,所有的数据都透明化地摆在了所有人的面前,这些千门万类的大数据都能干什么,会创造出怎样意想不到的价值,都是需要深入研究和开发的。

目前为止,大数据的应用根据其使用程度可划分为三类:(1)拥有大数据,但无法完全利用。这类主要是指政府部门、银行、通信行业等。(2)无大数据,但能间接推动大数据的使用。这类主要是指IT服务行业、咨询机构。(3)有数据,基本能使用大数据产生价值。比如百度、淘宝、京东等互联网企业。

大数据的应用中,会发现很多本来毫无关联事物之间的因果关系,从而产生利益,这就是大数据最大价值所在。政府利用大数据实现市场经济调控、国防安全预测、城市交通疏导;医院利用大数据提升医疗服务,改进治疗方法,跟踪患者病情及时提供必要帮助;企业利用大数据制定有针对性营销方案,有效降低成本,提高销售率;金融机构利用大数据根据用户存款记录、信誉度等推荐相关理财产品,提高存款率;电商业利用大数据根据用户购买记录与访问记录推荐相关类别商品,提高购买力度;娱乐业利用大数据预测电影、艺人、栏目的受欢迎程度,并为制片人评估投入一部影视作品的最优资金,保证基本利益;社交网络利用大数据为用户推荐与之兴趣相近,或有可能认识的人,同时根据其浏览信息作相应推广[3]。

其实,大数据的应用远远不止这些,已开发的和未开发的领域都十分广阔。在未来的生活中大数据的身影会无处不在。发展在继续,以知识发现知识,以知识创造知识,无处不在的大数据很快将会渗透到我们生活的每一分一秒和生活的每一个角落。

3大数据对高校图书馆的影响与挑战

高校图书馆作为一个知识基地,随着面向公众开放与加入高校图书馆联盟后,其信息服务机制,数据存储、管理与保护方式整体都受到了大数据的冲击与挑战。不同读者对知识的需求模式也在多元化,各种需求间的独立性与联系性都需要大数据去分析挖掘,才能使高校图书馆保持正常的服务。大数据对信息服务业带来的影响与挑战促使高校图书馆必须要从海量的大数据信息中快速、准确地把握读者的个性化需求,提高服务质量,确保其长期、良性的发展、存在[4]。根据现有大数据特点,对高校图书馆的影响与挑战主要有以下三个方面:

3.1数据类型多元化

大数据与传统数据最大的不同就在于其结构的复杂性,一般的数据形式都是单一的、相对独立的,而大数据是结构化、半结构化与非结构化数据的总和。据互联网数据中心2013年给出的数据显示:每年全球数据量中只有17%是结构化数据,83%左右是非结构化,这些数据的处理与充分利用才是大数据时代下所要完成的工作。

高校图书馆中传统的数据主要是纸质和电子文档、简单的管理数据库,但在大数据下,数据的类型也变得多元化。除基础性电子文档,管理数据库的存在,还产生了其他一些非结构化数据,例如在一些高校图书馆中,提供的服务有临时阅读和借阅的模式,借阅读者的信息会直接保存在数据库中,但临时借阅的读者数据会通过在图书馆各个角落安置传感器,随时反馈读者的阅读信息,这部分产生的数据就是一种非结构化的;还有知网是高校图书馆的重要应用之一,科研、学术都对其有了更高的要求,推荐给读者与之搜索相关度较高的文献也是大数据的工作内容[5]。数据类型的多元化对高校图书馆提出了更高的要求,是发展中必须考虑的问题。

3.2存储能力高要求

大数据的独特架构促使其对存储能力要求不断提升。高校图书馆从传统纸质型转向数字型后,存储能力的提高也是面临的一个挑战,软硬件的发展都是由数据的需求而决定。高校图书馆因是非营利性机构,基础设施的条件都会受资金的影响,大数据的增长速度每天都是几何倍数增长,最小的存储单位都是PB级。需求的增长要求存储容量、传输速率和计算能力都应增强。早期采用DAS技术,该技术在存储上要求服务器与客户端1∶1配比,无共享性,管理维护难度大;近期一般采用NAS与SAN技术存储数据,SAN技术的优势是存储容量大,可扩展性好,但计算性能稍弱,系统安装复杂,成本高;NAS技术也能存储大容量数据,具有较好的扩展性,且系统安装简单,但安全性较弱。大数据时代对存储能力的性能要求更高,结合自身条件,选取一种适合的存储技术,制定出一个长远的可行性规划并按规划进行实施,是高校图书馆建设前期的首要任务[6]。

3.3服务体系高标准

图书馆的基本工作内容还是服务大众,满足读者不断变化的信息需求。高校图书馆的信息资源量大,具备大数据的特征,将大数据引入到高校图书馆,更能改善服务体系,提高服务质量。大数据环境下,高校图书馆的主服务模式也受到了影响,信息服务的重点内容变成了对大数据的分析。由于异构化数据占大数据的比重日益增大,处理难度也相对增加,如何分析处理好这些大数据,快速提取,准确地满足用户可能存在的需求,制定个性化信息服务,才是大数据下高校图书馆的新型服务体制。

大数据环境下高校图书馆的服务体系必须具备高效、快速的反馈能力。建立的信息服务模式一般有以下几种:基于数据整合的一站式资源服务、基于数据分析的学科知识服务、基于数据应用的信息可视化服务和基于数据挖掘的智慧服务。

大数据环境下,高校图书馆从封闭的服务模式转变成开放的模式,从现实转变成虚拟,服务的对象也从人对人转变为人对数据。基于大数据的高校图书馆服务体系目前应该从信息、数据、知识、智能四个方面制定体系。

4大数据时代高校图书馆可采取对策

高校图书馆前所未有地受到大数据的影响与挑战,促使其制定相应的对策积极应对这一挑战。高校图书馆应使用专门技术人员管理大数据,对大数据管理制定统一管理政策,平衡与大数据有关的工作内容。具体对策如下:

4.1引进专门技术人员管理分析大数据

大数据时代,高校图书馆的生存必须依靠一大批懂技术的专业人士作为支撑,不能只依靠几个基本的管理人员,信息化服务占主要内容时,技术人员的作用性尤其重要。要想使高校图书馆持久、稳定地发展下去,核心竞争力就是拥有大数据的比拼,数据的规模、数据的获取、管理、分析、提取利用等专业工作都需要懂技术懂大数据的人员来操作。传统的高校图书馆管理人员较多,一般只有少数技术人员甚至没有,这些在大数据时代都已不能满足读者多元化、个性化的需求,引进大数据技术人员及时解决各种供需矛盾势在必行。

4.2异构化数据的处理

异构化数据将是大数据的主要体现形式。早期的单一文本、视频、图片数据占有比重大幅下降,混合模式数据逐渐占据主导地位。高校图书馆中生成的大数据一般都与读者需求密切相关,解决此类问题的常用方法是基于内容过滤和协同过滤推荐法。两者都是根据读者的历史记录,进行针对性推荐。基于内容过滤法主要是考虑读者对信息内容的关注度,对某一类图书内容关注度高的进行推荐,但会忽略掉评价体系中没有但读者可能感兴趣的部分。基于协同过滤法是考虑读者对某类图书的关注度,并没考虑到书中的实际内容,根据对相同类型图书的兴趣变化进行推荐,但对数据的真实性无法辨别。目前一般都是采用混合两种算法的模式,根据读者使用记录,对大数据进行分析、挖掘制定出合理的个性化服务。

4.3安全防范机制的强化

数据存储后的安全保障也非常重要。读者的个人信息,图书馆中的珍贵馆藏,一旦泄露都将造成无法挽回的损失。高校图书馆的数据保护应该在人力和技术方面有所加强,在不暴露隐私的前提下去挖掘、使用大数据,安全、有效地确保信息的完整性。

高校图书馆的安全防范机制采取的措施可以从三个方面入手:一是加强权限管理,不同用户授予的权限严格控制,较高的权限尽可能少的人拥有;二是加强网络安全防范,采用数据加密,建立防火墙,建立及时可靠的应急响应系统等;三是树立良好的服务形象,合理合法使用读者信息,提升服务机制。保证既有效使用大数据,又不泄露读者个人信息的双重目的。

5结语

大数据时代的到来对高校图书馆的存在与发展带来一定的冲击,对人们熟知的服务体系与知识展示方式带来革命性的变革,同时对现有技术与方法提出更高更严的要求。通过近几年对大数据的分析研究,一些基础理论方面如数据捕获、存储、分析与提取过程中,对相应的数据模型、计算能力、智能辅助系统和知识服务体系都会出现更多的新技术与模式。

高校图书馆对大数据的引入势在必行,而大数据对高校图书馆工作变革的影响也是不可估量。尽管目前可能会出现工作、生活、用户隐私、信息保密会暴露的潜在不安全因素,但随着技术的逐步进步,未来大数据技术带给高校图书馆的利益远大于其存在的问题。在未来,高校图书馆如何更好把握新时代契机,将大数据技术充分利用,消除其不利因素,深度挖掘其潜在价值,将是我们今后的重点研究方向。

参考文献:

[1]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2015,(5).

[2]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013,(4).

[3]李凤念.大数据时代高校图书馆受到的挑战及其发展策略[J].农业图书情报学刊,2014,(3).

[4]刘晓穗.大数据时代普通高校图书馆的发展策略[J].河北科技图苑,2014,(11).

[5]韩雪.大数据时代的高校图书馆建设[J].图书馆论坛,2014,(8).

[6]张文彦,武瑞原,等.大数据时代的图书馆初探[J].图书与情报,2012,(6).

责任编辑:李增华

中图分类号:G250.7

文献标志码:A

文章编号:1674-6341(2016)01-0126-03

作者简介:南楠(1981—),女,河南洛阳人,讲师。研究方向:计算机网络、自动化控制。

收稿日期:2015-11-19

doi:10.3969/j.issn.1674-6341.2016.01.054

猜你喜欢
服务体系高校图书馆大数据
智慧出行,智绘未来——新一代出行服务体系构建与实践探讨
“三效合一”构建现代农业服务体系
建好公共法律服务体系“最后一公里”
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广
基于大数据背景下的智慧城市建设研究
初具规模的健康管理服务体系