胡玮玮
(周口师范学院图书馆,河南 周口 466000)
图书馆所需“大数据”发展及管理研究
胡玮玮
(周口师范学院图书馆,河南 周口 466000)
伴随着互联网以及各项网络信息技术的迅猛发展,大数据时代冲击着人们生活的方方面面。大数据给作为信息的搜集、处理与传播的中心的图书馆带来了新的机遇与挑战,图书馆如何在大数据时代有效地处理信息、管理数据,直接关系到图书馆的可持续发展。
图书馆;大数据;管理
1.1 大数据相关概念
大数据(Big Data)作为信息时代的产物,也影响了信息时代的发展,最早对大数据做出定义阐释的是美国的麦肯锡公司,“无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。” 这一定义直接反映了大数据的“海量数据”这一特点,涉及了大数据段处理过程,但是,并没有对大数据的其他特性或者发展轨迹有清晰的解释。直到国际数据公司给大数据提出新的定义,也就是我们今天公认的4V特性。这一定义从大数据的属性特点上入手,清楚地界定了大数据,笔者认为这一定义在解释哪些数据更有价值或者如何判断数据的分析难度以及判断数据的分析方式方面更具合理性。
4V包括了容量(Volume)、速度(Velocity)、多样性(Variety)以及价值(value)。4V不仅区分了大数据还指出了大数据的特点。容量特征是指大数据的数据总量很大,尤其是近年来数据朝着海量爆炸式发展,数据的计量单位也不再是KB、MB,而是GB、PB等,容量大是大数据的首要特征。速度特征是指大数据的产生、传播、更新速度快,信息的有效期可能很短,例如电子商务中,数据的变化速度很快,又如期货、股票交易中,数据的变化速度也是打破了传统的计算周期。多样性特征是指大数据的存在类型、传播类型等方面的多样化。已存在类型为例,大数据的数据包括了结构化数据、非结构数据、半结构化数据。数据传播媒介包括了微博、微信等新媒体,也包括了图书、报纸等旧的传播媒介。就数据的生产与传播上,数据不再停留在单一的来源,我们每个人都是信息的生产者与传播者。价值特性跳出了3V的范畴,从是否有价值层面限定了大数据。在大数据的研究领域,还有学者认为大数据还有复杂性等特性,正是大数据这些特性给图书馆带来了新的挑战与机遇。
1.2 大数据带来的挑战
1.2.1 数据处理的难题
大数据时代对图书馆带来的挑战首当其冲的是数据的处理难度提高,因为大数据时代数据的容量大、更新速度快、数据的复杂性提高、数据类型过于多样化,数据的利用步骤过多。以数据的复杂性为例,由于大数据的类型多,承载方式多等原因就造成了大数据的复杂性提高,数据的处理难度相较于以前进一步增大,同时由于数据的处理复杂程度高,也直接影响了数据的处理速度和处理深度。
以数据的利用为例,大数据的处理一般至少包括了采集、分析和解释三个步骤。首先是数据的采集,从数据集成模型来看,现有的数据抽取与集成方式可以大致分为以下4种类型:基于物化或ETL方法的引擎、基于联邦数据库或中间件方法的引擎、基于数据流方法的引擎及基于搜索引擎的方法。而数据的分析作为大数据的重中之重,包括了如何分析数据,如何深度挖掘信息以及评估分析结果等多方面。这些繁复的步骤一定程度上限制了信息的处理速度。影响了图书馆对信息与数据的处理效率。
1.2.2 技术难题
大数据给图书馆带来的另一发展难题就是技术难题,这就包括了科技技术难题与技术人才难题。科技难题是因为大数据时代下分析数据要求有先进的软件技术支持与硬件设施的改善以及多学科的技术支持,包括了统计学、语言学、计算机科学、可视化技术等等.软件上要求图书馆人员要会操作云技术以及计算机的相关软件,包括数据库的操作、云计算软件的操作。硬件上要在资金情况允许的情况下最大可能的升级设备。另外,图书馆在大数据冲击下面对的另一难题是人才难题,“我国目前IT人员本身配备不足的现状与大数据需要IT人员增加的矛盾更加突出,大数据对我国人才的培养模式以及现有人才的储备提出了严峻的挑战”。所以,科学技术不成熟以及技术人才的缺乏是图书馆发展面临的重要问题。
1.2 安全问题
虽然传统图书馆中数据和信息的传播速度低、传播效率不高,但是,信息处理的各个环节相对比较安全,面对大数据时代复杂的网络环境,信息的价值因素越来越被人们重视,对于一些高价值数据的保存与利用面临着很大的安全隐患。实际应用中,很多图书馆通过云数据共享一个或多个数据库,信息传播的中间环节增多,这就产生了许多信息安全问题。包括了黑客攻击、病毒等多重原因造成的信息泄露丢失、用户信息篡改等方面。
1.3 大数据带来的机遇
事物的发展是一把双刃剑,大数据的迅速发展,数据的数字化、网络化程度增高,使得数据的处理难度增大、对技术的需求增加以及数据安全受到威胁,但是,大数据时代也给图书馆带来了新的发展机遇。包括深入分析用户的使用、建立新的知识服务引擎、风险评估以及数据管理等。
首先是深入分析评价用户的使用情况,预测用户的下一步使用。大数据可以根据用户的使用信息来分析用户的行为、意愿、知识服务需求以及知识能力需求,进而对其使用行为展开预测,更好地满足用户的需求。其次是建立新的知识服务引擎,知识引擎直接关系到图书馆能否在大数据环境下的生存,对图书馆的发展至关重要。新型知识服务引擎包括了资源推荐引擎、学术搜索引擎、用户资源及行为智能分析引擎、分析决策预测引擎,在这些引擎中,技术引擎是图书馆信息服务的技术核心。最后是风险评估与数据管理方面,大数据可以帮助图书馆建立各类知识服务及业务建设的风险模型,也可以帮助其他群体使用客户建立相关的风险模型,例如图书发行的收益与评估、企业的收支风险评估等,这些都可以经过大数据分析、预测及智能辅助决策技术建立具有自身机构特色的、科学的及实用的风险模型。至于数据管理方面,大数据在提高了对图书馆数据分析要求的同时,也给图书馆带来大量有价值、以获取的数据,这些数据对于图书馆提高数据分析的程度与质量有重要意义。
大数据冲击着各行各业,图书馆也不例外。面对大数据时代的爆炸时数据,图书馆的发展呈现三种可能,一种认为大数据时代的到来对图书馆的发展没有好处,不能对图书馆的基础业务带来有效变革,而且变革成本高。第二种认为大数据时代给图书馆的发展注入了新的活力,对图书馆的发展只有益处,没有害处。第三种认为大数据对图书馆的发发展有利有弊,笔者认为第三种观点比较妥当。
大数据时代的冲击虽然给图书馆带来了诸多挑战,但同时又为图书馆未来的飞速发展注入了活力,使图书馆迎来了新的发展机遇。所以,图书馆必须直面大数据时代,在认清其带来的价值与风险的同时,科学理性地看待大数据。努力从技术、软硬件以及管理方面入手,提高了图书馆的运作效率,争取最大程度利用大数据给图书馆带来的发展可能性。
管理的程度、方法决定管理的效果。面对大数据时代,图书馆的管理者必须明确科学、高效、创新的管理理念,所谓科学、高效、创新就是在研究大数据以及相关理论的基础上科学的设定管理目标,管理的具体措施,敢于打破陈规,锐意进取地打破传统图书馆管理中的弊端,使整个图书馆的管理定位在高效有序的环境中。
2.1 完善技术、人才方面管理
首先是技术方面,加强管理不是一句空话,面对大数据,图书馆的管理人员也就是图书馆的技术人员,科学的发展始终离不开技术与人才。面对大数据的海量数据,图书馆的工作与人员只有不断学习、利用技术、创造技术,才能保证图书馆永远跟上大数据的步伐。大数据时代使图书馆对技术的要求更多,包括了云技术、数据库技术等。
图书馆管理着首先必须明确技术至上的原则,开展知识培训、积极组织开展技术学习与技术竞赛,调动人员方面的积极性。其次是可以积极引进一些数据分析模型,拓展新的业务范围。增强对于技术的操作能力,提高图书馆的核心竞争力。
2.2 完善软件硬件管理
大数据时代要求图书馆具有良好的软件与硬件设施,这直接决定了图书馆对数据的处理速度与处理质量,面对这一需求,图书馆管理者可以从两个方面入手,第一,准确评估自身,只有准确评估图书馆的发展状况、业务范围、资金实力以及改革的目标才能了解图书馆是否升级现有的软件与硬件设施以及升级的方式、改革的时间、改革的具体措施等多重问题。另一方面是面对投资与收益的问题,应该考察图书馆能否在下一次技术更新之前收回投入资金,获得效益。图书馆可以根据自身的实际需要来引入大数据中的一些分析引擎与数据库。对于资金不足、技术能力落后的图书馆,可以考虑不自己建立数据而是以付费的方式享受云技术或数据库。
总之,在大数据时代完善软件硬件设施是必须,但是,如何完善就要根据自身适用于发展的需求,不可盲目跟风,浪费图书馆资源,影响图书馆发展的长远利益。
2.3 完善数据管理
大数据下的图书馆,“通常有三种角色:大数据的使用者或受益者、大数据的提供者或开发者及大数据的运营者或维护者。”所以,针对图书馆在大数据环境下面临的海量、复杂、难以深入分析的数据,图书馆必须要不断完善数据管理。图书馆可以在科学评估的基础上改变现有的图书馆信息分析模型,争取建立多重处理信息的方式,加强对于数据的综合处理能力,通过分析众多资源,包括网络资源、信息资源、服务资源、知识资源以及硬件资源来更准确、高效地分析数据以及预测趋势。例如,图书馆可以利用云计算技术进行数据分析和处理,科学分析其企业所面临的客观发展优势和威胁,预测企业面临的风险,帮助企业建立更好地风险模型,提高用户的使用满意程度。大数据时代,数据的分析是重中之重,不断完善数据管理是图书馆下一步工作的重点,也是目前学界比较关注的问题之一。
综上所述,面对大数据时代的变化速度快、复杂性高的爆炸式增长数据,图书馆必须明确其带来的挑战与机遇,从完善数据管理,完善软件硬件管理,完善技术、人才方面管理等方面入手,争取最大限度地发挥大数据给图书馆带来的机遇,促进图书馆的可持续发展。
[1]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013(4).
[2]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013(4).
[3]樊伟红,李晨晖.图书馆需要怎样的"大数据”[J].图书馆杂志,2012(11).
[4].张兴旺.大数据时代图书馆的服务创新与发展[J].情报资料工作,2013.
G252
A
1671-0037(2014)12-54-2
胡玮玮(1986-),女,本科,助理馆员,研究方向:图书馆学。