武涛,胡鹰
大数据时代,高校图书馆数字资源建设面临前所未有的机遇和挑战。高效的网络信息传播,为读者阅读提供了更加便捷的用户体验。但是,在高校图书馆数字资源建设中,还面临资金投入、设备引进、网络宽带数据建设、网络信息流通管理等一系列问题,只有处理好了这些问题才能真正实现高校图书馆数字资源的共享。
2009 年,麦肯锡公司(McKinsey&Company)首次提出了大数据的概念;2011年,大数据概念从硅谷蔓延到北京,引起了相关机构的关注[1]。大数据是指在某个时刻不能被传统数据库软件工具抽象处理的数据集合。实际上,大数据不仅是许多数据的集合,而且在存储方法和处理技巧上有别于传统数据。传统的数据主要包括数字和单词,数据一般都存储在数据库中,结构明确,数据元素之间具有相关性。例如,用户信息通常包括身份证、姓名、性别、出生日期等,这些结构化的数据彼此具有一定的相关性,数据量小,通常低于TB字节级。而大数据包含数字和文本,以及非结构化数据,如图像,音频,视频,链接等[2]。在处理技能方面,大数据需要将数字、文字与视频、图片等非结构化数据一起处理,其处理的数据量能够达到PB级甚至更高。可以说,大数据不仅意味着数据量大,而且意味着数据处理的速度快。
1.大数据信息非常丰富
互联网信息服务在很大程度上方便了用户,也有利于信息共享。在网络环境下,用户对数据信息的需求在不断加大,这在多方面影响了大数据的存储与利用。视频印象、图片图画及文件等以不同方法的数据呈现在人们的日常工作中,数据在真实、有效地表达需求方面的效果日益显著,方法也日益多样,数字资源的数量也相应增长。
2.数据结构复杂
互联网时期的数据方法非常烦琐,且计算机信息处理能力在不断地发生改变[3]。网络沟通平台处于快速发展中,人们对数据的需求日益增加,数据信息的种类日益多元,不同信息采用不同的存储方式进行存储,使得数据的处理方法也变得更加复杂。
3.数据价值密度低
数据价值密度与数据总量之间的关系通常是成反比的。数据总量越低,数据价值密度越高。一段特定时长的视频,可能在几秒钟内才有有价值的数据。在庞大繁杂的数据信息里价值是有限的。当前大数据时代急需解决的大问题是如何使用精密的算法来达到提取核心价值的目的[4]。
目前高校图书馆文献资源建设的核心问题是数字资源建设,高校教学科研对此需求很大。通过对比我国大部分高校图书馆数字资源建设情况,我们发现,数字资源建设对于图书馆的发展十分重要。但是,目前图书馆数字资源建设方面还存在以下4个方面的问题亟待解决。
数字资源优化整合,即根据特定要求,把数字资源进行重组分类。当前,部分高校的图书馆数字化体系还处于相对孤立的状态,其信息化建立仍然停留在信息孤岛阶段,资源整合力度较小。高校图书馆应根据实际状况,优化数字资源配置,优化整合各种资源,实现数字资源利用的最大化。
在大数据环境下,高校图书馆数字资源存储表现出品种繁杂,结构杂乱,存储空间大的特点。杂乱的数据会使数据处理的难度增加,从而产生更多的信息冗杂。因此,需要对数据进行精简和优化,做必要的备份和存储,减少不必要的数据核算。
大数据中的很多数据借助云核算,分散储存在各个“云”中。而用户的动态性和云核算的杂乱性等,使得存储的数据存在安全隐患。高校图书馆的数据信息同样面临这种信息安全隐患,特别是用户的个人信息、图书馆的重要数据等。
大数据技能通常包括:人工智能、云核算、并行处置、散布式处置、数据挖掘、数据存储备份以及可视化分析等技能。高校数字资源建设的客观实际,需要高校图书馆员利用大数据技能,收集、整合、分析相关数据,并将数据转换为有价值的信息,深入浅出地反馈给用户。然而,目前这方面的人才缺口还很大。
精通计算机及图书馆情报知识的全能型人才是高校图书馆急需的。首先,高校应积极引进数字资源建设方面的专门人才;其次,加强图书馆在职员工的信息技能培训;最后,图书馆可以采用“不求我有,但为我用”[5]的思路,与高校内其他部门、院系或其他单位开展人才交流与业务交流,借助社会资源促进自身建设。
为了缩短数据搜索的时间,提高资源的利用效率,在高校图书馆数据资源建设中充分运用动态化数据处理方式,根据数据使用的实际情况,对数据库进行动态处理。通过分析图书馆日常数据资源可知,目前,不仅要中止清算那些下载率及阅读率很低的数据库,还要加强利用率高的数据库建设。
建设高校图书馆数字资源,不仅要进一步挖掘大数据的价值,促进数字资源的共建共享,还要增强图书馆员的数字资源建设的责任感和使命感,加强其信息技能培训,提高其数据安全防范意识,特别是对个人隐私、受版权保护等不能共享数据的重点保护。在个人信息保护的具体操作方面,可以让用户自行选择个人登录图书馆等行为数据是否需要保存以及保存的期限。
高校图书馆要在协作沟通的基础上,建立数字资源的共享机制,扩大数据资源的共享规模。共享机制的建立可以使用户在网络条件下,更便捷地使用多种数字资源,提高对数字资源的利用效率。
高校图书馆建立特色数据资源库,要坚持规范性、时效性、完备性等原则,注重信息的共享。建立特色数字资源的重点是要注重资源库中数据的组织构成。因而,在设计特色数字资源库时,要重点关注“信息导航”“字段检验”以及“资源衔接”等项目。要依据实际需要设置相关数据库网站和代码,从源头上为客户提供一站式服务。同时,在元数据设计相关方面,要对不同类型的数据资源进行细致描绘,最大限度地满足用户需求。例如,一方面,对视频文件、互联网数据资源、电子图书及相关资源位置进行标注;另一方面,对文献、参考文献资源及元数据等相关材料进行标引,并将相同数据库的材料进行科学整合[6],防止错误,进一步提升检索效率。
如今,人们可以通过共享、评估等方法获得更多的信息资源。高校图书馆可以利用大数据,收集读者的年龄、性别、爱好、检索习惯等信息,发掘有价值的数据关系,了解读者不同阶段的个性化特征,捕捉他们感兴趣的内容,并向他们推送所需要的、有价值的信息,使读者可以更加快速地获得想要的信息。
高校图书馆员为大数据时代的核心资源[7]。大学图书馆建设不仅要升级硬件,更要提升软件,而加强图书馆员的综合业务培训是其中的重要内容。只有顺应时代要求,加强数字化建设,提高图书馆员数字资源建设的综合技能,才能真正提升图书馆的信息化服务水平。
[1]贵阳日报官方微博.大数据,创业的下一个暴风口[EB/OL].(2015-04-29).http://blog.sina.com.cn/u/1999472465.
[2]高琳.大数据思维与图书馆知识资源发现[J].图书与情报,2015(1).
[3]余红,刘娟.开放数据及其对图书馆信息资源共享的影响[J].图书馆,2014(4).
[4]康春鹏,杜蕊.大数据给图书馆带来的机遇与挑战[J].现代情报,2014,34(5).
[5]周杰,苏静,曾建勋.下一代数字图书馆的发展思考[J].图书情报工作,2013(8).
[6]马晓亭.大数据时代图书馆数据长期可用性保障研究[J].现代情报,2013(12).
[7]李勇辉.大数据概念辨析及应对措施[J].互联网天地,2014(1).