刘亚莉
关键词:大数据环境;数字图书馆;信息服务资源;整合存储
摘要:为了应对数据量不断增大的多类型信息资源,图书馆采用了资源整合与存储技术。文章阐述了大数据环境下图书馆信息服务资源整合存储的意义,提出了图书馆大数据资源整合的存储策略,并在此基础上设计了数字图书馆信息资源云存储系统。
中图分类号:G250文献标识码:A文章编号:1003-1588(2017)11-0090-02
随着新兴的物联网技术、云计算技术以及社交软件的快速发展,衍生数据的增长速度惊人,网络中充斥着海量数据,这些都预示着大数据时代的来临。人们的生产生活已经离不开数字化信息,而在海量数据中筛选出有效数据的相关技术已经成为专家学者重点关注的问题[1]。值得注意的是,作为传统图书信息资源提供者的图书馆也应该与时俱进,尝试获取更为准确和有效的数据信息。显然,图书馆应该依靠海量图书资源平台,将大数据处理技术与数字图书馆服务理念进行紧密结合,积极探究数据的获取、整理以及存储等技术,为用户提供更加有效和人性化的服务。
1大数据环境下图书馆信息服务资源整合存储的意义
1.1为资源共享提供技术保障
在整合和管理馆藏资源后,图书馆方面还需要借助先进的信息处理技术维护和存储图书文献资源,尤其是非常稀缺的光盘制品和微缩文献制品等。由于采用的存储技术具有运行稳定性高、存储技术成熟、存储寿命长、存储应用面广以及存储密度大等优势[2],所以笔者尝试将RSS技术、标签技术以及Web2.0技术等应用在图书馆存储工作中,从而帮助图书馆实现用户信息推送服务、用户个性化定制服务、扩大检索服务、新书发送服务以及相关信息链接服务等[3]。正是由于上述服务提供的技术支持,才能为图书馆与用户之间的互动交流提供有利环境,才能让用户有更多机会参与到信息交流过程中来,并根据个人的信息需求获取相应的信息资源服务。
1.2便于文献资源的提供和利用
需要说明的是,很多历史文献资源极其珍贵,尤其是原稿只有一份时,不可能滿足用户的阅读需求,而且相互传递阅读也不可能实现。然而,一本一千多页的16K的书籍,经过数字化处理之后就可以利用六张微缩平片进行存储,而且这些平片可以直接进行传送阅读。当然,关于音像制品、微缩制品以及光盘的管理和存储技术就显得十分重要,如果没有有效的管理和存储技术,就会对资源管理和共享产生不利的影响。
2图书馆大数据信息服务资源整合存储系统设计
2.1系统总体架构
总体来讲,基于数字图书馆的云存储资源模型主要包括应用服务部分、平台服务部分以及基础设施部分等,这些都参照层次进行分类[4]。其中,应用服务部分主要提供具体的系统功能,平台服务部分主要提供系统监控功能、用户管理功能以及为应用服务部分提供专门接口等。形象地说,基于数字图书馆的云存储资源模型就是一种云端类型的网络,该网络可以提供高并发的网络计算服务以及网络功能服务等,该模型可以利用分布式技术和虚拟化技术扩展Web网络服务器、应用服务器、存储服务器以及数据库服务器等,还可以在不同区域的数字图书馆之间提供多种检索、计算以及存储服务等。具体的区域数字图书馆资源云存储模型图见图1。
基础设施服务层(即IaaS层)是区域数字图书馆云存储模型的基础部分,支撑着整个模型框架的运作,其利用虚拟化技术将硬件资源和相应管理功能进行有机结合。该服务层包括两个方面的功能:一是利用网络硬件设备、存储设备以及主机进行虚拟化、抽象化以及分布式处理,将数字图书馆的各种硬件设备整合在一起,共同封装为基于云存储的基础服务设施,用户只需将其当成一个整体即可,当然也无须知道是哪部分设备提供服务,只要发布调用设备命令就可以获取到所需的硬件和软件资源。二是借助虚拟化技术以及抽象化技术,基础设施服务层为用户提供备份管理、计算服务管理、数据存储管理以及负载管理等服务。
平台服务层(即PaaS层)是区域数字图书馆云存储模型的中间部分,又称为云中间件,其将系统的复用性软件和通用性软件进行整合,从而实现为区域数字图书馆提供PaaS层服务。该服务层主要提供以下几个方面的功能:一是提供系统信息管理接口功能,如提供课题管理、专题管理、资源管理以及简报管理等功能。二是提供平台核心服务接口功能,如提供行为分析和统计功能、任务调度功能、资源整合功能以及检索功能等[5]。三是提供信息发布接口服务,如提供用户定制、发布信息检索、系统资源导航以及资源专题发布功能等。四是提供信息规划接口功能,如提供信息资源规划以及资源体系规划等功能。五是系统信息资源加工接口功能,如提供信息生产的分析和统计功能以及信息内容编发功能等。六是提供资源库的发布接口功能。
应用服务层(即SaaS层)是区域数字图书馆云存储模型高层部分,可以为区域数字图书馆提供所需的服务和应用软件支持。借助应用服务层提供的软件功能,区域数字图书馆可以根据用户具体需求,将系统功能以租用的方式提供给用户或其他组织。具体来讲,系统提供的服务功能主要包括RSS信息服务、信息订阅推送服务、系统信息检索服务、个性化用户信息服务、系统公共信息服务、企业竞争监管服务、用户参考和咨询服务、技术评估服务以及高新技术查新服务等。
用户权限使用计费模块主要提供用户管理、系统计费、用户权限确认以及系统支付等功能。系统管理以及业务支持模块主要提供系统管理以及业务支持的相关功能,从而保证整个系统能够正常运行。客户端模块是整个数字图书馆的最高层,不仅为用户提供登录功能,而且还可以直接与服务器进行交互,该模块不再局限于个人计算机,只要是能够访问云端的终端设备都可以登录客户端。
2.2云存储模型结构分析
云存储模块是一种集合了客户端、服务器、存储设备、应用软件、接入网以及访问接口等模块功能的综合型系统,已经不是一个功能单一的存储设备。显然,存储功能是整个云存储模型的核心功能,并且借助应用软件对外提供数据存储服务以及用户使用功能等。云存储模型的具体结构示意图见图2。endprint
云存储系统模型主要有四层结构:第一层为存储层,即云存储的底层。需要注意的是,云存储设备的结点分布广泛且数量巨大,而结点之间可以借助互联网、光纤网络以及广域网进行连接。在存储设备中还会配备存储的统一管理设备,可以实现针对存储设备的虚拟化管理。传输层还能实现冗余管理、硬件设备维护以及运行状态监管等功能。第二层为基础管理层,该层为云存储模型的核心部分,也是系统功能实现最为复杂的部分。基础管理层可以利用分布式技术、集群技术以及网络计算技术等实现各个存储设备之间的数据交互,从而实现将多个存储设备进行集合并统一提供数据服务,还能够保证数据交互的速度更快、性能更好以及稳定性更强。此外,CDN类型的内容分发系统以及数据加密技术还能够保证系统数据的完整性和安全型,以及私密数据不能被无权限的用户访问,与此同时,还可以利用数据备份功能、数据容灾功能保障存储数据的安全,以防存储数据的损坏和丢失。第三层为应用程序接口层,该层为云存储模型中最为灵活和多变的部分。云存储提供商可以根据不同用户的应用需求,开发出不同的用户服务接口,从而提供不同的服务,如可以提供远程数据备份、视频监控、网络硬盘存储、视频点播以及IPTV平台等功能。第四层为访问层,该层是用户与云存储模型之间的链接部分。该层能够利用公用应用接口,保证有权限的用户可以登录云存储系统,从而实现云存储系统的相应功能。由于云存储提供商的应用目的和单位性质不尽相同,所以其提供的访问类型以及访问方式差别也较大。
3结语
资源共享模式是大数据时代图书馆发展的必然趋势,同时也是现阶段发展的唯一途径。借助资源整合技术,图书馆不仅可以实现信息资源的规模化处理,还可以实现本馆与其他图书馆在同一平台上用户和资源的统一管理,从而最大限度地实现资源共享的目的。而存储功能就是借助先进技术,将文献资源按照一定的次序进行管理和存储处理,让相同或相似的文献资源紧密关联,这也是基于文献资源的存儲处理的核心所在。
参考文献:
[1]温浩宇,李京京.大数据时代的数字图书馆异构数据集成研究[J].图书馆杂志,2012(9):138-141.
[2]吴珺,谢树泉,工春枝.基于语义的隧联网数据整合方法[J].智能系统学报,2014(6):209-213.
[3]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-71.
[4]张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报,2012(6):15-21.
[5]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40.
(编校:崔萌)endprint