石林林
(苏州科技学院天平学院图书馆,江苏 苏州 215009)
融合云存储的SOA下高校图书馆数据合并存储研究
石林林
(苏州科技学院天平学院图书馆,江苏 苏州 215009)
为解决高校合并后各图书馆数据合并存储及资源共享问题,分析了融合云存储的SOA的特点,并利用融合云存储的SOA建立架构模型。该模型简单实用,充分体现了融合云存储的SOA进行数据合并存储的优势。
高校图书馆;云存储;SOA
随着中国高等教育改革的深入,高校合并是改革的重要环节。图书馆作为文献中心,收藏着大量文献信息资源及数字信息资源,由于各高校图书馆管理数据的系统和方式不一样,如何实现各图书馆数据的合并存储及资源共享是亟待解决的问题。随着面向服务的架构(Service Oriented Architecture,SOA)能力以及云存储交付能力的不断完善,可以利用融合云存储的SOA架构来解决图书馆间数据合并存储问题。下面,笔者对融合云存储的SOA下高校图书馆数据合并存储问题进行了研究。
1.1SOA
SOA 是一个战略性的技术框架[1],它通过将大部分现有系统封装成服务,并且将这些服务抽象到一个统一域,它促使大型用户内部及外部所有相关的系统公开和访问定义良好的服务以及绑定那些服务的信息,它们又可以进一步抽象成流程层和组合应用,从而形成新解决方案[1]。从本质上说,SOA为架构增添了灵活性,使得可以灵活地通过配置完成系统的更改,按照需求定制应用环境,无需绑定硬件。基础架构服务包括计算服务、网络服务和存储服务等,从而不再需要重新开发系统。
SOA 具有如下一些特征:①可重用。一个服务创建后能用于多个应用和业务流程。②松耦合。服务请求者不需要知道服务提供者实现的技术细节,例如程序语言、底层平台等。③明确定义的接口。服务交互必须是明确定义的。④无状态的服务设计。服务应该是独立的、自包含的请求,在实现时它不需要获取从一个请求到另一个请求的信息或状态。服务不应该依赖于其他服务的上下文和状态。当产生依赖时,它们可以定义成通用业务流程、函数和数据模型。⑤基于开放标准。当前SOA的实现形式是Web服务,基于公开的W3C及其他公认标准,并采用第一代Web服务定义的SOAP、WSDL和UDDI以及第二代Web服务定义的WS-*来实现SOA。
1.2云存储
云存储是指通过集群应用、网格技术或分布式文件系统等将网络中大量不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问。云存储是云计算系统的延伸,可理解为是配置了大容量存储空间的云计算系统,其结构模型构成如下[2]:①存储层。存储层是云存储最基础的部分,是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。②基础管理层。基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更强大的数据访问性能。③应用接口层。应用接口层是云存储最灵活多变的部分,不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。④访问层。任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储服务。
1.3融合云存储的SOA
云存储和SOA之间具有如下关系,即云存储提供按需使用的IT资源,因而可将SOA扩展到用户防火墙之外并延伸到云存储提供商,从中寻找SOA的优势,该过程可以描述为“融合云存储的SOA”。事实上,可以把云存储当作SOA向云平台中资源的扩展,关键在于找出哪些服务、信息和流程更适合放入云平台中,以及哪些服务需要通过已有或新建的SOA进行抽象。融合云存储的SOA下图书馆数据合并存储的特点表现在以下几方面[3]:①避免数据重复。由于每个图书馆都有各自的存储系统, 各个图书馆购买了相同镜像文件和远程数据库使用权后,导致相同数据重复存储,从而浪费人力和财力。云存储通过光纤、广域网将分布在各地的存储设备连接起来,通过存储虚拟化技术进行集中到一个域中进行管理,通过系统查重,删除重复数据,可以节省大量存储空间。②节省成本。图书馆利用云中服务商进行设备、数据的管理与维护,无需重复相应管理,且无需重复建设数据,因而节省了图书馆的成本。③管理方便。各个图书馆只需提出具体的需求即可,不用掌握云存储的管理技术,只需付费使用,因而较传统的存储方式更加便于管理。④促进了图书馆间的资源共享, 通过云存储可以弥补资源上的不足。
图1 融合云存储的SOA建立架构模型
云存储的构成与图书馆数据中心的构成一样,都包括诸多编程语言、操作系统、数据库、Web服务器、协议和应用编程接口(API)[5],关键是确认哪些云服务真正适合其内部的系统和应用程序。运用云存储的前提是必须确保云服务与图书馆的基础架构相互集成,SOA架构作为一种易扩展、二次开发费用低的基础架构可以将两者结合起来,从而形成一种更有竞争力的框架模型(见图1)。将各个图书馆的数据资源架构延伸至云计算和云存储时,应包含以下基本步骤:①定义数据;②定义服务;③定义流程;④定义治理;⑤定义哪些候选数据、服务和流程应该放在云平台中,哪些应该放在本地服务器。以苏州科技学院图书馆为例,该馆书目MARC资源管理系统使用江苏汇文提供的软件,自建数据库中所使用的光盘是北京畅想之星,购买的镜像文件是清华同方CNKI。构建融合云存储的SOA时,由于数据目录中并无确定格式,因而可以根据需要进行创建,目标信息模型如下:
Marc
Marc_Isbn
Marc_Sm
Marc_Cbs
Marc_Writer
CD-ROMCD-ROM_Isbn
CD-ROM_Ssh
CD-ROM_Tm
Date_Creat
CNKI
CNKI_Name
Customer_Number
Product_Number
Date_Creat
目标信息模型可以分为2个组件,即逻辑模型和物理模型。使用逻辑数据模型与使用传统的数据库开发进行架构设计的差别在于信息源不同,由于传统的数据库开发需要定义新的数据库,而由架构设计的项目产生的逻辑数据模型的信息源是现有数据库。根据目标信息模型,把各高校图书馆的数据统一存放到一个虚拟的域环境中,这样读者可以利用任意平台通过标准的服务接口(如Web服务)访问位于本地和云平台的应用系统中的相关服务。
随着面向服务的架构能力以及云存储交付能力的不断完善,可以利用融合云存储的SOA架构来解决图书馆间数据合并存储问题。对融合云存储的SOA的特点进行了分析,并利用融合云存储的SOA建立架构模型。该模型简单实用,为构建高校图书馆高性能的信息资源共建共享平台提供了有利条件。
[1]马国耀.云计算与SOA[M].北京:人民邮电出版社,2011.
[2]张龙立.云存储技术探讨[J].电信科学,2010(8):72-74.
[3]黄燕.云存储在图书馆数字资源存储中的应用[J].信息技术与网络,2011,31(4):68-70.
[4]严海兵,姚武霞,过言之.云计算下的图书馆数字资源存储研究[J].苏州科技学院学报,2011,28(3):50-53.
[5]梁爽.基于SOA的云计算框架模型的研究与实现[J].计算机工程与应用,2010(8):72-78.
[编辑] 李启栋
10.3969/j.issn.1673-1409(N).2012.06.037
TP393.08
A
1673-1409(2012)06-N112-02