李 洁
(枣庄市图书馆,山东 枣庄 277100)
在云计算技术日益成熟的背景下,如何将其更好地引入和应用于数字图书馆建设已经成为业内人士普遍关心的焦点[1]。云计算具有诸多强大功能,如超级运算功能、海量存储功能、即时数据交互功能等,能够推动数字图书馆安全性、高效性以及经济性的不断提升,从而为读者提供更加优质的云个性阅读服务。
在云图书馆建设工作中,迁移策略的选择和确定至关重要。只有选用适宜的迁移策略,才能够将传统数字图书馆的相关内容以一种较适宜的方式迁移到云计算环境中,在充分保障云数字阅读服务业务稳定开展的条件下,进一步降低各项成本(包括建设成本、运营成本、维护成本以及升级成本等[2]),与此同时,提高资源实际利用率,总之,数字图书馆动态迁移优化具有相当积极的现实意义。
首先,应考虑来自云服务提供商方面的风险。不仅要考虑提供商的信誉度,而且要考虑云基础设施的合理性,同时还应考虑提供商的综合技术实力。这些都是数字图书馆开展动态迁移工作中首先需要思考的问题,是数字图书馆动态迁移工作得以顺利开展的前提保障。不仅如此,它也和后期运营及维护密切相关。
其次,应考虑来自互联网方面的危险[3]。在云迁移工作中,无法完全避免来自网络的威胁。与此同时,网络安全性以及传输质量的高低也将对整个迁移工作的有效性产生直接而重要的影响。
最后,迁移到云环境之后,能否获得合理的云系统结构,能否提供高质量的阅读服务,能否有效降低运营成本等,均是需要重点考虑的问题。这是保障读者正常云阅读的必要条件之一。
若想保证数字图书馆动态迁移工作顺利进行,还需要了解并掌握其涉及的一些关键性问题,主要包括数据迁移安全与迁移后的管理和监控,数字图书馆云迁移的效率和质量,云迁移过程网络的传输安全和可用性以及云迁移管理策略及冗余备份机制建立等问题。
云迁移工作的实质是数据迁移,主要包括运营管理数据的迁移、云业务数据的迁移、用户资料的迁移等。上述迁移将会对系统的安全性、高效性以及经济性等产生直接而重要的影响。在迁移操作环节,采取何种措施以保证传输过程中数据的安全性(包括防窃取、篡改以及非法控制等[4]),以及迁移完成后在整个云平台的理想可用性,具有相当积极的意义。除此之外,应重视并做好迁移操作前的备份工作以及迁移完成后的管理工作,避免非法访问的发生,同时保障授权用户的正常访问。
在云迁移工作中,应充分考虑服务内容和水平以及云环境本身特点,从而最大限度地保障和提升云迁移的效率以及质量。
应重点提高云迁移的智能化水平,实现智能化管理整个云平台的工作性能,即监控器将获取的相关监测数据传输给控制器,由后者自动完成数据的迁移工作。除此之外,基于用户实际使用状况以及服务器具体负载信息[5],选调出负载处于最低水平的服务器为客户提供服务,如此一来,便能够极大提升云资源的利用效率。
为强化用户防护能力以及数据实际传输效率,云服务提供商数据中心基于目标用户地理位置的差异而分布于不同的地域,其不仅具有地域视角上的平均分布特点,同时还具有云服务保障机制上的所谓冗余备份特点。在云迁移工作中,信息甚至会经由多家运营商网络,所以,保证数据传输的安全性以及效率便显得尤为重要,这在某种程度上决定了云迁移工作能否取得预期效果[6]。所以,不仅要采取针对性的安全防护措施,同时还需要了解和掌握支持数据迁移的网络及相关设备的负载情况,从而最大限度地获得更为优质的网络传输宽带以及传输效率。
数字图书馆中的诸多应用平台以及数据被转移到更为先进的云计算环境中,在此过程中,无论是系统配置,还是管理方式,又或者服务模式,均变化极大。通过何种途径更加高效且更加可靠地迁移传统数字图书馆的管理策略,从而保证云环境之下具有更为优异的管理质量,是云环境下数字图书馆动态迁移工作面临的主要难题之一。除此之外,传统服务模式在迁移为云服务模式的过程中,将会面临和承担原本属于云环境的一系列风险或威胁。如何建立健全冗余备份机制已成为当务之急,只有如此,才能最大限度地保证各类应用程序的可用性,同时真正落实备份以及安全恢复工作。
为保证云图书馆的管理质量以及运营效率,应结合云应用服务的相关特点,积极应用管理效率最优原则,将某些应用(如E-mail等)转换成软件即服务模式,并将其当作一种云租赁服务并通过云服务商予以统筹管理。与此同时,和图书馆安全级别密切相关的核心应用以及数据管理(如云读者客户资料管理等[7]),最好采用自主开发的相应的管理程序,并有机融入云基础设施平台,交由图书馆管理员通过基础设施,进行高效管理。云图书馆具有诸多优势,数据安全级别高且总量较小,其不仅采用了当前较为先进的加密措施,同时还能够转移到数据中心以外的专门用于存储的设备上,如此一来,即便有数据灾难发生,也能够及时且有效地予以还原。
相较传统数字图书馆而言,云图书馆拥有更为庞大的读者规模,因此采用云服务定制方式可以满足不同用户的不同需求。与此同时,单就信息处理而言,由于涉及海量数据的计算、存储以及传输,因而对系统以及服务安全性有着更为严格的标准。所以,在迁移工作中,应结合应用程序本身的服务特性、软件和云系统之间的契合度、不同用户的不同需求、云系统基础设施标准等诸多内容,应用适宜的平台即服务方式,并根据用户实际需求对平台即服务予以必要的优化和调整。当然,也可以采用重构这种方式。除此之外,在面对新客户的新需求或者某些无法迁移的应用时,则需要根据云系统的具体特性以及用户实际需求进行重建。
对传统图书馆业务以及数据进行迁移时,不仅要保证迁移的高效性,而且要保证迁移的可靠性以及安全性,这将会对云图书馆系统的后期运行产生直接而重要的影响。假若迁移工作中存在以数据冗余大为代表的不良问题[8],那么将会削弱云系统对数据的处理质量,从而影响到云端服务质量,严重时甚至造成系统瘫痪。
数字图书馆普遍存在以下特点:①数据存储结构较为复杂;②数据存储量较大;③数据服务应保持良好的持续性;④数据类型决定了安全等级的高低等。根据其数据存储的相关要求,在最大限度保障整体数据一致性以及几乎零误差的前提下,采用分次迁移这种方式以完成传统图书馆数据到云端的高质量迁移。其中,数据分次迁移的操作原理如图1所示。通过客户端的透明操作,将需要迁移存储的数据通过DAS或者SAN存储结构磁盘阵列及时存储到磁带库,完成数据迁移操作。同时,为了节约存储空间,一些暂时无用的数据可以放入回收站,需要时可以再从回收站中取出。
图1 数据分次迁移的操作原理
基于数字图书馆的特点,在进行云数据迁移时还需注意以下几点:第一,应对计划迁移的数据予以系统分类,从而尽量削弱原始数据库原有的复杂度以及多样性,了解并掌握原系统和云系统在数据库方面的异构特性,明确数据的提取操作以及传输所对应的方式与格式,从而使得数据迁移能够满足跨平台性以及通用性。第二,对已经迁移完成的数据予以全面且细致的检查,主要包括数据格式、数据长度以及区间范围等,从而使得云端数据能够和原始库具有理想的一致性。第三,在迁移操作中,不仅要考虑云图书馆存储服务器应具有理想的负载均衡性,同时还应该考虑用户应用相关服务的便捷性。对于用户搜索频次较高的视频、博客以及其他资源,应采用冗余存放的方式将其归入指定的存储空间,如此便能够大幅提升数据读取速度,进而有效提升云系统的整体服务能力。
在虚拟化技术的帮助下,能够将云图书馆合理划分成若干个具有可动态分配特征的资源池,该资源池不仅具有良好的集成性及通用性,同时在容错性及可靠性方面也较为突出,赋予了云图书馆更强大的计算能力,还实现了对存储资源的高效利用,在减少建设及运营成本的基础上,实现了当前社会所倡导的低碳运营。为进一步提升和保证云系统的可靠性以及安全性,采用合理削减云模拟系统整体工作负载的做法以避免发生云热点故障,从而实现对云虚拟系统的高质量迁移。
云图书馆为用户提供云专有服务时,热点云空间势必会占用更大的CPU资源、宽带资源以及内存资源,导致节点负荷大幅超过正常值而形成所谓的资源热点。为进一步提升和保证云图书馆的存储以及访问效率,其在存储数据时一般应用分散式外部存储方式,所以对于云虚拟系统迁移而言,其实质是将这一系统由云资源池中的某个物理机准确迁移到另一个目标物理机,然后在后者身上达成对图书馆云服务的高效、有机整合,最终实现对云服务负载的有效均衡。
当基础设施承担着超出正常标准的资源负荷时,可借助虚拟机动态迁移这种方式在主机和主机之间实现对负荷的集体分担与均衡。云图书馆管理员只需要定时审查云虚拟系统工作日志便能够找出那些需要迁移操作的虚拟系统,同时查看并保证目的主机拥有大量富余的CPU资源、网络宽带资源以及内存资源等以完成对被迁移虚拟机的有效接受。与此同时,对迁移进程中将会应用到的一系列资源予以30%预留,避免由于动态迁移操作占用过量的云资源而给迁移质量带来负面影响。
虚拟化技术在某种程度上屏蔽了云基础设施硬件资源所具有的异构性制约,使得云系统基础架构无需对用户开放,且不会影响正常服务的提供[9]。然而,对虚拟化迁移目的机进行选取和确定时,应尽可能地选择那些具有同样或者相近结构的虚拟机监控器,同时采用一致性的迁移协议以及内存迁移算法,如此一来,便能使云虚拟系统平台具有更加理想的移动性、负载均衡性以及容错性。
复旦大学的刘鹏程设计了一种能够理想满足服务等级协议的动态迁移框架(如图2所示)。该框架由中央控制引擎以及位于不同服务器上的本地迁移引擎组成,中央控制引擎能够从整体角度了解和掌握数据中心中所有平台资源的使用情况,并根据事先设定的策略,发起虚拟机迁移,以达成数据中心整体范围内的负载均衡,进一步提升资源利用率。
图2 虚拟机动态迁移框架
在云迁移工作中,应重视并加强图书馆管理员对整个云系统的安全访问控制力度,根据不同类型数据所对应的安全等级来赋予管理员、云供应商以及用户与其身份相符的权限,并对关键数据通过AES256位方式予以特别加密,提高数据的安全系数,避免数据由于被窃取等原因而丧失对整个云系统的控制权。除此之外,应对迁移之后的云系统予以系统规划,不能片面地考虑云迁移成本而忽略了云系统的计算性能、可用性以及扩展性,从而使得迁移之后的云系统在应用程序及数据方面准确无误、高效安全、经济实用。在云基础设施资源选择方面,应尽可能地缩短所租用的云数据中心和目标主体用户之间的距离,保证传输宽带能够有效匹配云图书馆所具有的计算能力以及存储能力,避免因为传输瓶颈问题而降低服务质量。在云迁移工作完成之后,建议聘请信誉度良好且资质齐全的第三方以云图书馆为目标对象,基于整体视角展开相应的评估以及调试,从而保证迁移质量和迁移成本之间的有机协调。
以传统数字图书馆为目标对象,将其各类资源迁移到云端,并于云环境之下创设一个现代化的、先进的数字服务模式,能够大大保证和提升图书馆云系统的运行效率以及服务质量。在整个云迁移工作中,应基于用户具体需求,透彻分析和有效掌握原有数字图书馆的相关特点,运用合理的云迁移策略,如此才能保证迁移之后得到的云图书馆具有足够的安全性、高效性、经济性以及便捷性,最终构建一个能够获得用户认可与好评的云数字图书馆。
[1]陈臣,马晓亭.基于云计算的数字图书馆动态云迁移问题与对策[J].图书馆学研究,2011(21):48-50.
[2]陈臣,李映宗,高军.面向云计算的数字图书馆动态迁移对策与优化[J].现代情报,2012(6):51-54.
[3]马晓亭,陈臣.云计算环境下数字图书馆动态云迁移方案研究[J].图书馆理论与实践,2012(6):1-3,8.
[4]陈臣,武文慧.云数字图书馆数据中心虚拟化需求分析与管理策略研究[J].高校图书馆工作,2012(5):58-60.
[5]马晓亭.面向云计算的数字图书馆动态迁移关键问题及优化[J].高校图书馆工作,2012(6):69-71.
[6]陈臣.基于动态安全策略的云数字图书馆虚拟化安全管理研究[J].现代情报,2013(1):40-42,50.
[7]陈臣,樊馨蔓.云计算环境下数字图书馆虚拟机动态迁移调度策略研究[J].图书馆学研究,2013(12):36-38.
[8]吴英平.中小学数字图书馆的定位与建设策略[J].中小学图书情报世界,2010(1):50-52.
[9]陈臣.云计算环境下基于负载特征的数字图书馆虚拟机迁移调度策略[J].图书馆理论与实践,2014(2):87-90.