基金项目:2012年教育部人文社会科学青年基金项目“云计算环境下数字图书馆云服务信息化平台架构策略与用户服务模式研究”(项目编号:12YJC870019)研究成果。
作者简介:王志强(1988-),男,讲师,硕士,研究方向:云计算,数字图书馆建设、数字图书馆网络安全。•信息资源开发与利用•
〔摘要〕核心数据的管理与保护问题,给云计算环境下的数字图书馆的发展带来了巨大挑战。本文首先分析了云计算环境下数字图书馆海量数据的高效管理,以及云端数据快速、精确查询问题。然后,提出了一种基于云计算的数字图书馆核心数据管理与保护策略。该策略能够有效提升系统资源的利用率、服务可用性和解决资源瓶颈问题,并保证了用户核心数据的安全。
〔关键词〕云计算;数字图书馆;核心数据;管理;保护
DOI:10.3969/j.issn.1008-0821.2014.05.018
〔中图分类号〕G25076〔文献标识码〕A〔文章编号〕1008-0821(2014)05-0088-03
Study of Core Data Management and Protection Strategy
for Digital Library Based on Cloud ComputingWang Zhiqiang
(School of Information Engineering,Lanzhou University of Finance and Economics,Lanzhou 730020,China)
〔Abstract〕Core data management and protection imposes a grand challenge to the development for digital library under cloud environment.In this paper,firstly it analyzed problem of the mass of data of efficient management and the clouds accurate data precision quickly of digital library under cloud environment.And then,a core data management and protection strategy for digital library based on cloud computing was proposed.It could improve system resource utilization,improve service availability and resolve resource bottlenecks,and effectively solve the security problem of uses core data.
〔Keywords〕cloud computing;digital library;core data;management;protection
随着云计算技术的发展和在数字图书馆应用的不断深入,图书馆可为读者提供安全、高效、经济、便捷的云个性化服务,读者已摆脱了所处地域、阅读模式、网络带宽和阅读成本等问题的束缚。
但是,图书馆云个性化阅读服务所具有的海量数据存储、高效处理、快速访问与检索、高速传输和无缝扩展能力,在提高图书馆云个性化服务质量和读者满意度的同时,也大幅度增加了数据环境的复杂性和管理难度,数据具有海量、异构和非确定性的特点。因此,如何加强云图书馆数据结构和管理的安全性、可用性、容错性、可控性和可扩展,对于提高图书馆市场竞争力、云服务模式有效性和读者云阅读满意度具有重要的意义。
1云图书馆核心数据管理面临的问题与挑战
11须加强云虚拟化资源部署与配置数据的管理
云计算环境下,图书馆将云基础设施资源深度虚拟化为一个大的资源池,根据读者云阅读服务需求动态部署、分配和管理。如何加强云虚拟化资源部署、分配过程控制数据的管理,并对全过程进行准确、实时、动态的数据采集、跟踪、处理和修正,是关系图书馆数据中心自动、准确地描绘虚拟化资源不同对象之间的关联关系,以及能否智能、实时地采集云服务系统虚拟化资源配置种类、数量和需求变化数据的关键。同时,也是能否以可视化的方式描述资源配置组织结构,为有效制定、执行云虚拟化资源的分配、部署、调度和管理策略,提供准确、可靠数据支持的保证[1]。
12云图书馆数据管理的层次划分
云图书馆数据环境具有海量、非确定性、分布异构和动态变化的特点,要求数据管理层次的划分过程科学、可控和逻辑性强。
从数据处理的功能性和过程划分,云图书馆数据管理层次主要分为数据的组织与管理、数据的集成与管理、分布式并行处理和数据分析4部分。数据组织与管理层要求数据库具有海量数据分布式存储的功能,具有较强的存储经济性和容错性。数据集成与管理层要求数据中心具有海量数据处理、分析和满足读者QOS(服务质量)需求的能力。分布式并行处理层可实现分布式环境下数据的挖掘和处理,具有高效的云资源分配和并发任务调度能力。数据分析层可对云图书馆数据库中海量的结构化、半结构化和非结构化的文本、语音、图形和图像数据,在不确定的知识条件下通过高效数据挖掘和分析,为读者提供语意明确、高价值密度的关系化服务数据[2]。
13核心数据管理的安全性与可靠性
核心数据管理的安全性与可靠性,是关系云图书馆个性化服务有效性和读者阅读满意度的重要问题。首先,云服务商数据存储具有环境复杂、安全威胁多、多用户共享和可用性要求高的特点。图书馆应根据云阅读服务安全级别需求,与云服务商签署相应安全等级的云服务租赁协议,确保图书馆管理与用户服务数据的安全性。其次,云图书馆应保证所存储的数据能够科学管理、高效访问、快速查找和准确定位,且数据管理与使用具有较低的成本和较高可用性。第三,数据管理应具备较强的冗余性、容错性并支持灾难恢复,能够依据数据管理可靠性划分等级,制定相应的存储、使用、冗余和灾难恢复策略。
14核心数据管理有效性的评估与保障
核心数据管理有效性的评估,是云图书馆依据读者服务水平协议,对云图书馆数据管理的科学性、安全性、经济性、可用性和用户阅读愉悦感整体评估的过程。同时,也是云图书馆量化数据管理质量,发现数据管理平台和策略存在的问题,优化平台管理性能和管理策略的关键。
云图书馆核心数据管理有效性的评估与保障,主要应包括云图书馆数据结构的科学性、数据采集与知识发现的有效性、数据管理的效率与可用性、数据管理过程是否符合国家法律规定和保护读者隐私、云租赁协议的合理性与经济性、数据管理平台的兼容性与可扩展性等方面的内容。此外,还应根据云图书馆服务模式和读者阅读需求转变,及时修改评估指标内容和修正评估指标的影响因子,确保评估结果科学、全面、准确和可用[3]。
15核心数据管理的可持续发展保障
随着读者云个性化服务内容、模式和用户需求的转变,图书馆必须加强数据管理平台的管理效率、方式、可用性和运营成本控制,才能适应云图书馆未来数据管理需求和确保云服务可持续发展。
endprint
首先,应重点关注云服务租赁商基础设施数据存储、管理与服务性能的提升,以及所签署的云服务租赁协议在数据存储、应用管理方面的安全性、效率、经济性和可用性。其次,应通过技术革新和管理策略优化,提高云图书馆数据管理资金的投资使用效率。在保证读者云阅读质量的前提下,通过有效降低数据管理与云服务成本来提高图书馆服务市场竞争力。第三,图书馆可预测未来云数据库存储容量、云资源需求和管理内容的变化趋势,通过制定短期和长期的数据管理与服务能力提升计划,有效降低图书馆数据管理、用户服务和可持续发展的风险[4]。
2云图书馆核心数据的管理与保护策略
21实现核心数据的全流动性
随着无线通信技术的发展和图书馆智能移动阅读终端的普及,高速数据接入的移动阅读方式,成为读者云阅读体验活动的重要组成内容。在服务数据的高速、移动传输的环境下,如何降低图书馆云数据存储的固化程度,实现数据完整、智能、自主的流动,是关系读者云计算环境下移动阅读质量和满意度的关键。
首先,图书馆应利用云计算海量存储、高性能计算和快速传输的特性,将服务数据的管理、查询和数据下载任务交付云端完成,以此大幅度降低云移动阅读活动对阅读终端性能的要求。同时,须将在云端采集、查询的数据,通过透明化的同步过程下载到阅读终端,保证读者阅读终端数据和云端数据实时同步。其次,云图书馆应根据云阅读服务数据的重要性、可用性和使用频率,将数据划分为不同的优先存储级别,根据存储级别判定结果将数据分别存储于高性能在线磁盘或者低成本磁盘上,并根据判定结果的周期变化进行核心数据动态存储,实现存储资源与成本的最优化配置。
22加强核心数据的管理和价值发现
云图书馆数据主要包括云系统运营与管理数据、用户服务数据、读者注册与社会关系数据、图书馆运营决策数据等。图书馆根据数据对读者服务有效性和阅读活动可持续发展的影响程度,将数据分为核心数据和一般数据。核心数据具有精确、集成、跨越信息系统不同功能模块、可重复使用和存在于多个异构应用系统中的特点,对云图书馆的高效运营和服务质量保障具有重要意义。
云图书馆核心数据的管理是一个复杂和由多个信息系统共同作用的过程。首先,在核心数据采集、处理、清洗、转换、管理、复制和同步过程中,云图书馆应保证核心数据存储模式统一和内容完整、准确、权威,可为图书馆管理员和读者提供清晰、具有较高价值密度的,云图书馆运营、管理和读者服务决策支持。其次,图书馆应实时对核心数据进行管理、监督、维护和完善,确保核心数据信息具有较高的真实性、准确性、时效性和可用性,可真实反映图书馆运营服务与读者阅读活动状况。第三,图书馆应加强核心数据的价值发现和提取,及时预测、发现在云图书馆运营与用户服务过程中存在的威胁与隐患。同时,依据核心数据的决策支持作用来优化云服务资源和服务模式,不断提高读者云阅读活动的满意度[5]。
23确保云图书馆核心数据安全、保密
根据云安全联盟(CSA)发布的30版《云计算关键领域的安全指南》描述,云图书馆数据安全内容主要涉及用户数据不被非授权的用户获取,以及数据可随时获取两方面的内容。因此,云图书馆在核心数据安全管理中,应重点加强数据可控性和可用性的管理。
231加强图书馆数据管理系统的自身安全建设
随着数据环境和用户服务过程复杂度的增加,云图书馆面临着许多新的数据管理安全威胁和挑战。
云计算环境下,数据可在云服务商云存储设备、图书馆数据中心、用户终端之间大规模、大范围的迁移,已成为云服务模式的一个突出特点。因此,云图书馆在数据迁移之初,首先应准确评估拟迁移数据与其它数据源整合的有效性,以及如何通过数据过滤、净化和审核过程提升数据质量,保证数据提取、转换和加载过程安全、高效。其次,云图书馆应通过系统防护、入侵检测、安全配置、身份认证、访问控制、数据加密、多租户隔离、数据备份等手段,提高数据管理系统的自身安全性和防御能力。第三,云图书馆可在云服务商云服务平台、云图书馆和读者之间建立VPN(虚拟专用网络),通过VPN安全加密的方式将云服务商、云图书馆和读者的核心数据传输安全管理,纳入到云图书馆数据管理的安全架构下,确保云图书馆核心数据在云服务商、图书馆、读者三者之间的传输安全。
232制定并执行科学、可靠的核心数据安全管理策略
首先,云图书馆应结合核心数据管理面临的安全威胁与风险,加强云图书馆管理员和用户的数据安全管理、使用教育。同时,通过云服务商安全管理级别评估,制定切实可行的安全管理制度和设定关键系统的分级、分权管理策略,在制度上保证核心数据管理、应用安全。其次,应将核心数据的安全管理融入数据生命周期管理全过程中,结合数据环境特点重点关注数据安全级别划分、虚拟机隔离、多租户数据隔离、残余数据安全擦除、数据存储安全保障与备份、灾难恢复、读者隐私保护、数据安全传输等方面内容。第三,实现数据保密设施和性能、数据完整性和可用性、数据的销毁和可恢复性、数据虚拟化安全管理水平的自动评估和优化,提高云图书馆核心数据安全管理的智能、自动化水平[6]。
24加强数据管理平台和运营中心的功能建设
云图书馆应加强数据管理平台和运营中心的功能建设,确保数据管理过程安全、高效、可靠、容错、可扩展和能够提供数据管理接口。
首先,图书馆云数据管理平台可根据数据管理任务特点进行云资源的分配、管理与调度,为图书馆提供可靠、灵活和高性价比的数据管理服务。可支持云图书馆管理员通过远程登录的方式,进行海量数据的实时管理、分析、查询处理、数据库维护与优化工作。其次,云图书馆应加强自建和云服务商数据库系统的计划、组织、协调与控制工作,确保数据管理和运营平台符合云计算标准和用户服务质量要求。第三,云图书馆应重点关注数据中心机房基础设施标准、云系统设备性能和兼容性、管理运营系统的性能和可控性、数据维护与使用人员的技术水平等,并将图书馆数据管理平台和运营中心的建设标准量化,确保平台建设与数据管理过程中,风险能够识别、评价、分配和可控。
3结束语
云计算环境下,图书馆数据中心具有数据海量、异构和非确定性的特点,大幅度增加了数据迁移、管理、存储、应用和维护的难度。此外,读者云个性化阅读服务的不确定性和较高体验需求,对云图书馆数据管理的安全性、效率、经济性和可用性提出了更高的要求。因此,为了提高云服务保障能力和读者云阅读活动满意度,图书馆应加强核心数据的存储、管理、查询和使用能力,实现核心数据的智能、自动化管理,才能保证云图书馆数据管理过程规范、一致、完整、实用性和可扩充性。
参考文献
[1]刘正伟,文中领,张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012,49(增刊):26-31.
[2]赵宏伟,宋宝燕,邵一川.云计算环境下的一种高效的资源管理策略[J].计算机科学,2012,39(2):212-215.
[3]常润梅,孟利青,刘万军.电信企业云计算数据中心容量管理[J].辽宁工程技术大学学报:自然科学版,2013,32(8):1112-1117.
[4]杨健,王剑,汪海航,等.移动云计算环境中基于代理的可验证数据存储方案[J].计算机应用,2013,33(3):743-747,792.
[5]冯登国,张敏,张妍,等.云计算安全研究[J].软件学报,2011,22(1):71-83.
[6]孙福权,张达伟,程勖,等.基于Hadoop企业私有云存储平台的构建[J].辽宁工程技术大学学报:自然科学版,2011,30(6):913-916.
(本文责任编辑:马卓)
endprint