◆王智宇
智能存储在企业云存储中的应用与研究
◆王智宇
(广东省电信规划设计院有限公司 广东 510630)
随着互联网、云计算、大数据等技术的快速发展,许多企业为了提高数据共享、并发处理、协作办公能力,引入了云平台。云平台可以将政企单位的计算机按照矩阵模式连接在一起,构建一个基于智能存储的云服务平台,实现信息的动态管理、均衡负载、虚拟化管理,具有重要的作用和意义。
智能存储;云计算;虚拟化;数据迁移
随着大数据、云计算、移动计算、数据库等技术的快速发展,许多企业引入了先进的自动化办公系统,比如公文管理系统、绩效管理系统、招标管理系统、OA管理系统等,这些系统有力地促进了企业信息化、共享化、智能化水平,也为企业发展带来了新的生产力,提高了企业的市场竞争力[1]。企业自动化工具的增多,也促进了云计算在企业共享中的应用,很多企业开始引入云计算技术,构建云服务平台,将所有的系统都部署于同一个系统,这样就可以更好的满足企业发展需求。
云服务平台开发的关键就是设立数据存储和管理系统。因此本文为了提高数据共享能力和并发处理效率,提出采用智能分级存储模式,实现数据的动态、分级管理。智能存储包括六个关键功能,分别是元数据管理、数据迁移控制、数据文件估值、数据迁移控制、数据访问重定向和文件监视功能[2]。元数据管理可以将数据划分到最小级别,保证数据迁移的原子性和完整性。数据迁移控制可以将访问频次非常高的数据迁移到优先级较高的位置,同时将访问频次变低的数据迁移到较弱的区域。数据文件估值可以按照数据访问频次、大小、创建时间、占用存储空间等进行估值,以便为数据迁移控制提供依据。数据访问重定向管理可以提高数据访问的虚拟化程度,构建一个新型的数据访问平台,进一步提高数据访问性能,数据访问重定向不需要用户掌握数据存储的位置,只需要输入逻辑业务请求即可完成重定向管理性能。文件系统监视管理可以实时监控系统运行情况,包括访问命中率、系统延时、读写比例、存储空间大小等,为文件系统迁移控制提供评估信息。数据迁移管理可以为用户提供一个迁移控制模型,这样就可以实现数据迁移的层级管理,调整数据存储的优先级比例,更好地实现数据智能化、动态化存储。智能存储在云存储中的应用如图1所示。
图1 企业智能云存储
企业智能云存储开发和设计过程中,最为关键的内容是实现数据分类、数据放置和数据迁移。
数据分类可以根据企业日常工作的内容实现数据划分,按照工作需求划分为新闻数据、公文数据、财务数据、人力数据等,将这些数据实现进行分类管理,以便能够提高智能云存储的效率。目前,为了进一步提高数据分类的准确度,论文已经提出了采用专家知识和数据挖掘的分类算法,比如模式识别、机器学习和统计分析方法,设置业务主题规则,实时的进行数据分类和估值。
数据放置可以根据智能云分级存储系统的需求,将数据实现分级放置。目前,数据放置采用先进的优先级原则,可以在数据库中添加新型数据和热点数据,这些数据被访问的次数非常高,数据放置的方法也非常科学,这些都会影响智能分级存储系统的效率和速度,如果数据放置不合理,将会形成一个数据访问瓶颈问题,造成数据访问速度整体效率大大下降。目前常用的数据放置模式包括顺序放置、随机放置和优先级放置。顺序放置按照数据保存的顺序将数据存储到服务器中,保存政企单位的数据信息,顺序放置可以实现数据的先进先出功能,最新的数据始终保存在高位置,这样就可以促进数据访问效率提升。随机放置可以采用Hash算法,将新型数据放置在最新的数据库hash位置,随机放置保存的数据不连续,只是放置在一个合理的位置,如果用户访问相关的数据也需要随机访问。优先级放置可以将数据库进行层次化,优先级较高的位置放置热点数据,优先级较低的位置放置非热点数据,这样就可以以最快的速度访问最新数据内容。
数据迁移技术。智能云分级存储系统运行过程中,政企单位信息化系统产生的数据是动态变化的,因此数据库访问也具有优先层次划分,利用数据迁移技术可以将不同的数据迁移到不同的优先级位置上,这样就可以提高数据访问效率。智能云分级存储系统中,数据迁移技术包括同级迁移和异级迁移两种方法。同级迁移模式发生在同一优先级位置的存储系统硬件配置发生变化,为了能够均衡硬件的负载情况,可以在同一级进行数据库中进行迁移,确保存储器具有足够的容量。异级迁移模式是指根据数据估值,可以将重要的、访问频次较高的数据迁移到优先级较高的位置,异级迁移模式是系统最为常见的模式,可以更好地优化存储系统,异级迁移过程中是自动化的,迁移过程可以是高性能存储设备向低性能存储设备迁移,也可以相反迁移。
智能分级存储设计最为关键的技术就是虚拟化技术。虚拟化可以实现桌面虚拟化和服务器虚拟化。桌面虚拟化可以配置一个虚拟化的桌面服务器,并且能够安装相关的虚拟化工具,这样就可以创建多个逻辑独立的虚拟机,每一个虚拟机都可以关联一个虚拟桌面用户ID,这样就可以运行服务器。系统面向每一个终端用户定制和创建一个虚拟用户桌面,每一个桌面仅需要配置一台键盘、一个鼠标和一个显示器,安装一个云端桌面即可登录到服务器,加载虚拟桌面运行时信息。连接管理中间件可以为用户虚拟桌面、服务器提供一个资源池,实现逻辑业务的通信连接和资源调度功能,将远程数据中心的服务器虚拟化,提供数以万计的虚拟桌面客户端。因此,高密度的用户群造成了调度、管理的困难,同时一个磁盘也难以形成并发访问能力,网络带宽资源也无法得到协同,因此而已采用一个连接中间件,能够实现用户认证、通信连接、数据转发、资源调度,负责虚拟桌面应用功能启动、负载均衡、分配桌面资源等功能。
服务器虚拟化是桌面虚拟化系统的一个重要的组成内容,虚拟桌面严重依赖服务器虚拟化的性能。桌面虚拟化需要提供并发处理能力、透明存储能力、分片管理能力,同一台物理服务器可以经过虚拟化操作,形成多个虚拟桌面。目前,服务器端虚拟化技术较多,主要是针对承载服务器运行的硬件物理资源进行抽象化,这些技术主要包括虚拟CPU、虚拟设备与输入输出、虚拟内存,并且针对每一个虚拟桌面提供一个强大的隔离性、安全性操作内容,保证虚拟桌面用户的并发处理能力,保证每一个虚拟化桌面的运行数据是完整的、安全的。
随着企业云计算平台的应用和改进,企业云存储将会引入更加先进的管理功能,实现企业云存储的先进性、全面性管理模式,更好地为企业提供智能化、信息化和自动化服务,进一步解放企业生产力,提高企业市场竞争能力。
[1]毛正标.云存储在校园网中应用的研究[J].中国高新技术企业,2014.
[2]刘锋.云存储技术在智能交通中的作用的理论分析[J].电子技术与软件工程,2016.