云计算环境下的分布存储关键技术

2021-11-22 21:04迟松特
中国管理信息化 2021年16期
关键词:容错性存储技术计算环境

迟松特

(辽河油田勘探开发研究院,辽宁 盘锦 124010)

0 引言

云环境下的数据运行能够为企业或者个人用户提供多样化、个性化的数据存储服务,同时具备可扩展性特点,为国民经济的发展预留了较大的空间。基于云计算的广泛应用,云存储服务出现,借助分布式文件系统、网络存储等关键性技术,其能够整合多方面的云计算资源,构建一个高效可靠的云存储系统,并面向用户开放存储服务。与传统存储技术相比,分布式存储技术能够使不同类型的存储设备协同工作,并配合数据隔离技术,为用户提供性能强大的云存储服务。分布式存储技术极大地满足了海量规模、高扩展性的数据处理需要,然而随着社会经济发展对数据处理的要求越来越高,分布式存储技术也面临新的挑战。

1 云计算环境下的分布存储关键技术概述

1.1 网络存储技术

云计算环境下分布存储关键技术的应用,需要处理快速增长的数据和信息,这就需要高性能的网络存储技术作为支撑。传统网络存储技术在应用中存在各种问题,如利用效率低、成本高、易产生“信息孤岛”等,人们急需一种效率高、成本低、可共享信息的新技术,而网络附属存储(Network Attached Storage,NAS)技术的出现正好迎合了这一需要。NAS 技术结构主要包括网络接口、数据操作系统、存储接口以及专属文件共享服务协议等[1]。在此技术架构下,通过网络接口接收用户的数据,之后由操作系统进行处理,将其转化为一个个数据块并予以分类,用户在进行特定操作后就可存储和调用数据。NAS 技术能够满足一对多、多对一的数据服务需要,极大地提高数据存储的利用效率,并简化数据存储流程,从而提高云存储的成本优势。

1.2 分布式文件系统

分布式文件系统(Distributed File System,DFS)将海量的数据分布在不同的节点存储在系统里,并基于此构建一个整体的文件存储系统,方便用户随时调用,极大地提高了分布存储技术的扩展性。DFS 技术的应用也有利于提高数据存储的安全性,当个别节点的存储设备发生故障时,其他节点的存储设备能够进行数据恢复,避免数据丢失,从而保证整个云存储系统顺利运行。

1.3 P2P 存储技术

P2P 存储(Peer-to-Peer Storage)技术充分结合了计算机网络和分布式系统的优势,并解决了传统分布式存储技术将服务器与用户端分离的问题,使各个节点的存储设备都处于平等的地位,突破了角色的限制,提高了存储资源的利用效率,能够最大限度满足网络数据和资源共享需求。同时,P2P 存储技术具有极高的自组织性,不管从哪一个节点接入,都不会影响整体存储系统的运行,保证了云存储服务的可靠性[2]。另外,云计算环境下,在分布存储的运行中应用具有明显成本优势的P2P存储技术,并借助网络存储系统整合可用的存储资源,极大地降低了存储成本。

1.4 新型存储技术

随着云计算环境趋于成熟,分布存储关键技术的发展也越来越成熟,各种新型存储技术不断涌现,如对象存储技术(Object-based Storage Device,OSD)、统一存储技术等。其中,OSD 存储技术能够通过特定的算法实现存储对象的加密,将抽象数据看作一个对象,并能够在不同的存储平台之间实现流通共享,具有较高的私密性、扩展性和安全性;统一存储技术能够融合多个存储方案,并构建一个统一的存储平台,从而为用户提供多样的数据取用服务,这一技术通常被大型企业级别的用户应用,能够解决其存储管理复杂、存储成本过高的问题。

综合以上存储技术,构建混合应用的分布式存储结构能够处理海量的用户运行数据,并有效提高数据存储和运行的效率,简化实际的存储流程,提高云存储服务的质量。

2 云计算环境下分布存储关键技术问题分析

云计算环境下,分布式存储关键技术的应用虽然弥补了传统存储方式的不足,但随着应用的深入,也暴露了不少技术性问题,如容错性问题、可扩展问题、成本控制问题等,具体如下。

2.1 容错性问题

容错性主要是指在存储系统发生意外故障之后,整体的网络存储系统不会失效,能够正常运行,并为用户提供持续的存储服务的能力。传统数据存储模式下,为了提高存储服务的容错性,一般是配置高性能的存储设备,虽然一般情况下能够实现这一目标,但增加了企业的存储成本,也有可能影响数据存储的质量。这一容错性解决方案显然并不适用于分布存储方式。云计算环境下,分布式存储的节点随时在增加,数据失效的风险也在不断增加,其对信息容错性的要求更高。因此,要想提高分布式存储方式的性能,必须引入功能更强大的容错技术,着力解决数据失效问题,保障数据存储的安全性和完整性。

2.2 可扩展问题

可扩展性能一直是影响网络存储性能的关键性因素。传统存储模式下,通常是通过增加存储磁盘设备拓展存储空间。然而,这一方式并不能真正解决分布式存储的可扩展性问题,且随着国民经济的发展,分布式存储需要处理的数据规模在不断扩大,拓展存储磁盘无法有效解决存储空间不足的问题。对分布式存储关键技术而言,可扩展性尤为关键,在保证不影响现有用户数据存储服务的基础上,进一步拓展存储空间和优化性能,但这一性能的优化不能通过廉价的服务系统实现。因此,为了保障云环境下分布存储的高性能,在设计之前就要充分考虑其可扩展性,预留合适的扩展空间,同时也应保证可随时增加扩展性能,以进一步提高分布存储能力。

2.3 成本控制问题

对企业经营管理而言,存储的成本控制问题是其需要考虑的重要因素之一,能否以较低的成本实现对快速增长的大量数据的存储,是企业选择云存储供应商时考虑的关键问题。云计算环境下,需要处理的数据规模呈指数趋势增长,这些数据的存储和运行都需要超大规模的存储空间支持,也需要消耗相应的成本。同时,为了实现数据取用的高效率,需要配置高标准的文件系统,以实现相应的存储功能。在此背景下,如何优化分布存储技术以降低存储空间和资源消耗,同时减少运行成本,是各个云存储服务供应商需要解决的关键性问题,这也是影响分布存储技术进一步推广的重要因素之一。

3 云计算环境下分布存储关键技术的优化

为助力企业的数字化转型升级,必须着力优化分布式存储关键技术,解决其容错性低、扩展性差及成本高等问题,以进一步提高云存储的性能和功能,满足用户的个性化数据使用需要。

3.1 优化容错性

云计算环境下,提高分布存储关键技术的容错性,可以从两方面展开。一是采用复制容错技术。优化分布存储关键技术的容错性,可通过复制容错技术,创建多个数据模块,将数据分布存储在不同节点中,当某个数据发生意外时,可以通过调用其他的数据模块获得数据。复制容错技术的应用能够直接快速地获得数据,取用数据的效率较高,然而这一技术对数据存储空间的要求较高。二是采用纠删码容错技术。与复制容错技术相比,纠删码容错技术对数据存储空间的要求不高,其通过多个数据对象生成编码,不需要复制完整数据,只是复制丢失的数据,但相应地,其数据处理量相对较大[3]。在分布存储关键技术优化过程中,应根据自身存储需求合理选择引入复制容错技术或纠删码容错技术,解决分布存储的容错问题,为用户提供优质的数据存储服务。

3.2 提高扩展性能

与传统存储技术相比,分布存储方式为企业提供了一种成本相对较低、扩展性能较高的存储服务。然而云环境下,随着需要处理的数据规模不断扩大,分布存储技术的扩展性能已成为不可忽视的问题。基于分布式存储技术的存储节点往往数量庞大,其中心的扩展性也需要得到保障。提高分布存储技术的扩展性能,需要着力提高其文件系统的扩展性,优化数据处理方式,压缩文件大小,简化数据分发服务流程,在保障数据服务的基础上,提高数据处理的效率和质量,从而提高数据网络的可用性和扩展性。然而,分布存储技术扩展性能的提升往往伴随成本的增加。因此,企业在提高分布存储技术的扩展性能时,应注意在应用构架之前就考虑系统的可扩展性,为之后系统的升级预留空间。同时,为了尽可能地降低成本,新增的扩展系统和设备应与原有的系统兼容,循环利用原有的设备,避免资源浪费、成本大幅度增加。

3.3 应用节能技术

云计算环境下,应用分布式存储技术还需要考虑优化节能技术,以减少资源消耗,降低存储成本。一方面,应优化硬件节能技术,选择低耗的硬件存储设备和资源,同时在保障系统运行性能的前提下,构建相对低能耗的数据存储结构,实现节能减排的目标。另一方面,优化软件节能技术,在充分保证分布存储系统服务功能的基础上,强化存储节点的管理,及时关闭剩余的存储节点,避免不必要的存储空间浪费[4]。同时,积极引入高标准的数据管理技术,如缓存数据预取技术、静态数据管理、动态数据管理等,提高数据运行的效率,避免过度运行造成资源浪费[5]。

4 结语

云计算环境下,运用网络存储技术、分布式文件系统、P2P存储技术、新型存储技术等分布存储关键技术,能够构建一个高效、可靠的云存储系统,为用户提供多样化的数据存储服务。随着社会对各个行业服务延续性要求的提高,人们对分布式云存储技术的要求也越来越高,因此需要进一步优化其容错性,提高扩展性能,应用节能技术,提高云计算存储服务能力。

猜你喜欢
容错性存储技术计算环境
云计算环境下网络安全等级保护的实现途径
关于计算机网络存储技术分析
基于一致性哈希的高可用多级缓存系统设计
大数据云计算环境下的数据安全
基于FAT文件系统的数据存储技术的研究
数据存储技术的应用
基于FPGA的并行测试高速存储技术
云计算环境中任务调度策略
基于免疫算法的高容错性广域保护研究
基于多Agent的有限广域方向比较算法与仿真实现