谢钢
RAID技术探讨
谢钢
楚雄技师学院,云南 楚雄 675000
RAID技术以其突出的优势,极大地提高了速度和可靠性。基于此,介绍了RAID技术的原理和最常用的RAID级别,并提出了怎样选择RAID级别。
RAID;级别;磁盘阵列
磁盘阵列简称RAID(Redundant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列是由很多便宜、容量较小、稳定性较高磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上,在提高硬盘容量的同时,还能够充分提高硬盘的速度,使数据更加安全,更加易于磁盘的管理。
RAID技术主要包含RAID 0~RAID10等数个规范,它们的侧重点各不相同,常见的规范有如下几种:
RAID 0:拥有最佳的读写速度,并且能随着硬盘数量的增加而提高。不过数据安全性差,其随着硬盘数量的增加而变得更低。[1]
RAID Level 1:使用的是Disk Mirror(磁盘映射)技术,就是把一个硬盘的内容同步备份复制到另一个硬盘里,所以具备了备份和容错能力,这样做的使用效率不高,但是可靠性高。
RAID Level 3:采用Byte-interleaving(数据交错存储)技术,硬盘在SCSI控制卡下同时动作,并将用于奇偶校验的数据储存到特定硬盘机中。它具备了容错能力,硬盘的使用效率是安装几个就减掉一个,可靠度较佳。
RAID Level 5:目前应用最广泛的RAID技术。各块独立硬盘进行条带化分割,相同的条带区进行奇偶校验(异或运算),校验数据平均分布在每块硬盘上。以n块硬盘构建的RAID 5阵列可以有n-1块硬盘的容量,存储空间利用率非常高。任何一块硬盘上的数据丢失,均可以通过校验数据推算出来。RAID 5具有数据安全、读写速度快,空间利用率高等优点,应用非常广泛。但不足之处是如果1块硬盘出现故障,整个系统的性能将极大地降低。RAID 5比上述几款RAID模式要复杂得多。RAID 5具备了RAID0的速度优势和RAID1的数据安全。RAID Level 5使用的是Disk Striping(硬盘分割)技术,与Level 3的不同之处在于它把奇偶校验数据存放到各个硬盘里。各个硬盘在SCSI控制卡的控制下平行动作,有容错能力。跟Level 3一样,它的使用效率也是安装几个再减掉一个。[2]
RAID 10:一个RAID 0与RAID 1的组合体。它利用奇偶校验实现条带集镜像。所以,它继承了RAID 0的快速和RAID 1的安全。我们知道,RAID 1在这里就是一个冗余的备份阵列,而RAID 0则负责数据的读写阵列。更多的情况是从主通路分出两路,做Striping操作,即把数据分割,而这分出来的每一路再分两路,做Mirroring操作,即互做镜像。这就是RAID 10名字的来历(也因此被很多人称为RAID 0+1)。由于利用了RAID 0极高的读写效率和RAID 1较高的数据保护、恢复能力,使RAID 10成为了一种性价比较高的等级,目前几乎所有的RAID控制卡都支持这一等级。但是,RAID 10对存储容量的利用率和RAID 1一样低,只有50%。
选择RAID 012345不仅要考虑成本问题、容错功能和传输性能,而且未来之可扩充性也应符合应用的需求。在应用市场上的选择把握难度比较大。
3.1 RAID条切“striped”的存取模式
在使用数据条切(Data Stripping)的RAID 系统之中,对成员磁盘驱动器的存取方式,可分为两种:并行存取(Paralleled Access)和独立存取(Independent Access)。RAID 2和RAID 3 是采取并行存取模式。RAID 0、RAID 5则是采用独立存取模式。[3]
3.2 并行存取模式
并行存取模式是把所有磁盘驱动器的主轴马达作精密的控制,使每个磁盘的位置都彼此同步,然后对每一个磁盘驱动器作一个很短的I/O数据传送。如此一来,从主机来的每一个I/O 指令,都平均分布到每一个磁盘驱动器。
为了达到并行存取的功能,RAID 中的每一个磁盘驱动器都必须具备几乎完全相同的规格:转速必须一样;磁头搜寻速度(Access Time)必须相同;Buffer 或Cache的容量和存取速度要一致;CPU处理指令的速度要相同;I/O Channel 的速度也要一样。总而言之,要利用并行存取模式,RAID 中所有的成员磁盘驱动器,应使用同一厂牌相同型号的磁盘驱动器。并行存取RAID的最佳应用是:并行存取RAID之架构,以其精细的马达控制和分布数据传输,将数组中每一个磁盘驱动器的性能发挥到最大,同时充分利用Storage Bus的频宽。因此,并行存取模式特别适合应用在大型数据连续的档案存取应用,如影像、视讯档案服务器;数据仓储系统;多媒体数据库;电子图书馆;印前或底片输出档案服务器等其他大型且连续性档案服务器。
3.3 独立存取模式
相较于并行存取模式,独立存取模式并不对成员磁盘驱动器作同步转动控制。其对每个磁盘驱动器的存取,都是独立且没有顺序和时间间隔的限制,同时每笔传输的数据量都比较大。因此,独立存取模式可以尽量地利用Overlapping 多任务、Tagged Command Queuing等高阶功能,来“隐藏”上述磁盘驱动器的机械时间延迟(Seek和Rotational Latency)。由于独立存取模式可以做overlapping 多任务,而且可以同时处理来自多个主机不同的I/O Requests,在多主机环境(如Clustering),可以发挥最大的性能。
独立存取RAID的最佳应用是:由于独立存取模式可以同时接受多个I/O Requests,因此特别适合应用在数据存取频繁、每笔数据量较小的系统。如在线交易系统或电子商务应用;多使用者数据库;ERM以及MRP 系统;小文件之文件服务器等。
RAID技术的出现,极大地提高了数据的传输速度和可靠性。我们应当深刻理解RAID级别的优缺点,根据实际需求,综合权衡取舍,合理地选择RAID级别,以获得最佳的存储效果。
[1]王刚.云计算的分析与研究[J].信息技术,2013(6):137-140.
[2]戴士剑,刘品新.磁盘阵列的电子物证检验研究[J].信息网安全,2011(1)7.
[3]李清.RAID5 磁盘阵列数据恢复[J].中国新通信,2013,(10):4-5.
谢钢(1980—),男,云南楚雄人,汉族,讲师,主要从事计算机课程研究与教学。
TN972
A
1009-6434(2016)04-0018-01