张子尧 张晋荣 刘靖宇
RAID方案可靠性分析
张子尧 张晋荣 刘靖宇
河北工业大学计算机科学与软件学院,天津 300401
RAID具备优秀的I/O性能和较高的可靠性,广泛应用于各种领域。不同的应用场景需要数据存储的可靠性不同,不经过分析而选取的RAID方案可能造成资源的浪费或者使用户承受数据损失的风险。基于此,对各RAID方案可靠性进行了分析,并完成了对各级RAID特点及适用性的总结,为根据实际需求选择RAID方案提供了理论依据。
RAID;可靠性;磁盘阵列
独立磁盘冗余阵列[1]最早由Patterson等人提出。优秀的I/O性能和较高的数据可靠性使RAID技术获得了迅速的发展。根据磁盘数据布局的不同,常见的RAID可分为RAID 0/RAID 1/RAID 10/RAID 4/RAID 5。各级RAID适用于不同级别的数据安全需求。不经过分析而选取的RAID方案可能造成资源的浪费或者使用户承受数据损失的风险。
本文通过分析常用RAID级别的可靠性,为针对实际需求选择RAID方案提供了理论依据。
RAID方案可分为不同等级[2]。不同RAID等级权衡了数据的可靠性及I/O性能。结合实际应用,可针对特定的存储环境及数据安全性需求选取不同的RAID方案。图1为常见RAID方案结构示意图。
RAID 0成本低,磁盘利用率可达100%,一般只是在那些需要高性能快速读写以及对数据安全性要求不高的情况下才被使用,例如图形工作站等。
图1 常见RAID方案结构示意图
RAID 1虽然不能提高系统性能,但具备的高可靠性适用于存放重要数据,如服务器和数据库存储等领域。
RAID 5通过校验块在磁盘间的均匀部署,解决了RAID 4校验盘的瓶颈问题。这种数据布局兼顾了前几种RAID方案的优点,均衡了存储成本、系统性能与系统可靠性。以5个硬盘组成的RAID 5为例,其数据存储方式如图1(e)所示。当RAID 5中存在小于两块的故障盘时,利用正常工作的磁盘进行异或运算即可恢复故障盘的数据。RAID 5可为存储系统提供一定的数据安全保障能力,但其数据保障程度不及RAID 1,但存储成本要远比RAID 1低。RAID 5可靠性同RAID 4一致,可用公式(4)表示。
在Linux Kernel 3.1下构建各级RAID来进行对比实验。实验用硬盘与服务器的参数见表1与表2。
表1 磁盘参数
表2 服务器参数
我们以6块硬盘分别组成RAID 0/RAID 1 /RAID 10/RAID 4/RAID 5,经实验验证,结论和上述分析基本一致。其可靠性对比表如表3所示。
表3 各级RAID可靠性数据
通过分析常见RAID方案的原理及可靠性,根据具体的需求采用适当的RAID方案,能有效降低数据损失的风险及保证系统的性能需求。
[1]Patterson D. RAID: Redundant Arrays of Inexpensive Disks[C]//International Conference on Management of Data,1988.
[2]冯丹,袁圣权,张江陵.磁盘阵列附网存储技术的研究[J].计算机工程,2002,28(10):172-173.
[3]刘靖宇,谭毓安,薛静锋,等.S-RAID中基于连续数据特征的写优化策略[J].计算机学报,2014,37(3):721-734.
[4]Dong Y F, Liu J Y, Yan J, et al. HS-RAID 2: optimizing small write performance in HS-RAID [J]. Journal of Electrical & Computer Engineering, 2016(2016):8 pages.
Reliability Analysis of RAID Scheme
Zhang Ziyao Zhang Jinrong Liu Jingyu
School of Computer Science and Engineering, Hebei University of Technology, Tianjin 300401
RAID has been widely used in various fields with excellent I/O performance and high reliability. Different application scenario demands different reliability of data storage. RAID schemes selected without analysis may result in the waste of resources or the risk of data loss. The paper analyzes the reliability of each RAID scheme, and completes the features and applicability summary of different RAID levels, so as to provide a theoretical basis of choosing RAID level according to the actual demands.
RAID; reliability; disk array
TP391.4
A
河北省高等学校科学技术研究项目资助(QN2014192);河北省科技计划项目(15210325);河北省自然科学基金(F2016202145)。