RAID技术在数字图书馆中的应用

2010-09-14 03:01阴江烽
河南图书馆学刊 2010年3期
关键词:奇偶磁盘硬盘

阴江烽

(广东省委党校图书馆,广东 广州 510053)

1 RAID的特点

RAID诞生于1987年,其定义要追溯到1988年发表的A Case forRedundant Array of Inexpensive Disks(RAID)中,是由三位加州大学伯克利分校的研究人员提出的这种阵列的发展方向。它的作用是将小的廉价磁盘组合起来建立一个大型、快速和安全稳定的数据储存媒介,代替大的昂贵磁盘,以此降低数据存储的费用。它在物理上由多个磁盘组成,但在逻辑上就只有一个逻辑盘,通过把数据分成多个数据块(Block)在多个磁盘上并行写入/读出,以提高访问磁盘的速度。早期RAID一般是在SCSI磁盘驱动器上实现的,SCSI适配器保证每个SCSI通道随时都是畅通的,在同一时刻每个SCSI磁盘驱动器都能自由地向主机传递数据,不会出现像IDE磁盘驱动器争用设备通道的现象。

RAID是一个服务器大容量硬盘,其可用性强,延展性好,作业效率高,在大型主机上经常可见,尤其在信息存取量大的主机上。RAID的主要特点是:(1)性能好。这是最重要的一个方面。开发RAID就是为了提高性能,从理论上说,仅RAID0就可以获得使用单硬盘双倍的速度,如果使用者想要增加信息存储量及存取速度,那么RAID是极好的选择。(2)价格低。如前所述,RAID开发的初衷就是利用“便宜”的小硬盘组合起来代替大的昂贵硬盘,自然在价格上就有一定的优势。(3)稳定性好。特别是硬RAID的稳定性要比软RAID更高一些。(4)操作简便。RAID操作简便,比较容易掌握。(5)兼容性。硬RAID的兼容性很好,甚至可以兼容DOS,而软RAID只有Windows2000/XP才能支持。(6)安全性。RAID具有很好的安全性,这也是信息存储最需要的。

2 RAID的分类

RAID在信息存储方式上,因不同的需求有不同的规格,经过不断的发展,现在已拥有了从RAID 0到RAID 7共8种基本RAID级别,还有一些基本RAID级别的组合形式,如RAID 0+1(即RAID 0与RAID 1的组合),RAID 50(RAID 0与 RAID 5的组合)等。不同的RAID级别代表着不同的存储性能、数据安全性和存储成本,其比较如下图:

2.1 RAID 0

RAID 0是一种串行架构,其全名叫做数据分块储存阵列(Stripping),是最常用的,也是所有规格中惟一不具容错性,但效率却是最高的。它将一个逻辑盘的数据分割成数个区块分布在多个物理磁盘上,由于RAID 0使用了一种名为“数据串行”的机制,数据是用连续“串行”的形式,以规定的大小储存在实体硬盘上,这表示大于实际串行大小的文件将会被分散储存在硬盘阵列中,因此单一文件中的不同串行可以平行处理,在这种情况下,其阵列或“串行集合”的数据传输率即为阵列中最低速硬盘的数据传输率与该阵列硬盘数之乘积。若使用相同的硬盘,则数据传输率带宽恰好是单个硬盘传输率的倍数,为了不浪费空间,一般在RAID 0的组建时,均选用容量相同的硬盘,若条件允许,最好选用型号也相同的硬盘。此规格最需提醒用户的是,如果阵列中任何一块硬盘损坏,整个系统的信息将全部损失。且构建好阵列后,阵列中的硬盘将无法单独使用。

2.2 RAID 1

RAID 1是一种镜像架构,又称为Mirror或Mirroring(镜像),因为它就是将一份信息同时储存于两个硬盘中。简单地说,即是一个两块硬盘所构成的RAID 1阵列,其容量仅等于一块硬盘的容量,因为另一块只是当作数据“镜像”。若其中一个硬盘出现问题,系统仍可正常运作,它具有备份的功能。显然这是最可靠的一种阵列,不过也是较贵的一种RAID解决方案。RAID 1的写入速度通常较慢,是由于数据要分别写入两块硬盘中并作比较导致的,读取速度较单一硬盘来得快,是因为数据会从两块硬盘中较快的一块中读取。

2.3 RAID 2

RAID 2是RAID 0的改良版,以汉明码(Hamming Code)方式将信息编码后分割为独立位元,并将信息分别写入硬盘中,但是因为加入了错误修正码(ECC,Error Correction Code),所以储存的信息会比原来的大。

2.4 RAID 3

RAID 3也被称为带有专用奇偶位的条带,每个条带片上都有相当于一“块”那么大的空间来有效存储冗余信息,即奇偶位。奇偶位是数据编码信息,如果某个磁盘发生故障,可以用来恢复数据。RAID 3需要经过编码将信息位元分割,并分别存于硬盘中,而将同位元检查单独存于一个硬盘中。但由于信息的位元分散在不同的硬盘上,因此就算读取一小段信息都有可能用到所有的硬盘,故这种规格比较适合在读取大量信息时使用,尤其有益于访问较长的连续记录。RAID 3需要同步主轴驱动器来预防较短的记录导致的性能下降。

2.5 RAID 4

RAID 4与RAID 3不同的是,它在分割时是以区块为单位分别存放于硬盘中,但每份信息存取都必须从同位元检查的那个硬盘中取出,并于相对应的同位信息核对,由于使用频繁,所以该硬盘损耗率可能会提高。

2.6 RAID 5

RAID 5也被叫做带分布式奇偶位的条带,每个条带片上都有相当于一个“块”那么大的地方用来存放奇偶位。它改善了RAID 4同位元检查使用频繁的问题,将原始信息与同位元检查重新组合后,以位元分割的方式储存于各硬盘中,所以每个硬盘都有同位信息,以降低存取过度的问题。

2.7 RAID 0+1

这是一种Dual Level RAID,也有人称之为RAID Level 10,它就像是由RAID 0和RAID 1组合而成,叫做“零加一”,也称为RAID 10,方法就是镜像一个串行集和将镜像做串行格式化。即两组按一定的分割区域,连接不同的两块大容量的阵列硬盘,它们互为“镜像”。因为使用了串行结构,所以读写性能极佳,系统也十分可靠。在每次写入数据时,磁盘阵列控制器会将数据同时写入两组 “大容量阵列硬盘组”。同RAID 1一样,虽然其硬盘使用率只有50%,但它却是最高效率的划分方式。其特点使其特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域。

2.8 RAID 50

RAID 50也被称为分布奇偶位阵列条带,RAID 50其实就是RAID 0与RAID 5的组合。它像RAID 0一样,跨磁盘存取数据;又像RAID 5一样,使用分布式奇偶位,RAID 50提供数据可靠性,优秀的整体性能,并支持更大的卷尺寸,最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。

3 RAID技术在数字图书馆中的应用

信息存储技术目前已经得到了IT业界和各应用领域专业人士的重视,同时也为数字图书馆提供了解决海量信息存储难的技术和信息存取与检索的绝妙空间。

3.1 数字图书馆的发展前景

数字图书馆从电子图书馆之父——美国学者Vannevar Bush于1945年在 《大西洋月刊》中提出“Memex”一词至今,已经历了半个多世纪的历程。随着信息技术的发展和完善。数字图书馆的网络化、互联化、世界化的程度将进一步加深,并将逐步形成数字图书馆群,实现真正意义上的资源共享。目前,各国正在致力于创建全球数字图书馆 (Global Digital Library,GDL)模型。GDL 是未来图书馆的发展趋势,一旦GDL建设成功,全球用户将能够以最低的成本、极快的速度存取分布在全球的数字化信息资源库的信息。

3.1.1 21世纪现代化图书馆的特征。(1)办馆模式、存在形态的一体化、网络化、国际化。(2)馆藏资源的电子化、虚拟化、特色化。(3)业务工作的标准化、规范化、兼容化。(4)用户需求的社会化、多元化、集成化。(5)用户利用图书馆的自助化、远程化、即时化。(6)服务手段的自动化、智能化、便捷化。(7)服务内容的深入化、精品化、专业化。(8)业务组织结构的学科化、平面化、矩阵化。

3.1.2未来图书馆的存在形式。(1)物理形态——现实空间和虚拟空间的统一。(2)载体形态——纸质印刷型文献和电子型文献的统一。(3)信息记录形态——数字化与非数字化的统一。(4)资源配置形态——协作收藏与资源共享的统一。(5)功能形态——整理和创新的统一。

3.2 RAID在数字图书馆中的应用

众所周知,在传统的图书馆中,信息和知识的传播完全依赖于其物质载体,一本书中的资源不能同时被多个读者共享,另外读者还必须到图书馆借阅书籍,才能获得其中的信息资源。而现代化管理的图书馆则运用现代信息技术,彻底改变了这种现象。现代化的网上图书馆系统软件是其重要组成部分,也是不可或缺的,一般该系统均采用了先进数据压缩解压缩技术、虚拟光驱和光盘管理技术。系统管理员可通过该系统软件将现有的光盘软件压缩并拷贝到服务器的磁盘阵列上,形成资源库,建立网上图书馆。在局域网内的任意一台工作机上的用户可以同时或不同时地调用资源库中相同或不同的信息资源,实现了真正意义上的资源共享。而不用去图书馆等待借阅,更不会遭遇“此书已借出”的烦恼。

网上图书馆主要包括建立系统和点播系统两个功能,建立系统是指系统管理员将光盘压缩并拷贝到服务器所连接的磁盘阵列中,并对这些资料实施分类管理,以便于系统管理员和读者查询浏览;点播系统是指网上图书馆建立后,在网络中的任意一台计算机上,读者可以查询已建立的分类资料库,并点播出自己所需的资料,而不必担心资料是否被其他读者所使用。网上图书馆作为校园网的一个重要组成部分,上网后既可供校园网所有站点点播查询馆藏资源,又可作为一个独立的子系统独立存在。

3.3 信息存储技术的发展趋势

RAID不失为目前中小型图书馆信息存储技术的最佳选择。但随着宽带网络技术、INTERNET网络技术的发展,IT领域的又一次浪潮—网络数据存储将进入一个新的发展空间。IT用户已经深刻地认识到:不管网络功能发展到什么程度,人们最终需要的是网络上的数据,数据是网络的核心,简便、快速、安全地传输可用数据才是网络最根本的用途。因此,在未来可以预见,各用户的网络数据将以惊人的速度保持增长,越来越多的用户要求从原来的以“服务器中心”模式,转变以“数据中心”为模式的智能的独立地位的网络存储解决方案。目前流行的存储结构主要有以下三种。

3.3.1直接网络存储系统NAS(Network Attached Storage),实施以“数据中心”为模式,它集成IP技术及RAID技术于一身,是通过网络接口和以太网络直接相连的存储服务器系统,各种文件服务器及网络工作站都可透过网络直接存取NAS上的数据,由于它不需要通过文件服务器,明显缩短了响应时间,充分发挥网络的带宽。NAS可在几分钟内增加到网络,可提供高可用性的磁盘阵列存储系统,还能提高文件服务速度,减轻网络主机的负担,降低购买及维护成本,以及在不间断网络运行环境下增加或设置存储系统,是最符合我国国情的存储解决方案。

3.3.2 存储区域网SAN(Storage Area Network),是以光纤技术为核心组成的、多功能的、以“数据中心”为服务模式的区域网络存储备份系统,它的组成包括存储备份管理软件系统、光纤阵列、磁带库或光盘库、光纤交换机等设备,目前它在存储领域里是容量最大、速度最快、扩充性最强、安全性最高、功能最完善的存储备份系统,但最大的缺点是管理较复杂及价格太昂贵而让大多数客户望而却步。

3.3.3 直接附加存储DAS(Direct Attached Storage),被定义为直接连接在各种服务器或客户端扩展接口下的具备RAID技术的数据存储设备。它依赖于服务器,其本身是硬件的堆叠,不带有任何存储操作技术。属于以“服务器中心”模式。

[1] 林林.深入浅出玩 RIAD[J].电脑爱好者,2001,(2).

[2] 陈东平.电脑配置双剑合壁之双硬盘和RIAD篇[J].电脑爱好者,2001,(7).

[3] 邹蓬.走近 RAID[N].电脑报,2002-1-28(F1).

[4] 胡舟.软/硬 RAID 的比较[N].电脑报,2002-6-3(C16).

猜你喜欢
奇偶磁盘硬盘
谈谈奇偶函数的应用
n分奇偶时,如何求数列的通项
HiFi级4K硬盘播放机 亿格瑞A15
Egreat(亿格瑞)A10二代 4K硬盘播放机
解决Windows磁盘签名冲突
活用奇偶函数的性质妙解题
修改磁盘属性
磁盘组群组及iSCSI Target设置
创建VSAN群集
我区电视台对硬盘播出系统的应用