谢家积 苏宝林
(绥化学院电气工程学院 黑龙江 绥化 152061)
在探讨linux系统存储领域上的各种存储技术,我们可用从底部开始研究——存储架构,再层层替上:功能→文件系统→文件计划,如图(A)。
下面的三个架构基本覆盖了绝大多数的存储模型,如图(B):
& 直接附加存储(Drect-Attached-Storage)DAS;
&存储区域网络(Storage Area Network)SAN;
&网络附加存储(Network-Attached Storage)NAS;
(B)
直接附加存储即直连方式存储,它是通过SCSI接口而连接到服务器,输入输出直接发送存储设备当中,所以也可称为SAS(Server-Attached Storage),即服务器附加存储。因为它是依赖于服务器,所以基本不需要带任何存储系统。
下面是DAS的一些结构特点:
(1)实现了RAID技术;
(2)无法提供跨平台的共享文件功能(仅限于一个独立的操作系统),需相应的服务器操作系统支持;
(3)没有自身的管理软件;
(4)可在扩充性的前提上增加硬盘并重新做RAID,但会对网络服务有一定的影响;
(5)在多台服务器当中,对数据库的备份与恢复时比较费力;
SAN目前已经取得了空前的发展,在管理比较复杂且巨额预算的的IT技能企业当中,作为长远规划的企业级是比较不错的存储方式,它不仅解决了数据块增长的问题,还对IT部门用于存储体系结构适应变化的优化以便能够在性能和实用性上提高了成本和技术。在今天的SAN当中,它已经具有类于window的用户界面,并且安装十分简单,这大大降低了更多的管理人员。
存储区域网络,就通过类于光纤,网线等互连的方法而把很多台存储服务器组和成的一个单独的网络存储数据,实现企业级的数据存储服务,主要由几个部分组成:存储和设备备份,光纤,交换机,光纤通道与SCSI间的桥接器等。除了存储设备外,它还需要光纤交换机作为网络连接部件。SAN协议和界面具有广泛性和多样性。它作为存储协议以太网已经出现在Linux中完全实现,它不仅完全支持10千兆以太网,且允许构造高性能的SAN,还类似于ATA over Ethernet(ATAOE)的协议,可通过以太网扩展ATA协议。
所谓的NAS,就是通过网络存储合并,在不同的客户端的文件级别进行访问,也就是以文件为最小单位。例如NFS(Network File system)和SMB/CIFS就是最常见NAS所支持网络协议。它的主要特点是能为多种客户端服务,使客户更安全的访问数据,相对来对于一般的设备(如U盘,CD/DVD),NAS显得更智能,因为它不依赖于其它主机设备,当其他设备停机或不能正常运行时,NAS也能正常的访问。
SAN和NAS已经成为当今两大主流存储技术,相对与其他设备文件服务器而言,网络附加存储不仅仅只在数据的备份,文件的存储等方面具有自身的一定的优势外,它主要是才用了低功耗,简化的CPU处理器,这也使之作为专业的数据存储,在中小型企业的重要部门中能充当很好的备份,冗余等方面的重任。并且比较容易安装,切比较快速,扩展性也非常好,易于维护等特点,保证了对服务器性能要求低,从而降低服务器成本,使之更能广范围的普及和应用。网络附加存储在整体的结构上主要有:核心CPU处理器,相应的管理文件服务的工具,还有一个或多个硬盘驱动(包括存储期间,磁盘阵列,磁带或可移动的存储介质等)。
在linux平台上,并不是所有的的存储架构都适合于DAS,SAN和NAS存储,因为linux是开放的,导致内部技术的更新非常频繁,所有linux中的最新尖端的技术是比较多的。
相对于一些不是新功能的技术,但本质上因为存储架构是对象存储架构,对象存储架构从元数据从分离出独立文件并独立的存储它们,他不仅最大的降低了元数据的瓶颈,还能进行分段数据的方式在多个服务器上进行并行的访问增强存储性能。
Linux的标准功能存储虚拟化,它曾经是高端存储系统的独特功能。在linux中,逻辑卷管理器(Logical Volume Manager,LVMs)是一个很重要的服务,它位于可用的物理存储之上,可以进行磁盘的调整,即可用性调整添加或删除空间。除此之外,还可以通过物理设备提高到逻辑设备的能力,例如,只读,只写和快照,跨卷的数据分段等独立的磁盘冗余阵列(RAID)。在LVM中主要有三个概念:
物理卷(Physical Volume):物理卷可以是一个磁盘,RAID,一个分区。为LVM提供了LVM存储介质。
逻辑卷组(Logical volume Group):就是把多个物理卷组成了逻辑卷组,因为他们在硬件上不连续,这就需要吧逻辑卷看成一个存储连续的逻辑硬盘。
逻辑卷(Logical Volume):多个逻辑卷可以组成一个逻辑卷组,也就是说卷组可分成若干个逻辑卷,相当于逻辑磁盘和逻辑磁盘分区。
在使用LVM之后,插入一个逻辑层,可以认为是在磁盘上创建一个逻辑分区。只不过这个磁盘是逻辑卷(组),最后在这之上创建文件系统。虽然对于单个磁盘的读写会有一定的性能损失,但是LVM的好处就体现出来了,首先他可以不受磁盘实际大小的限制,也就是LVM的扩展性,还能提高磁盘的I/O性能。
在 linux中,主要是运用 ext2,ext3,ext4,swap文件系统,在尖端的文件系统中也支持ZFS和Butter FS,但可运用先进的分布式系统,集成文件系统,并行文件系统,这可以解决处理基于存储理念中的新问题,在ZFS和和Butter FS中,都支持数据的重复删除,内部数据保护,数据校验,快照等高端存储技术。ext3在ext2的性质上主要是实现了日志结构的功能,可以进行对系统文件的更改进行记录。
其中ext3文件系统主要包罗这几个块结构:
(1)superblock:记录了文件系统的 inode/block的总量,使用量,剩余量,以及文件系统的格式和相关的文件系统信息等;
(2)inode:记录文件的属性和文件数据对应的block号,注意的是一个文件只能拥占一个inode;
(3)block:记录文件的具体内容,可占一个或多个block;
(4)Fliesystem Description(文件系统描述说明);
(5)block bitmap(区块对照表);
(6)inode bitmap(inode 对照表);
在存储生态系统的发展过程中,linux存储永远是处于前端的,器源代码的开放和拥有大量开发人员,能最新的有效的和经济的改变存储的数据归档,所以在未来,linux存储应该会主导整个存储领域当中!