网络存储技术在地震数据存储中的应用

2011-01-06 06:35
震灾防御技术 2011年3期
关键词:存储技术存储设备存储系统

曾 薇 杨 乐 谭 颖

(中国地震台网中心,北京 100045)

网络存储技术在地震数据存储中的应用

曾 薇 杨 乐 谭 颖

(中国地震台网中心,北京 100045)

随着地震观测和地震科学研究水平的提高,大量宝贵的地震科学数据不断产出。安全有效地存储这些海量地震数据,是目前迫切需要解决的问题。本文简要介绍了网络存储技术的发展和应用,并通过分析地震数据对存储系统的要求,探讨了网络存储技术在地震数据存储中的应用。

网络存储 NAS SAN 地震数据

引言

计算机、网络和存储设备是信息技术基础设施的三个主要部分。在计算机技术方面,CPU性能和各种总线技术得到了极大的发展;在网络方面,万兆网络得到了广泛的应用。而与计算机和网络相比,数据存储技术还相对落后,管理存储设备的方式也相对原始。在计算机性能和网络技术飞速发展的今天,人们需要更先进的数据存储方式,以解决存储容量扩展、存储性能提高和对主机影响等方面的问题,为此网络存储应运而生。

网络存储是指借助于网络存储设备,通过原有网络或者构建专有的存储网络,为用户提供统一的数据存储与数据共享服务,它是基于网络的存储方式。网络存储可将数据存储任务从服务器主机中分离出来,这样可减轻服务器的负荷,并将传统的数据存储独立出来,作为网络的一部分,为网络用户共享,它消除了数据“孤岛”现象。同时网络存储的目标是整合广泛的存储设备,包括磁盘驱动器、备份磁带驱动器、磁盘阵列、光盘库等所有的存储设备,这也使得存储资源的集中管理和备份成为可能。

1 网络存储技术

1.1 网络存储接口技术

存储设备通过标准化的I/O接口技术与服务器或者交换机/路由器通信,以实现开放式的系统互联。在存储系统的应用中,目前最主要的接口技术包括:SCSI、光线通道以及iSCSI等。

1.1.1 SCSI

SCSI(Small Computer System Interface)是用于计算机和智能设备之间(硬盘、软驱、光驱、打印机、扫描仪等)系统级接口的独立处理器标准。在系统中应用时,SCSI必须要有专门的SCSI控制器,也就是一块SCSI控制卡,才能支持SCSI设备,这与IDE硬盘不同。在SCSI控制器上有一个相当于CPU的芯片,它对SCSI设备进行控制,能处理大部分的工作,减少了中央处理器的负担(CPU占用率)。也正是由于 SCSI 拥有这些出众的优点,使得 SCSI 能够在专业应用中占据绝对的主导地位。

SCSI是 1979 年由美国的施加特 (Shugart) 公司 ( 希捷的前身 ) 研发并制定的,并于1986 年获得 ANSI(美国标准协会)的承认。从发明到现在,SCSI通过20多年的发展已经成为一系列技术的集合,其性能也呈现多种多样,如:多种总线宽度、多种总线速率、各种SCSI总线仲裁方式等。SCSI的总线速度已由开始的5兆字节/s发展到现在SCSI ULTRA320的320兆字节/s,并且仍在不断地提高(周敬利等,2005)。

1.1.2 光纤通道

光线通道(Fiber Channel)是存储系统中常用的介于I/O通道和网络连接之间的通讯协议。光纤通道能为不同的设备间提供高速的数据交换通道,同时,也能提供较远距离的通讯,目前,常见的光纤通道网络可达到约10km的通讯距离。

光纤通道协议是一个分层的通讯协议,它包括:物理层、编解码层、帧协议/流控制层、通用服务层、上层协议层。而光纤通道网络中的设备必须遵循光纤通道协议的各个层次来通讯。

一般的存储设备,如磁盘、磁带库等都有光纤通道接口,可以直接与其他光纤通道设备连接。而服务器往往没有光纤通道接口,无法与其他光纤通道设备连接。在实际应用中,服务器需要一个主机总线适配卡(Host Bus Adaptor),而这个主机总线适配卡可插在服务器内部的总线扩展槽上,适配卡上有光纤通道接口。这样一来,服务器就可以通过主机总线适配卡与光纤通道的连接设备(如光纤通道集线器、交换机)或其他光纤通道设备连接了。

1.1.3 iSCSI

iSCSI(internet Small Computer System Interface)是由IEETF公司开发的,它结合了TCP/IP和SCSI的网络存储接口标准,可将SCSI命令和块状数据封锁到TCP/IP包中发送、接收,同时用IP协议将存储设备连接在一起。发送端可将SCSI命令和数据封装在TCP/IP包中通过网络转发,当接收端收到TCP/IP包后,可将其还原为SCSI命令和数据并执行,完成之后再将返回的SCSI命令和数据封装到TCP/IP包中,再传送到发送端。

通过在IP网上传送SCSI命令和数据,iSCSI推动了数据在网际之间的传递,同时也促进了数据的远距离管理。由于IP网络的广泛应用,iSCSI能够在LAN、WAN甚至internet上进行数据传送,使得数据的存储不再受地域的限制。

1.2 RAID技术

RAID是Redundant Array of Independent Disks的缩写,译为独立冗余磁盘阵列。RAID将一组磁盘驱动器用某种逻辑的方式联系起来,作为逻辑上的一个磁盘驱动器来使用,可提高数据读取速率和提供磁盘容错能力。

RAID系统由2个主要部件总成:RAID控制器和磁盘阵列。RAID控制器是RAID系统的“大脑”,负责路由、缓冲及管理主机(或网络)与磁盘阵列之间的数据流。RAID控制器通常以高速接口技术,如上面提到的SCSI、光纤通道等与主机(或网络)和磁盘连接(图1)。

图1 RAID系统的物理结构Fig. 1 Physical structure of RAID

RAID控制器有各种不同的级别,由于各级采用的工作模式和算法不同,具有不同的可靠性和性能,根据应用的需求可以选择相应的RAID级别。

2 网络存储的基本架构

目前,基于网络的存储架构有三个主要的发展方向:NAS、SAN和IP-SAN。网络连接存储NAS通过IP网络向客户端用户提供文件级服务,而存储区域网络SAN和IP-SAN则通过网络向服务器用户提供块级I/O服务。对于服务器而言,SAN和IP-SAN存储设备表现为标准的块设备,而NAS存储设备对于PC或者服务器则表现为一个专用的文件服务器。NAS与SAN、IP-SAN在体系结构上存在较大的区别,而SAN与IP-SAN的体系结构存在较多的相同点。

2.1.1 NAS存储体系结构

NAS使用了传统以太网和IP协议,当进行文件共享时,则利用了NFS和CIFS以沟通NT和 Unix系统。由于NFS和CIFS都是基于操作系统的文件共享协议,所以NAS的性能特点是进行小文件级的共享存取。

从NAS的简单机制可引申出它的一些明显的优缺点。优点:NAS的部署非常简单,只须与传统交换机连接即可;其次,它的成本较低,因为NAS的投资仅限于1台NAS服务器,而不像SAN是整个存储网络,同时,NAS服务器的价格往往是针对中小企业定位的;第三,NAS服务器的管理非常简单,它一般都支持 Web的客户端管理,对熟悉操作系统的网络管理人员来说,其设置既熟悉又简单。而在简单易用的背后,NAS的缺点也非常明显:从性能上看,由于与应用同时使用一个网络,NAS会增加网络拥塞,反过来,NAS性能也严重受制于网络传输数据能力;其次,从数据安全性看,NA一般只提供两级用户安全机制,虽然这能简化使用,但还需要用户额外增加适当级别的文件安全手段。

2.1.2 SAN存储体系结构

SAN和NAS所适合的应用不同。SAN是传统的DAS技术的发展延续,适合大量的数据块访问方式的网络存储技术,即信息主要是以块方式存储及管理的应用。SAN与DAS的主要区别在于:SAN技术在主机和存储设备之间增加了专用的存储域交换机,构成了光纤FC存储域网络,实现了网络存储访问。

高性能的光纤通道交换机和光纤通道网络协议是 SAN的关键。我们把以光纤通道交换机为骨干的网络拓扑结构称为“SAN Fabric”,而光纤通道协议是SAN的另一个本质特征。SAN正是利用光纤通道协议上加载SCSI协议来达到可靠的块级数据传输。

SAN以光纤通道交换机和光纤通道协议为主要特征的本质决定了它的诸多优点,可简单地概括为性能、距离、管理等方面。首先,在一些关键应用中,传输块级数据要求必须使用SAN,尤其是多个服务器共同向大型存储设备进行读取。由于在数据传输时被分成小段,使SAN对服务器处理的依赖较少,可以有效地传送爆发性的块数据,SAN的性能及可靠性就得到了充分的发挥。其次,通过城域网(MAN),SAN可以实现远程灾难恢复。一般地,使用E3信道, SAN可以在不降低性能的同时将部件间的距离增加至150km。第三,也是很重要的一点,SAN的管理是集中而且高效的。用户可以在线添加/删除设备、动态调整存储网络以及将异构设备统一成存储池等。

2.1.3 IP-SAN存储体系结构

IP-SAN是近些年来新兴的网络存储技术,它通过使用TCP/IP以太网替代光纤通道网络。前端通过IP网络连接到服务器,后端采用IPSAN协议连接到存储设备。iSCSI协议是IP-SAN中最为流行的协议,是IP存储网络的典型代表。

IP-SAN有效地利用了以太网络,保护了现有的在以太网络上的投资,而且千兆、万兆以太网络的广泛使用,使得IP-SAN的性能得到提高。采用IP-SAN存储网络,可以达到较好的兼容性和高的性能价格比。

目前,相关的IP-SAN标准仍在制定中,在核心业务的应用也不多,其安全性和稳定性还有待考证。从网络协议来看,IP协议比较适合传输大量的小块数据,性能与FC存储协议适合传送大块数据相比仍有差距。

3 SAN与NAS的融合

SAN对于高容量块状级数据传输具有明显的优势,而NAS则更加适合文件级别上的数据处理。尽管二者存在根本特性上的差异,但SAN和NAS 实际上可以相互补充存储技术。如:SAN擅长块数据传输,极易扩展且管理设备有效。用户可以使用 SAN进行关键应用(比如数据库、备份等),以完成数据的集中存取与管理;而NAS 支持若干客户端之间文件共享,用户可以使用NAS作为日常办公中需要经常交换小文件的地方(比如存储网页等)。SAN和NAS在实际情况中还可以并存在一个系统中。再如:SAN可以与NAS联合使用,旨在为NAS设备提供高性能、大容量的存储设备,同时许多SAN通常也驻留在NAS的应用中(刘俊熙,2004)。

目前,许多公司已经推出了融合NAS与SAN的存储解决方案,同时每家公司的方案都会有其独特的一面,然而,从总体上看,这些方案大致可分为两类:一类名为“NAS头”;另一类名为“统一存储系统”。

3.1 在NAS的基础上添加对SAN的支持

在NAS基础上添加对SAN的支持,就是“NAS头”方案(图2),在该方案中仍是以NAS为中心,NAS设备提供对SAN的支持,其中“NAS头”由专为提供文化服务而优化的部件构成,相当于原来NAS存储方式中的NAS文件管理器。

业务系统(如数据库等)对性能要求较高的应用可部署在SAN的环境下,通过高速FC通道对数据进行存取;而对于性能要求不高但是需要资源共享的情况,即主要是文件级资源共享的应用系统(如Web应用、流媒体应用等)可部署在NAS环境下,通过TCP/IP通道对数据进行存取。

图2 “NAS头”方案拓扑架构Fig. 2 Topology structure of SAN+NAS

“NAS头”连接到后端的SAN存储上后,此时的NAS服务器就相当于SAN存储网络的网关,在前端主机需访问SAN时,通过网关将文件级的访问转换成数据块级的访问,可节省前端主机HBA卡的开销。同时又可以利用SAN进行存储,为“NAS头”提供存储容量,这就使“NAS头”后面的存储设备可以根据环境的需求扩展到非常大的容量。

“NAS头”方案虽然在一定程度上解决了SAN与NAS系统在存储设备级的共享问题,但在文件级的共享上却与传统的NAS系统遇到了同样的可扩展性问题,当一个文件系统负载很大时,“NAS头”很可能成为系统的瓶颈。另外,SAN与NAS之间的空间无法进行有效利用。而这种模式的优点是可以充分利用不同存储系统的一些优秀品质,但是并没有减少管理和使用的复杂程度。

3.2 统一存储系统

要实现一台高端存储系统完成所有数据的存储空间需求,同时又支持SAN和NAS的访问,在具体部署上首先要划分出SAN和NAS的存储逻辑分区,以保证在不同的应用模式下使用不同的资源配置,这样才能在满足业务需求的同时消除资源竞争(图3)。

这种实现方式与在SAN前加“NAS头”正好相反,它不是SAN到NAS的支持,而是NAS到SAN的支持,即在原有的NAS基础上,增加对FCP协议的支持。由于NAS具有自己的操作和文件系统,因此增加的FCP和原有的NFS、CIFS、HTTP一样,仅是一个协议的支持。同一网络存储可以通过不同的接口卡完成对SAN和NAS的同时支持,如通过以太网卡可以提供NAS的访问服务,而同时又可以通过HBA卡提供SAN的访问服务。至于NAS和SAN则可以共同而有效地使用所有虚拟化的空间。

图3 统一存储拓扑架构Fig. 3 Topology structure of united storage

有些统一存储设备一般只支持高性能磁盘,这就造成了设备价格居高不下,也使得产品的投资风险加大,而将NAS和SAN统一在一个设备中,其可靠性相对2个存储设备而言是有所下降的。

4 地震数据存储的意义

地震数据主要来自于观测、检测、调查、试验、实验以及研究分析等科技活动。目前我国已有地震观测台站2000多个,形成了涵盖地震、地磁、地电、地壳形变、GPS、地球重力、地下流体等方面的观测网,这些观测网自建立以来源源不断地产出了大量宝贵的地球科学基础数据,这些数据除用于地震行业的地震预测、地震基础研究和防震减灾外,同时也为我国的地球科学基础研究、科研创新、国民经济建设、生态环境、国防建设等提供了具有重大价值和应用意义的数据(路鹏等,2007)。

安全有效地存储这些海量地震科学数据,是目前迫切需要解决的问题。而地震数据存储设备整体规划的具体目标,就是建立高效、安全、可靠的地震信息数据存储和处理的基础平台,并在此之上提供对各种应用环境及数据集的有效备份和恢复机制,从而保证主要业务系统能够持续、正常、稳定地运行。

5 网络存储技术的应用

中国地震台网中心是我国地震监测预测、数据信息分析处理与服务、科技情报信息服务的专门业务机构,其中地震监测预报、震害预防、紧急救援又是核心技术支撑平台。中国地震台网中心数据存储系统需要集中各系统的数据存储需求,实现数据存储、数据管理和数据备份三项功能。

地震监测数据存储包括全国511个台站的最近3个月的连续波形数据,以及最近12个月的地震事件波形数据和相应的处理数据。连续波形数据为实时连续接收数据,每秒数据量约为0.83M,暂存20分钟后数据存储到原始数据库中。每次入库数据量为1G/次。数据处理系统从原始数据库中读出数据,经过分析处理加工成为数据产品,写入产品数据库。数据服务系统可访问原始数据库和产品数据库,并提供数据服务。

抗震救灾指挥部技术系统的数据业务内容包括:基础信息和应急处理数据。数据存储方式有数据库和文件两种形式。基础信息包括地理信息、震情数据、遥感信息和来自各级指挥中心的基础数据等。基础信息数据一次性写入数据库,定期进行少量数据更新,数据长期在线。当大地震发生应急系统启动时,会产生突发性的、大量和频繁的基础数据访问,要求数据存储系统有尽可能高的读出速度。应急处理数据为应急系统启动时,由外部接收或内部产生的应急相应的处理过程数据。

国家地震前兆台网中心每天接收约2.5G的增量数据。数据存入原始数据库,原始数据经分析处理后,成为产品数据存入产品数据库,产品数据长期在线,并提供数据服务。

国家地震信息网络系统每天产出大量的系统运行状态监控数据。负责台网中心技术系统各类服务器的安全备份,并提供用户的信息与数据服务。

中国地震台网中心对汇集到的海量数据,按照各类数据的特点,考虑到数据的安全性、保密性级别,以合适的方式、适当的介质和数据格式进行存储。根据对各分项需求的分析和信息存储技术的发展,中国地震台网中心存储系统采用SAN+NAS的基础架构,同时提供高性能的Block存储服务和可共享的File存储服务。磁盘阵列采用中高端智能多控制器磁盘阵列,以满足中国地震台网中心数据在线处理和长期存储的需求。

中国地震台网中心业务模式比较复杂,业务系统除了数据库业务以外还有很多非数据库业务。业务系统中的数据库(对性能要求较高的应用)部署在SAN的环境下,通过高速FC通道对数据进行存取;而对于性能要求不高但是需要资源共享,主要是文件级资源共享的应用系统(如Web应用、流媒体应用等)部署在NAS环境下,通过TCP/IP通道对数据进行存取。通过建立这个集成的数据存储系统,实现了中国地震台网中心核心数据的存储管理,并保证核心数据在中国地震台网中心内部被妥善长期的保存和快速的访问。

刘俊熙,2004. 电子商务环境下的网络信息存储技术:NAS 和SAN 的融合应用. 信息化与网络建设,(12):64—65.

路鹏,刘瑞丰,李志雄等,2007. 地震科学数据的分级分类探讨. 西北地震学报,(3):248—251.

周敬利,余胜生等,2005. 网络存储原理与技术. 北京:清华大学出版社.

Application of Network Storage on Seismic Data Management

Zeng Wei, Yang Le and Tan Ying
( China Earthquake Networks Center, Beijing 100045, China)

A large amount of valuable seismic data is produced continuously as the improvement of seismological observation and earthquake research. At present, the most important issue is how to save the mass seismic data safely and effectively. This paper briefly introduces the development and application of network storage technology,and discusses its application through the analysis of requests by seismic data storage.

曾薇,杨乐,谭颖,2011. 网络存储技术在地震数据存储中的应用. 震灾防御技术,6(3):335—342.

2011-05-26

曾薇,女,生于1980年。2006年毕业于北京邮电大学,获计算机应用专业硕士学位,同年入职中国地震台网中心信息网络部。主要研究方向:信息网络、卫星通信。E-mail: zengwei@seis.ac.cn

Κey words: Network storage; NAS; SAN; Seismic data

猜你喜欢
存储技术存储设备存储系统
分布式存储系统在企业档案管理中的应用
天河超算存储系统在美创佳绩
关于计算机网络存储技术分析
多级分布式云存储技术在公安领域的应用研究
数据存储技术的应用
浅析铁路视频监控存储设备设计
华为震撼发布新一代OceanStor 18000 V3系列高端存储系统
基于电池管理系统的数据存储系统设计
浮式平台水下电缆( 立管) 快速解脱及存储技术研究
Windows环境下禁用USB存储设备程序设计与实现