刘波涛
[摘 要]随着日益增长的数据信息需求,对数字图书馆的存储技术和存储设备提出了更高的要求,传统的存储设备和存储技术已经无法满足数字图书馆的存储要求。本文从设备成本,系统可靠性,兼容性,安全性等方面对常用的几种存储技术进行分析和比较,探讨符合现阶段数字图书馆存储要求的存储方式,并为未来存储技术的发展和运用进行战略性思考。
[关键词]网络存储 NAS SAN IP SAN ISCSI 存储技术
[中图分类号]TP393[文献标识码]A[文章编号]1007-9416(2009)12-0075-03
The IP Network Storage Technology of Digital Library System
Liu Botao
(College of Computer Science, Hunan University of Arts and Science Hunan Changde Post:415000)
[Abstract]With the growing demand for data and information on the Digital Library of the storage technology and storage devices a higher demand,the traditional storage devices and storage technology has been unable to meet the storage requirements of digital libraries. Based on current digital library funding,technology,the existing storage methods were compared.Discussion on Digital Library meets the present requirements of the storage memory,and for the future storage technology in the development and use of strategic thinking.
[Key words]Network Storage;NAS;SAN ;IP-SAN;ISCSI
1 引言
知识经济时代的到来,促使人们对于信息和知识的需求进一步扩大,图书馆作为一个传统意义上的知识获取媒介,其单一的实体化模式已经严重的制约了其发展,在这种大背景之下,依托于传统实体图书馆的网上数字图书馆建立和发展了起来。与传统的图书馆相比,数字图书馆具有信息存储量大,检索方便,可远程迅速传递,并且还具有信息共享优势,在很大程度上提高了信息的使用率[1]。近年来,数字图书馆凭借这些优势,迅速被互联网用户所青睐,其发展速度惊人。我国数字图书馆的建设从1997年的“中国试验型数字式图书馆项目”实施开始,经过不到十年的发展,取得了一定的发展,目前已经进入初步实用阶段,以中国数字图书馆,中国期刊网,超星数字图书馆为代表的数字图书馆也已初具规模。但是随着数据业务的迅速增长,数字图书馆迫切需要一种大容量且可实现共享的高速存储设备。
2 几种常用的存储技术研究
2.1 NAS
NAS(Network Attached Storage,网络附加存储)是一种专业的网络文件存储及文件备份设备。它按照TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据传输。
NAS系统包括处理器、文件服务管理模块和多个用于数据存储的硬盘驱动器(如图1所示),其完全独立于操作系统,可实现不同类型文件的共享[2],Web界面易于操作和管理,在增加和减少服务器时均不会中断网络服务。此外,NAS在RAID的基础上增加了存储操作系统,其数据可以在异构平台上共享。NAS使文件访问操作更为快捷,并且易于向基础设施增加文件存储容量。NAS适用于通过网络将文件数据传送到多台客户机上的应用,尤其在数据长距离传送的环境中优势明显;NAS应用于高效的文件共享任务中,例如Unix中的NFS和Windows NT中的CIFS。 NAS设备可以进行优化,以文件级保护向多台客户机发送文件信息,提供可靠的文件级数据整合(见图1)。
NAS设备的安装、调试、使用和管理非常简单,采用NAS可以节省一定的设备管理与维护费用。NAS设备提供RJ-45 接口和单独的IP地址,可以将其直接挂接在主干网的交换机或其它局域网的Hub 上,通过简单的设置(如设置机器的IP地址等)就可以在网络即插即用地使用NAS 设备,而且进行网络数据在线扩容时也无需停顿,从而保证数据流畅存储。
2.2 FC SAN
FC(光纤通道技术)是ANSI为网络和通道I/O接口建立的一个标准集成,支持HIP PI、IPI、SCSI、IP、ATM等多种高级协议,它的最大特性是将网络和设备的通讯协议与传输物理介质隔离开[3]。这样多种协议可在同一个物理连接上同时传送,高性能存储体和宽带网络使用单I/O 接口,使得系统的成本和复杂程度大大降低,并且其可以支持点到点(Links)、仲裁环(FC-AL)、交换式网络等多种拓扑结构。
FC使用全双工串行通信原理传输数据,在1GB标准下,传输速率高达1062.5Mbps ,即为100MB/S,双环可达200MB/S,2Gb下,上述数字将翻倍。FC标准下可以通过同轴线、光纤介质进行设备间的信号传输,使用同轴线传输距离为30米,使用单模光纤传输距离可达10公里以上,这使得在SAN模式下实现物理上分离的、不在机房的存储变得非常容易(见图2)。
2.3 IP SAN
IP SAN就是指iSCSI SAN。iSCSI(Internet Small Computer System Interface, 互联网小型计算机系统接口)是由互联网工程任务组(Internet Engineering Task Force)开发的基于互联网协议(IP)的存储网络协议。
IP SAN服务器通常使用专用SCSI连接以及块级接口实现与本地连接的存储系统的通信。iSCSI将SCSI块存储命令封装到以太网数据包中,以便通过IP网络进行传输[4]。(如图3所示)这样,服务器就能够使用标准的SCSI存储命令通过标准的 IP基础设施与共享的存储设备进行通信。iSCSI 就是透过IP 网络,将SCSI 块数据转换成网络封包的一种传输标准,它和NAS一样透过IP网络来传输数据,但在数据存取方式上,则采用与NAS不同、却与FC-SAN相同的块协议(Block Protocal)见图3。
3 数字图书馆系统存储方式的可行性分析
3.1 三种存储方式对比分析
NAS、FC SAN和IP SAN在性能、存储介质等技术参数上存在一定的区别,而且其构建成本和管理模式也存在很大差异,数字图书馆系统要选用哪一种存储方式,必须经过对这些技术参数的深入研究,并结合自身的资金和设备条件,在现有资金技术条件下,采用最经济性的方案。NAS、FC SAN和IP SAN的差异如表1所示。
从上图可以看出,FC SAN在其性能上具有明显的优势,便于集中管理而且完全不受电磁感染的影响,但数据传输受到距离的影响很大,在通常情况下不会大于50km,这决定了它不能有效地整合更多的主机与存储的需求。从资金投入上考虑,基于FC SAN的存储设备价格居高不下,使用FC SAN,必须购买HBA、光纤交换机、光纤磁盘阵列、管理软件等,其购置成本相对较高。NAS系统与FC SAN相比存在明显的成本优势,但是由于NAS基于TCP/IP通信机制,在扩展性上存在局限性,性能不高,而且管理分散,无法满足用户对高效性和可靠性的要求。IP SAN 虽然在性能上略逊与FC SAN,但是其成本低廉,而且没有距离的限制。
3.2 数字图书馆存储方式的选择
我国的数字图书馆发展时间不长,而且在资金上相对紧张,购入高成本的存储设备对于图书馆的整体生存和发展来说是不经济的。在选择存储方式时,应该从实用性和经济性两个方面进行综合考虑,在三种方法中选取性价比最高的存储技术和存储方式。通过以上对NAS,SAN,IP SAN这三种方式相关技术参数的对比分析,不难看出,IP SAN在性能和成本上具有显著的优势。
IP SAN与上述两种方法相比,其优势主要体现在以下四个方面。首先,IP SAN构建成本低廉。适配卡、交换机和缆线的购置成本都比FC要低很多,而且还可以使用免费下载的iSCSI Initiator 驱动程序模拟iSCSI卡。其次,IP SAN技术的使用没有距离的限制,它通过IP网络来传输数据,传输距离无限制,这对于异地数据的传输及备份相对方便。第三,传输速度较快,虽然与FC SAN的速度相比,IP SAN 稍微逊色,但其高达1GB的速度相比与NAS已经相当出色,完全可以满足数字图书馆的数据传输需要,并且在未来随着10GB以太网的普及,IP SAN的速度可以随着提升为10GB,这比新一代的FC SAN的4GB还要快得多[5]。最后,由于IP SAN采用的iSCSI技术,对于系统管理人员不像FC SAN系统要求那么高,这就为数字图书馆省去了聘请专业技术人员的成本。总之,IP SAN存储技术是在数字图书馆现有的资金水平和人员水平下,最具经济性的方案,是数字图书馆最佳的存储方式。
4 对未来数字图书馆网络存储技术的展望
数字图书馆是一个电子化信息的仓储,能够存储大量各种形式的信息,用户可以通过网络方便地访问它,以获得这些信息,并且其信息存储和用户访问不受地域限制。数字图书馆是将包括多媒体在内的各种信息的数据化、存储管理、查询和发布集成在一起,使这些信息得以在网络上传播,从而最大限度地利用这些信息。数字图书馆利用多媒体数据库技术、超媒体技术,针对数字化书馆中各种媒体的特性,在图象检索、视频点播和文献资料提出等方面提出了一套有效可行的管理检索方案。在当今电子商业、环球市场、虚拟机构日趋普及的年代BitLibrary作为一套完善的媒体资产管理系统,无疑创造了一个安全稳妥的环境,方便共享和销售数字资料。数字图书馆是传统图书馆在信息时代的发展,它不但包含了传统图书馆的功能,向社会公众提供相应的服务,还融合了其他信息资源(如博物馆、档案馆等)的一些功能,提供综合的公共信息访问服务。可以这样说,数字图书馆将成为未来社会的公共信息中心和枢纽。信息化、网络化、数字化,这一连串的名词符号其根本点在于信息数字化;同样电子图书馆、虚拟图书馆、数字图书馆,不管我们用什么样的名词,数字化也是图书馆的发展方向。
网络化存储是未来数据存储的发展趋势,网络存储提高了数据的共享性、可用性、可扩展性和管理性,符合数字图书馆对信息存储的高可靠性、高兼容性和高安全性些缺陷的要求。目前NAS的性能较低,FC-SAN 的实现费用较高,互操作性差,IP-SAN作为性价比最高的信息存储方式是数字图书馆系统的最佳选择,IP SAN存储网络技术具有低成本、被广泛采用、良好的标准化情况、高扩展性、以及良好的安全性和QoS保证等诸多优点,并且随着高速度以太网的普及,IP SAN存储方式的速度还将得到显著的提升,为数字图书馆系统的进一步发展提供强大的存储技术支持。
[参考文献]
[1] 郭建峰.数字图书馆信息存储系统架构的探讨[J].现代情报,2005(06):71-73.
[2] 周林,石夫乾.数字图书馆系统中的IP网络存储技术研究[J].中国信息导报,2005(12):44-45.
[3] 何中林.基于IP的网络存储技术研究[J].中国科技信息,2005(23):95-96.
[4] 彭建荣.网络存储技术及其发展趋势[J].计算机与现代化,2006(07):66-68.
[5] 周敬治,张莲芬,林桂娜.数字资源存储系统的构建模式研究[J].情报科学,2007(01):113-116,138.