关于数字图书馆系统网络存储技术的思考

2009-02-11 10:02阎丽洁侯晓媛
新媒体研究 2009年1期

阎丽洁 侯晓媛

[摘要]随着信息技术的发展,需要存储和传播的信息量越来越大,信息的种类和形式越来越丰富,传统图书馆的机制显然不能满足这些需要。因此,人们提出数字图书馆的设想。从设备成本,系统可靠性,兼容性,安全性等方面结合目前数字图书馆的发展情况和资金,技术条件做一些分析和探讨。

[关键词]网络存储 NAS SAN IP-SAN ISCSI存储技术

中图分类号:TP3文献标识码:A 文章编号:1671-7597(2009)0110063-01

知识经济时代的到来,促使人们对于信息和知识的需求进一步扩大,图书馆作为一个传统意义上的知识获取媒介,其单一的实体化模式已经严重的制约了其发展,在这种大背景之下,依托于传统实体图书馆的网上数字图书馆建立和发展了起来。与传统的图书馆相比,数字图书馆具有信息存储量大,检索方便,可远程迅速传递,并且还具有信息共享优势,在很大程度上提高了信息的使用率。随着数据业务的迅速增长,数字图书馆迫切需要一种大容量且可实现共享的高速存储设备。

一、几种常用的存储技术研究

(一)NAS

NAS(Network Attached Storage,网络附加存储)是一种专业的网络文件存储及文件备份设备。NAS适用于通过网络将文件数据传送到多台客户机上的应用,尤其在数据长距离传送的环境中优势明显;NAS应用于高效的文件共享任务中,例如Unix中的NFS和Windows NT中的CIFS。NAS设备的安装、调试、使用和管理非常简单,采用NAS可以节省一定的设备管理与维护费用。NAS设备提供RJ-45接口和单独的IP地址,可以将其直接挂接在主干网的交换机或其它局域网的Hub上,通过简单的设置(如设置机器的IP地址等)就可以在网络即插即用地使用NAS设备,而且进行网络数据在线扩容时也无需停顿,从而保证数据流畅存储。

(二)FC-SAN

FC(光纤通道技术)是ANSI为网络和通道I/O接口建立的一个标准集成,支持HIP PI、IPI、SCSI、IP、ATM等多种高级协议,它的最大特性是将网络和设备的通讯协议与传输物理介质隔离开。这样多种协议可在同一个物理连接上同时传送,高性能存储体和宽带网络使用单I/O接口,使得系统的成本和复杂程度大大降低,并且其可以支持点到点(Links)、仲裁环(FC-AL)、交换式网络等多种拓扑结构。FC使用全双工串行通信原理传输数据,在1GB标准下,传输速率高达1062.5Mbps,即为100MB/S,双环可达200MB/S,2Gb下,上述数字将翻倍。FC标准下可以通过同轴线、光纤介质进行设备间的信号传输,使用同轴线传输距离为30米,使用单模光纤传输距离可达10公里以上,这使得在SAN模式下实现物理上分离的、不在机房的存储变得非常容易。

(三)IP-SAN

IP-SAN就是指iSCSI SAN。iSCSI(Internet Small Computer System Interface,互联网小型计算机系统接口)是由互联网工程任务组开发的基于互联网协议(IP)的存储网络协议。IP-SAN服务器通常使用专用 SCSI连接以及块级接口实现与本地连接的存储系统的通信。iSCSI将SCSI块存储命令封装到以太网数据包中,以便通过IP网络进行传输。这样,服务器就能够使用标准的SCSI存储命令通过标准的IP基础设施与共享的存储设备进行通信。iSCSI就是透过IP网络,将SCSI块数据转换成网络封包的一种传输标准,它和NAS一样透过IP网络来传输数据,但在数据存取方式上,则采用与NAS不同、却与FC-SAN相同的块协议。

二、数字图书馆系统存储方式的可行性分析

(一)三种存储方式对比分析

NAS、FC-SAN和IP-SAN在性能、存储介质等技术参数上存在一定的区别,而且其构建成本和管理模式也存在很大差异,数字图书馆系统要选用哪一种存储方式,必须经过对这些技术参数的深入研究,并结合自身的资金和设备条件,在现有资金技术条件下,采用最经济性的方案。NAS、FC- SAN和IP-SAN的差异如表1所示:

从上图可以看出,FC-SAN在其性能上具有明显的优势,便于集中管理而且完全不受电磁感染的影响,但数据传输受到距离的影响很大,在通常情况下不会大于50km,这决定了它不能有效地整合更多的主机与存储的需求。从资金投入上考虑,基于FC-SAN的存储设备价格居高不下,使用FC-SAN,必须购买HBA、光纤交换机、光纤磁盘阵列、管理软件等,其购置成本相对较高。NAS系统与FC-SAN相比存在明显的成本优势,但是由于NAS基于TCP/IP通信机制,在扩展性上存在局限性,性能不高,而且管理分散,无法满足用户对高效性和可靠性的要求。IP-SAN虽然在性能上略逊与FC-SAN,但是其成本低廉,而且没有距离的限制。

(二)数字图书馆存储方式的选择

我国的数字图书馆发展时间不长,而且在资金上相对紧张,购入高成本的存储设备对于图书馆的整体生存和发展来说是不经济的。在选择存储方式时,应该从实用性和经济性两个方面进行综合考虑,在三种方法中选取性价比最高的存储技术和存储方式。通过以上对NAS,SAN,IP-SAN这三种方式相关技术参数的对比分析,不难看出,IP-SAN在性能和成本上具有显著的优势。IP-SAN与上述两种方法相比,其优势主要体现在以下四个方面。首先,IP-SAN构建成本低廉。适配卡、交换机和缆线的购置成本都比FC要低很多,而且还可以使用免费下载的iSCSI Initiator驱动程序模拟iSCSI卡。其次,IP-SAN技术的使用没有距离的限制,它通过IP-网络来传输数据,传输距离无限制,这对于异地数据的传输及备份相对方便。第三,传输速度较快,虽然与FC-SAN的速度相比,IP-SAN稍微逊色,但其高达1GB的速度相比与NAS已经相当出色,完全可以满足数字图书馆的数据传输需要,并且在未来随着10GB以太网的普及,IP-SAN的速度可以随着提升为10GB,这比新一代的FC-SAN的4GB还要快得多。最后,由于IP-SAN采用的iSCSI技术,对于系统管理人员不像FC-SAN系统要求那么高,这就为数字图书馆省去了聘请专业技术人员的成本。总之,IP-SAN存储技术是在数字图书馆现有的资金水平和人员水平下,最具经济性的方案,是数字图书馆最佳的存储方式。

三、对未来数字图书馆网络存储技术的展望

数字图书馆是将包括多媒体在内的各种信息的数据化、存储管理、查询和发布集成在一起,使这些信息得以在网络上传播,从而最大限度地利用这些信息。数字图书馆利用多媒体数据库技术、超媒体技术,针对数字化书馆中各种媒体的特性,在图象检索、视频点播和文献资料提出等方面提出了一套有效可行的管理检索方案。在当今电子商业、环球市场、虚拟机构日趋普及的年代BitLibrary作为一套完善的媒体资产管理系统,无疑创造了一个安全稳妥的环境,方便共享和销售数字资料。数字图书馆是传统图书馆在信息时代的发展,它不但包含了传统图书馆的功能,向社会公众提供相应的服务,还融合了其他信息资源(如博物馆、档案馆等)的一些功能,提供综合的公共信息访问服务。可以这样说,数字图书馆将成为未来社会的公共信息中心和枢纽。信息化、网络化、数字化,这一连串的名词符号其根本点在于信息数字化;同样电子图书馆、虚拟图书馆、数字图书馆,不管我们用什么样的名词,数字化也是图书馆的发展方向。

网络化存储是未来数据存储的发展趋势,网络存储提高了数据的共享性、可用性、可扩展性和管理性,符合数字图书馆对信息存储的高可靠性、高兼容性和高安全性些缺陷的要求。目前NAS的性能较低,FC-SAN的实现费用较高,互操作性差,IP-SAN作为性价比最高的信息存储方式是数字图书馆系统的最佳选择,IP-SAN存储网络技术具有低成本、被广泛采用、良好的标准化情况、高扩展性、以及良好的安全性和QoS保证等诸多优点,并且随着高速度以太网的普及,IP-SAN存储方式的速度还将得到显著的提升,为数字图书馆系统的进一步发展提供强大的存储技术支持。

参考文献:

[1]彭建荣,网络存储技术及其发展趋势[J].计算机与现代化,2006(07).

[2]周敬治、张莲芬、林桂娜,数字资源存储系统的构建模式研究[J].情报科学,2007(01).

[3]基于IP的高可用海量网络存储系统的研究[J].通信学报,2007(01).