气象信息系统中的存储区域网络选型与应用*

2021-05-21 06:27王证帅陈荣忠吕巧谊
海峡科学 2021年4期
关键词:存储设备光纤气象

黄 澎 王证帅 陈荣忠 吕巧谊

(1.厦门市气象灾害防御技术中心,福建 厦门 361006;2.厦门海峡气象开放重点实验室,福建 厦门 361006)

1 概述

在气象信息数据急速增长的今天,高效地存储和处理数据成为气象科学发展的新重点[1]。从效率的角度来说,除了购买高性能的存储硬件设备、优化存储系统软件外,还需要在架构上合理设计整个系统的存储方式。在企业级的存储解决方案中,传统的存储架构早已被存储区域网络(Storage Area Network,SAN)所取代。近些年来,存储区域网络在气象信息系统中也已得到了部分应用,但是,在设计气象网络架构时,科研和业务技术人员通常聚焦于IP网络的设计以及网络安全层面的规划,忽略了对存储区域网络的探讨。事实上,选择一种合适的存储区域网络对于气象信息系统设计来说十分必要。

基于此,本文将首先以光纤通道存储区域网络(Fibre Channel Storage Area Network,FC SAN)为重点,阐述当前主流的存储区域网络架构与原理,并对气象信息系统中的存储区域网络选型给出建议。最后,通过厦门市气象局信息系统升级改造项目总结存储区域网络在气象信息系统中的典型应用。本研究旨在为后续的气象网络规划工作提供参考。

2 存储区域网络原理简介

传统概念中,存储设备作为主机的一部分而存在,主机通过内部IO总线与其进行数据交互。这种模式下存储的可扩展性和安全性都存在着较大弊端,无法满足企业级数据存储需求。随后诞生的直连式存储(Direct-attached Storage,DAS)方案一定程度上缓解了上述弊端带来的存储压力。直连式存储将存储设备与服务端剥离开,通过SCSI技术或FC技术将存储设备直接外挂于主机总线上,提高了存储设备的可扩展性,满足了高性能传输需求。但是,DAS模式下,主机仍然会占用相当大运算资源去进行存储维护与管理。同时,DAS往往直接采用SCSI通道作为主机与存储的连接,而SCSI通道带宽不高,且可用于建立SCSI连接的SCSI ID有限,因而无法满足大规模的连接需求。所以目前,DAS方式仅用于小型系统中[2]。

为了解决DAS的不足,SAN应运而生。SAN是目前大中型IDC机房的“标配”。本质上,SAN将存储设备作为一个独立的网络单元,供其他设备共享。在SAN架构下,服务器与存储设备间通过FC、IP等通道连接,解决了DAS直接以SCSI通道进行连接的不足。SAN将存储设备进行网络化管理,有利于存储整合和资源共享并且具有高可靠性和可扩展性,同时还便于数据备份和统一灾备。

主流的SAN架构包括FC SAN、IP SAN、FCOE等,这些SAN架构的区别在于IO数据的外层封装方式以及传输链路存在差异,表1为三种存储区域网络的比较。

表1 三种主流SAN架构对比

其中,FC SAN应用最广,采用FC SAN架构时,连接存储设备的服务器需配置FC HBA卡,并且需要专门购买价格昂贵的光纤交换机。数据传输过程中,主机下发的IO操作通过FC HBA卡被封装成FC数据包,然后通过光纤交换机进行传输。值得一提的是,FC只是一种封装和传输协议,实际组网中的传输介质并不一定是光纤,只不过目前绝大多数FC SAN是以光纤作为物理链路。典型的FC SAN组网拓扑见图1。

图1 FC SAN组网拓扑

当前,已经有相当一部分应用场景开始使用IP SAN以及FCOE(Fibre Channel over Ethernet)方式来组建存储区域网络。与FC SAN相比,IP SAN以及FCOE的组网成本相对较低。IP SAN下,主机IO的操作被封装在IP数据包中,而FCOE下,IO被封装进二层以太网帧中。这两种方式将存储区域网络以及 TCP/IP网络有机地结合在一起,节约了SAN的建设成本。不过,在目前已有的技术条件下,其传输效率不如FC SAN。

谈到SAN,不得不提网络附加存储 NAS(Network Attached Storage)。NAS是指一个具有独立操作系统的网络存储单元。该存储单元通过NFS、CIFS等文件共享协议将自身目录进行网络共享,而客户端系统则根据需求将共享目录挂载进文件系统目录树。经常被使用的Windows网络映射盘就是NAS共享的一种方式,该方式在气象信息系统中被广泛使用。NAS的存储部分可以是NAS服务器自带的物理硬盘,也可以是SAN中的存储单元。本文认为,服务器对待网络映射盘(NAS方式)与SAN提供的磁盘的最根本区别在于IO的最小单位。读写网络映射盘时,主机每次向NAS服务端请求的单位是文件,而读写SAN盘时,主机每次向SAN存储发出的IO最小单位是存储的底层物理单元(例如簇)。在实际应用场景中,NAS与SAN经常融合组网以满足多种业务访问需求。

3 气象信息系统存储区域网络选型建议

目前,气象探测设备的空间分布密度大规模增加,每天由自动站、雷达、气象卫星以及各种各样的探测设备传回的气象数据以PB级增加[3]。同时,探测精度的提升、数据二次开发需求的增加也对存储的空间和性能提出了新的挑战。因此,必须合理地对气象数据的存储进行规划与布局,才能从容面对气象大数据时代的到来。本文将从省、市、区三个级别探讨存储区域网络的选型建议。

省级气象信息中心是每个省气象数据的存储核心与枢纽,在存储的规划与设计上需要兼顾性能、稳定性以及安全性。在当前技术条件下,相比于其他存储区域网络类型,FC SAN具有速度快、稳定性高等优势,因此可以优先选择FC SAN 作为省级气象信息系统存储架构。为了实现数据存储的物理安全性,在节点部署上应当以双节点双链路进行冗余设计,必要时还应当进行数据的异地容灾建设。而考虑到目前气象信息系统中广泛使用映射盘作为单位间的数据传递方式,因此在FC SAN的基础上建议配置高性能的专用NAS服务器,以提高映射盘访问速度。

市级的气象信息系统主要存储本地气象信息数据,以及对省级数据进行备份。若不涉及对外单位提供数据服务,没有高并发的IO需求,可以不专门建设存储区域网络而直接采用直连式存储,然后采用NAS方式进行数据共享,节约建设成本。若IO需求较大,可以选择价格相对FC SAN低的IP SAN 或 FCOE方式进行存储组网。而个别访问量大,IO性能要求很高的地市建议参照省级方式进行FC SAN建设。在市级存储区域网络建设时,还应充分考虑下辖县级气象信息系统的存储需求,可以将部分存储需求较大的县级存储集约至市级,便于存储的后续统一管理与维护。

县级气象信息系统因IO数据量较少,不建议单独建设SAN。在某些特殊情况下,例如有些县级需要建设小规模的虚拟化平台,那么可以用光纤专线接入所在市级系统的SAN(直接以FC通道经光纤接入,非IP方式接入),无需专门自建一套存储系统。但是,当以此种方式接入市级存储区域网络时,市级系统应当在边界做好数据安全措施,确保数据安全。此外,县级气象信息系统可以根据本地气象信息数据量大小决定是否购买小型NAS设备以便进行数据共享。

4 存储区域网络在气象信息系统中的典型应用

气象系统的业务具有一定特性,除了满足日常业务数据的存取需求,还要兼顾科研、外单位数据共享等方面的因素[4],因此需要根据具体情况来规划和部署存储区域网络。本文将以厦门市气象局信息系统升级改造项目为实践基础,简述存储区域网络在气象信息系统中的典型应用。简要拓扑见图2。

图2 厦门市气象局存储区域网络简图

系统采用FC SAN组网模式将三个主要模块接入存储区域网络,分别为NAS服务器、虚拟化资源池以及部分机架式服务器。其中,NAS服务器用来满足快速的映射盘服务,对各气象业务部门以及外单位提供高速数据共享。虚拟化资源池由多台高性能服务器组成,划分为若干集群,承载了全市气象信息系统中的绝大部分虚拟机的运行。根据科研以及业务需求,部分机架式服务器(如数据库服务器)也被接入存储区域网络,用以实现高性能存储与计算。

图2中,存储资源池由SSD盘与SAS盘分级构成,重要业务与应用划分SSD盘,而普通业务划分SAS盘,这种分级方式在节约建设成本的同时实现了性能的定向优化。对于客户端来说,服务端采用的存储架构是透明的,客户端与服务端通过IP网络进行数据的交互。该应用方案提升了客户端层面对气象信息数据的访问,加快了应用层面的读取效率,同时方便了数据的备份,提高了数据安全性。

5 结束语

气象大数据时代,存储是基础和重点,存储性能的优劣直接决定数据存取快慢,而存储区域网络的合理设计能更好地发挥出存储的性能和节约建设成本。气象信息网络工作者十分有必要加深对存储以及存储区域网络的理解,从而为做好新时代气象信息服务提供保障。

猜你喜欢
存储设备光纤气象
气象树
《内蒙古气象》征稿简则
FIBBR King-A系列HDMI光纤线
高品质的忠实还原 FIBBR Ultra Pro2 HDMI光纤线
一条光纤HDMI线的诞生长飞/长芯盛FIBBR工厂走访实录
大国气象
美丽的气象奇观
全国产1550nm 窄脉宽光纤放大器
浅析计算机硬件发展史
浅析铁路视频监控存储设备设计