SAN在非线性制作网中的应用

2012-04-08 19:01李道寰
关键词:高带宽磁盘硬盘

李道寰

(哈尔滨电视台,黑龙江 哈尔滨 150036)

SAN在非线性制作网中的应用

李道寰

(哈尔滨电视台,黑龙江 哈尔滨 150036)

SAN是一种类似于普通局域网的高速存储网络,应用在电视台的非线性编辑制作网中,不仅为其提供了安全稳定的高带宽,而且满足了广电领域特有的对数据流量和数据质量的高要求。试以哈尔滨电视台为例,介绍SAN的代表产品S2A6200存储体系的特点及常见问题的处理方法。

SAN;FC;存储;S2A6200

随着网络技术的迅猛发展,当前的非线性编辑系统已经不单单局限于单个的编辑机,也正在向着网络化的方向发展,哈尔滨电视台于2002年末建成了非线性编辑制作网。该网络采用FC网和以太网相结合的双网结构和双压缩率的技术,大大提高了电视节目的图像质量和制作能力。由于制作对画质的要求较高,这又带来了视频码流的提升,高质量的视频码流需要稳定的高带宽,而且随着网络站点的进一步增多,也需要稳定的高带宽。如何增加网络带宽?我们提出采用SAN中心存储来解决高带宽的方案。本文就以哈尔滨电视台为例,谈谈SAN存储体系在非线性制作网中的应用。

一 什么是SAN存储体系

SAN(Storage Area Network)是一个高速网络,有些类似局域网,将服务器和客户机工作站使用光纤通道(FCP)作为传输机制连接到磁盘阵列或磁带上。SAN通过消除服务器和存储之间专业的连接来使存储被许多主机共享。SAN最重要的因素是使网络上的任何一台机器在需要它的时候能够共享存储。SAN可以提供非常高的传输速率,具有支持多种协议和多种平台的能力,可以强化和合并数据的存储资源、存储池和存储管理,同时消除服务器的瓶颈。

二 哈尔滨电视台的SAN——S2A6200存储体系

哈尔滨电视台采用的SAN是DDN公司的S2A6200系列。它具有如下特点:

1.系统的高带宽。

在S2A6200存储体系中,由于存储体并发工作等结构的合理性和大容量Cache的增加,使得网络的带宽得到了大幅度的提高。同时,S2A6200方案中,Switch的连接方式由串联改为并联,使网络传输中的瓶颈消失了。大容量硬盘、大容量Cache、并联Switch、双通道HSTD模块输出让网络带宽在扩充的时候不会受到限制。

S2A6200控制器采用双控制器共4口配置(每个控制器开2个数据接口)并行工作。两台FC交换机共有4个接口与S2A6200的控制器连接。FC通道为100MBPS,并发4个FC通道理论总带宽为400MBPS。

2.系统的安全性。

在网络站点数量增多的时候,由于带宽在某些地方出现瓶颈,就使得网络的安全性和稳定性受到极大的影响。传统方案,对于硬盘塔只应用了RAID3进行备份,而不存在硬盘的热备份,所以硬盘的安全性存在着很大的问题。而S2A6200系统则具备硬盘热备功能,系统正常工作时,如果其中某块硬盘出现故障,可在不关闭S2A6200系统的情况下进行替换,保证正常的编辑播出不受影响,最大限度的保障了整个网络系统的安全性和稳定性。

3.系统逻辑单元。

S2A6200提供的是真正的共享的高读写带宽,所有的I/O均是针对同一个LUN(逻辑盘)所进行的,而且硬盘不需分组,实现了真正的全局共享。

那么S2A6200是怎样协同多块硬盘工作的呢?

S2A6200中最多32个TIER可以是一个LUN,在系统中提供一个逻辑硬盘,我们在工作站中访问的就是此逻辑盘。我们在此网络中使用60块的硬盘,其中50块146G的硬盘,10块73G的硬盘。我们所定义的是每10块硬盘一组,共六组。每组对应位置上的硬盘和为一个TIER,我们所定义的是第一个TIER为第一个LUN,大小为(583GB);第二和第三个TIER是第二个LUN,大小是(2TB);第四和第五个TIER是第三个LUN(2TB),第六个TIER是第四个LUN大小是(1TB)。我们的S2A6200就定义了这四个LUN。

我们在工作站上看到的就是这四个逻辑盘的盘符,我们访问的是组成LUN0和LUN1,LUN2,LUN3的逻辑盘。

三 S2A6200常见问题的处理方法

1.磁盘错误的处理。

磁盘的错误分几个等级,不同的等级对应不同级别的错误,有的错误系统可以自动修复,有的需要手动修复,有的则不能修复只能通过更换解决。

(1)KEY1错误。KEY1错误出现的最频繁。多出现在磁盘不稳定的状态下,这种错误系统发现后能自动的修复,但是当有大量的KEY1错误出现时,说明这块硬盘已经不能使用,需要更换。

(2)KEY2和KEY6的错误。这两个问题是磁盘没有准备好的错误。这是硬盘转速下降,系统自动重启初始化这块硬盘的过程中所报的错误。这种错误如果频繁出现,则可能是硬盘箱和线的问题。

(3)KEY3的错误。这个错误是中等的错误。系统发现后需要手动修复。

(4)KEY4的错误。这个错误是致命的,系统报这个错误说明硬盘已经有硬件的问题,就只能更换了。

(5)KEY B的错误。当有大量的磁盘出现这个报错,则是硬盘通道的故障,或者是线或者是IO模块的故障。

2.磁盘通道故障。

(1)通道无法访问故障,此类故障由不稳定的磁盘端口或磁盘通道线引起。信息显示S2A磁盘通道D无法完成初始化过程,导致控制器无法正确识别D通道内的所有硬盘;如果S2A系统出现以上信息,建议现场对该磁盘链路进行可靠性检查和交换测试,包括控制器磁盘端口和磁盘通道线,重点是磁盘通道线。

(2)通道硬盘读写错误故障,此类故障由不稳定的IO模块引起,常见现象如下,

Key: B ASC 47 ASCQ 0 FRU 3 Info 0211C400

Disk_Int 11-3 10:23:50 Recovered Aborted Command Disk 5B ID 6

Key: B ASC 47 ASCQ 0 FRU 3 Info 01C8E1C0

Disk_Int 11-3 10:44:10 Recovered Aborted Command Disk 2B ID af

Key: B ASC 47 ASCQ 0 FRU 3 Info 01CAD440

Disk_Int 11-3 10:44:23 Recovered Aborted Command Disk 4B ID cd

Key: B ASC 47 ASCQ 0 FRU 3 Info 02066800

Disk_Int 11-3 10:58:06 Recovered Aborted Command Disk 1B ID 4c

Key: B ASC 47 ASCQ 0 FRU 3 Info 01C9B400

Disk_Int 11-3 11:06:32 Recovered Aborted Command Disk 3B ID e0

以上信息显示S2A控制器在读写B通道中所有硬盘时发生错误,并且控制器在试图修复此错误时失败;如果S2A系统显示以上信息,建议现场对该磁盘链路进行可靠性检查和交换测试,包括磁盘通道线和磁盘阵列IO模块,重点是IO模块。

3.主机通道连接链路故障。

(1)S2A主机端口到光纤通道交换机之间的连接链路故障,此类故障是由于连接部件不稳定引起,常见问题如以下S2A系统日志文档片段:

DMT_12 9-25 17:24:46 Command Aborted: SCSI cmd:2A LUN 1 DMT_12 Lane:6 T:300

a:51984647 l: 9a8 00/21 02,02 W:RDY AB

xxxx-01 WWN:10000000C92Cxxxx port:1 lane:6 OX_ID:0247

此报错信息提示主机“xxxx-01”在S2A某一端口上的R/W操作请求由于等待时间过长被S2A系统中止;“SCSI cmd”代表主机对S2A读/写操作,“T:300”代表S2A对该请求的等待时间,“port1”代表响应并中止这一操作的S2A主机端口。

如果S2A系统的某一个主机端口在短时间内频繁发生以上报错,建议现场对该端口与交换机端口之间的连接链路进行可靠性检查和交换测试,包括MIA/线缆/GBIC/交换机端口,重点是铜缆或光纤线缆。

Host_Int 12-28 22:52:47 HOST48: CRC error frame received

Time_Int 12-28 22:53:17 Timeout: SCSI cmd:2A LUN 0 DMT_42 Lane:0 T:300

a:8328C399 l: 198 21/21 03,01 W:RSP

Anonymous WWN:10000000C92A7xxxx port:4 lane:0 OX_ID:00EA

此报错信息提示S2A主机端口4接收到CRC校验出错的数据帧,同时主机对S2A的操作请求因等待时间过长被S2A系统中止;“HOST48”代表S2A主机端口4收到坏帧,其他标识含义与上例相同。

如果S2A系统的某一个主机端口在短时间内频繁发生以上报错,建议现场对该端口与交换机端口之间的连接链路进行可靠性检查和交换测试,包括MIA/线缆/GBIC/交换机端口,重点是该端口连线在交换机上所连接的GBIC。

(2)光纤交换机端口到主机之间的链路故障。此类故障是由于主机的HBA或主机到交换机的光纤不稳定引起。

常见问题如以下日志片段:

DMT_16 9-25 17:24:56 Command Aborted: SCSI cmd:28 LUN 1 DMT_16 Lane:1 T:7

a:B8091511 l: 9a8 00/00 02,02 W:RDY AB

xxxx-01 WWN:10000000C92Cxxxx port:1 lane:1 OX_ID:02D5

此报错信息提示主机“xxxx-01”对S2A主机端口1的数据操作请求被来自主机方面的命令中止。

如果S2A系统的某一个主机端口在短时间内频繁发生以上报错,建议现场对该主机与交换机端口之间的连接链路进行可靠性检查和交换测试,包括HBA/线缆/GBIC/交换机端口,重点是该主机的HBA和主机至交换机的光纤连线。

在以上几例中,判断“Command Aborted”命令来源可以借助系统显示的时间参数T,当此参数在100以上时,可以判断数据请求被S2A中止;当此参数远远小于100时,可以判断数据请求被主机中止。

四 结语

SAN以光纤通道(Fibre Channel)为基础,实现了大容量存储设备数据的共享,突破了现有的距离限制和容量限制,具有高速的存储设备通道,灵活的存储设备配置要求,快速的数据备份,兼容以前的存储设备,数据的高可靠性等优点,为非线性制作网提供了安全稳定的高带宽,满足了广电领域特有的对数据流量和数据质量的高要求。目前,SAN存储体系正在迅速发展,新产品将在带宽、系统的稳定性、IO的吞吐、磁盘的容量上有更大的提升。SAN存储在非线性制作网络中的使用必将有更广阔的空间。

[1]喻春轩.新世纪的数字网络电视[J].广播与电视技术,2001(2).

[2]汪支方.曲靖市中小学教育教学数据资源共享平台集成研究[D].昆明理工大学,2007.

[3]陈伟娜.基于光纤通道技术的易迅空间系统[D].暨南大学,2007.

ClassNo.:TN948.4DocumentMark:A

(责任编辑:宋瑞斌)

ApplicationofSANintheNonlinearEditingSystem

Li Daohuan

SAN is a high-speed storage network, just like a local area network. The application of SAN in nonlinear editing system, not only the stable high-speed bandwidth can be supplied, but also the requirements for the higher quality of the data flow can be met. The paper introduces the characteristics of the product S2A6200 which is a representative of SAN series and the method to solve the problems happened during the operation of SAN network.

SAN;PC;storage;S2A6200

李道寰,工程师,哈尔滨电视台制作中心。

1672-6758(2012)07-0080-2

TN948.4

A

猜你喜欢
高带宽磁盘硬盘
HiFi级4K硬盘播放机 亿格瑞A15
Egreat(亿格瑞)A10二代 4K硬盘播放机
解决Windows磁盘签名冲突
Achronix推出突破性的FPGA系列产品
修改磁盘属性
城市光网引领高带宽应用探讨
面向PPPoE用户的宽带测速平台的搭建和应用研究
磁盘组群组及iSCSI Target设置
创建VSAN群集
我区电视台对硬盘播出系统的应用