电视台硬盘播出系统故障处理

2009-11-16 02:48罗蕴军
声屏世界 2009年10期
关键词:磁盘阵列日志硬盘

播出系统概述

新余电视台的硬盘播出系统主要由两台MagiStream视频服务器、两台数据库服务器、一套二级存储硬盘阵列系统(盘塔)及多台工作站组成。两台视频服务器互为热备份,具有快速响应能力,高度安全可靠的播出能力,以及超大容量的在线存储能力。基本存储容量为150h(8Mbit/s),存储模块采用RAID 5技术,各带3块通道卡。通道卡带可嵌入式数字SDI输出和模拟复合输出。服务器通过局域网支持素材本地上载,或通过网络异地实时上载,支持素材以数据文件方式高速上传到本地服务器。数据库服务器用来存储管理各种播出信息,如节目上载、节目播出、视音频节目的一致性检查、用户账号、用户操作权限、数据备份与恢复、日志管理等工作。各工作站分别完成相应的功能(如上载、编单、审片、迁移和播控)。

各制作部门将节目直接通过线缆经上载通道和网络交换机进入视频服务器存储,或进入二级存储的硬盘阵列中。在播出控制机的控制下,服务器存储的素材按节目播出单的顺序依次由视频服务器的解码通道回放、经切换、键叠加、音频处理等环节送到传送端口发送。除了信号主通道外,还有由矩阵作为核心单元的信号调度部分、与模拟系统互联的A/D、D/A、加解嵌系统、同步系统、控制网络系统、通讯网络系统、数据服务系统、监听监看系统等,作为不可或缺的组成单元共同完成播出任务。

播出系统故障处理

一、播控工作站播控界面灰条显示。

故障现象:播控工作站告警,提示无法链接上数据库,执行全部自动提取后,播控界面全部灰条显示,上载节目、导入素材都无法进行。

技术分析:此故障主要原因是由于各工作站都无法链接上文件服务器,也就是说链接不上数据库造成的。链接不上数据库,就意味着无法向数据库中写入文件信息,也无法从数据库中提取出文件信息,从而使上载节目、导入素材及节目播出都无法正常进行。

处理方法:1.分别对主、备数据库服务器进入重启,使服务器在重启后,数据库恢复正常工作。2.如果多次出现这种现象,应做好数据库备份,然后将文件服务器操作系统原有GHOST备份进行恢复,恢复备份数据库。3.如果这种现象比较频繁,需要重新设置系统,重新安装数据库。这是一项比较慎重的工作,要把各种因素都考虑到,如做好数据库备份,找到最近版本的数据库脚本等等。

二、节目状态在各终端显示不一致。

故障现象:待播节目在播出工作站节目播出单上显示节目状态为“缺文件”,而经查询,该节目在审片端显示状态正常,同时经验证主、备服务器和二级存储阵列(盘塔)均存在该节目文件。

技术分析:此故障一般在节目从二级存储阵列(盘塔)自动向主、备服务器进行节目迁移时出现,是因网络出现瞬时拥堵而造成,而且两个服务器中必有一个服务器存在的节目文件是正确的。

处理方法:对于缺文件现象,可在“在线播出”界面上双击该文件,下端即显示缺文件的原因。1.在时间允许的情况下,在主、备服务器的磁盘阵列中查找到相应节目的文件夹,可将正常文件夹内的视频、音频、数据等文件一起拷入另一服务器上的该节目文件夹内,进行同名文件覆盖。文件复制即将完毕时会报错,将错误确定后,在播出工作站进行节目提取。节目播出单上该节目显示状态正常,则故障排除。2.如果时间不允许,且节目播出单也不能调整,但已知哪个服务器上有正常节目文件,可在该节目将要播出前将切换矩阵手动切换至相应路数。3.如果时间不允许,节目播出单也不能调整,又无法确定是哪个服务器上的节目文件不正常,播控操作人员必须时刻关注监视器,同时作好手动切换准备。自动切换后,如播出节目画面正确,不必进行任何操作,如播出的是垫片画面,操作人员应在第一时间进行手动切换。由于该方法有可能会出现半秒左右垫片画面,一般不建议使用。4.事后,应找到引起网络瞬时拥堵的根源,彻底消除此类故障的发生。

三、播控软件中的功能操作无响应。

故障现象:两个频道的主、备播出终端机在退出并再次进入播控软件时,长时间没有响应,或进入播控软件后,对节目单的多项功能操作无响应,但主、备服务器按原有播出程序正常播出电视节目。

技术分析:此故障主要原因是应用数据库的急速膨胀引起数据库服务器的运行效率低下,影响播出终端机与数据库的通信。在硬盘播出系统中,数据库记录了大量重要的数据,是整个系统安全运行的核心部分。数据库中除需要记录业务工作必须的节目单、素材、广告包以及部分管理数据信息外,还处理整个系统所有相关的操作记录相应的日志,如编单日志、上载日志、节目播出日志、播出操作日志等。伴随整个系统的正常运转,数据库中记录的日志文件快速增长,直接导致应用数据库日志文件急剧膨胀,数据库服务器的运行效率日益低下。

处理方法:1.在不影响播出的前提下,分别对主、备数据库服务器进入重启,让服务器在重启过程中自动释放一定的应用数据库空间,完成当日的正常播出。2.对日志文件进行截断动作,即可将日志文件记录的过期动作进行清除,并重新记录新的动作,这样就可以有效地限制日志文件增多。3.如果在采取截断日志动作之前,数据库文件已经庞大到无法正常运行,可通过数据库管理工具本身提供的压缩功能,压缩日志文件。4.建议定期对过期的数据进行清除或转存备份,以确保应用数据库的简洁高效。

四、播出服务器告警写入操作失败。

故障现象:服务器告警,提示“系统试图从缓冲区传输文件数据到DeviceHarddiskPartitionlClips,写入操作失败,且仅有部分数据能写入文件”。同时控制器上显示“CHL=XID=X Parity/CRC Error”。

技术分析:服务器盘塔中硬盘出现坏块或磁盘阵列RAID出现故障。

处理方法:1.重启服务器后,提示盘塔中有坏块存在,需要运行CHIKDISK。忽略磁盘检测程序,服务器直接进入播出界面。2.如第一方法处理后,还是提示盘塔中有坏块存在,重新做REBUILDING。3.如故障依旧,就需要对磁盘阵列重新做RAID5,做完RAID5后,格式化磁盘阵列,在磁盘阵列中建立CLIPS文件夹共享,然后从另一服务器中把其CLIPS中的所有文件复制过来即可,这些步骤需花费很长时间,一般在每天非重要播出时间(如停播后及开播前)进行。

五、视频服务器控制器出现报警音。

故障现象:视频服务器的RAID控制器多次出现周期性报警音,并在日志中报告读写时延或响应缓慢。

技术分析:视频服务器的硬盘在使用了一段时间后可能会出现问题。比如,硬盘在读写的过程中因随机造成数据错误;硬盘接近寿命终结时会多次出错,并频频报警,或在日志中报告多次读写时延或响应缓慢。

处理方法:在系统首次报告硬盘问题时不必立即更换,认真分析系统的运行日志,详细了解硬盘的故障原因。对于随机因素造成数据错误,可以在RAID阵列中对该盘进行数据恢复。如果该盘多次出现错误,并在日志中报告多次读写时延或响应缓慢,应尽快更换坏硬盘。在更换或重启硬盘时,一般要先在操作系统中将硬盘设为DEAD,让该盘脱离阵列的工作。在系统报告操作完成后,轻轻将硬盘抽出一点,以硬盘接口断电为宜,再让硬盘在槽位上停留1min左右,完全停转后再抽出。此时不要马上抽离硬盘,以避免划伤。

六、上载工作站采集中途画面静止。

故障现象:上载工作站上载软件启动正常,刚开始采集正常,但采集中途画面静止,提示“重新初始化采集板卡”。

技术分析:从故障情况可以判断,上载工作站网络连接应该没有问题,也就是说和所要传输的目的盘及所连接的文件服务器没有问题,问题出在上载工作站采集卡上。

处理方法:1.重启该上载工作站。2.在操作系统的硬件设备管理器中将采集卡卸载后,再扫描硬件改动,重新安装采集卡的驱动程序。3.打开机箱,取下采集卡,清理一下插槽及板卡插排,重新开机。

(作者单位:新余电视台)

参考文献:

1.张彤:《浅谈硬盘播出设备的安全维护》,《内蒙古广播与电视技术》,2007(2)。

2.罗蕴军,金 乙:《电视台数字硬盘播出系统故障浅析》,《电视技术》,2007(5)。

3.盛敏:《硬盘播出中常见故障的应急处理》,《西部广播电视》,2007(9)。

猜你喜欢
磁盘阵列日志硬盘
一名老党员的工作日志
扶贫日志
HiFi级4K硬盘播放机 亿格瑞A15
Egreat(亿格瑞)A10二代 4K硬盘播放机
更换磁盘阵列磁盘
游学日志
我区电视台对硬盘播出系统的应用
电视播出机房磁盘阵列预防性维护
一种基于粗集和SVM的Web日志挖掘模型
一例EMS磁盘阵列故障分析及改进