气象数据库系统故障问题浅析

2021-09-10 07:22张瑾
科学与生活 2021年14期

摘要:民航气象传真广播系统(简称气象数据库系统)主要由通信分系统、数据库分系统、预报平台、服务平台四部分组成,本文通过对几起数据库系统的故障分析,使大家能够分享维护经验,更加掌握数据库的数据流程,以便快速及时的解决故障。

关键词:气象数据库 应用服务器 资料处理子系统 应用库 历史库

1 引言

数据库分系统处理的主要气象资料包括:卫星云图资料,国家气象局 9210 业务系统的气象资料,世界区域预报系统发布的全球重要天气预告资料,主要机场气象台的天气雷达实时探测资料,各航站的自动观测资料,机场例行观测资料。

2 数据库分系统的接口

数据库分系统与通信分系统的接口是数据库服务器和应用服务器上的 /home/mhdbs/data 目录。通信分系统将接收到的气象资料按类别存放在该目录下的12个子目录中。资料处理子系统对/home/mhdbs/data目录下的12个子目录进行监控,当发现目录下有气象资料时,便会逐个对资料进行分析、分解,存入 Oracle 数据库中,在对某个气象资料处理完毕后将/home/mhdbs/data 下的该原始文件转移到/home/mhdbs/trash中相对应的目录中。预报平台、服务平台从Oracle数据库中读取所需信息。

3 数据库分系统的资料处理流程

由于归档文件会占用一定的服务器存储空间,即磁盘空间监控/home的使用率日积月累不断增长,因此为了更妥善的保存归档文件,系统提供归档文件迁入、迁出功能。资料文件的迁入迁出分为两个部分,其中归档资料文件的迁入是指将保存在已安装数据库管理子系统客户端的机器上的压缩归档文件迁入到服务器,归档资料文件的迁出是指将服务器的压缩归档文件迁出到已安装数据库管理子系统客户端的机器上,并在迁出时对迁移文件的正确性和完整性进行检查。

4 定期执行的操作

4.1 定期检查自动归档运行是否正常

以oracle登录服务器cd /home/mhdbs/data/backup/当天日期 查看归档文件一共有多少个,正常情况下应该为33个后缀为.zip的文件。如果文件个数不符合,请下载/home/mhdbs/bin/log/oracle日志信息,将日志信息发回数据库分系统厂商。

4.2 定期检查进程运行是否正常

每天查看12个入库进程的运行情况,如果发现异常,可以直接通过界面启动。如果12个入库进程异常终止,请将/home/mhdbs/bin/log下的日志发给数据库联系人。

4.3 定期检查自动资料清除运行是否正常

(1)进入【日志和统计】--【资料处理日志浏览】。

(2)级别仅选择error级别。

(3)若存在记录,请登录服务器下载/home/mhdbs/bin/log/dms文件夾下日志并发给数据库分系统联系人。

4.4 定期检查磁盘空间监控

若/home的磁盘利用率超过70%,建议利用数据库管理子系统客户端【资料处理】菜单下的【归档文件迁出】功能迁出归档文件。

磁盘空间监控发现/u0的使用率超过70%,则点击【系统监控】--【数据库监控】--【存储空间利用率】选项卡中的【回收空间】按钮释放空间。

5 案例分析

5.1 案例分析一

5.1.1 故障现场处置

最近一段时间,巡视数据库服务器磁盘空间监控时发现/home的使用率达到50%以上,有时甚至快达到60%。由于归档文件存放在/home/mhdbs/data/backup文件夹下,进一步检查发现,在/home/mhdbs/data/backup文件夹下,还有部分归档文件已经迁移成功但未删除,这样就占用了部分磁盘空间。经过对DB00和DB01数据库迁出文档保存文件夹对比检查,未迁出的重新进行【归档文件迁出】工作,已经迁出的运行命令:rm –r 文件目录,进行归档文件删除,只保留backup下2020年7月的归档文件。完成后/home的磁盘利用率降为35%。

另外/home/mhdbs/data/configtables下每隔五天保存一份配置文件备份,从2013年开始运行保存至今,虽然每份文件不大但日积月累也占用一定的磁盘空间。经咨询厂家工程师,可以删除以前备份。运行命令:du –sm 目录名称,可以检查目录所占空间大小。在DB01数据库/home/mhdbs下建立文件夹backup20200713,将2013年到2019年的配置文件备份先暂时迁移到此文件夹下,经过一段运行确定未影响正常运行后再进行删除。也可以释放/home一部分空间。/trash目录和日志未定时自动删除也会占用/home空间,需定时检查。至此大大降低了/home磁盘利用率。

5.1.2 故障原因分析

由于归档文件存放在/home/mhdbs/data/backup文件夹下,系统每天执行的自动归档操作产生的归档文件将不断的占用/home文件夹的使用空间,使得/home的磁盘利用率不断增大,为了保证系统的稳健运行,在每周五的周维护中,都会进行【归档文件迁出】工作,该功能可以将AIX服务器上存储的归档文件迁移到安装管理子系统客户端的PC机保存,并将已经迁移成功的归档文件从AIX服务器上删除,以释放/home的磁盘空间。

5.2 案例分析二

5.2.1 故障现场处置

3月09日,在检查预报室区域预警与机场警报综合处理软件时,发现该软件编发的机场警报(JJ)、终端区天气预警(ZD)、话音方式航空器空中报告(AR)以及MDRS重要天气概率预报(MR)在软件自带的本机数据库以及上海民航气象数据库可查询到相应产品,但在济南民航气象数据库查询不到。联系区域预警与机场警报综合处理软件工程师协助排查原因,上述类型的预报产品,经软件处理后自动发送到通信服务器receive/forecastchart目录下,由通信服务器根据BSB表完成上述产品通过数据库服务器prog进程入本地数据库IMAGE01_PROG数据表和转发上海处理,经查阅数据库prog进程日志,发现上述产品在本地入库时出现告警信息,导致未能入库。

5.2.2 故障原因分析

数据库服务器入库控制参数-常规天气图标准设置过大(100)导致上诉预报产品文件出现FILE SIZE ERROR告警未能入库,时间配置参数资料早到时间判定设置不合理(180)出现sendtime is too early告警导致产品文件未入库。联系太极工程师协助排查系统配置参数设置,打开数据库管理客户端,选择系统配置->业务处理配置->时间配置,更改资料早到时间判定参数为1440。选择系统配置->业务处理配置->入库控制,更改常规天气图标准参数为0。

6 结束语

气象数据库系统在民航气象情报交换中占有重要作用,保障整个数据库系统正常运行尤为重要,了解数据的基本流转流程,了解数据的整个架构,有助于维护维修人员快速的处理问题。随着维护经验的不断积累,对整个系统的保障技术会更加日益成熟,最大限度的保障设备的安全运行。

参考文献:

[1]气象信息系统基础 岗前培训教程

[2]余柏山,LINUX系统管理和网络管理.北京:清华大学出版社.2005

[3]民航传真广播系统数据库分系统使用手册

[4]民航传真广播系统改造工程AIX操作系统培训讲义

作者简介:张瑾,1972年5月,女,工程师,设备维护维修