陕西省历史高空气象观测记录表数字化成果

2014-09-27 02:37张聪娥陕西省气象信息中心西安710014
陕西气象 2014年2期
关键词:图像文件记录表高空

张聪娥(陕西省气象信息中心,西安 710014)

陕西省历史高空气象观测记录表数字化成果

张聪娥
(陕西省气象信息中心,西安 710014)

简要介绍了“陕西省历史高空气象观测记录表数字化处理”工作的内容、成果,并对成果数据集、文件结构进行了简要介绍,旨在使资料管理者和使用者及时了解气象档案数据结构,提高资料检索能力和资料使用效率;最后指出了本次数字化资料存在的问题,以供使用者参考和后续资料整编修正。

数字化;扫描图像数据集;录入文件数据集;陕西

气象资料数字化处理是将纸介质历史资料转为电子介质信息,以实现气象资料的电子检索和利用。由于年代长、保存条件差和PC-1500计算机打印质量等问题,许多高空观测记录表纸张已经出现不同程度的变质,字迹严重变淡、变模糊,这些原始观测资料急需尽快拯救和保护。目前,国家气息信息中心已对馆藏的高空气象观测记录月报表(高表-1、高表-2)进行了数字化扫描和数字化录入,而各省(区、市)气象档案馆馆藏的历史高空气象观测记录表高表-11、高表-12、高表-13、高表-14、高表-16还没有进行信息化处理,因此,中国气象局启动了《气候变化应对决策支撑系统工程》—“近代器测历史气候资料拯救和数字化子系统”项目,要求对历史高空气象观测记录表进行数字化处理。陕西省2012年5月—2013年9月开展“陕西省历史高空气象观测记录表数字化处理”工作,对西安(泾河)、延安、汉中、安康、洛川5个高空探测站1954—2010年高表-11、高表-12、高表-13、高表-14、高表-16等高空观测记录表进行数字化扫描,对1957—2010年07时和19时高表-12、高表-13中从地面~5 hPa规定等压面风资料进行数字化录入,并对所有扫描的图像文件和录入的数据文件进行了认真全面的质量检查。本文简要介绍成果数据集、文件结构,使资料管理者和使用者及时了解气象档案数据结构,提高资料检索能力和资料使用效率。

1 数字化成果

“陕西省历史高空气象观测记录表数字化处理”工作主要形成以下数字化成果:高空观测记录表扫描图像文件数据集(见表1)、高空观测规定等压面风录入文件数据集(见表2)。

表1 陕西省高空观测记录表图像文件数据集清单

表2 陕西省高空规定等压面风录入文件数据集清单

2 数据组成和文件结构

2.1 高空观测记录表扫描图像文件数据集

该数据集提供高空风向风速、压、温、湿等原始探测数据,由若干图像文件组成,每页记录表对应一个文件。当需要原始探测数据时可检索该数据集里的文件,调阅对应观测记录表图像。

经纬仪小球测风观测记录表(高表-11)扫描图像文件数据集提供规定高度层风向、风速等原始探测数据;探空球测风观测记录表(高表-12)扫描图像文件数据集、雷达测风观测记录表(高表-13)扫描图像文件数据集、雷达单独测风观测记录表(高表-16)扫描图像文件数据集提供规定高度、规定等压面层风向、风速等原始探测数据。文件名为“UPAR_WEW_xx_MUL_FTM_GBnn_JPG_IIiii_YYYYMMDD_TTz.jpg”,其中“UPAR_WEW”、“MUL_FTM”、“JPG”为固定码;“xx” 为省区标识符,陕西省为SN;“GBnn”为高表类别代码,nn取11、12、13、16时分别表示高表-11、高表-12、高表-13、高表-16;“IIiii”为区站号(如延安为53845);“YYYYMMDD_TTz”为记录表年(4位)、月(2位)、日(2位)、时(北京时,2位)、页码(1位)。例如:文件UPAR_WEW_SN_MUL_FTM_GB11_JPG_53845_19580101_191.jpg表示延安1958年1月1日19时小球测风观测记录表第1页;探空观测记录表(高表-14)扫描图像文件数据集提供规定等压面层、特性层、零度层及对流层顶高度、压、温、湿等原始探测数据。文件名为UPAR_WEA_xx_MUL_FTM_GB14_JPG_IIiii_YYYYMMDD_TTz.jpg ,其中“UPAR_WEA”、“GB”为固定码,其余含义同上。如UPAR_WEA_SN_MUL_FTM_GB14_JPG_53845_19580101_072.jpg表示延安1958年1月1日07时探空观测记录表第2页。

2.2 高空观测规定等压面风录入文件数据集

该数据集提供规定等压面层高度、风向、风速等数字化数据,由若干文本文件组成,每月对应一个文件。当需要数字化资料时可检索该数据集里的文件,打开对应文件读取数据。

文件名为“GAAF-IIiii-YYYYMM.TXT”,简称GAAF文件(GAAF表示高空观测规定等压面层风),“IIiii”、“YYYY”、“MM”分别为区站号、年份、月份。例如,文件GAAF-53845-195803.TXT表示延安1958年3月规定等压面风录入文件。

GAAF文件由台站参数、风资料数据和文件结束符组成。台站参数是文件的第一条记录,共5组占一行,从左至右分别为区站号、测风海拔高度、测站类别和探测次数、年份、月份;风资料数据分时次(先07时后19时)按日期升序录入。每日数据记录包括探测时间、各层(地面~5 hPa)数据两部分。探测时间为一组,共8位占一行;各层数据排列规则为:每层5组数据占一行,从左至右分别为气压、位势高度、时间、风向、风速,根据等压面层数顺序录入。每日数据记录以“,”结束,月最后一日记录以“=”结束,文件以“######”结束。

3 成果不足

(1) B01文件是包含规定等压面风资料的数据集,是最有比对性的参照数据源。利用“高空数据录入质量检查软件”对1981—2010年规定等压面风录入数据进行质量检查时主要采用“与B01文件对比检查”这一检查方法,而1957—1980年无B01文件,所以对这一段录入数据进行质量检查时由于没有参照数据,“与B01文件对比检查”这一关键检查无法进行,录入数据中存在的一些潜在错误可能没有及时发现。

(2)1957—1968年高表-11和高表-12交替使用频繁,承担高空观测记录表数字化的公司录入人员不熟悉记录表格式,有些时次高表-11的风资料被误录入。由于高表-11是用规定等压面的平均高度而非实测高度计算出来的风资料,数据缺乏代表性,但时间紧、任务重,这些错误还未得到纠正,以致这部分数字化资料缺乏真实性和可信度。

以上问题有待在今后资料整编、资料服务以及业务、科研使用过程中继续修正和完善。

张聪娥.陕西省历史高空气象观测记录表数字化成果[J].陕西气象,2014(2):36-38.

1006-4354(2014)02-0036-03

2014-01-07

张聪娥(1963—),女,陕西户县人,工程师,从事高空气象资料、报表审核。

中国气象局重点建设项目“气候变化应对决策支撑系统工程”

B

猜你喜欢
图像文件记录表高空
2022.04.21~2022.05.20国外运载火箭发射记录表
2022.1.21~2022.2.20国外运载火箭发射记录表
高空走绳
2021.01.21~2021.02.20 国外运载火箭发射记录表
2020.7.21~2020.8.20国外运载火箭发射记录表
高空缆车
不要高空抛物!
高空莫抛物
图像电子文件的归档格式及其转换研究
两步把PDF转为Word文档