王丽吉,魏爽,刘熔熔
(浙江省气象信息网络中心,杭州310017)
地面观测因其原位探测原理,成为所有观测手段中对真实大气的最可靠逼近。地面观测业务化直接关系到天气预报的准确性,同时也是极端天气灾害、季风变率、气候模式改进等相关研究工作的主要数据支撑[1],因而从早期就有较完整的历史资料积累。然而,由于观测手段与信息化能力的不断发展,历史气象资料存在数据源多样、存储手段多样等非均一化问题。
降水随时间变化的过程和降水强度,对于研究我国降水特征,尤其是暴雨特征具有重要意义,而短时强降水因发生时间短、强度大,造成的危害更大。因此,长时间序列、高时间分辨率、高质量的降水数据产品的研制需求迫切[2]。在自动观测业务化运行之前台站观测设备为非传感器形式,其中降水观测使用自记式雨量计,降水过程在自记纸上留下的降水曲线(即降水迹线)客观记录了降水随时间变化的过程,反映了各种时段的降水强度,其最小时间分辨率为分钟,是其他降水观测资料所不可替代的[3]。而自动观测业务化运行之后降水量的观测由自动雨量传感器获得,无论是数据的存储、传输还是使用都已数字化。
早期的降水自记纸时间跨度长、观测时间分辨率高,作为历史降水资料十分珍贵,但却因其是纸质图像档案,无法大量快速便捷地被调用,与自动观测获得的数字化数据脱节,其规范保存和数字化建设意义重大。中国气象局对纸质历史气象资料的数字化工作开展多年,到2018 年为止,通过提取降水自记纸迹线信息获得的历史分钟降水数据集已全部制作完成。
浙江省最早的气象观测资料可追溯至建国前,目前省气象档案馆内完好保存的地面观测自记纸始于1948 年。自建国前至2003 年省内自动气象站建设之前,气象观测设备一直以非传感器形式的观测仪器(如自记雨量计等)为主。从2003 年开始,省内的国家地面气象站逐渐开始使用自动化设备,并于2005 年全部实现自动化。自动气象站以自动传感器观测为主,浙江省气象局气象信息网络中心负责各个站点的数据接收,并完成数据入库、质量控制和业务服务。
下面分别介绍从自记雨量计的自记纸降水迹线中提取的分钟降水量和从自动雨量传感器中获得的分钟降水量两类分钟降水数据。
图1 虹吸式自记雨量计内部结构(左图:实物,右图:示意图)
图2 浙江省文成县1987年6月13-14日降水自记纸扫描及迹线跟踪图像文件(.bmp格式文件)
地面气象站自动化业务开始之前,站点的降水量观测以自记式的翻斗雨量计或虹吸式雨量计(见图1)为主,当有降水现象产生时,自记仪器会在自记纸上留下降水迹线。降水迹线虽然客观记录了降水随时间变化的过程,反映了各种时段的降水强度,但自记纸以纸张形式保存于气象档案馆内,数据使用过程很难满足目前实际业务和科研工作中大量快速的需求。
中国气象局对于纸质历史气象资料的数字化处理工作始于上世纪70 年代末[4],先后对全国地面站的报表以及温、压、湿、风、降水自记纸进行了图像扫描。在图像文件得以全面保存的基础上逐步开展图像文件数字化。浙江省到目前为止完成了所有站点自建站始至自动观测前的降水自记纸迹线信息提取,该时段的分钟降水数据集也已制作完成。图2 给出了浙江省文成县1987 年6 月13-14 日降水自记纸扫描图样,图中同时保留了降水迹线的跟踪提取痕迹(红色实现)。下面简要介绍迹线提取流程。
按照国家气象信息中心制定的《降水自记纸数据提取技术规定》[5]要求,在降水自记纸迹线提取之前需完成降水自记纸图像文件预处理,图像文件初检、图像朝向和分辨率调整,并建立降水自记纸图像文件清单。在此基础上使用软件进行迹线的自动跟踪。自记纸数据提取应以站为单位进行,开始提取后首先进行图像检查,如图像严重倾斜应重新扫描。然后进行提取参数设置和时间分辨率设置,包括自记纸类型(虹吸、翻斗)、图像分辨率、跟踪方式和阈值等的设置,按照迹线的起止点位置及标注时间设置时间分辨率。迹线数据提取以自动跟踪为主,当跟踪不准确时需人工修正跟踪迹线,确保与实际迹线重合。
迹线跟踪产生的图像文件格式为.bmp 格式,在迹线跟踪过程中产生的相关数据记录文件为.zjr 格式。迹线跟踪过程实际上每分钟降水量的记录过程,将zjr通过特定算法转换为.dat 文本格式的分钟降水量文件,便于后期读取和应用。图3 为分钟降水文本文件截图,文件名命名规则为
R01IIiiiY11Y12Y13Y14Y21Y22Y23Y24。DAT,其 中IIiii 为国家气象站统一台站号,Y11Y12Y13Y14数据起始年份,Y21Y22Y23Y24为数据终止年份。
图3 以台站号为单位的分钟数据降水文件
浙江省自2003 年开始在全省范围内逐步建设自动气象观测系统,其中降水雨量传感器多采用双翻斗式雨量传感器。到2005 年为止所有国家级站点自动观测都已正式业务运行。
自动站观测结果由各地方台站以.txt 文件形式按时传输至省气象局气象信息网络中心,其中分钟数据文件每日上传一次。每月月初将上一月所有分钟数据文件按照固定格式制作成一份时间跨度一个月的分钟数据文件,即J 文件。
由降水自记纸迹线提取获得的分钟降水数据经过浙江省气象信息网络中心以及国家气象信息中心两轮质量控制。质量控制方法的基本思路是:从迹线中提取的分钟降水:①将其小时累计值与小时降水量(A6文件)进行对比或:②将其20~20 时累计值与历史记录的定时降水量进行对比。由于A6 文件中的小时降水量是观测员在自记纸换下后对纸上小时雨量的人工计算,与当前使用软件进行迹线提取后获得分钟降水再进行小时累加得到小时降水量相比,两者的原始数据完全一致,因而两者在数值上应几乎相等的。然而由于人工计算误差、错误以及遗漏难以避免,在实际情况中两者存在差异。
排除正常时差影响,如提取的逐时降水量累计值与对应时间段A6 逐时降水量累计值差异超过以下范围:①小时累计降水量<5.0mm 时绝对误差>0.3mm,②小时累计降水量≥5.0mm 时误差百分率>2%,③无A6时,当提取数据20~20 时累计降水量与雨量器日降水量R 的绝对误差超过0.5mm(R≤5mm)或者超过R×10%(R>5mm)时,应依次检查跟踪迹线与降水迹线是否重合,降水分辨率、起止时间设置等有无错误,A6 是否有误(A6 中数据与自记纸标注降水量不一致时为A6 错误)。当发现A6 错误或缺失且原因不明时,需要将A6 文件中的数值予以订正或补全。
对自动观测站分钟数据的质量控制即对每月制作的J 文件进行质量控制,其中涉及到降水数据的主要质控算法为时间一致性和内部一致性[6]。通过使用地面气象测报业务软件(Operational Software for Surface Meteorological Observation,OSSMO)完成对J 文件的自动质量控制,如在质控过程中出现疑误,由审核人员对J 文件进行修正。
从降水自记纸扫描图像中提取迹线信息获得的历史分钟降水数据,按照国家气象局数据文件格式和命名要求制作成数据集,并且经过了省级和国家级数据质量控制。然而这一数据集数据文件格式与2003 年后地面自动气象观测站上传至省级气象部门的分钟数据文件格式并不一致,由此给需要使用长序列、全时段分钟降水数据的业务和科研工作者带来极大不便。为了整合两种数据源,将两种数据的分钟降水量以站点为单位、按时间顺序依次录入数据库中,以此隐藏不同时期不同数据源的格式差异,形成统一表结构的、便于查询和使用的长序列、全时段分钟降水数据。
图4 给出了浙江省长兴站(国家气象站统一台站号为58443)分钟降水数据表,数据库为SQL Server,表中字段依次包括站号、年、月、日、时、观测时间以及逐分钟降水量。如需获得一定时间段和(或)一定空间分布的累积降水量只需对数据库进行操作即可。
图4 采用SQL Server数据库的分钟降水数据表
长时间序列、高时间分辨率、高质量降水数据集的研制对气象业务和科研工作意义重大。地面气象站自动观测业务化运行之前,降水观测使用自记式雨量计,通过降水过程在自记纸上留下降水曲线记录降水随时间的变化,自记纸以纸质历史档案的形式保存于省一级气象档案馆内。而自动观测业务化运行之后降水量的观测由自动雨量传感器获得并上传至省一级气象部门。本文重点阐述了两种数据源及其质量控制方法的差异,并讨论了通过数据库录入整合两种数据源的可能性。本文主要结论如下:
(1)按照国家气象局气象信息中心技术规定,对降水自记纸进行图像扫描、迹线提取和历史分钟降水数据集制作,获得地面气象站建站始至自动观测前的分钟降水数据;从自动站上传的分钟数据文件中获得自动观测后的分钟降水数据。
(2)计算小时累计降水量或20~20 时定时累计降水量,通过其与历史记录对比,完成迹线提取的历史分钟降水数据质量控制;通过地面气象测报业务软件完成对自动观测分钟降水数据质量控制。
(3)采用SQL Server 数据库,将两种数据以站点为单位、按时间顺序依次录入,形成统一表结构的长序列、全时段分钟降水数据表。
值得指出的是,如此长时间跨度、高时间分辨的降水数据集是我国降水强度特征,特别是短时强降水特征的研究的重要数据支撑。浙江省地处长江下游入海口,东临太平洋,全年汛期时间长、降水量大,如何在降水气候特征研究中有效使用该数据集是下一步工作的重点。