吴兴洋 周成霞 兰方信 卜英竹 潘徐燕 许平
(贵州省气象信息中心,贵州 550002)
在自动气象站投入气象观测业务以前,气象观测站用配有自记记录纸的翻斗雨量计和虹吸雨量计来观测连续的液态降水天气过程,其降水自记迹线记录了液态降水随时间变化的变率(也称强度)和雨量,对降水迹线进行数字化提取,能获得降雨过程的分钟、小时降水数据,据此建立一个气象观测站的分钟、小时降水数据文件[1]。
降水自记迹线及雨量数字化提取工作,国外相关工作少有报道。20世纪80年代,国家气象中心就在降水自记迹线数据提取技术及产品开发应用方面进行了探索[2],用数字化仪进行试验研究,由于误差难以控制和工作量太大,未能在全国开展该项工作[3]。20世纪90年代初,用黑白滚筒扫描仪进行扫描和程序识别跟踪曲线的方式,进行降水自记纸的数字化工作,由于系统自动化识别降水自记曲线性能差,曲线跟踪的人工干预操作多,工作量大,没能全面开展[3]。2001年4月—2012年11月,国家气象中心和广东省气象局基于当时的软硬件环境研制了降水自记纸数字化处理系统[4],采用当时先进的图形扫描和数据处理技术,实现了对降水自记信息的完整、真实的提取。2002—2006年,应用该系统,全国完成了国家地面基准、基本气象站降水曲线数据提取工作,形成了我国地面基准、基本气象站1960—2000年期间的分钟、小时降水数据标准文件。应用这些分钟、小时及日降水数据,国内多个行业的研究人员在“我国大陆地区降水位相的特征分析”“不同区域历时、小时、逐时、日降水雨强特征研究”“暴雨强度公式研制”等方面取得了大量的成果[5-18]。
为了拯救纸质历史气象资料,满足气象业务、科研及其他部门对长序列精细化的降水数据需求,2016年6月起,中国气象局预报司组织国家气象信息中心、各省(区、市)气象局,用一年多的时间,完成我国所有国家地面气象站改用自动气象站前一年的降水自记迹线及雨量的数字化提取,建立我国地面气象站完整性好、序列长、质量高、唯一的分钟和小时降水文件数据集。为此,成立了全国历史气象资料数字化项目技术组,制订了技术规定[19],完善了2002年应用的迹线提取系统,新开发了降水数字化成果质量检查和评估软件[20-21]。本次应用的降水自记纸数字化处理系统在2002年的基础上增加了扫描图像的朝向、分辨率调整功能,保证提取迹线与雨量的准确性、比较性。新开发的降水数字化成果质量检查和评估软件,让数字化生产单位质检人员、省级质检人员、国家级质检人员都能快速回放检查提取迹线与原迹线的偏离度,实现降水迹线提取降雨量与对应时段(主要是过去12和24 h)人工观测降雨量的对比检查,迹线提取的逐小时雨量与人工读取的逐小时雨量对比检查,该软件最大限度地提高了质检工作的质量和效率。经过了三级质检建立的降水分钟、小时数据文件,保证了提取的雨量数据与实际降水过程雨量的一致性、准确性、可用性及实用性。
20世纪80—90年代,对于降水自记仪器介绍、迹线记录分析处理的文章[22-31],其内容涉及不同雨量计介绍,异常记录和特殊记录的讨论,对于做好本次降水自记纸迹线及数据提取有很好的指导作用。本文根据不同时期的观测规范,结合实例,总结了应用降水数字化成果质量检查、评估软件做好质检工作的流程、内容及技术,提出了对于跨越定时观测时段(包括跨日界记录)的异常迹线,技术规定未明确处理规则的处理方法,达到提取雨量数据尽量逼近异常迹线时段的实际降雨天气过程;分析了用数字化提取小时降雨量与历史人工读取小时降雨量的一致性来评价数字化成果一致率存在缺陷,探索了降水迹线数据提取成果质量评估的改进方案,对比了两种方案的评估结果。
2016年6月起开展的全国降水自记纸数字化工作内容包括:完成31个省(区、市)2049个地面气象站、计划数6513879页的降水自记迹线及雨量的数字化提取(表1)。最终完成数与此有一些误差,如贵州实际完成了276282页降水自记纸的迹线提取,涉及的质检工作包括修改、补录了4163个月A6(历史自记纸人工整理小时降水数据文件)文件,核对46354页降水自记纸的迹线及雨量提取,查阅校对4994日人工定时观测日降雨量与自记迹线提取日降雨量差异较大的记录,该项工作量之大可见一斑。
表1 全国降水自记纸数字化工作分省计划 Table 1 National precipitation recording paper digitization work sub-provincial plan
一般情况下,安装在同一个观测场的雨量器和雨量计,雨量计自记迹线数字化提取降雨量数据累计值与对应时段定时观测降雨量应基本一致;雨量计自记迹线数字化提取的逐时数据与人工读取逐时数据应该基本一致。据此,降水自记纸迹线数字化提取技术规定:降水迹线提取降雨量数据20时—次日20时累计降雨量与雨量器日降雨量R的差:R≤5 mm时,误差应≤0.5 mm,R>5 mm时,误差应≤R×10%。当人工读取小时累计降雨量≤5.0 mm时,提取的逐时降雨量累计值与对应时间段人工读取逐时降雨量累计值差值应≤0.3 mm,累计降雨量≥5.0 mm,误差百分率≤2%。提取迹线与图像迹线的偏离度≤0.2 mm,起始、终止时间与原记录时间误差≤2 min。
降水自记纸记录数字化规范[1]规定,降水迹线提取信息包括:降水迹线、雨量计类型、雨量和时间坐标比例尺、降水迹线的起止时间及异常记录等。
准确提取降水自记迹线及降雨量数据的关键在于做好上述提取信息的质检工作,内容包括:图像扫描分辨率达到精度要求;降水迹线起止时间正确、降水分辨率设置正确;跟踪迹线与原迹线偏离度低于记录精度;异常记录处理符合技术规定等。原因是跟踪迹线与降水迹线偏离,会导致提取小时降雨量数据及累计值与人工读取小时降雨量及定时降雨量误差大,降水分辨率不恰当会引起提取降雨量数据系统性偏大或偏小,起止时间错误引起逐时降水数据错误,甚至改变了降水过程的起止时间,迹线出现异常未正确处理,则提取降雨量数据就不是实际降雨过程的降雨量。遵循如下流程与规则,才能全面准确完成所有内容的正确质检。
质检流程第一步是用自记降水检查程序(ZJJC)检查降水图像和提取迹线文件ZJR完整性、正确性。查看迹线提取位图图像BMP大小,检查扫描图像分辨率是否符合要求。为了保证降水自记纸扫描图像上降水迹线提取及转换数据精度不低于曲线记录精度,如21号降水自记纸,图像扫描分辨率应不低于150 dpi[4],对应的BMP图像大小在440 KB左右,本次应用的提取系统要求图像分辨率不大于200 dpi,对应的BMP图像大小在560 KB左右。
质检流程第二步是检查提取参数文件(LIB)一行中最后两列即:时间、降水分辨率数据,Rxxxxx1961080101.old,219,3245,20.35,.01321,.47389,其中的斜体数值,查看是否满足精度要求。方法是将LIB文件导入Excel,分别对最后两列排序查看即可。不同型号的自记纸,其记录精度不一样,相应的满足提取精度要求的图像分辨率不同。如21号自记纸,150 dpi的图像扫描分辨率,则时间分辨率应不低于0.012,降水分辨率应不低于0.4。
质检流程第三步是对异常处理程序(ZJR)输出的异常记录逐条审核,查看异常时间段内是否有正常迹线未跟踪,对跨越08、14、20时的异常迹线要用08、14、20时的定时观测降雨量数据进行分段处理。
质检流程第四步是核对ZJJC提出的每一条疑误信息,核实数字化值与人工读取值差异原因及其处理是否正确。
质检流程第五步是检查应用质检评估(ZJPG)软件逐一检查根据挑选条件(与定时、A6差异超技术规定的、日降雨量>30 mm、小时降雨量>10 mm、迹线有异常的等)筛选出的迹线是否存在起止时间设定错误、跟踪迹线偏离原迹线、异常时段内有正常迹线未跟踪,注意查看临时(AS—linshi—file)文件中每条迹线起始、终止时间,其中与换纸时间差异较大的,要逐一核对。
降水迹线的形成需要雨量计雨量测量系统和其自记系统协同运转,记录一次降水天气过程的迹线异常来自于这两系统中之一或两部分运转失灵,如自记钟停、记录笔出墨异常、笔压失灵、虹吸雨量计浮子漏水、翻斗雨量计翻转失灵、跨大步等等,每一种故障都会引起迹线不正常,造成较大的测量误差。质检人员应熟悉不同异常迹线的产生原因,表现形式,正确判断降水迹线异常时间段,当自记纸上没有标明异常时间或异常时段标记不明时,异常持续时间参考A0或A文件[32]中天气现象的降雨记录时间。本文以虹吸雨量计为例,根据历史观测规范对降水自记纸迹线及数据提取技术规定进行补充,归纳提取迹线及降雨量数据应遵循的原则和处理方法。
提取迹线、雨量必须真实反映实际降雨天气过程,有雨时,降雨量必须提取出来,无雨时,一定不能出现降雨量。如图1所示,19时原记录注明无雨,迹线数字化提取有0.1 mm降水,查阅该日天气现象记录,降雨终止时间为16时20分,因此,图1中19时数字化提取的0.13 mm降雨量是错误的。
1960年前,降雨量人工定时观测是07、19时,07、19时的降雨量被用来代替了历史气象月报数据文件[32]中08、20时的降雨量,1960年后,有的观测员对降水观测规范“20时降水观测时和观测前无降水,而其后至20时正点之间(包括延续至次日)有降水,应于20时正点补测降水并记录降水量及天气现象”这一规范执行不到位,上述两种情况都会引起降水迹线提取降雨量与人工定时观测时段降雨量出现差异,降水日数出现差异,这是观测时长不一致引起。由于人工观测与迹线提取降雨量在08、20时有1~15 min的时间差,08、20时前15 min有强降水时,会带来过去1、12、24 h提取降雨量与对应的定时观测降雨量有较大差异。图2a所示为一站2000年6月6—7日的降水迹线,图2b为迹线提取与定时观测对比情况,表2为迹线提取降雨量与定时观测降雨量记录。图中看出该日19时50分起降雨,20时降雨量为3.7 mm,而该日定时观测20时降雨量为0.0 mm,应是20时人工定时观测降雨量未补测降雨量,降雨量计入到下一日,因此,6日人工观测降雨量无降水,引起6、7日定时观测与自记观测降雨量差异和降水日数不一致。
图1 无雨时数字化提取有降雨量的错误提取 Fig. 1 Error of digitized extraction for rainfall when there is no rain
图2 (a)某站2000年6月1—7日降水迹线原始图像;(b)图2a所示迹线提取及雨量数据:6、7日与定时观测降雨量和降水日数不一致 Fig. 2 (a) Original image from precipitation track on 1 to 7 June 2000 at a certain station; (b) Trace extraction and rainfall data shown in Fig. 2a: the precipitation and precipitation days observed on 6 and 7 June are not consistent with those observed at regular intervals
技术规定要求,在自记迹线异常时间段内有正常迹线,要提取正常迹线及降雨量数据,时段内异常时间各时降雨量采用平均分配该异常时段降雨量,对于异常迹线跨越08、20时的情况,未明确规定应用上08或20时定时观测降雨量数据。本文认为考虑到与历史定时观测过去12 h或24 h降雨量的一致性,应以08时、20时为界分段处理异常迹线,这样尽可能将降水迹线异常时的降雨量分配到相应时间段,逼近实际降雨天气过程。07、19时有定时观测降雨量,应以07、13、19时为断点分段处理;08、20时有定时观测降雨量,应以08、14、20时为断点分段处理。如图3所示,18日18 时—19日22时仪器故障,迹线异常,异常迹线按一段异常处理(图3b),以20时为界分段处理(图3c)。图3b中20、21、22时迹线提取降雨量分别是25.7、21.0、2.0 mm,18日迹线提取降雨量为29.96 mm,人工定时观测降雨量为35.6 mm,两者有较大差异。图3c应用了20时定时观测降雨量,以20时为界分段处理,其中20、21、22时迹线提取降雨量分别是31.3、15.5、1.9 mm,提取的降雨量更符合当时的降雨天气过程,日降雨量也与人工定时观测雨量保持了一致性,同为35.6 mm。为清楚对比,将两种方法处理的18、19日降雨量结果列于表3。
表2 图2a所示人工定时观测与同时段降水迹线提取降雨量对比 Table 2 Comparison between the artificial timing observation as shown in Fig. 2a and the precipitation trace line extraction at the same period
当迹线提取降雨量与定时观测降雨量出现较大差异时,查阅气薄-1定时观测降雨量无误,应该根据天气现象降雨记录时间,在有降雨期间增补异常降雨时段来处理,异常降雨量就是该时段定时观测降雨量与时段内正常迹线提取降雨量之差。图4a所示为此类一例,27日人工08时定时观测降雨量为20.1 mm,图4b中其迹线提取值仅为8.9 mm,查阅天气现象记录,26日夜间至27日09时55分有雨,因此判定迹线走平段05时20分—08时降水迹线异常,应作异常处理,异常时段降雨量为20.1-8.9=11.2 mm。27日09时55分—16时47分,间断式下雨,27日20时定时观测降雨量为2.3 mm,因此08时—16时47分做异常处理,异常时段降雨量2.3 mm。
当降水迹线出现中断时,中断时间未超过1 h,如果用连线两端点的方法处理缺测段,提取降雨量与定时观测量一致,用这种方式处理中断时段是合理的[31](图5)。图5a为某站1969年5月22—23日降水迹线图像,历史观测员当时处理为23日04—08时异常,降雨量为25.2 mm,图5b为迹线提取图,采用断点到底连线,按正常虹吸处理,其结果与定时观测降雨量一致,这样处理比之历史观测员处理要与天气过程相符(夜间该站不观测)。
本次质检评估采用提取逐小时降雨量数据与对应的人工读取小时降雨量进行一致性评估。可是在正点时刻有强降水发生时、迹线异常时,会出现提取小时降雨量与人工读取小时降雨量差异较大,出现明显的不一致。人工读取小时降雨量出自于多名观测员,强降水跨过正点时,肉眼分辨力有限,当有时间订正时,人工无法精确、均匀分配时差,与数字化精确提取的小时降雨量出现差异较大不可避免。异常迹线发生时,人工是将异常时间段的累计降雨量计入降雨过程的最后一小时,数字化是将该值平均分配到异常时段各小时,导致异常时段逐时降雨量两组数据不一致。为此提出,迹线异常时段逐时数据不参与评估,增设异常小时降雨量统计及评估,这可评估国家地面气象站过去业务质量和同期仪器故障率。降水时长1 h以上的,采用过程降雨量进行一致性评估,这样评估的一致率更为客观。举例如下:某站1998年有效降水560 h,提取小时数据(包括异常迹线分配的小时数据)与对应的人工读取有50 h出现较大差异,逐时一致率为91%。如果用本文提出的评估方案,差异较大的仅08时观测时长不一致引起,共2 h,逐时一致率接近100%,异常小时数42 h,异常率7.5%。图6是该站1980—2006年两种评估方案的结果对比。
自记降水迹线及数据提取是为了拯救纸质历史气象资料和获取同期小时、分钟降水资料数据开展的历史气象资料信息化工作,目的是建立起我国国家地面气象站分钟降雨量的长序列资料。以此为基础数据,可计算降雨过程中任意时间段的降雨量,制作成各种降水数据产品,相关人员应用这些数据对降水过程任意时段降水强度及其分布特征进行统计分析、时空分析。有了分钟降水强度数据,能对暴雨的分时雨强分布进行深入研究,对天气雷达降雨量预估进行评估和验证。一个地区有了长期的雨强序列资料,人们能够对本区域的强降水特征有全面的认识,为农业、城市、交通、水利等领域的规划和建设及政府防灾减灾策略的制定提供科学的数据支撑。
图3 (a)某站1998年6月18—19日降水迹线原始图像;(b)图3a中异常时段不分段提取迹线及降雨量;(c)图3a中异常时段以18日20时为界分段提取迹线及降雨量 Fig. 3 (a) The original image of precipitation track line of a certain station from 18 to 19 June 1998; (b) Track lines and rainfall were extracted unsegmented in abnormal periods in Fig. 3a; (c) Trace lines and rainfall were extracted segmented in the abnormal period with 20 BT on 18 June 1998 as a dividing date
历史降水资料数字化建设工作范围遍及全国,资料时间跨度长,期间涉及观测规范、时制的多次变化,异常记录情况多样,技术规定不可能面面俱到,只有对迹线跟踪及数据提取全面质检,对提取雨量与人工定时观测出现差异较大,超出技术规定范围的记录,必须去一一查证,依据当时的规范进行合理的处理,才能得到正确的降水序列资料。在查证提取雨量与人工定时观测超出技术规定范围记录的过程中,自记纸需要核实的内容包括:自记纸日期是否正确;结合前后记录核实日期是否标注错误;迹线异常未被发现;如4.4节中个例,这类情况都需要重新处理。对于正点时刻有强降水、迹线异常、跨日界降水引起的超差记录,只要过程降雨量一致,核实即可。对于提取雨量与人工定时观测差异大的记录,在自记纸正确及迹线正常的情况下,必须用观测记录薄核实定时观测降雨量,在分析雨量计工作正常的情况下,同时核对当日相邻站的雨量后,方可修正定时观测雨量。特别提到1960年前,定时观测是07、19时,与现行08、20时不一致,限于篇幅和资料不足,未列举对翻斗雨量计的实例。
表3 图3a所示异常迹线分段与不分段提取的逐时雨量及时段累计降雨量(单位:0.1 mm) Table 3 Cumulative rainfall of hourly rainfall and time interval extracted by section-wise and non-section-wise abnormal track lines as shown in Fig 3a (unit: 0.1 mm)
图4 某站1979年5月26—27日降水迹线原始图像(a),降水自记纸观测迹线跟踪处理(b) Fig. 4 (a) The original image of precipitation track line, 1979; (b) tracking and processing of self-recording paper observation track lines of precipitation at a station from 26 to 27 May 1979
图5 某站1969年5月22—23日降水自记迹线及人工处理(迹线中断处异常处理)(a),降水迹线及数据提取(迹线中断处正常连线处理)(b) Fig. 5 (a) Precipitation recording track and manual processing (abnormal processing at the break of track); (b)Precipitation track and data extraction at a certain station from 22 to 23 May 1969 (normal connection processing at the break of track)
图6 某站1980—2006年用逐时降雨量与降水过程评估提取降雨量与人工读取一致率 Fig. 6 Consistency rate between extracted rainfall and manual observation by hourly precipitation and precipitation process assessment in a certain station from 1980 to 2006
Advances in Meteorological Science and Technology2019年3期