莫遵元
摘 要:区域加密气象站在防汛抗旱工作中发挥着重要的作用,是地方领导开展相关工作的数据基础。但由于加密气象站一般无人值守,气象数据,特别是雨量数据故障率较高。因此,及时发现异常数据,第一时间维护故障站点,有重要的社会意义。本文提出了通过极值检查、空间连续性检查、时间连续性检查等方法,对区域自动气象站数据进行判断分析,及时发现可疑数据,该方法在实际工作中发挥了明显的作用。
关键词:区域气象站雨量;异常数据;分析
中图分类号:S164 文献标识码:A DOI:10.11974/nyyjs.20180532065
引言
近年来,湖北省投入了巨大的人力物力,至2017年底已建设了近3000套区域加密自动气象站,为防汛指挥提供了丰富的数据,是防御山洪和地质灾害的法宝。但由于区域自动气象站未无人值守站点,虽然每年都进行了数据校准,但由于地处环境复杂,各类数据,特别是雨量数据故障频发。由于区域自动气象站雨量数据是地方开展防汛抗旱决策的重要依据,错误的数据会影响到政府的决策,造成严重的社会和经济损失,因此,确保自动气象站雨量数据的准确可靠是气象保障工作的重中之重。在实际工作中,如果能第一时间发现可以的雨量数据,及时进行处理,是提高自动站雨量数据可用性最行之有效的方法。
1 区域自动站数据质量控制的难点
国内外学者对气象资料的质量控制方法作过一些研究,如王海军等研究了自动气象站实时资料自动质量控制的方法[1],刘小宁等研究了地面气象资料质量控制方法[2-3],王新华等研究了自动站A文件质量控制方法[4],不过针对区域自动气象站的降水资料质量控制的研究在国内较少。
区域自动气象站一般建设在乡镇,站点分布密集,可以监测中小尺度的天气系统,但这也对区域自动气象站雨量数据的异常分析带来了很大的难度。由于中小尺度系统降水突发性强,时空分布很不均匀,因此很难在一次降雨过程中发现雨量数据是否异常。
本文主要介绍了通过对区域自动气象站数据进行实时监控,对雨量数据进行初步分析,及时发现雨量数据的异常,并提醒保障人员处理异常数据,维护故障台站。
2 数据处理与分析方法
目前,对于雨量数据异常分析的主要方法,在国内外仍以通过分析过程雨量数据的时空差异性和极值检查为主。不过通过实际工作,在对异常雨量数据进行分析统计中,笔者发现通过检查小时數据和分钟数据,更易发现雨量异常数据。
2.1 雨量异常数据的产生原因
区域自动气象站雨量数据的异常主要有以下原因产生:由于雨量传感器或电缆出现故障,如干簧管生锈或断裂,数据线断裂或短路等原因,导致出现的雨量数据故障,该类故障一般表现为无降雨或者降雨异常偏大获偏小;雨量筒堵塞或损坏导致雨量数据为0或者数据偏小,在实际保障中笔者发现因为蜘蛛网导致的堵塞,导致降水数据异常的情况时有发生,且较难判断;由于采集器的故障,出现雨量产生随机的错误数据,这种情况较少。
2.2 雨量数据库的设计和建立
为了第一时间发现雨量异常数据,需要对区域站雨量数据进行实时监控。通过人工来监控大量的区域站雨量数据,显然不太可能。因此,建立了区域自动站雨量数据库,实时从省局CIMISS系统中获取雨量数据,进行处理后保存到本地数据库中。数据库主要包括以下3个库表。
台站基本信息表,主要设计了台站名称,区站号,所在县名,所在乡镇名,经度,纬度,海拔高度,建设时间,手机卡号,相关联系人员,备注信息等。
自动站雨量数据表,主要设计了区站号,数据观测时间,数据入库时间,分钟降雨量,小时降雨量,日降雨量,控制代码,运行状态。
异常雨量数据表,主要设计了区站号,异常数据观测时间,数据异常原因,异常数据值。
2.3 气象观测数据的冗余检查
为了对分钟数据的缺测数据进行检查,保证气象数据的可靠性,设计了气象数据的冗余检查功能,对雨量数据进行了预处理。在冗余检查中,如果该小时内有过多的分钟数据为缺测,当缺测数据超过设定的阈值时,那么在对该小时数据入库时,加上缺测标识,判断该小时数据不可靠。
2.4 雨量数据的极值检查
在雨量数据的极值检查中,一般通过对小时数据极值检查和分钟数据的极值检查2种方式来开展。一般实施中以小时极值判读为基础,配合分钟雨量阈值检查,来确定异常数据。
雨量数据的小时极值检查是通过设定自动站小时雨量的极值,该值一般以30a整编质量为依据,设置分月的小时雨量极值。在设置中,综合考虑每个加密自动站与国家气象站的距离、地理环境等是否相似等因素。如湖北省某站小时雨量极值表如下。
通过该方法,利用设定的极值对该地区2016年5—6月的数据进行分析,仅查出10条数据超过极值。可以发现通过小时雨量极值检查的方法可能会滤掉很多可疑数据。出现这种情况,主要是因为小时雨量机制本身就有很大的极端性,超过该极端天气的雨量值一般较难出现。
分钟雨量阈值一般按照本地的气候特征来设置。比如上站,设置分钟雨量极值为10mm,然后利用分钟雨量极值法进行分析,查出了59条数据超过极值,经过进一步分析,确认这59条数据全部为异常数据。
2.5 降雨数据的时间连续性检查
对于一场系统性连续降雨过程,可以通过雨量数据的时间连续性来检查。通过对小时内的所有分钟数据进行分析,重点分析小时内各分钟雨量的大小和分钟雨量数据的联系性,可以发现降雨的异常数据。
选择了6月22日20:00—6月23日20:00一次降水天气过程的24h的数据进行分析。在分析中,排除小时雨量很小的数据,仅分析小时雨量超过10mm的降水数据,在对降水数据进行分类统计后,共统计了小时雨强大于10mm的数据1053条,对这些数据进行进一步分类分析,发现如下情况。
首先把小时内分钟降雨量值大于0的数据条数,依次按照0~10条,10~20条,20~30条,30个以上进行统计。小时内降水分钟数不超过10条的有15个时次,在10~20条之间的有23个时次。分析这38个时次的降雨,发现其中雨量数据异常的很多,因此可以把分析的重点放在降水分钟数不超过20条时次上。
然后把小时内有降水的分钟数不超过20条的38个时次,检查这些时次中分钟降雨量在3mm以上的。在分析中发现,如果没有超过3mm分钟降雨量的雨量数据,在进一步判断中基本没有异常。但是如果有超过3mm分钟降雨量的,特别是3mm分钟降雨量数据达到5条以上的,该小时的数据一般都是有误的,属于异常数据,需要保障人员及时维修。
在分析中发现还有一种情况,当某个分钟降雨数据超过了1mm,但是该时次前后都没有雨量数据,那么这条孤立的数据也是可疑数据。如果这种情况出现了多次的话,那么该站数据基本可以判定为有误数据。出现这种情况,一般都是由于雨量筒堵塞导致,由于堵塞不完全,每过一段时间渗水会出现1mm的降雨。
2.6 降雨数据的空间分布一致性检查
对于一场降雨天气过程,降水一般发生时不会仅有1个站点监测到降雨,周边站点也会监测点该降雨过程。不过对于特别局地性的降雨过程,对于降水过程进行空间一致性分析则不可靠。因此,该方法主要用来分析比较长时间降雨偏少或者是没有降雨发生的站点。
该检查方法一般是通过统计分析一个较长时间段的雨量数据,将雨量数据相对周边站点或相对于平均雨量明显偏小的站点列为可疑站点,进行人工复检。比如当某一站点的降雨量小于该地区平均雨量的30%以上时,可以认为该地区降雨数据不正常。这种故障一般是由于雨量传感器堵塞、干簧管损坏等原因造成的。利用该方法判断1个月数据,基本上可以确定仪器故障站点,需要保障人员进行维护。
3 对照中尺度监测系统进行人工检查
利用计算机算法,对区域自动站数据进行雨量数据异常检查,虽然能发现雨量数据的一些问题,但是还需要技术人员进行最终的判断来确定。保障人员可以通过人机交互,通过查看雷达、卫星反演降雨数据,检索周边站点降雨量,对异常站点和周边站点雨量进行时序检查,多种方式判断站点数据是否为异常数据。
4 总结
利用自动站雨量异常判断方法,如果只有个别时次出现了可疑数据,则可能是有些偶然的因素导致的,只需要电话通知协理员进行检查即可;如果某个站点降雨量多次提示可疑,那么该站设备发生故障的可能性极大,需要技术去维护。对于局地性很强的中小尺度天气系统,如果系统提示为可疑数据,在对应雷达分析的基础上,可以联系当地协理员,以免误删暴雨天气。为了最大程度的保证自动站雨量数据的可用性,保障人员需要每年汛期前对所有自动站设备做一次全面巡检,在有强天气过程前对重要站点和故障频发站点进行再巡检,以免设备故障导致雨量信息不可用。
利用自动站雨量异常判断法来寻找故障站点在本地业务中发挥了明显的效益,但数据处理方法仍需要完善,要想做到异常数据的全自动监测,仍有一定的技术差距。利用单种中尺度观测设备来判读设备的运行情况,本身就具有很大的局限性。因此在下一步的工作中,需要綜合利用卫星、雷达等中尺度探测产品,结合雷达反演降水数据和卫星数据,对区域自动站异常降水数据进行再次分析,在多种产品的支持下,判断的准确性必将可以大大提高。
参考文献
[1]王海军,杨志彪,杨代才,龚贤创.自动气象站实时资料自动质量控制方法及其应用[J].气象,2007(10).
[2]熊安元.北欧气象观测资料的质量控制[J].气象科技,2003
(5).
[3]刘小宁,任芝花.地面气象资料质量控制方法研究概述[J].气象科技,2005(3).
[4]王新华,罗四维,刘小宁,等.国家级地面自动站A文件质量控制方法及软件开发[J].气象,2006(3).
[5]任芝花,熊安元.地面自动站观测资料三级质量控制业务系统的研制[J].气象,2007(1).