徐昕,许晖
(吉林省气象信息网络中心,吉林长春130062)
MDOS系统是以台站级数据监测、省级数据质量控制、国家级数据质量评估三级质控体系为主线,集成数据上传监控、国家站数据指控信息处理、区域站数据指控信息处理、元数据信息处理等基本数据质控处理功能,还包含了A、J、Y文件制作管理、数据质量评估考核等服务产品。
省级数据处理人员通过该系统能够清晰了解实时资料上传情况,一旦发现缺报或空报现象,及时与台站取得沟通,大大提高了数据的实时性。通过该系统的数据指控信息处理功能,能够对数据进行批量检索,对于质控系统提出的疑误信息进行二次人工判断,并将判断后有异议的数据返回台站进行核对,增加了省级与台站级的数据交流,这样大大提高了气象数据的准确性。
吉林省共有55个国家地面观测站,1380个区域自动气象站。其中,国家基准气象站4个,国家基本气象站26个,国家一般气象站25个。1380个区域站在吉林省内均匀分布(见图1)。
图1 吉林省国家地面观测分布情况
全省1435个地面观测站实时监测气象数据,省级通过MDOS系统接收来自于国家站的分钟数据、小时数据、日数据、日照数据,以及来自于区域站的小时数据。
调取 MDOS系统中 2015年 10月 30日 20:00~2016年 10月30日 20:00(北京时间),吉林省 55个国家站疑误信息,共计26254条,并对这些疑误信息进行细化质量分析与评估。
将全部疑误数据按照要素种类进行分类,共计要素120个。对同种类要素进行数量合并,汇总基础种类共计17个(详见图2)。
可见,在所有要素中,地温、降水、能见度为疑误产生次数最多的几类,分别占全部的31.96%,15.77%,12.31%。下面将针对这几类问题进行详细分析。
图2 按观测要素分类疑误数据比例图
对所有地温类疑误数据产生时间进行分析,可以得出表1,地温疑误数据时间分类。
表1 按产生时间分析地温要素疑误数据数量表
通过疑误数据数量排序可知,3月、1月、7月为产生问题较多月份,均在1000条以上。由此推断,1~3月、6~10月地温问题明显(见图3)。
图3 地温疑误数据统计图
对所有地温类疑误数据进行要素详细分类,可以看出D40、D10、D05、D20为产生疑误信息次数最多的四类,均在1000条以上,相反的,D320、D160、D80的疑误信息数量较少,均在400条以内。由此可以推测,产生地温疑误信息的主要原因在于浅层地温要素。
综合表1的分析,可以总结出,地温类要素产生疑误信息最多的月份在于降水较多的季节,且浅层地温传感器受到的影响较大。以上结论符合常年观测实际经验,根据对台站数据的分析及以往实地调研结果可以初步推测,产生这种情况的主要原因在于,降水较多的季节经常会造成浅层积水,会对地温观测数据的正确性产生影响,造成观测数据不准确,或经过长时间浸泡,使浅层地温观测仪器发生故障。
对所有降水类疑误数据产生时间进行分析(见表2),可以看出,降水疑误数据产生月份。
表2 按产生时间分析降水要素疑误数据数量表
可见,降水问题最多的时间主要集中在6~10月份,为每年夏季降水较多的汛期。
将所有降水疑误数据进行产生级别的分析,可以得出表3:降水疑误数据产生级别。
表3 按产生级别分析降水要素疑误数据数量表
由表3可以看出,几乎全部的疑误数据都是由省级质控和台站主动修改,且台站主动修改的数量占全部的70.37%,是省级质控比例29.55%的两倍以上。由此可以说明,降水类疑误数据从产生级别来看,主要产生原因为台站未及时发现数据错误,而是通过mdos系统滞后提交修改。
综合分析降水疑误数据错误描述和反馈描述进行分析。
经统计,错误描述原因统计共计195种,进行相似原因合并后,共计54种。对这些错误描述进行统计整理,可以得出表4,可见,“降水缺测”为最主要原因。错误描述统计。
表4 按错误描述降水要素疑误数据数量表
针对错误描述中出现最多的原因“缺测”进行反馈描述分析,可以得出表5:缺测对应的反馈描述。
表5 按缺测对应的反馈描述分析降水要素疑误数据数量表
由表5可见,造成雨季降水要素出现疑误信息“缺测”的最主要原因在于仪器故障。经长期数据处理经验及以往台站调研考察经验,初步总结造成汛期降水观测仪器故障的原因有:因相对湿度过大或仪器过于敏感经常造成的降水数据出现0.1mm野值;因降水量过于集中导致超出翻斗式雨量传感器测量最大翻转频率,而无法得到准确数据;因雨水长时间浸泡导致传感器故障,经常在无降水时次出现缺测。
综合对表1~表5进行分析,可得到以下结论:
吉林省地面观测降水疑误信息主要出现在6~10月降水较多的月份,其主要疑误是由于仪器故障导致的非正常降水缺测,提出此疑误信息的级别主要为台站。针对以上降水问题,今后应加强台站日常数据维护,提高实时上传准确率,减少月末制作A文件时对数据质疑的突击,并加强在汛期对仪器的维护。
对2015年~2016年一年内能见度疑误数据的错误描述和反馈值进行统计分析,得到表6,错误描述分类。
表6 按错误描述分析能见度要素疑误数据数量表
根据表6所示的反馈值情况统计可见,78.6%的反馈值为缺测,证明经台站反馈确认后仍无法得到正确能见度值。
表7 缺测对应的反馈描述分析能见度要素疑误数据数量表
综合表6和表7可知,在能见度观测的过程中,存在问题最多的为缺测,经过与台站沟通确认,78.60%的能见度缺测数据需使用备份站数据或人工内插等方式,这大大增加了人工的工作量和出错概率。
经过对吉林省2015年 10月30日 20:00~2016年 10月 30日 20:00(北京时间)55个国家站疑误信息(共计26254条)观测数据的分析,可以看出:
导致地面观测数据质量下降的主要观测要素是地温(31.96%)、降水(15.77%)、能见度(12.31%)。
产生这些要素疑误的主要月份为每年6~10月(地温疑误的主要月份还有1月~3月)。
产生这些要素疑误的主要原因多为降水导致的仪器故障。因此,今后应加强对仪器的维护,尤其是地温传感器、降水传感器、能见度仪的维护。在6~10月对仪器巡查频次应增加,尽量减少因仪器损坏导致的数据缺失。