福建区域气象观测自动站气温数据集建立及质量评估*

2022-02-14 04:04张祖熠
海峡科学 2022年12期
关键词:错误率最低气温正确率

蓝 俊 袁 伟 张祖熠

(1.福建省气象信息中心,福建 福州 350001;2.福建省气象科学研究所,福建 福州 350001)

1 概述

福建省地处我国东南沿海,依山面海,海岸线长,丘陵山地多,地形环境独特。受大陆性与海洋性气候相互影响,福建气候复杂多变,高温、台风、暴雨、山洪泥石流等灾害频发,气象灾害呈现出种类多、影响范围广、活动频率高、持续时间长、次生和衍生灾害比率大、灾情危害重的特征,是受气象灾害影响最严重的省份之一。台站观测资料作为对实际天气的记录,是研究天气灾害、农业生产、检验数值模式等的重要数据支撑。近几年,区域自动气象观测站逐步在全国地面气象台(站)部署,福建省区域自动站资料形成了以大数据平台为数据载体,以短临预报、集合预报、延伸期预报为业务支撑的局面[1-2]。由于观测源的复杂性导致数据自身存在各种各样的问题,如历史数据存在标准化程度不高、质控标准不一致、数据格式不一致、完整性不一致、连续性不一致等情况。为此,迫切需求长时间序列、高质量的小时气温数据产品[3-5]。

自2009年福建省第一批区域加密自动站投入使用以来,实现了高时空分辨率的气温数据,自动站气温资料在预警、评估、专业服务等业务领域的应用进一步深入。利用已有的气温观测数据,形成一套覆盖2009年以来福建省区域站、小时分辨率、高质量的气温数据产品,为精细化气象服务提供更有力的业务支撑[6-8]。

2 资料与方法

2.1 数据源收集

基于福建省地面气象区域站的观测气温资料,收集了福建省2008—2020年所有地面气象区域站数据、国家气象信息中心下发的地面气象区域站数据和现存CIMISS数据环境下地面气象区域站数据,将这三个数据源中的气温数据整理为自动站小时气温原始数据集。

2.2 数据集质量控制

2.2.1 质量控制码的设置

在建立气温数据集的过程中,需要对气温数据进行质量控制[9]。根据实际情况,共设4种质量控制码(QC码)。其中,QC=0,代表数据正确;QC=1,代表数据可疑;QC=2,代表数据错误;Q=9,代表数据缺测。首先设置初始数据QC=0,当无观测数据时QC=9,然后按气候界限值检查、内部一致性检查、时间一致性检查和空间一致性检查的顺序进行质控,数据通过当前检查方可进入下一步检查,否则对被检数据重新设置或修改质量控制码。

2.2.2 质量控制方法

①从气候的角度不可能出现的要素临界值称为要素的气候界限值(N)。气温要素值(x)是否在本站气温特定的变化范围[0,N]内的检查为区域站气候界限值检查,即要求x∈[0,N],超出测站气温变化范围的观测数据为错误。

②内部一致性检查指同一时间观测的气象要素之间的关系必须符合一定规律,即要求满足最高气温≥气温≥最低气温,不符合此关系式的观测数据为可疑。

③对通过内部一致性检查的数据进行时间一致性检查。时间一致性检查主要依据气温在时间上具有显著的相关性和良好的一致性特点,对指定站点同一要素不同时次资料间的相关性进行考核,判断在一定时间间隔内气温数据前后波动是否在指定范围内,超出测站气温变化范围的观测数据为可疑。

④对通过时间一致性检查的数据进行空间一致性检查。空间一致性检查主要根据空间上连续变化的气象要素在地理空间上具有相关性的特点,即空间距离较近的气象站点的特征值比距离较远的站点具有更大的相似性,对被检查站点被检查时次的气温,使用邻近参考站点对应气温数据,采用空间插值方法进行估计。气温实测值与估计值差异明显较大时,观测数据为可疑。

2.3 数据集质量评估指标

分别用Sa,Sb,Sc,Sd,Se,Sf,Sg表示应观测数据组数、实有数据组数、有效数据组数、缺测数据组数、正确数据组数、可疑数据组数、错误数据组数,用P0、P1、P2分别表示正确率、错误率、可疑率,H表示实有率。因此,可将第i个站点各项指标公式表示如下。

利用实有率评估数据的完整性和正确率、错误率、可疑率评估数据的质量状况。如无特殊说明,本文统计的正确率和错误率均未包含缺测数据[10-11]。

3 数据集质量评估

3.1 观测数据的时空分布

每个区域站观测要素不尽相同,因此只对有观测气温要素的区域站数据进行统计分析。由图1(a)可知,区域站数总体呈增长趋势,截至2020年,具有气温要素观测的区域站近1500个站。其中,2009年区域站数增幅最大,约增加200个,2016年增幅次之。

福建省区域站数起始年代空间分布如图1(b)所示,以2010年以前新增区域站为主,且新增区域站主要集中在沿海区域,呈“东密西疏”的特点,尤其是厦门、漳州、莆田、福州四地的新增区域站最多。

(a)区域站数变化曲线 (b)区域站起始年代空间分布

3.2 数据的完整性

由图2可以看出,历年最高气温实有率、最低气温实有率及气温实有率基本一致。其中,2008年实有率最低,均为78%左右,2009年实有率大幅提升,达到90%以上,并持续增长至2011年。2012年、2013年实有率相较上一年有所下降,但降幅低于2%。从2017年开始又逐步上升,到2020年实有率均达到98%以上。

图2 2008—2020年福建省区域站最高气温实有率、最低气温实有率与气温实有率

3.3 数据质量

经统计,最高气温正确率、最低气温正确率、气温正确率每年均在99%以上。图3展示2008—2020年福建省区域站最高气温、最低气温、气温平均正确率空间分布。由图3可见,绝大部分区域站小时最高气温正确率在99.8%以上,只有15个区域站的最高气温正确率在98%以下,但均高于75%。最低气温正确率与气温正确率呈沿海区域站高、中西部较低的分布规律,其中,中西部区域站正确率大部分高于98%,低于98%以下的区域站分别是19个、18个,但正确率均高于75%。

(a)最高气温 (b)最低气温 (c)气温

经统计,最高气温错误率、最低气温错误率、气温错误率数据均小于0.12%。由图4可以看出,绝大部分区域站数据错误率在0.01%以下,分别占总站数的96.46%、96.87%、96.8%,说明区域站平均错误率较低。1.23%、0.82%、1.09%的区域站数据最低气温错误率、气温平均错误率为0.01%~0.02%,0.61%、0.75%、0.95%的区域站数据最高气温、最低气温、气温平均错误率为0.02%~0.04%,所有区域站的数据错误率均小于25%。

(a)最高气温 (b)最低气温 (c)气温

另外,2008年最低气温可疑率和气温可疑率最高,达到0.9%左右,随后逐渐减小至2012年。2013—2020年,两者的可疑率在0.5%以内波动。各年最高气温可疑率均小于最低气温可疑率和气温可疑率。图5为2008—2020年福建省区域站最高气温可疑率、最低气温可疑率、气温平均可疑率空间分布。可见,绝大部分区域站小时最高气温可疑率在0.02%以下,占总数的98.03%,仅有1.02%的区域站最高气温可疑率在1.5%~5%。最低气温与气温平均可疑率空间分布基本一致,呈沿海区域站低、中西部较高的规律,中西部区域站可疑率大部分低于1.5%,所有区域站的数据可疑率均小于5%。

(a)最高气温 (b)最低气温 (c)气温

3.4 数据分析

选择2008—2020年有完整观测资料的区域站计算区域站的年平均气温距平,如图6(a)所示。2008—2020年福建省年平均气温呈整体上升趋势,2008年平均气温为18.54℃,2012—2017年平均气温缓慢上升,2020年福建省区域站平均气温达到最高,为19.96℃。图6(b)是区域站2008—2020年平均气温空间分布,可以看出,福建省各区域站气温差最大为10℃左右,年平均气温呈沿海较高、中西部地区较低,低纬度地区较高、高纬度地区较低的分布规律,这主要与福建省“依山傍海”,大部分面积为山地丘陵的地理特点有关,东部临海地区温度较高,中西部丘陵地区温度较低。

(a)年平均气温距平和年平均气温变化情况 (b)区域站年平均气温空间分布

4 结论

本文利用2008—2020年不同源的区域站气温数据进行整理,主要结论如下。

①福建省区域站空间呈现东密西疏的分布趋势。2008—2020年区域站最高气温实有率、最低气温实有率、气温平均实有率总体呈现增长趋势,2020年均达到98%以上。

②在对最高气温、最低气温、气温数据质控后,三者的正确率每年均在99%以上,呈现沿海区域站气温数据正确率高、中西部区域站正确率较低的规律。同时,三者的年平均错误率均在0.12%以下,可疑率均在1%以下。

③区域站数据集显示2008—2020年福建省气温总体呈现增长趋势,呈沿海年平均气温高、中西部年平均气温较低的分布规律。

猜你喜欢
错误率最低气温正确率
门诊分诊服务态度与正确率对护患关系的影响
北辰地区日最低气温特征及影响因素研究
小学生分数计算高错误率成因及对策
更 正
正视错误,寻求策略
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
解析小学高段学生英语单词抄写作业错误原因
数学选择题练习