基于探空观测的多源掩星折射率质量控制及对比

2020-01-15 03:44郭启云杨荣康程凯琪李昌兴
应用气象学报 2020年1期
关键词:廓线探空折射率

郭启云 杨荣康 程凯琪 李昌兴

1)(中国气象局气象探测中心, 北京 100081)

2)(南京信息工程大学, 南京 210044)

引 言

气象观测是提高天气预报、数值预报质量的基础。目前,气象观测手段主要包括卫星、飞机、雷达、气球探空等,气球探空观测(简称探空观测)是高空气象最主要的直接探测方式之一,可获取大气温、压、湿等垂直分布[1-3],探测质量相对较好[4],常作为风廓线、GPS/MET观测等高空遥感设备相对参考[5-7],并作为卫星大气温湿廓线的真实性检验标准[8-10]。近年来,掩星观测逐渐发展成为高空气象数据重要来源。全球导航卫星系统(GNSS)遥感技术是介于传统被动遥感与主动遥感之间的一种新型遥感探测技术,具有全天候、自校准、高精度、高垂直分辨率和低成本等优点,成为各国竞相争夺的高技术热点[11]。20世纪80年代末全球导航定位系统(GPS)逐渐面向应用,1988年美国科学家首次提出利用GNSS掩星探测地球大气的设想,并通过1995年4月发射的MICROLAB-I卫星进行了GNSS掩星探测的概念验证。随后,各国相继发射了卫星,开展GNSS掩星对地球大气的试验和研究。2006年美国和中国台湾联合开发的气象、电离层与气候星群观测系统(COSMIC),成为迄今为止世界范围内最为成功的掩星大气探测活动,欧洲气象卫星应用组织也于2006年发射了Metop-A卫星[12-13],两者使每天接收到的廓线数量可达3000条左右,有力弥补了目前全球大气观测系统的不足,尤其增加了在海洋、南北两极、高原和沙漠等缺少探空地区的气象监测[14],同时由于其具有垂直分辨率高、受云雨天气影响小等优点,因此被广泛应用于数值预报、气候变化、电离密度监测和青藏高原的研究[15-18],对改进天气预报、气候监测和空间天气研究有积极意义。我国自“十五”以来,开展了星载掩星大气探测系统研制,目前已在星载GNSS掩星探测载荷技术方面取得长足进步,2013年发射的风云三号C星(FY-3C)搭载GNSS掩星探测载荷实现了全球大气垂直探测,它不仅是国内第1台星载业务运行的GNSS掩星探测仪,而且是国际首台北斗导航系统和全球定位系统双系统兼容掩星探测仪,每天大约接收到500次的掩星观测[19]。

GPS卫星信号在穿过地球电离层和中性大气时,受电子密度和大气折射的干扰会出现路径弯曲和信号接收延迟,反演出电离层电子密度和大气温度、压强和水汽,折射率的探测质量对反演结果尤为重要[20-22]。研究发现折射率观测存在一定误差,特别在热带地区低层水汽较多的区域存在负偏差,Wickert[23]和Kuo[24]将CHAMP,SAC-C掩星与探空、ECMWF全球再分析进行了对比,得出在5 km 以下CHAMP折射率有明显的负偏差,在日本地区平均相对误差超过了3%。苟小平等[25]利用2006 年的COSMIC 掩星与全球探空对比,发现运用“开环”技术在一定程度上修正了GPS 掩星在对流层低层的负偏差,但同时也带来较小的正偏差。折射率负偏差会导致反演的水汽减少,因此,对掩星折射率进行质量控制(简称质控)是提高反演观测质量的重要环节。国际上有多种内置质控方法,常见的有连续法[26]、贝叶斯法[27]、变分法[28]和综合法[29]等,Zou等[30]在2006年使用模式分析场作为参考利用双权重方法对COSMIC和CHAMP的折射率和弯曲角进行了质控,国内臧欣[31]使用该方法对掩星折射率进行了质控。但利用探空作为参考,对掩星折射率进行质控的研究报道较少。因此,本文利用2017年9月1日—2018年8月31日探空与多源掩星作为样本,采用双权重标准差方法及设置掩星与探空的相关系数阈值的质控方法,分别对不同气候区内多源掩星折射率进行评估及质控,并对比不同掩星的分析结果。

1 数据与方法

1.1 数据简介

①探空数据:2017年9月1日—2018年8月31日全国120个探空站的L波段探空秒级观测,探空仪型号为GTS,温度静态指标为0.3℃,气压静态指标为1 hPa(500 hPa以上)和2 hPa(500 hPa以下),相对湿度静态指标为5%(12 km以下),探测质量相对较好[32-34]。L波段探空每天进行两次观测,分别为00:00和12:00(世界时,下同),包含有温、压、湿、风等气象要素,垂直分辨率为6~7 m,高度范围为地面~35 km。

②掩星数据:COSMIC,Metop-A和FY-3C每天分别提供覆盖全球约2000条、600条和500条左右掩星事件的大气廓线,最近几年COSMIC掩星数据量有所下滑,每天大约接收到500条左右掩星大气廓线。数据主要包括弯曲角、折射率以及由折射率反演得到的温、压、湿大气廓线,垂直分辨率约为200 m,温、压、湿的观测高度范围为地面~40 km,折射率为地面~60 km。

1.2 数据预处理

1.2.1 探空数据计算折射率

探空无直接观测的折射率,需利用温度、气压和相对湿度计算[35],公式如下:

(1)

(2)

(3)

其中,Es为饱和水汽压(单位:hPa),t为温度(单位:℃),E为水汽压(单位:hPa),U为相对湿度(单位:%),n为折射率(单位:N),P为气压(单位:hPa)。

1.2.2 探空与掩星时空匹配

由于探空站点固定,空间分布不均匀,所以将3种掩星与探空进行时空匹配。时间匹配为3 h以内;由于西部地区和北部地区探空站相对稀疏,所以空间分配在呼和浩特以南、西宁及成都以东、澳门以北的区域是距离范围在±100 km以内,其他区域为掩星与探空站之间的距离范围在±200 km以内。垂直层次上,掩星廓线高度范围是地面~60 km 左右,但探空通常无法达到60 km高度,将两者层次进行统一,从地面到30 km每隔200 m选取1个数值,共151层。

1.2.3 质控方法

采用双权重标准差法及设置掩星与探空之间相关系数阈值的方法,设有n个掩星折射率样本(Ni,i=1,2,…,n),n个探空折射率样本(Bi,i=1,2,…,n)。

①计算掩星折射率的权重函数:

(4)

式(4)中,c代表“关注目标”的参数,采用1996年Lanzante研究的双权重方法中的c=7.5[36];根据文献[32]中当权重函数|wi|>1时,进行数据递归,取wi=1.0;M为掩星折射率的中位数,MAD为偏差中位数。

(5)

(6)

③计算各个气候区每层探空与掩星数据的相关系数r:

(7)

由于12 km以下探空相对湿度精度较高,计算得到的折射率精度也较好,而掩星在高层反演精度较高,所以仅对12 km以下的掩星以探空为参考场进行质控,将掩星与探空的偏差即观测增量作为样本量,计算每一个偏差的权重及偏差的双权重平均值和双权重标准差,按照上述原则判定,并根据相关系数再次进行判断。相关系数越大,说明该层掩星和探空相关性越好。在统计检验时,将检出可疑值的显著性水平α=0.05,称为检出水平,按照超过阈值的相关系数占所有相关系数的5%计算出相关系数阈值,经过统计后设定相关系数的阈值,当各个气候区掩星与探空某层的相关系数小于阈值时,则认为该层的可疑数据为错误数据,否则,认为可疑数据为正确数据。

1.2.4 气候区划分

根据多年平均气温、降水量和海拔高度等条件,参考文献[37]将我国划分为4个气候区。亚热带季风气候区分布在秦岭淮河以南,水汽含量较为丰富,夏季高温多雨,冬季温和少雨;温带季风气候区分布在北方,即秦岭淮河一线以北,大兴安岭到太行山一线以东区域,夏季高温多雨,冬季寒冷少雨;温带大陆性气候区分布在广大内陆地区,冬夏温差大,全年降水少;高原山地气候区主要分布在海拔较高的山地、高原地区,全年低温,降水量少。图1为中国气候区划分以及120个探空站分布。由上述折射率计算公式可知,折射率分布与温度、气压和水汽的分布相关,不同气候区的折射率统计特征不同,双权重平均值和标准差存在差别,划分气候区可消除因气候不同造成数据差异太大,使数据更符合正态分布,同时根据区域气候特征划分标准,使质控更准确。

图1 中国气候区划分(a)及120个探空站分布(b)

2 试验结果

表1为2017年9月1日—2018年8月31日与探空匹配到的COSMIC,Metop-A,FY-3C在4个气候区的掩星廓线数。温带大陆性和亚热带季风气候区由于探空站点较多,所以匹配到的掩星数量较多,对于高原山地气候区,探空站分布较为稀疏,与其匹配到的掩星数量也较少,FY-3C在高原山地气候区匹配到的廓线数仅为7。当匹配量较少时,如对FY-3C在高原山地气候区仅匹配到7条掩星廓线,不宜采用探空作为背景场进行质控。2017年7月开始,FY-3C掩星更新一次,其数据质量得到改进,主要体现在采用质控标识码为100的样本廓线,其他为不足信廓线,在匹配之前将这些样本进行剔除。

表1 掩星在4个气候区与探空站匹配到的廓线数量

2.1 折射率、偏差和相关分析

2.1.1 折射率

图2为3种掩星在4个气候区折射率的双权重平均值和标准差的廓线分布,3种掩星双权重平均值几乎无差异。4个气候区掩星折射率的双权重平均值从低层到高层逐渐减小,对流层低层可超过300 N,高层减小到3 N以内,两者相差两个量级。4个气候区折射率的双权重平均值在5 km及以上差别不大,5 km以下由于亚热带季风气候区水汽含量较多,所以折射率双权重平均值高于其他3个气候区。双权重标准差整体呈现从高层向低层逐渐增大,在亚热带季风气候区,比温带季风和温带大陆性气候区高10 N左右,这是由于亚热带季风气候区水汽含量较大,折射率较大,同时水汽含量较大,也会使电磁信号变得复杂,导致标准差增大。由于3种掩星之间的双权重平均值和标准差较为相似,以下阈值区间划分以COSMIC掩星的结果为例。

根据上述COSMIC掩星4个气候区折射率的统计特征,确定折射率在4个气候区的可疑数据和错误数据阈值区间如图3所示(所有时间均为世界时,下同)。4个气候区正常数据的区间从低层到高层逐渐减小,低层数据较大,可接受的范围也较宽,高层数据值很小,接受范围也随之变小。在低层,不同气候区之间存在有较大差别,温带大陆性气候区和温带季风气候区接近,亚热带季风气候区由于低层双权重标准差较大,所以其正常数据区间也较大,且数值比其他3个气候区大,对4个气候区分别制定阈值区间使质控更加准确。

图2 掩星在4个气候区折射率数据的双权重平均值和双权重标准差廓线分布

续图2

2.1.2 偏 差

根据上述阈值区间对掩星折射率进行质控,剔除错误阈值范围之外的数据,将掩星折射率减去探空折射率得到的偏差作为观测增量,再次进行质控。图4分别为3种掩星在4个气候区与探空折射率偏差的双权重平均值和双权重标准差。从偏差的双权重平均值看,COSMIC掩星在4个气候区5 km 以下多为负偏差,且亚热带季风气候区负偏差较大;5 km 以上偏差较小,均在0.5 N以内。Metop-A掩星在亚热带季风气候区6 km以下为负偏差,其他两个气候区则是低层为负偏差,然后逐渐转为正偏差,这与COSMIC的结果不同。FY-3C的结果与COSMIC不同,在亚热带季风气候区2 km以下为正偏差,2~6 km为负偏差,6 km以上又逐渐转为正偏差,整体偏差都在2 N以内,温带大陆和温带季风气候区偏差较小,在1 N以内。双权重标准差各区较为相似,4个气候区都是从高层到低层标准差逐渐增大,亚热带季风气候区标准差最大。以下仍以COSMIC为例划分质控的可疑阈值和错误阈值区间。

图3 COSMIC掩星在4个气候区折射率的可疑阈值和错误阈值区间及单个时刻的掩星折射率廓线

根据图4中COSMIC折射率偏差的统计特征,划分折射率偏差在4个气候区的可疑数据和错误数据的阈值区间(如图5所示)。4个气候区的正常数据区间从低层到高层逐渐减小,高层的折射率和低层的折射率相差两个量级,所以低层可接受的偏差范围较大,可有±30 N左右的偏差,但高层允许的偏差小很多。温带季风气候区和温带大陆性气候区正常数据范围较相似,最低层允许的偏差在±30 N左右,在亚热带季风气候区低层允许的偏差较大。根据划定的阈值范围对掩星的折射率进行质控,筛选出可疑数据和错误数据。

图4 掩星在4个气候区折射率偏差的双权重平均值和双权重标准差廓线分布

图5 COSMIC掩星在4个气候区折射率偏差的可疑阈值和错误阈值区间及单个时刻的掩星折射率偏差廓线

2.1.3 相关分析

2.1.1节和2.1.2节对3种掩星折射率以及与探空之间偏差的统计,划定了可疑数据阈值和错误数据阈值,剔除了错误数据,筛选出了可疑数据,设置探空与掩星之间相关系数阈值,对可疑数据进一步判断,以更好地对数据进行质控。图6是4个气候区3种掩星分别与探空折射率之间相关系数的廓线分布,相关系数分布在0.6~0.9,高层相关性更高,Metop-A掩星在高原山地气候区与探空折射率之间的相关性较差。经统计4个气候区相关系数,按照超过阈值的相关系数占所有相关系数的5%确定相关系数的阈值为0.44,将相关系数不小于0.44的可疑数据认为是正确数据,将相关系数小于0.44的可疑数据认为是错误数据,将其剔除。

2.2 质控效果

2.2.1 质控后的错误数据分析

经上述处理后,掩星质控出的错误数据散点分布如图7所示,因4个气候区相似,这里仅展示亚热带季风气候区。由图7可见,错误数据大多分布在对称轴的两侧,掩星与探空折射率相差较大的区域。在质控步骤中,根据掩星自身统计特征划分阈值区间挑选出异常值,之后引入探空数据作为参考,根据两者之间偏差的统计特征划分阈值区间挑选出与参考相差较大的值,同时引入相关系数再次判断增加严谨性,能更好地检测数据。

图6 掩星在4个气候区折射率数据与探空折射率相关系数的廓线分布

图8是3种掩星在4个气候区中第1步质控出的错误数据百分比随高度分布,1 km以下错误数据百分比较大,为5%~10%;1 km以上错误数据百分比多在5%以内,掩星数据质量较好,且3种掩星的结果相似。

在第2步质控出错误数据中(图9),Metop-A掩星在高原山地气候区较多,FY-3C掩星在温带大陆性气候区4 km以下百分比较大,约为10%,其他大多在6%左右,3种掩星亚热带季风气候区质控出的错误数据百分比较小,在4%内。

图7 亚热带季风气候区掩星折射率错误数据分布

续图7

2.2.2 质控前后的相关分析

计算掩星与探空折射率之间质控前后的相关系数,检验质控效果。图10为亚热带季风气候区质控前、掩星自适应质控后和全部质控步骤之后的多种掩星与探空折射率的相关系数,其他气候区结果相似(图略)。两个变量之间的相关系数很容易受异常值的影响,当有较大异常值存在时,两者之间相关性较差。在质控前,由于异常值的存在,探空与掩星折射率之间的相关性较差。经掩星自适应质控后,剔除一部分异常值后,相关系数明显提高,大部分相关系数在0.8以上。然后经过与参考的一致性检验及可疑数据的质控后,两种掩星与探空折射率之间的相关系数进一步提高,达0.9以上,质控效果很好。

图8 掩星第1步质控出错误数据百分比廓线分布

图9 多源掩星第2步质控出错误数据百分比廓线分布

图10 亚热带季风气候区掩星质控前、第1步质控后、最终质控后掩星与探空折射率的相关系数

3 结论与讨论

本文将2017年9月1日—2018年8月31日的 COSMIC,Metop-A和FY-3C掩星折射率数据在4个气候区中,使用全国120个探空站的秒级探空数据作为参考,分别对掩星折射率数据进行质量控制,并对结果进行分析,结论如下:

1) 根据气候特点将我国划分成温带季风、亚热带季风、温带大陆和高原山地4个气候区,使数据整体更符合正态分布,同时根据不同气候区特征划分不同的质量控制标准,使结果更加准确。

2) 通过对多源掩星双权重平均值和标准差的统计分析,3种掩星特征相似,但4个气候区相差较大,亚热带季风气候区在低层双权重平均值为超过300 N,而温带大陆性和温带季风气候区数值为280 N,高层平均值差异很小。

3) 通过对3种掩星与探空之间偏差统计分析,COSMIC和Metop-A掩星在亚热带季风气候区5 km 以下为负偏差,FY-3C在低层2 km以下为正偏差,2~6 km为负偏差,6 km以上又转为正偏差,FY-3C掩星在温带大陆性气候区和温带季风气候区的偏差比其他两个掩星数值小。

4) 根据正态分布的特征,选定双权重平均值±3 倍双权重标准差作为可疑数据阈值,双权重平均值±4倍双权重标准差作为错误数据的阈值,确定不同气候区的阈值。

5) 经统计,确定相关系数的阈值为0.44,再次处理可疑数据,使质量控制更严谨。质控后,掩星与探空相关性提高明显,效果较好。

此外,本文采用全国探空站对多源掩星进行质量控制,在实际应用中可能部分掩星数据找不到适合其做质量控制的探空数据,当匹配量在30以下时,方法受限。在后续工作中会逐步尝试加入模式分析场与未经质控的掩星数据进行匹配,模式分析场为格点数据,水平分辨率较高,可使所有在时间窗内的掩星数据得到质量控制,同时高原山地气候区的匹配数量也会大大增加。

猜你喜欢
廓线探空折射率
用L波段探空测风雷达评估风廓线雷达测风准确性
福州探空气球的漂移轨迹特征及其对航空飞行的影响分析
风速廓线形式对HDPE板高立式沙障风沙流场的差异性研究
利用光速测定仪分析空气折射率的影响因素*
先进多孔径视宁度廓线仪数值模拟研究∗
MP-3000 型地基微波辐射计探测性能分析
凸透镜是否等于会聚透镜
国内首个无人机机载下投探空系统将探测台风
利用CrIS红外高光谱卫星数据反演大气温湿度廓线的研究
高光谱红外探测仪温湿度廓线在华东地区的真实性检验