风廓线雷达产品与ERA5 再分析资料的对比分析

2022-01-19 13:04梁维亮
气象研究与应用 2021年4期
关键词:风廓北海柳州

黄 晴,梁维亮,黄 荣

(广西壮族自治区气象台,南宁 530022)

引言

风廓线雷达是一种新型的地基测风雷达,利用大气湍流对电磁波的散射作用对大气进行探测,以获取风廓线等产品。风廓线雷达能够实时连续提供大气的三维风场、大气折射率结构常数等气象要素随高度的分布,具有时空分辨率高、连续性、实时性好的特征[1]。对其产品的应用是对常规探空观测的有力补充,有助于提高当地强对流预报预警的能力,对中小尺度天气、对流演变具有预报意义。目前风廓线雷达资料在强降水[2-3]、冰雹[4-5]、台风[6]等过 程中都得到了应用分析。为了更好地使用风廓线雷达产品,首先要了解产品数据的准确性。

目前,风廓线雷达数据的验证主要以常规探空资料为主,并且有学者在对比中探究了质控阈值。万蓉等[7]对黑山站风廓线雷达资料与加密探空资料进行对比,探究有效样本比率。吴蕾等[8]进行了北京南郊大气探测试验基地的L 波段雷达探空与风廓线雷达资料的相关性分析。费松等[9]设置了5 个置信度门限,将风廓线雷达数据分成6 个数据集,再分别与探空资料进行对比。王栋成等[10-11]对济南边界层风廓线雷达资料和L 波段雷达探空测风进行对比,系统地分析了两者大风数据的各种统计特征,并探究了长期时空变化规律。一般而言,数据验证工作主要受资料时空分辨率的制约。气球探空资料一天两个时次,时间分辨率低。气球上升速度约为380m·min-1[12],完成一次探空具有时间差,受风和降水的影响气球还会出现水平漂移,所以探空数据和风廓线雷达数据存在不可避免的偏差。再加上探空站点稀疏,可用于对比的资料很有限。有学者利用再分析资料进行风廓线雷达数据验证工作[13-14],再分析资料的高时空分辨率特点能有效保证用于对比的样本量。

选用ECMWF 第五代再分析资料ERA5 与2019 年至2020 年(非连续时段)广西三部风廓线雷达实时风产品作对比分析,探究数据的准确性。再分析资料ERA5 前身为ERA-Interim,具有高时空分辨率,采用由10 名成员组成的集合4D-Var 资料同化系统来评估大气的不确定性,并且利用更多的观测数据,特别是卫星资料进行先进的数据同化,能更准确的估计大气状况[15],作为参照物用来分析气象要素的垂直场具有很大的优越性。

1 资料与方法

1.1 资料来源

选用的三部风廓线雷达分别位于北海、南宁和柳州。北海站风廓线雷达探测高度为100~11380m,垂直分辨率自下而上为60m、120m、240m,2020 年起对低层的探测精度加大,探测高度由55 层增加至68 层。南宁站探测高度为150~18390m,共79 层。柳州站探测高度为150~14550m,共63 层。后两个站的垂直分辨率自下而上均为120m 和240m。

风廓线雷达有三种水平风场产品:实时采样高度上的产品数据(ROBS)、0.5h 平均采样高度上的产品数据(HOBS),1h 平均采样高度上的产品数据(OOBS)。其中ROBS 产品是每6min 完成一次体扫获取一组数据,具有很高的时间分辨率,有利于实时气象分析预报业务上的应用。为方便对比,对ROBS 和HOBS 产品均选取整点数据作为研究对象。

ERA5 再分析资料是选用1979 年至今等压面小时数据,水平分辨率为0.25°×0.25°,时间分辨率为1h,垂直高度从1000hPa 到1hPa 共37 个等压层。

1.2 对比方法

首先将ERA5 再分析资料位势高度换算成海拔高度,然后将两种资料进行相应时次的高度对比。采用邻近法将高度最邻近,并且高度差小于风廓线雷达数据所在高度的垂直分辨率作为一组样本数据。检验误差指标主要有:

N 为样本数,O 为风廓线雷达产品,E 为再分析资料,S 为标准差,风向差定义为-180°~180°。MAE反映了误差的平均状态,消除了正负偏差相互抵消的情况,值越小,说明两者误差越小。RMSE 反映了误差的离散程度,值越小,说明误差分布越集中,对极端误差反应敏感。BIAS 反映了偏离程度,大于1则说明风廓线雷达观测值总体大于再分析资料,小于1 说明风廓线雷达观测值偏小,越接近1 说明误差越小。

2 结果与分析

2.1 不同风廓线雷达产品对比

表1 为北海站三种风廓线雷达产品与ERA5 再分析资料的对比分析。两者的风向相关系数均大于0.6,风速相关系数均大于0.7。平均比偏差都略小于1,风廓线雷达数据总体小于ERA5 数据。ROBS、HOBS、OOBS 之间数值差距非常小,整层平均风向风速R 和BIAS 的差值都小于0.02。风向MAE 最大差值为0.88°,RMSE 最大差值为1.25°。风速MAE最大差值为0.06m·s-1,RMSE 最大差值为0.07m·s-1.其中风向在1km 以下、9km 以上,风速在0.5km 以下、9km 以上指标差值显著增大。MAE 差值在0.5km以下最大,风向差为2.03°,风速差为0.10m·s-1。风向的RMSE 最大差值在0.5~1km,达2.23°,风速的RMSE 最大差值在9km 以上高度,达0.43m·s-1。说明整体上风廓线雷达在一小时内单次体扫探测的水平风数据与小时平均数据差异小,特别是在1~9km高度探测的水平风波动很小,风速比风向的波动更小,在近地层和高层波动增大。柳州站也有相似特点(表略),但该站更易受近地层摩擦影响,水平风波动小的高度主要在2~9km。OOBS 产品无论风向还是风速,平均绝对误差和均方误差都最小,稍显优势。但鉴于ROBS 产品的时间分辨率更大,在气象业务上有更大的优越性,将着重分析该产品。

表1 北海站三种风廓线雷达产品与ERA5 资料水平风的对比

2.2 不同高度分组对比

如表2 所示,北海站无论风向还是风速都呈现中层相关性最好,高层优于低层,近地层最差的单波峰特点。相比风向,风速在整层都表现出更高的相关性。风向在4~6km 相关性最好,R 达到0.76,并且误差也最小、最集中。风速在4~9km 相关性最好,R 达到0.87,2~4km 相关性也超过了0.8,并且在这个高度误差最小、最集中。无论风向还是风速都在小于0.5km 的近地层表现出最差的相关性,R 均小于0.4,误差也最大、最离散。从BIAS 来看,北海站风廓线雷达整层风向数据都略小于ERA5。风速在1km以下要明显小于ERA5,在2~9km 稍大于ERA5。总的来说,北海站风廓线雷达产品在2~6km 数据质量最好,在0.5km 以下质量最差。

表2 北海站ROBS 产品与ERA5 资料不同高度水平风的对比

从表3 可看出,南宁站整体数据误差要大于北海站。其风向相关性呈双波峰特点,在2~4km 和6~9km 最好,R 超过0.6,并且在0.5~4km 相关性要好于风速。风速相关性呈单波峰特点,在4~9km 最好,达到0.74,在0.5km 以下和4~9km 优于风向。风向在1~2km 误差最集中,2~4km 误差最小。风速在4~6km 数据质量最好。无论风向还是风速都在0.5km以下呈现非常差的相关性,R 均小于0.2。但误差最大、最离散的是在9km 以上高度。从误差偏离程度来看,南宁站风廓线雷达数据大部分要小于ERA5,特别是近地层的风速,BIAS 值小于0.5,只有0.5km以下和9km 以上的风向数据大于ERA5。总的来说,南宁站风廓线雷达产品的水平风向在1~4km 质量最好,风速在4~6km 最好,9km 以上无论风向还是风速质量都最差。

表3 南宁站ROBS 产品与ERA5 资料不同高度水平风的对比

柳州站无论风向还是风速的相关性都呈双波峰特点,特别是4~9km 表现出显著优势,风向R 大于0.6,风速R 甚至超过了0.8(表4)。同样也是在0.5km以下相关性最差,风速R 为0.2,风向R 仅为0.03。在0.5~2km 和9km 以上风向相关性比风速更大,其它高度上风速相关性更大。柳州站的误差整体也是大于北海站。误差最小的是在4~6km,风向和风速的误差都最集中。风向误差最大的是在0.5km 以下的近地层,风速误差最大是在9km 以上的高空。柳州站风廓线雷达数据也是大部分要小于ERA5,风速的偏离程度大于风向,只有0.5km 以下的风向BIAS值大于1。总的来说,柳州站风廓线雷达产品在4~6km 质量最好,风向在小于0.5km,风速在大于9km的质量最差。

表4 柳州站ROBS 产品与ERA5 资料不同高度水平风的对比

3 极端误差阈值选取

由于观测原理和数据处理方式不同,两种资料存在误差在所难免。当误差大于一定数值后,会被认定为可疑数据。怎样定义极端误差阈值以供数据筛选,为后续预报和研究工作提供数据基础是要探究的问题。万蓉等[7]定义风向差在20°以内、风速差在3m·s-1以内为有效样本。吴蕾等[8]定义大于“三倍标准差”为较大偏差,进行数据剔除。郭启云等[16]在对测风质量控制研究中,基于平均偏差和标准偏差设置了可疑值阈值和错误值阈值。大多数关于风廓线雷达和探空观测系统资料的对比研究都表现出20~25°,2~3m·s-1的标准偏差[17-18],并由此设置误差阈值得到70%以上的有效样本率[19]。

设置0.5m·s-1的风速间隔和5°的风向间隔,分别循环剔除大于阈值的极端误差,并计算剔除后的样本的均方误差(RMSE)、数据有效率和平均绝对误差(MAE),同时分析随着阈值的减小三个检验指标的增长幅度,计算公式如下:

由图1 可看出,北海站风速差阈值设置在7~12m·s-1时,随着阈值的减小,RMSE、有效率和MAE的增幅都缓慢增加或是持平。阈值由7m·s-1减小至6.5m·s-1时,RMSE 的增幅减小,MAE 和有效率的增幅几乎不变。当阈值减小至6.5m·s-1以下时,三个检验指标的增幅都大幅度增加,斜率显著增大。说明北海站风速差主要集中在6.5m·s-1以下,当误差阈值设置在该区间,会有大量数据被剔除,导致可用数据显著减少。由此本文设定北海站风速差阈值为6.5m·s-1,此时得到的MAE 为2.03m·s-1,数据有效率为91.54%。较北海站而言,南宁站的增幅曲线斜率较为一致,没有明显的转折点,说明风速差分布比较平均。鉴于许多研究都得到小于3m·s-1的标准偏差,本文将设置7m·s-1为南宁站的风速差阈值,该阈值下MAE 减小为2.88m·s-1,恰好小于3m·s-1,数据有效率为79.77%。柳州站风速差阈值在大于8m·s-1时,随着阈值减小,检验指标的增幅整体缓慢增大,其中阈值由10.5m·s-1减小至10m·s-1和由8.5m·s-1减小至8m·s-1时,出现了增幅减小的现象。当阈值减小至8m·s-1以下后,增幅呈稳定增大的趋势。因此本文设定柳州站风速差阈值为8m·s-1,此时得到的MAE 为2.44m·s-1,数据有效率为89.10%。

图1 剔除不同风速差阈值后RMSE、数据有效率、MAE 的增幅

图2 是以5°风向差为间隔的检验指标增幅情况。北海站风向差阈值在大于105°时,RMSE 和MAE 的增幅呈波动状,时而增大时而减小。当阈值减小至105°以下时,增幅才较稳定地呈增长趋势。因此设定北海站风向差阈值为105°,此时得到的MAE 为23.47°,数据有效率为92.49%。南宁站增幅也是在大阈值区间呈波动状,直至100°才开始稳定增大,此时MAE 为23.97°,有效率为90.04%。柳州站的波动性更强,呈现“U 型”变化,说明柳州站的风向误差比另两个站更离散。在阈值减小至85°以下后,增幅才呈稳定增大的趋势。设置柳州站风向差阈值为85°后得到的MAE 为18.78°,数据有效率为84.21%。

图2 剔除不同风向差阈值后RMSE、数据有效率、MAE 的增幅

结合以上分析,最终选取三个站的极端误差阈值分别为北海站105°、6.5m·s-1,南宁站100°、7m·s-1,柳州站85°、8m·s-1。并得到同时剔除风向风速极端误差后的检验指标,北海站MAE 22.73°、2.00m·s-1,有效率85.60%;南宁站MAE 23.44°、2.85m·s-1,有效率71.63%;柳州站MAE 18.17°、2.33m·s-1,有效率79.48%。三个站的MAE 都小于25°和3m·s-1,与前人的研究结论相对应,并且有效率都能达到70%以上,保证了业务利用率。

4 结论

利用2019 年至2020 年(非连续时段)广西三部风廓线雷达(北海、南宁、柳州)的实时风产品和ECMWF 第五代再分析资料ERA5 作对比分析,探究风廓线雷达资料的误差大小、离散度和偏离度,以及不同风廓线雷达产品间的差异,并选取得到每个站点的极端误差阈值,有关分析结论如下:

(1)风廓线雷达1h 内探测的水平风波动不大,ROBS、HOBS、OOBS 三种产品数值差距小,特别是在2~9km 高度,并且风速比风向的波动更小。OOBS产品稍显优势。

(2)风廓线雷达水平风数据整体小于ERA5 再分析资料。三个站中,北海站的误差最小。北海站水平风误差最小的是在2~6km,0.5km 以下误差最大。南宁站的风向误差最小是在1~4km,风速是在4~6km,9km 以上误差最大。柳州站在4~6km 误差最小,风向在小于0.5km,风速在大于9km 误差最大。

(3)分别选取北海站105°、6.5m·s-1,南宁站100°、7m·s-1,柳州站85°、8m·s-1作为三个站的极端误差阈值。剔除极端误差后三个站的MAE 都小于25°和3m·s-1,并且有效率都能达到70%以上,兼顾了数据的可靠性和有效率。

猜你喜欢
风廓北海柳州
高邮边界层风廓线雷达数据获取率分析
柳州柳工叉车有限公司
柳州柳工叉车有限公司
一种综合的风廓线雷达数据质量控制方法
用L波段探空测风雷达评估风廓线雷达测风准确性
北海北、南海南
四川盆地风廓线雷达大气折射率结构常数特征分析
北海 美丽的地方
汉北海淳于长夏承碑
柳州柳侯祠祭田在鹿寨