基于区域建模的能见度预报及影响因子分析*

2022-07-06 11:28:50赵翠光赵声蓉吕终亮

气象 2022年6期

赵翠光赵声蓉林建吕终亮姚莉韦青

国家气象中心，北京 100081

提要：利用2008—2018年逐日能见度站点观测资料，通过旋转经验正交函数分解方法分析得到不同季节能见度天气的客观分区，在此基础上，以2017—2019年欧洲中期天气预报中心全球数值预报模式输出和相关诊断量及站点观测资料分别作为预报因子和预报量，应用多元线性回归、事件概率回归估计和判别分析等综合算法，分区域、分季节建立能见度预报模型，并将区域预报模型应用于区域内站点,得到站点能见度预报结果。以2020年资料为独立样本进行试报，检验结果表明：基于区域建模的能见度预报效果在不同季节、不同预报时效较模式直接输出有很大提升，明显订正了模式对冬季低能见度天气低估的情况，在1 km以下级别低能见度预报中显示出较高的预报技巧，尤其在低能见度出现较多的05时最为明显。因子分析表明，影响能见度的因子主要是与边界层条件密切相关的温、压、湿、风等因子，以及反映下垫面热状况因子、降水相关因子和稳定度因子。不同季节、不同等级能见度预报模型中高频因子不同，春季高频因子主要为温度相关因子，夏季与降水相关的因子选入频次较高，秋、冬季不稳定因子更重要。

引言

能见度(指大气水平能见度，下同)是天气预报中重要的天气要素，低能见度天气不仅影响人们的日常生活和身体健康，而且对交通运输、航空、航海等影响更为严重。水平能见度下降到1 km以下，常会导致航行延误、高速封闭，也是造成历史上许多航空灾难的原因之一(Allett,2004)。因此能见度预报，尤其是低能见度天气的预报十分重要。

数值预报模式中能见度预报通常由云水含量、相对湿度和降水等其他物理量诊断得到(Smirnova et al，2000；Benjamin et al，2004；Gultepe and Milbrandt，2010)。Herman and Schumacher(2016)的研究表明雾-霾和强降水是造成能见度降低的重要因素，而雾的形成对地面风、低层稳定度和湍流及其他因素等的微小差异具有较高的灵敏性(Gultepe et al,2007),因此数值预报模式中能见度预报准确率较低。

不同数值预报模式，由于动力框架和物理参数化方案等方面的差异，具有不同的预报系统误差。通过统计方法，在历史的模式和观测资料基础上建立相关模型可以在一定程度上消除系统误差，从而达到对模式预报进行订正的目的。美国气象发展实验室研究表明以全球预报系统为基础的模式输出统计(MOS)预报的性能优于模式直接输出(Dallavalle et al，2004)。研发人员通常采用神经网络、多元回归分析、支持向量机及深度学习等统计方法，开展定量和概率的能见度预报研究(周开鹏等，2020；胡海川等，2018；吴波等，2017；熊亚军等，2015；张自银等，2018；路婵，2010)，但针对全国范围的能见度预报工作较少，且低能见度预报仍然是难点问题。

针对以上问题，本文采用基于区域建模的MOS方法，开展中国区域能见度预报试验。MOS(Glahn and Lowry，1972)是业务预报中重要的模式后处理方法，针对不连续分布的要素(如能见度、降水等)，则利用事件概率回归方法有较好的预报效果(Antolik，2000；赵声蓉等，2009)。同时由于低能见度为小概率事件，采用区域建模方法来扩展小概率事件的“样本数”，提高预报模型的稳定性。区域建模方法是将变化特征相似的站点归为一个区，联合区域内站点建立预报模型(赵翠光和赵声蓉，2011；Wilks，2011)，再将区域模型应用到区域内任何站点上，实现站点预报。

本文首先利用能见度多年历史实况观测资料，采用旋转正交经验分解(REOF)方法(黄嘉佑，1990)分季节对全国能见度天气进行客观分区；在客观分区基础上，采用多元线性回归(MLR)、事件概率回归估计(REEP)和判别分析的综合算法建立区域预报模型，将区域预报模型应用到区域中任意站点上；检验分析了试报结果，并与模式输出进行对比；最后对模型所选高频因子进行分析和讨论。

1 能见度天气区划分

分区方法包括客观方法和主观方法，主观方法一般是按照人为经验、行政地域等进行划分。经验正交函数(EOF)分析是提取气象要素场时空变化优势信号的方法, EOF分析方法分离出的空间分布结构能够反映气象要素场的主要空间特征，但是不能清晰地表示不同地理区域变化特征(魏凤英，2007)，所取区域范围不同,得到的特征向量空间分布也不同。但上述局限可以通过REOF 得到克服。

REOF是在EOF展开的基础上再做最大正交方差旋转，从而使原要素场的信息特征集中映射到荷载场所表示的优势空间上，旋转后荷载的贡献要比旋转前分布均匀,这是因为旋转后各主成分着重表现空间的相关性分布特征,高荷载只集中在某一较小的区域,而使其他大部区域的荷载尽可能地接近 0，从而更容易识别空间型，旋转后的特征场在时间上也比旋转前更稳定。

已有能见度天气分区研究工作多是以月、季资料为基础开展(黄楚惠等，2019；程叙耕等，2013；林建等，2008；张利等，2011；周贺玲等，2007；王淑英等，2003)，并不适用于逐日能见度预报。因此本文以2008—2018年逐日能见度站点观测资料为基础，针对我国春夏秋冬四个季节，采用REOF对能见度进行客观分区。按Cattell(1966)提出的方法，当主分量解释方差突变时，来确定分区个数，为验证划分区域是否合理，对各分区第一主成分两两求相关，检验表明这些不同区域之间的能见度异常变化存在着显著的差异，分区是合理的。

根据REOF得到四个季节能见度天气区如图1所示。整体上看,与全国二级气象地理区划(郭进修等，2006)相似，但本文分区更能体现要素的季节变化和区域气候特征。以山东省为例，春季和夏季山东全省变化特征较一致，而秋、冬季呈现内陆和沿海气候特征不同的特点，冬季山东半岛东部3个站(由于站数少，图中没有显示，但是在建模中得到应用)和辽宁南部沿海为一个区，区别于山东其他地区。这与“秋、冬季内陆大雾高发，沿海大雾日数较少。从深秋到冬季，山东内陆常出现大范围大雾,而沿海海温较低不易出现大雾天气”的研究结论(林建等，2008；郗兴文,2010;李建华等，2010)是一致的。

图1 基于2008—2018年逐日能见度观测资料REOF方法分解的(a～d)我国不同季节能见度客观分区Fig.1 Division of visibility in (a-d) different seasons in China based on REOF of daily observation visibility from 2008 to 2018

2 建模资料

2.1 预报量定义

能见度为不连续的非正态分布变量，在使用回归方法时，直接预报能见度很难得到好的预报效果，因而将能见度划分为不同级别(见表1)，把级别定义为预报量。能见度资料来源于国家气象信息中心整编的2017—2019年全国2 423个站点的能见度实况观测。

表1 能见度分级Table 1 Visibility classification

2.2 预报因子

本文使用的模式资料为2017—2020年欧洲中期天气预报中心(ECMWF)全球数值预报模式输出产品。为涵盖能见度的发生发展，预报因子包括模式直接输出产品(直接因子)和诊断得到的具有物理意义的派生因子(表2)。直接因子包括温、压、湿、风、降水、云量、能见度、地表反照率等模式直接输出量。派生因子分为四类：一是温湿、水汽因子，例如：温度露点差、Ky指数、湿静力温度、饱和湿静力温度、假相当位温、比湿、水汽通量、水汽通量散度、相对湿度超过90%的高度层数等；二是动力因子，例如：涡度、散度、螺旋度、偏差风等；三是动力和热力综合因子，例如；位涡、湿位涡、位涡倾斜发展判据、锋生函数等；四是要素的梯度、切变、平流变化和时间累计因子，例如：温度、气压梯度，风速、位温、不同高度层的(假)相当位温的垂直切变，温度、涡度、厚度平流，3时次累计平均垂直速度等。将以上的地面或各高度层的变量放入候选因子“池”中，为下一步建立能见度预报模型做准备。

3 建模技术方案

本文采用MLR、REEP和判别分析等综合算法，建立某一时刻能见度与各物理量之间的统计关系。其中REEP方法是将预报量看成随机事件 ,将事件出现与否转化为 0、1化的二值变量，预报结果为0～1的概率值，等级预报则是在概率预报基础上，基于特定的判别条件(本文采用TS评分最大的判别条件)，在建模样本中确定事件出现与否的概率判别阈值(Weiss and Ghirardelli,2005)。

表2 建模候选因子分类Table 2 Classification of building model candidate factors

以2017—2019年资料按春夏秋冬四个季节建立模型。为了更好地处理季节过渡的问题，相邻两个季节之间时间重叠了一个月：分别为春季(2月15日至6月15日)；夏季(5月15日至9月15日)；秋季(8月15日至12月15日)；冬季(11月15日至3月15日)。

回归分析中，预报因子需要与预报对象具有较好的相关性，且预报因子之间要相对独立，因为预报因子间相关性过大，会使得回归系数对样本数据的微小变化变得十分敏感，从而使得预报模型变得很不稳定。经过预处理的预报因子数量非常大，在建模的过程中不可能把所有因子引入，因而，在预报因子进入回归过程前，先对因子进行初选，在因子初选方案中，一方面选择与预报量相关系数绝对值较大的因子，另一方面为减少复共线性问题，选择因子之间近似独立，即因子之间相关系数小的因子。

区域建模(RMOS)方法是同一天气分区中样本共享，基于历史的数值预报模式预报产品和实况资料，通过MLR、REEP和判别分析等综合算法建立区域预报模型，将区域模型应用到区域中任意站点上，得到站点预报模型。基于RMOS方法的能见度预报流程如图2所示。

图2 RMOS方法的能见度预报流程Fig.2 Flow chart of visibility prediction based on RMOS method

4 能见度预报检验及高频因子分析

4.1 能见度预报检验分析

为评价预报方法效果，对2020年20时起报的RMOS和模式直接输出(DMO)的能见度预报分季节进行检验分析。图3为不同等级、不同季节能见度在不同预报时效的TS评分，36 h预报时效内RMOS相对于DMO在不同季节、不同等级、不同时效上都表现出更好的预报效果，1 km以下级别预报改进最明显。RMOS预报TS评分相对于DMO有更明显的日变化特征，在夜间和凌晨低能见度出现次数较多的时次评分较高，中午和下午评分较低。RMOS预报的TS相对于DMO的提高也显示出日变化特征，最大值出现在05时，最小值在14时和17时。值得注意的是，秋季RMOS 1 km以下级别的能见度预报TS评分没有明显的日变化特征，这可能与秋季易发生大范围持续性的平流雾，低能见度天气日变化特征较弱有关(林建等，2008)。

DMO和RMOS预报在不同季节显示出不同的预报性能。DMO预报春、夏季节优于秋、冬季节，在1 km和2 km以下级别夏季明显优于其他季节。RMOS预报是秋、冬季节优于春、夏季节，且冬季明显优于其他季节，夏季相对较差。不同季节RMOS相对于DMO预报TS评分几乎均有提高，而冬季预报提升明显，特别在1 km以下级别上提升最为明显。对比冬季RMOS和DMO能见度预报的Bias评分(图4)可以发现，DMO很大程度上低估了事件的发生，不同级别的能见度预报范围都明显小于实况；对于10 km和5 km以下级别的能见度事件，RMOS订正后预报范围略大于实况，但对于1 km和2 km以下级别的较低能见度事件，由于局地性较强，RMOS订正后预报范围较实况偏大一些，也不难理解。冬季RMOS相对于DMO提高最为明显，主要是因为冬季大气环流相对于其他季节更稳定，数值模式的环流形势及要素预报较好，加上冬季能见度在四个季节中平均最低(林建等，2008；张利等，2011)，低能见度样本多，RMOS方法所建模型预报稳定，从而可得到更好的预报。

图4 2020年全国冬季各等级(a)DMO,(b)RMOS不同预报时效Bias评分Fig.4 (a) DMO and (b) RMOS forecast projection hour bias scores at different levels in China in the winter of 2020

夏季大部分预报时效RMOS预报相对于DMO有很大改进，5 km以下级别11—17时的预报TS评分略低于DMO，但RMOS的预报偏差Bias优于DMO(图略)。从图5可以看到，四个季节中伴有降水的低能见度事件发生频率均在14时前后达到峰值，但夏季下午的低能见度伴有降水的比例最高达70%以上,和刘承晓等(2017)的研究结论“7—8月与降水相关的低能见度相对集中在午后13—15时”是一致的，可见夏季午后的低能见度天气很多是由降水引起。刘西川等(2010)研究发现,降水粒子对能见度的影响受降水粒子类型、密度、速度、大小等多种因素影响，二者关系并不唯一确定，而能见度仪的观测前提是假定整个大气是均匀的，当大气均匀时代表性好，反之亦然。因此，能见度自动观测仪在出现降水时测量准确度不高(刘惠兰等，2014；司鹏和高润祥，2015)。RMOS方法预报是由实况观测和模式产品统计后处理得到，如果实况观测不稳定必定会影响统计预报效果。

图5 2020年全国(a～d)不同季节各等级能见度中伴有降水的站数占总站数百分比的日变化Fig.5 Daily variation of the percentage of stations with precipitation to total stations in visibility of different levels in (a-d) different seasons in 2020 in China

4.2 高频因子分析

不同分区不同等级的预报模型都是基于相同的预报因子群，模型最终选出与预报对象对应的最优因子组合，因此最终入选方程的预报因子会存在差异。对四个季节区域方程进行因子频数统计分析，可以考察因子对方程的贡献。表3和表4给出了四个季节模型中不同预报等级因子频数前十位的因子，总体上看，高频因子涵盖模式过去3小时内10 m 阵风、能见度因子和温、压、湿、风等基本因子以及反映下垫面热状况的反照率、与稳定度有关的相当位温垂直切变，气压梯度、锋生函数、位涡等因子以及3 h变温、温度平流等因子。

表3 不同季节10 km以下能见度预报建模因子频数排序Table 3 The frequency ranking of forecast modeling factors for visibility below 10 km in different seasons

表4 不同季节1 km以下能见度预报建模因子频数排序Table 4 The frequency ranking of forecast modeling factors for visibility below 1 km in different seasons

由于能见度和边界层条件密切相关，能见度预报模型所选频数较高因子几乎均为低层因子，模式过去3小时内10 m阵风、能见度、2 m最大相对湿度和风速基本因子稳居前列，很多文献阐述了这些因子对能见度的重要性(宗晨等，2019；丁一汇和柳艳菊，2013；张利娜等，2008；程叙耕等，2013；李霞和王胜利，2012；叶堤等，2006)。由于不同季节不同等级能见度的成因有所不同，因此统计得到的高频影响因子也不尽相同。

春、秋、冬季低能见度天气常伴有辐射雾，主要发生在晴朗、微风、近地层水汽充沛的夜间和早晨。这个时间天空没有云层阻挡，地面散热快，近地层空气温度迅速下降，如果空气中存在较多水汽，就会过饱和形成雾，所以，除了模式的过去3小时内10 m阵风和能见度因子，2 m相对湿度、2 m最大相对湿度因子排名也比较靠前。

四个季节中夏季的能见度预报与降水有统计意义上的高相关，包括湿层厚度(相对湿度≥90%的高度层数)、整层水汽含量以及表征不稳定的700 hPa Ky指数等与降水相关的因子，这跟4.1节分析的夏季午后的低能见度天气通常是由降水(伴有降水的比例最大达70%以上)引起的观点高度一致。

低层的变温和温度平流是影响春季能见度的主要因子，低层温度的迅速降低有利于水汽快速达到饱和，从而有利于雾的形成。微弱的低层暖平流的不断输入, 非常有利于近地层逆温的重建和维持,平流过程对大雾天气的长时间维持具有重要作用，而当伴随负温度平流南下的偏北风的爆发则有利于大雾的消散。

地表反照率因子在春、夏季相对于秋、冬季被选入频次更多，特别是对低能见度天气影响较大。地表反照率是反映地表对太阳短波辐射反射特性的物理参量，反照率效应使地表接收的短波辐射减少，地面增温效应显著减小，从而阻碍了大雾过程的消散，使大雾天气得以维持。

地面气压梯度在春、秋、冬季作为预报模型高频因子，可能跟它反映梯度风的大小或锋区强度有关。由于锋生作用产生浅层抬升, 有利于饱和湿空气的凝结以及近地层逆温的长时间维持，易造成锋前雾的形成。冬季，地面均压场容易导致低能见度辐射雾的形成(林建等，2008)。

近地层相当位温的垂直切变在秋、冬季节被统计为高影响因子，它包含了温度和湿度的垂直变化，表征近地面层湍流活动和边界层大气的稳定度。冬季，低层位涡被列入低能见度预报十大高频因子之一，这可能跟位涡下传及地面气旋发展相关。

除了低层因子外，秋季100 hPa经向风的平方，春季100 hPa 3 h变高也为高频因子。当对流层上部西风急流存在，高空风速在大气的动能、热量、水汽和气溶胶等能量和物质输送、交换中发挥着关键作用。高空风速特征，对于地面天气的时空分布和动力过程具有重要作用。城市和区域污染物、粉尘和花粉的扩散和传输也依赖高空风(任国玉等，2009;邹进上等,1990)。

不同等级所选的十大高频因子大部分相同，只是排序上有些变化，但是在秋、冬季的1 km以下级别偏差风和位涡因子是有别于10 km以下级别的高频因子，这可能跟秋、冬季静稳天气造成的低能见度有关。

5 结论与讨论

本文基于2008—2018年能见度实况观测资料，采用REOF分解方法对不同季节的能见度进行客观天气分区。以2017—2019年ECMWF模式输出、相关诊断量及站点观测资料分别作为预报因子和预报量，利用MLR、REEP、判别分析等综合算法，针对不同季节的能见度进行区域建模，并应用到区域内的站点上进行预报。

对2020年的能见度预报进行对比检验发现，RMOS和DMO能见度预报TS评分的日变化特征明显，在夜间和凌晨评分较高，下午评分较低。不同季节、不同等级RMOS预报TS评分相对于DMO均有提高。冬季1 km以下级别预报评分提升最为明显，RMOS订正了DMO低能见度预报低估现象，TS提高最大值出现在05时，最小值在14时和17时。

对预报因子统计分析显示，影响能见度的高频因子主要是与边界层条件密切相关的温、压、湿、风等基本因子以及反映下垫面热状况因子、降水相关因子、稳定度及辐射冷却作用的因子，并且不同季节、不同等级能见度预报被选入的高频因子不同。低层的变温和温度平流是影响春季的主要因子；地表反照率对春、夏季低能见度影响较大；夏季与降水相关的因子选入频次最多，包括降水量、湿层厚度、整层水汽含量等；秋、冬季反映边界层温湿度垂直变化的不稳定因子在能见度预报中也非常重要。

本文仅以数值模式产品及诊断量作为预报因子来建立短期能见度预报的统计模型，要解决低能见度空报率相对较大的问题，还应考虑大气成分等因子的应用。另外，对于短时预报来说，预报因子中还可加入雷达、卫星及地面气象及环境观测要素产品，以提高预报效果。