王 楠,朱 蕾,周建军,刘 倩,杨洪儒
(1.民航新疆空管局空管中心气象中心,新疆 乌鲁木齐830016; 2.民航新疆空管局空管中心培训中心,新疆 乌鲁木齐830016; 3.民航新疆空管局空管中心飞服中心,新疆 乌鲁木齐830016)
对于乌鲁木齐机场雾的研究, 前人多集中在基于天气学、统计学的预报方法的研究上[2-6],研究成果揭示了机场大雾多是在偏西气流型、弱暖脊型、巴湖槽前型的天气背景下产生, 配合适宜的温度、湿度、风场等低空气象要素,结合低洼的地势、冷湖及山谷风的共同效应, 使得机场冬季大雾多发且能见度偏低。近年来随着全球气候变化,乌鲁木齐机场大雾又表现出了不同的特征,生消规律有所变化,从而使雾的预报更难把握。 实际工作中预报员对雾的天气形势的掌握和适宜条件的认知, 多是基于一天仅有的两次探空观测数据、 新疆加密自动站数据和机场的微波辐射计数据中得到参考, 对预报雾有一定的指导作用。 但对雾的生消精细化预报的前瞻性不够,准确性较差[7-8],为空管运行决策所提供的服务质量有待提高。 故而加强高时空分辨率的数值预报产品对机场大雾天气中释用性研究,满足时间尺度和准确性的双重要求显得极为迫切。
随着预报技术的发展, 国内外的天气数值预报水平不断提升, 数值预报产品已成为预报员预报天气的主要参考依据[9-12]。传统的针对于数值预报产品的释用多集中在基于多模式集成技术的气象要素的对比分析上[13-15],对单站能见度的预报研究不多,民航气象对该方面的研究更为少见。 所以通过挖掘数值预报产品中与大雾相关性较好的预报因子, 利用特定的方法建立预报模型对能见度的变化进行预测[16-17],预报因子的物理意义明确,且准确性较高,因此成为当前业务中应用较为广泛的大雾客观预报方法。 因此,针对所研究区域的大雾天气特征,选择合适的影响因子和建模方法成为影响模式预测准确度的关键因素。
随着计算机技术的发展和人工智能技术的进步,机器学习得到了广泛的应用。其中基于支持向量理论的支持向量机(Support Vector Machine 简称SVM)方法[18-20],具有从海量的信息中自动识别并提取关键信息的特点, 适合处理本质上的非线性问题[21-22],在气象领域有较好的应用效果[23-24]。 周明薇等[25]和黄威等[26]基于ECMWF 和NCEP 资料,应用SVM 方法分别对邵阳地区雷暴潜势、淮河流域及其以南地区的强降水进行建模, 通过样本检验均取得不错的效果。 在单站预报方面,很多学者运用SVM技术对单站低能见度预测开展了建模试验[27-29],均取得了较高的TS 评分。
由于SVM 方法有不必知道因变量和自变量之间的关系, 通过对样本的学习即可获得因变量和自变量之间非常复杂的映射关系的特质, 以往应用SVM 建模的研究因变量多为无差别选取,有时会造成模式过度拟合,可解读性差,影响建模的速度和预测准确度。 因此,本文按照民航运行标准,将由于雾原因导致主导能见度低于800 m(含)的天气定义为低能见度天气(下同),作为本文的研究对象。应用天气学方法, 给出与机场低能见度天气关系较好的预报因子, 统计分析低能见度天气发生时各预报因子的分布特征,确定预报因子区间分类和阈值,然后基于SVM 方法,利用机场实际应用较好且数据较完整的EC 细网格数值预报产品开展未来21 h 能见度预报模型, 旨在为提高机场能见度的预报准确率提供参考。
乌鲁木齐地窝堡国际机场跑道中心点坐标为87°28′E,43°54′N,海拔高度647 m。 新疆的雾主要出现在北疆,尤以天山山区最多[30],机场正在此大雾多发区中, 本文以机场为中心,0.5°为半径, 在43.75°~44.25°N , 87.25°~87.75°E 范围内, 每隔0.25°取1 个点,共计9 个点(图1),作为本文因变量选取的地理范围。
使用的资料主要包括:(1)2015 年11 月—2018年12 月,逐日20 时(北京时,下同)起报EC 细网格数值预报产品(0.25°×0.25°),时效为21 h,时间间隔为3 h;(2)同期乌鲁木齐站(51463)逐日08、20 时探空资料;(3) 同期乌鲁木齐机场METAR 报文;机场民航自动气象观测系统(AWOS)主降跑道(25 号跑道)方向资料;(4)NCEP/ NCAR 1°×1°再分析资料分析SVM 建模预测准确时对应的天气形势。
图1 EC 细网格资料提取格点位置示意图
由2015—2018 年乌鲁木齐机场低能见度累计出现时次的逐月分布(图2)可知,机场低能见度天气11 月开始出现,12 月—次年2 月最多, 初春时节开始减少,3—10 月则很少出现。 1 月低能见度累计出现时间最多为729 h,距平百分率为143%,其次为12月,共计620 h,距平百分率为106%。 11 月—次年2月低能见度出现次数累计概率为96.15%, 因此本文应用上述4 个月的数据来表征机场低能见度的特点,并建立能见度预测模型,具有合理性。
合伙形式的评估机构,应当有两名以上评估师;其合伙人三分之二以上应当是具有三年以上从业经历且最近三年内未受停止从业处罚的评估师。
图2 2015—2018 年乌鲁木齐机场逐月累计低能见度出现时次
预报因子的选取是大雾预报的关键, 大雾形成所需的静稳结构与低层大气垂直分布状态和地面气象要素分布有关。 通过参考以往机场低能见度天气气候特征的研究成果, 结合高空探测数据和METAR 报文特征, 选取距离机场20 km 的乌鲁木齐站(51463)一天2 次850 hPa 的探空数据作为表征低能见度天气出现时周边气象条件的分布情况。用乌鲁木齐站(51463)850 hPa 的温度(T850hPa)与同时次机场的观测温度之差表征逆温情况,用850 hPa的相对湿度(RH850hPa) 表征机场上空湿度情况,用850 hPa 的风向风速(WIND850hPa)表征机场上空风场情况;选取机场METAR 报文中的温度、风向风速及对应时次的AWOS 观测数据中相对湿度表征机场近地面气象要素情况。
由图3a 可知,低能见度天气对应的逆温多集中在6 ℃(含)以上(为75.7%),随着逆温增强,低能见度天气出现的比率迅速增长; 而非低能见度天气发生时对应的逆温多集中在6 ℃(含)以下(为58.4%),两者在(3 ℃,6 ℃]逆温区间交汇,呈反相关趋势变化。 低空相对湿度情况显示(图3b)850 hPa 的相对湿度主要集中在(20%,80%]区间,且低能见度天气与非低能见度天气与相对湿度的对应关系呈反相关趋势,高湿度场对应非低能见度天气的多,低湿度场对应低能见度天气的多, 即850 hPa 相对湿度较小时,低能见度天气较易发生。其原因为冬季天山山区中段上空极易出现偏东或东南风, 使850 hPa 变干变暖,形成干暖盖,使机场能见度持续走低。
这种情况在图3c~3d 中也有所反映: 低能见度天气形势下,850 hPa 为偏东或东南风(风向角100~200°)次数偏多且风速较大,西北风(风向角250~350°)偏少且风速基本维持在10 m/s 以下;与此对应,非低能见度天气下,西北风明显变强,次数增多且风速较大,东南风相对减弱。 即东南风风速大,机场能见度低且维持时间长, 其原因为东南风层有助于逆温层和850 hPa 干层的建立和维持, 静稳结构更加深厚, 所以东南风对机场低能见度天气的出现及维持有着较为重要的作用。 如果机场上空为西北风且风速较大,则说明有扰动系统影响机场,有利于静稳结构的破坏,能见度转好。
图3 乌鲁木齐机场低能见度天气与非低能见度天气对应的逆温(a)、850 hPa相对湿度(b)、850 hPa风场(c、d)的变化曲线
除了低层大气垂直要素分布状态以外, 地面空气饱和情况也是大雾发生的重要条件。 由图4a 可知,11 月—次年2 月机场气温多在-20~0 ℃,低能见度和非低能见度天气对应的气温变化趋势较为一致,未表现出明显的差异。 地面相对湿度也表现有同样的特点(图4b), 相对湿度多集中在60 %以上,40%以下的相对湿度出现的概率较小。值得注意的是,93.5%的低能见度天气出现时地面相对湿度>80%。配合地面风场的分布特点(图4c),风速≤2 m/s出现概率为93.4%,低能见度天气下,风速≤2 m/s出现累计概率为96.2%, 其中又以风向不定的情况居多, 累计概率为43.4%。 但就风向和风速的分布上, 低能见度和非低能见度天气上并没有较为明显的区别,一致性较强。 故选取>5 ℃和<-20 ℃作为地面温度的阈值,>80%作为地面相对湿度的阈值,风速≤2 m/s 风向任意作为地面风场的阈值。
基于上述各因子与能见度之间的关系, 结合机场实际工作和数值预报产品类型, 最终确定表征低层气象要素的因子, 包括925、850 hPa 的相对湿度和风场;选取T850hPa-T1000hPa、T850hPa-T2m、T925hPa-T1000hPa、T925hPa-T2m温差表示逆温,共计8 个气象因子;表征地面气象要素因子包括10 m 风场,2 m 温度场及1000 hPa 相对湿度,共计3 个气象因子。
利用程序读取数值预报产品, 提取图1 各点对应的11 个气象因子, 计算99 个诊断量, 共同构成备选因子库,计算各因子与机场能见度的相关系数,在与预报时效对应的预报场单站位置及小幅影响范围内,选取物理意义好、相关性高、独立性强的因子进入模型。表1 列出了相关系数超过α=0.01 显著性检验的因子共计7 个,进入样本建模。值得注意的是地面3 个要素场均未进入到模型中, 分析原因可能为EC 产品对近地面层气象要素的预报准确度不高,尤其在地面风场上,风速≤2 m/s 与风速>2 m/s对应的能见度不同的特点,EC 产品对此很难分辨;由图4 可知,11 月—次年2 月机场低能见度与非低能见度天气对应地面要素场变化没有低层气象要素变化明显, 且基本保持了较为一致的变化趋势和数值范围,故而在相关性的计算中未通过检验。
将2015—2018 年机场METAR 报文中能见度作为建模样本,除去非雾原因引起的能见度≤800 m的时次, 样本总数为2037 个, 其中低能见度个例270 个,气候概率为13.25%;保持低能见度与非低能见度天气个数比例(1∶7.5) 抽取样本总数70%(1426 个样本) 作为训练样本,30%(176 个样本)作为检验样本进行建模和检验。 然后将训练样本的各个预报因子按照表1 的规则进行转化,再将预报因子分别作归一化处理, 使每一个因子的数据落入区间[0,1]。 公式为:
图4 乌鲁木齐机场低能见度天气与非低能见度天气对应的机场温度(a)、机场相对湿度(b)、机场风场(c)的变化曲线
其中xki是第k 个因子的第i 个数值,Xki′是该因子归一化后的值, min(xk)、max(xk)分别为第k 个预报因子数值序列的最小值和最大值。其中k=1,2,…,7;公式(1)中i=1,2,3,…,1426;公式(2)、(3)中i=2,3,…,1426。 同理将预报对象也做归一化处理。
表1 与能见度高相关性的预报因子列表
本文选取SVM 建模中稳定性较好且处理非线性问题较为常用的多项式核函数(Poly)和径向基核函数(RBF)进行建模实验及对比分析,表2 给出基于上述2 种核函数建模的训练样本结果。 表3 为其对应的检验样本结果。
表2 预报模型试验结果
表3 预报模型检验结果
在模型建立中,采用了TS 评分机制,选用训练样本TS 最高作为最优模型的选取标准,最终确定2种核函数的最优参数匹配如表2 所示。 分析训练结果可知,2 种核函数评分均较高, 其中RBF 作为核函数的预报准确率为89.20%,空报率和漏报率分别为6.25%和10.79%,TS 评分为0.84, 远高于低能见度天气出现的气候概率。 Poly 作为核函数进行SVM分析的TS 评分为0.80,准确率84.09%,空报率和漏报率分别为6.25%和15.90%。相对于RBF 核函数而言,漏报率偏高。综合分析模型预报准确样本和漏报样本可知,模型对于实况为[500 m, 800 m]范围内的低能见度的天气检验效果相对平稳, 对于实况为≤300 m 的低能见度天气表现出较为明显的振荡特点:预报准确时误差较小,漏报时误差较大。
RBF 核函数表现出了更为准确的预报效果,分析其原因为:对于不同目标量建模或是相同目标量,选取不同时次的样本做训练样本都有可能得到不同的最佳核函数。RBF 核函数与Poly 核函数相比具有参数少的优点。 因为参数的个数直接影响到模型选择的复杂性,本文建模引入因子7 个,对于机器学习来说,因子很少;再有RBF 核函数具有唯一最佳逼近的特性,且无局部极小问题存在,并且具有很强的聚类分析能力。 低层是否存在东南风与机场能见度变化有比较显著的关联, 在能见度的预测中权重较大,聚类分析效果明显;另外当Poly 核函数阶数比较高的时候, 核矩阵的元素值将趋于无穷大或者无穷小,易出现“维数灾难”。所以就本文选取的训练样本及检验样本而言,以RBF 为核函数的建模对乌鲁木齐机场能见度的变化有较好的预测能力且准确性较平稳。
为了进一步分析基于SVM-RBF 建模产品在机场实际工作中的应用价值, 对模型的检验样本进行预报误差分析。定义800 m(含)为评判标准:实况值低于(含)800 m,模式预测值为低于(含)800 m 则为预报准确,空报和漏报原则以此类推。
检验样本中模型预测准确次数73 次,具体分布如图5a 所示。 在预报准确的检验样本中,模型预测值整体偏小,偏小最大值为721 m;模型预测值偏大9 次,偏大最大值为200 m。 实况与模型预测值偏差主要集中在(-100 m,100 m)区间内,共计出现24个时次,其次为(300 m,500 m]区间,共计出现17 个时次。且比较不同能见度级别实况与预测值误差,具体表现为: 实况能见度≤300 m 的模型绝对平均误差为64.9 m; 能见度≤500 m 的模型绝对平均误差为136.3 m;能见度≤800 m 的模型绝对平均误差为274.1 m,基于上述分析模型准确度整体平稳且误差较小。
图5 RBF 预测能见度值与实况能见度值对比
低能见度天气检验模型漏报次数21 次,其与实况能见度的对比分析如图5b 所示。 在漏报的样本中, 模型预测值与实况值相差较大, 偏差最大值为1470 m,偏差最小值为280 m。 且比较不同能见度级别实况与预测值误差,具体表现为:实况能见度≤300 m 的模型绝对平均误差为1166 m;能见度≤500 m 的模型绝对平均误差为917.6 m; 能见度≤800 m 的模型绝对平均误差为683.7 m。由此可见模型对于能见度≤300 m 的预报误差大, 随着实况能见度的增加绝对误差有所减小。 综合分析模型预报准确样本和漏报样本可知,模型对于实况为[500 m,800 m] 范围内的低能见度的天气检验效果相对平稳, 对于实况为≤300 m 的低能见度天气表现出较为明显的振荡特点:预报准确时误差较小,漏报时误差较大。
为了进一步研究模型在天气过程预报的应用情况,本文选取模型预报效果较好的2017 年11 月18日20 时起报的21 h 预报产品与实况进行对比(图6)。其中实心三角标注的时刻是检验模型输出数据,其余为训练模型输出数据。 除了12 h 和15 h 预报场中能见度值相差较大, 其余各时次数值及变化趋势预报准确。
图6 2017 年11 月18 日天气过程实况及模型预测能见度对比
2017 年11 月16—17 日,乌鲁木齐机场出现持续30 h 的降雪天气, 为近地层提供了充足的水汽。后续新疆地区500 hPa 形势场为偏西气流转弱脊控制,850 hPa 形势场有暖舌自伊犁河谷东伸并缓慢
加强。 至18 日20 时—19 日08 时(图7),850 hPa风场显示机场低空东南风场建立并持续加强, 近地面逆温层深厚且稳定的形势。
按照表1 的物理量及相应格点, 调取EC 细网格本次预报场资料如表4 所示, 可见在中低层东南风及近地面逆温建立、 中低层湿度场的预测上,EC细网格产品总体预报较为准确。 具体分析本次天气过程可知, 在9 h 预报中925 hPa 东南风停止并转为西北风,850 hPa 仍在维持, 近地面逆温有所减弱, 至12 h 预报开始925 hPa 西北风加强,850 hPa东南风渐弱,15 h 预报显示850 hPa 干层逐渐减弱,湿度加强,850 hPa、925 hPa 西北风层建立, 模型预报能见度有所上升。 与实况气象要素分布相比,在12 h(图7c)风场的变化中EC 模式预报东南风转西北风较早,从而导致SVM 预测模型结论的偏差。 所以,SVM 预测模型输出能见度与实况的偏差来源于EC 细网格产品准确度的偏差, 而SVM 预测模型建立起来的能见度预报模型相对来说较为合理和稳定,随着EC 细网格产品准确率的提升,SVM 预测模型输出的能见度产品也将有进一步的改进。
(1)机场低能见度天气对应低层大气相对湿度较小,逆温较大,东南风较多且风速较大。 依据各因子对能见度变化的敏感程度进行区间分类的SVM建模预测效果较好。
(2)基于Poly 和RBF 所建的SVM 推理模型对低能见度天气均具有一定的预测能力,TS 评分分别为0.80,0.84,均超过低能见度出现的气候概率。 检验样本中,Poly 和RBF 的TS 评分0.50,0.64, 整体预测效果良好,且RBF 建模效果更佳。
(3)分析SVM-RBF 模型输出产品的预报误差,在预测准确的检验样本中, 预报误差主要集中在(-100 m,100 m],其次为(300 m,500 m],且模型在不同级别能见度的预报误差整体偏小。 但针对模型漏报的低能见度天气则有能见度越低, 预报误差越大的特点, 即模型的振荡性在漏报的样本中表现显著。
(4)分析模型预报效果较好的2017 年11 月18日20 时起报的21 h 低能见度天气预报可知,SVMRBF 模型预测效果较好且模型稳定, 随着EC 细网格产品准确性的提升,SVM-RBF 预测模型输出的能见度产品也将有进一步的改进。
最后需要指出的是,EC 细网格预报产品对近地面气象要素预报准确性不高, 未能与机场的能见度建立很好的关系; 再者模型预报产品中没有输入前一个时次实况能见度数值作为训练因子, 使得模型的输出产品具有较大的离散性, 本文曾尝试将前一时次的实况能见度作为因子进入模型进行计算,得到的结论显示前一时次的能见度在模型中占有过大的比重, 致使整个模型成为了前一时次能见度的外推,对能见度的预测,尤其是生消没有太好的实际价值,如何将实况能见度较好地引进模型中,还需要更合理的方法。
图7 基于再分析资料的2017 年11 月18 日天气过程中气象要素的垂直分布
表4 2017 年11 月18 日20 时起报的21 h 数值预报产品