肖志祥,姚 才,郑凤琴,赵金彪,黄小燕,史彩霞
(1.广西壮族自治区气象科学研究所,南宁 530022;2.广西壮族自治区气象局,南宁 530022;3.广西壮族自治区气候中心,南宁 530022;4.广西壮族自治区气象台,南宁 530022;5.广西壮族自治区气象灾害防御技术中心,南宁 530022)
西北太平洋和南海是热带气旋活动最频繁的地区,热带气旋登陆地点几乎遍布我国沿海,使得我国遭受热带气旋影响次数多、程度重、范围广[1]。热带气旋造成的狂风、暴雨、风暴潮[2]及洪涝、泥石流等次生灾害对我国沿海地区经济、社会发展和人员安全造成严重影响。每年平均约5 个热带气旋登陆或影响广西。研究表明,西行影响和登陆我国的台风频数多、强度强,影响范围广、经济损失严重,广西是受西行台风影响造成平均直接经济损失较大的省份之一[3-4]。进入广西最强的台风“威马逊”(1409)造成广西10 人死亡,直接经济损失超过138 亿元的严重灾害[5]。台风作为广西最主要的自然灾害之一,各行业和部门从中短期到季节尺度的台风与海洋精细化气象服务都提出了更高的需求。
中国气象局和广西壮族自治区气象局海洋气象业务发展规划都重点指出需提升台风风雨精细化预报预测水平。因此,开展契合广西本地需求的台风预报预测方法研究和产品研发显得尤为迫切。广西台风与海洋预报服务创新团队于2020 年7 月成立,本文主要介绍团队成立一年半以来在台风风雨预报、季节预测及集成平台等方面的工作及研究进展,以期为广大预报员和科研人员提供业务应用和研究的参考依据。
登陆热带气旋降水是热带气旋科学面临的三大挑战之一[6]。它的预报方法主要有动力模式、统计方法和统计-动力结合等三种。目前,短时间内提升数值模式对登陆热带气旋降水的预报能力十分困难。团队引入中国气象科学研究院任福明研究员研发的登陆热带气旋降水动力-统计集合预报模型(LTP_DSEF;图1)进行本地化应用。该模型主要有以下几个步骤:①热带气旋路径实时预报信息;②热带气旋相似路径识别。通过目标气旋的完整路径、相似区域、路径相似面积指数以及相似气旋历史排序等步骤完成;③登陆季节、强度、移速等相似特征对步骤②获得的排序进行进一步筛选,并选择n 个最佳相似气旋;④n 个最佳相似气旋过程降水的平均值或最大值的集合预报;⑤根据各参数组合方案的TS 评分结果获得最佳预报方案。具体步骤可参阅相关文献。
图1 基于路径相似的登陆热带气旋过程降水动力-统计集合预报思路[7]
本地化的LTP_DSEF 模式主要选用中央气象台主观的热带气旋路径预报,参数包括起报时刻、相似区域、相似面积指数、重叠度阈值、独立样本检验、季节相似、强度相似、最佳相似个数和集合预报方案等9 种。以2011—2013 年影响广西的10 个热带气旋作为样本,在超过16 万种有效参数组合中选取降雨量级为100mm 和250mm 的TS 评分最高组合作为最优参数。进一步使用广西遗传—神经网络方法回报的热带气旋路径,使用模式对近二十年影响广西的热带气旋进行了回报试验(图2)。从图中可以看到该模型对建模样本(2011—2014 年)的预报效果远优于欧洲中心,模型对独立样本(2014—2018 年)
图2 LTP_DSEF 模型对近二十年影响广西的热带气旋进行回报试验
蓝色和红色虚线分别为模型和欧洲中心在各时段的平均TS的预报能力总体也比欧洲中心有所提升。进一步对比分析表明,欧洲中心对1418 号台风的高评分总体提升了其TS,而对其他热带气旋的预报效果几乎都是本地化的模型表现最佳。本地化LTP_DSEF 模型对强降水的漏报小于欧洲中心,对近二十年在广西造成100mm 以上降水的热带气旋降水平均TS 约为0.18。
此外,还对不同路径、强度进入广西的热带气旋进行了分类检验。结果显示该模型对第二类路径(湛江到珠江口以西登陆)台风的暴雨以上累积降水落区预报效果最好,其次为第一类(湛江至海南岛登陆)和第三类路径(珠江口至汕头之间登陆)。当热带气旋强度达到台风级别且中心进入广西内陆时,模型的预报效果也很好。热带风暴以上强度的特大暴雨模型预报效果则远优于欧洲中心。该模型对热带低压等强度较弱且中心在广西陆地边缘的气旋预报效果较差,存在暴雨预报过度的情况。
在集合预报成员中,几乎总能找到一些与台风实际路径非常相似的成员。有关研究[8]结果表明,集合成员优选技术对改进登陆台风暴雨预报有明显提升。基于这样的思路,团队开展了基于台风集合预报路径偏差的成员优选订正技术研究。
首先,根据中央气象台台风中心定位,计算51个成员起报后6h(也可为12h)距离中心位置最近的前n 个成员作为优选成员。其次,根据优选的成员计算融合匹配平均统计量:(1)如果集合最大值≥100mm,融合值等于最大值;(2)如果集合90%分位值≥50mm,融合值等于90%分位值;(3)如果集合75%分位值≥25mm,融合值等于75%分位值;(4)如果集合中位值≥10mm,融合值等于中位值;(5)如果上述条件都不满足,则融合值等于10%分位值。
从检验结果看(图3),订正后的TS 评分总体上高于订正前,特别是对大暴雨的预报,各时效TS 评分均较有所提高。08 时和20 时起报的24—96h 大暴雨TS 评分提升20%以上。在空报率方面,20 时起报场订正后的空报率降低比08 时起报的明显,对大暴雨的空报率也优于确定性预报。但仍存在个别时效暴雨空报率加重的情况(如08 时起报的24h、72h时效)。
图3 2018—2020 年欧洲中心确定性预报(红色)和模型(蓝色)58 次预报结果的TS 评分
在未来的工作中,考虑加入集合平均场再次进行匹配,预计可有效降低融合匹配平均统计量的空报率。不同预报时效的优选成员数量也可进一步根据检验结果进行调整。全球集合预报模式仍有可能低估极端降水,加入区域模式的降水作为优选成员是进一步提升极端降水预报效果的有效途径。
大风是热带气旋三大灾害之一,但其得到的关注远不如台风降水,广西还没有建立针对热带气旋大风的客观预报方法。模糊神经网络(FNN)主要以模糊控制理论为基础,融合了模糊系统的非线性处理能力以及人工神经网络的自学能力等优点。该方法在台风强度预报方面有较好的预报效果,较适用于风速等非线性变化特征较明显的气象要素的预报中,将该方法针对台风影响广西期间的地面风速进行预报建模。该模糊神经网络由输入层、隶属函数层、推理层和反模糊化输出层四个环节组成(图4)。
图4 模糊神经网络结构图
此外,还与多元线性回归(MR)、支持向量机(SVM)两种机器学习方法建立的模型预报结果进行对比分析。由于各站点极大风速要素缺失较多,选取了样本量较大、时间连续性较好的桂林、梧州、龙州、南宁和玉林五个站点分别进行建模,沿海三市由于大风资料较少则不选为建模样本。由表1可知,三种预报模型预报的风速平均绝对误差在1.7~3.3m·s-1之间。其中模糊神经网络预报模型5 个站点的预报平均绝对误差为2.38m·s-1,其中预报误差最小为桂林站1.74m·s-1,误差最大为玉林站2.92m·s-1。多元线性回归和支持向量机模型预报的5 个站点的预报平均绝对误差分别为2.53m·s-1和2.76m·s-1。对比分析可知,模糊神经网络预报模型对桂林站、梧州站、龙州站、玉林站共4 个站点预报的平均绝对误差最小,总体预报精度最好。因此,最终选择模糊神经网络模型开展业务试用。
表1 三种机器学习模型预报风速的平均绝对误差(单位:m·s-1)
平均每年约有5 个热带气旋影响广西,如果在月-季时间尺度上对影响广西的热带气旋频数和强度有进一步认识,那么对广西气象防灾减灾服务具有更重要的意义。基于模糊神经网络[9]、BP 神经网络[10]等模型,前人研究初步证实了用人工智能方法开展热带气旋气候预测的有效性。结合业务需求,同时考虑气候预测的不确定性问题,我们通过多机器学习方法集成的方式构建广西热带气旋频数和强度客观气候预测模型,开展影响广西热带气旋频数和强度逐月、逐季滚动预测业务,满足广西气候预测业务需求。
根据广西气象业务的规定,当热带气旋进入东经112°E 以西,北纬19°N 以北时,则认为该热带气旋影响广西。此外,该热带气旋在影响广西区域范围内的最大强度记为该热带气旋影响广西的强度,最后把同一月份/季节内的平均热带气旋强度作为预测量。建模主要包括热带气旋预测的动态因子提取、模型评估调参两部分。计算影响广西热带气旋频数(强度)与逐季/月的各环境场(500hPa 和200hPa 位势高度,850hPa 和200hPa 经向风、纬向风、海平面气压及垂直风切变、海温)的相关系数,并取相关系数通过0.05 显著性检验的成片(大于10 个格点数)高相关区的区域平均值作为预测因子。季节预测使用前一个季节平均的海洋和大气环境场作为因子,月预测则使用起报前一个月的环境场作为因子。团队共采用了线性回归、贝叶斯岭回归、岭回归、套索回归、偏最小二乘回归、梯度提升算法、神经网络、支持向量机、决策树、随机森林、极端随机森林、多层感知机、长短时记忆等19 种机器学习模型开展集合预测。
使用1965—2015 年的数据作为建模样本进行训练,2016—2020 年的数据作为独立样本作检验。如图5a 所示,6—8 月平均影响广西的热带气旋在3个左右,年际变率非常小,主观预测的6—8 月热带气旋频数在4~6 个,2016—2020 年预测结果均显著大于实际状况,仅2016 年预测的最小值与实际相符。从客观模型预测效果看,除2016 年模型预测频数偏少外,其他四年多模型预测均值与实测频数极为接近,预测效果明显优于主观预测。图5b 为7—9月的预测结果。可以看到,主观预测效果较6—8 月有所提升,但是主观预测基本上是预测两个的范围,除2018 年预测是处在中值外,2016 年、2017 年和2018 年预测结果均是处于最大或者最小值,预测偏差仍然较大。从客观模型预测结果看,2017 年预测的最大值与实际相符,而2016 年、2018 年和2019年三年模型均值基本与实际状况相符,效果同样要优于主观预测。
图5 2016—2020 年6—8 月(a)和7—9 月(b)主观预测(绿线)、机器学习预测(黑色)及实际(红色)热带气旋数量对比
由于当前主观预测不包含热带气旋强度预测业务,这里只进行客观模型的结果与实际热带气旋强度的对比。图6 表明影响广西的热带气旋平均强度在6—8 月和7—9 月两个时段均存在较大的年际变率。2014 年由于超强台风“威马逊”的影响,实际最大强度可超过70m·s-1(图6a),而2017 年、2019 年仅为热带低压影响广西。虽然对2014 年“威马逊”模型预测强度仍然偏低,但已是其预测结果中最强的一年,强度变化趋势的预报较为准确。模型均能较好反映热带气旋强度在两个时段的年际变率(相关系数0.80 以上),6—8 月大多数年份的预测结果集中在25th~75th 之间,其中四年(2011 年、2012 年、2016 年和2020 年)与实际偏差极小(图6a)。7—9月的预测结果与6—8 月相似。
图6 2016—2020 年6—8 月(a)和7—9 月(b)机器学习预测(黑色)及实际(红色)热带气旋强度对比(m·s-1)
以上分析可知,多模型的平均值与实际影响热带气旋数量极为接近,效果好于主观预测,另一方面,即使在偏差较大的年份,模型对极值的预报与实际的变化趋势也相对应。模型对热带气旋强度的预测大多数年份在模型范围之内,其年际变率也能很好捕捉。从检验效果看,该模型无论是频数还是强度预测结果均有一定参考价值。
采用JAVA、WEBGIS 等技术,基于B/S 和C/S混合框架模式,初步搭建了广西台风与海洋预报服务业务支撑系统,具备台风的实时监测、各家台风路径预报数据的自动采集、相似路径台风检索、后台管理等基本功能。同时该系统作为团队台风降雨、大风、频数和强度预测产品发布的主要途径,并能实现台风灾害影响预估和评估的制作和发布,台风预报制作模块也在逐步开发中。该系统提升了广西台风与海洋预报服务的集约化程度。本着“边建设边应用”的原则,该系统已逐步在广西壮族自治区气象台、气候中心、沿海三市进行初步应用。
此外,根据业务和研究需求,该系统还集成了台风路径和强度预报的实时检验、历史台风基本环流场回顾两大功能。影响广西台风的一些基本知识也可从台风小百科和台风之最两个模块中便捷获取。
团队还开发了台风智慧气象服务微信小程序。该小程序主要针对手机用户,根据用户的位置,基于WEBGIS 地理信息系统,实时动态显示预警信号、台风最新动态和相应的台风强度预报、实况风场,弹窗显示台风与用户的距离和台风对用户所在位置的影响等级评估。用户可通过扫码进入微信小程序即可使用。
本文梳理介绍了广西台风与海洋预报服务创新团队近一年半以来的部分研究成果,内容主要包括台风风雨预报、频数和强度的季节预测以及应用平台三方面。对这些内容涉及的思路、具体方法及检验结果都做了简要的介绍,希望通过交流为广西及全国其他地区广大用户熟知应用。
与此同时,限于时间和研究基础的沉淀,团队研究体系虽然获得初步建立,但这些方法都还不完善,在今后的工作中需要进一步改善。例如,LTP_DSAEF模型的本地化应用可以更深入,加入一些具有广西台风特征的因子会更有特色和针对性;台风精细化降水预报不应仅限于全球模式集合预报成员,应当发挥高分辨率区域模式在极端降水方面的优势;台风大风预报建模受限于历史风速资料,选取的站点仍然偏少,应充分利用数值模式数据和人工智能模型的挖掘能力克服这一缺陷。团队建立的系统平台初步满足了应用和研究的集约化,但产品仍不够丰富,在满足广西海洋气象业务需要和研究的道路上仍需长足进步。