邱婷,肖文军,何佳玮,何雯
(国家海洋局东海预报中心,上海 200136)
热带气旋(Tropical Cyclone,TC)是一种强烈的灾害性天气过程,许多研究是针对其路径和强度预测的[1-8],而尺度方面的预测研究相对较少。我国常以7级、10级和12级大风风圈半径来度量TC尺度。TC尺度预测是大风、风暴潮和台风浪预报的基础,对防台减灾和灾害预警报有重要的意义。前人曾尝试读取TC等压线圈半径[9],或者通过TC风和气压场之间的动力平衡关系建立经验模型估算TC大风风圈[10-11],但因等压场资料的时效性或缺乏近中心最大风速半径(Rmax)的预报资料,未能实现对TC大风风圈半径的预测。美国国家飓风中心(National Hurricane Center,NHC)从2004年开始发布包含TC大风风圈半径的最佳路径分析数据及预报数据,主要计算方法有:统计计算,如基于气候学与持续性特征的统计预报模型(Wind Radii Climatology and Persistence Model,DRCL)[12];数值预报方法,如全球气象预报系统(Global Forecast System,GFS)与飓风研究与预报系统(Hurricane Weather Research and Forecast system,HWRF);集合预报方法[13]等。中央气象台近年来开始发布包含四象限大风风圈半径的TC分析数据,但目前预报业务中尚未给出TC大风风圈半径的预报数据。
TC风场预报一般可以通过气象数值模式或动力平衡风场模型给出,动力平衡风场模型的计算基于不同的气压分布模型[14-16],具有精度较高且计算快速的优势,因此在海洋预报业务中被广泛应用。随着观测手段和预报技术的提高,动力平衡风场模型也由过去的对称模型改进为四象限不对称模型,其中大风风圈半径或Rmax是动力平衡风场模型的关键参数,而各国预报机构至今都未给出Rmax的预报。为实现TC四象限大风风圈半径的预测,本文研究了中央气象台发布的西北太平洋2014—2018年364个TC发生过程中的大风风圈半径、实时位置和强度等资料。我们发现大风风圈半径变化复杂,与中心气压(P)以及近中心最大风速(V)等表征TC的参数间并无明显的相关关系(见图1),利用数据拟合难以获得满意的结果,因此需要一种新的方法从预报变量中寻找规律实现TC大风风圈半径的预报。神经网络模型是处理这种复杂的非线性问题的有效手段,能快速完成训练的模型计算,满足预报及时性要求,已在TC强度和风暴潮等预报中得到应用[17-19]。本文利用神经网络模型对TC非对称大风风圈半径进行预测研究,为更精确模拟TC风场提供基础。
图1 西北太平洋TC四象限7级风圈半径与中心气压和近中心最大风速的联合分布
本文所用数据来源于中央气象台在西北太平洋TC活动期间发布的实时分析资料和预测资料。本研究将实时分析资料视作实测资料,包括TC等级、中心位置、P、V、移速、移向、R7、R10和R12等,预测资料包括中心位置、P和V。数据更新一般在02时(北京时,下同)、05时、08时、14时、17时和20时,共6个时次,预测时效为5 d,时间分辨率为12 h,TC进入我国24 h警戒线后,资料会变更为逐时更新,分辨率提高到6 h,具体数据发布时效随TC强度路径有所变化。
多层前馈(Back Propagation,BP)神经网络是目前应用最为广泛的神经网络学习算法。典型的神经网络通常由输入层、隐含层和输出层3层构成。输入信号后信号向前传播到隐含层节点,然后经传递函数计算将输出信号传播到输出节点,最后由输出层输出结果。BP神经网络模型可看作从n维到m维的非线性映射,能充分逼近复杂的非线性关系,同时大规模并行协同处理数据,具有“自组织、自学习、自适应”等特点,在无法确切拟合出变量之间合理公式的情况下具有应用意义。
本文选用BP神经网络模型,经过不同参量的筛选与试验,确定模型时间延迟为2,即以预测时刻T的大风风圈半径为输出层变量,以当前时刻(t)与前一个时刻(t-1)的中心经度(lon)、纬度(lat)、中心气压(P)、近中心最大风速(V)、移动速度(Vm)、方向(Dirm)、R7、R10和R12,以及T时刻的lon、lat、P和V作为输入层变量,选择10个隐含层神经元,共有6 140组输入数据,训练算法为Levenberg-Marquardt方法,最大迭代次数为1 000,输入层采用正切S型传递函数tansig:输出层为线性函数purelin。具体预测公式如下:
预测R7时,若TC最大风力未达到10级,则式(1)中R10=0。
模型的训练与检验采用了2014年9号TC—2018年29号TC共122个TC过程记录。我们选取近几年对我国影响较为显著的1521号、1718号、1808号和1822号4个超强台风级TC,以及1510号和1807号两个台风级TC用于模型检验,将除去上述6个案例以外的116个TC过程的实测数据进行校正和勘误,再插值成逐3 h的样本用于神经网络模型训练。考虑到研究时段内中央气象台发布的预测数据最短时效为6 h,模型的后报时间T设为t+6 h、t+12 h和t+24 h,即后报时效为6 h、12 h和24 h,式(1)—(3)中后报T时刻所用t与t-1时刻的输入变量均来源于实测数据。
以1808号TC(超强台风级)为例,表1与图2a分别给出了台风主要参数与路径。台风移动过程中R7、R10和R12的6 h后报结果见图2b—d。可以看出,神经网络模型后报结果能较好地刻画出TC的非对称性特征,在四象限内大风风圈半径接近实测值。1808号TC开始形成的7月5日08时和发展初期的7月7日08时,模型结果较实测值与其他时刻相比稍大,4个象限不同后报时效的大风风圈半径误差如图3所示。图中每个时刻的中心点对应的为大风风圈半径在4个象限的平均值,东、北、西、南4个方向的柱长分别为NE、NW、SW、SE象限内的模型绝对误差。
图2 1808号TC路径及大风风圈半径后报结果示意图(红色:实测值,蓝色:预测值)
图3 1808号TC非对称大风风圈半径后报误差(蓝色:R7,红色:R10,黑色:R12)
图3 (续)
表1 1808号TC逐日要素
图4显示了用于检验的6个TC在不同象限的大风风圈半径后报误差。由于1510号和1807号TC是台风级,V没有达到12级,故未对R12进行后报,各台风平均的误差结果如表2所示。大风风圈半径随着特征风速的增大而减小,对应后报结果的平均绝对误差(Mean Absolute Error,MAE)也随之减小。6 h后报结果的MAE中,R7介于15~40 km,R10在5~15 km,R12<10 km。随着预测时效的增加,MAE逐渐加大,24 h后报R7、R10和R12的MAE分别为58 km、25 km和16 km,但各级大风风圈半径的后报平均相对误差(Mean Relative Error,MRE)较为接近,6 h后报在5%~15%之间。对比不同象限的结果发现,西北太平洋热带气旋多呈现NE象限风圈半径偏大的形态,其风圈半径的后报误差相较其他象限偏大。Sampson等[20]的评估分析表明,国外一些预报机构如NHC和欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts)等开发的预报模式对2012—2014年大西洋发生的飓风34节(近7级)风速半径进行预报,预报结果的MAE为:6 h误差为28~37 km,12 h误差为37~55 km,24 h误差为46~65 km。由此可以看出,本文建立的神经网络模型后报西北太平洋TC大风风圈半径与之相比误差相当,可作为西北太平洋TC大风风圈半径预测的有效工具。
表2 非对称大风风圈半径后报误差表
图4 非对称大风风圈半径后报绝对误差图
对比模型结果与实测大风风圈半径的变化过程发现,训练所得的神经网络未能很好地模拟出TC大风风圈半径的突变。以1808号TC 6 h后报的R7为例,如图3a所示,7月9日14—20时,1808号TC NE象限R7实测记录由500 km突增到600 km,而中心气压从925 hPa增大到930 hPa,V由58 m/s减小到55 m/s,台风强度略有减弱,模型的R7模拟值从538 km减小至486 km,未能模拟到这样的突变过程,导致在20时有超过100 km的绝对误差。该神经网络模型不能模拟TC结构如此的突变,从而产生了较大误差。
为评估训练所得的神经网络模型在实际TC预报业务中对大风风圈半径的预测能力,改用中央气象台发布的T时刻预测参量作为输入因子。当TC生成时,从中央气象台实时发布资料中获取最近t、t-1时刻的实测记录以及预测时刻T的预报参量,利用建立的神经网络模型进行大风风圈半径预测。
同样以3.1节6个TC为例,并新增2019年对我国影响较大的1909号台风“利奇马”进行预测,图5是不同象限的大风风圈半径预测误差,表3是预测的MAE、均 方根 误差(Root Mean Square Error,RMSE)和MRE。对比表2,发现预测结果相比后报结果误差有所增大,主要是由预测时刻T的输入因子的预报误差引起,但模型仍获得较为满意的结果。结合图5,R7、R10和R12最近时效的预测结果MAE分别为33 km、20 km和10 km,RMSE分别为49 km、28 km和16 km,总体平均的MRE仍较为接近,在10%~20%之间。同样地,模型也存在大风风圈半径突变难以预测的问题。
图5 非对称大风风圈半径预测误差图
表3 非对称大风风圈半径预测误差表
利用2014—2018年中央气象台发布的西北太平洋TC数据进行神经网络的训练与检验,建立了热带气旋非对称大风风圈半径预测模型。选取1510号、1521号、1718号、1807号、1808号和1822号TC,采用实测记录进行了未来6 h、12 h和24 h大风风圈半径的后报模拟,利用预报数据对上述TC以及新增的1909号TC的大风风圈半径进行预测。结果显示,R7的6 h后报平均绝对误差介于15~40 km,R10误差介于5~15 km,R12误差<10 km,误差随着时效的增加而增大,后报的MRE在5%~15%之间。预测结果中检验TC平均的R7、R10和R12最近时效的MAE分别为33 km、20 km和10 km,总体平均MRE在10%~20%之间。预测相比后报结果误差有所增大。与国外大风风圈半径预测模型相比,本文建立的神经网络模型预测误差略大,但具有输入参量少且计算量小的优势,可作为TC大风风圈半径预报的有效手段,在西北太平洋TC大风风圈半径预报业务中具有良好的应用前景。热带气旋的尺度特征尤其是尺度突变是一个复杂的问题,受到大气环流、海洋下垫面及路径类型等其他因素的影响[21-22]。本文建立的神经网络模型仅利用了中央气象台在TC发生期间给出的有限参量,难以模拟大风风圈半径的突变;另一方面,模型精度依赖于训练数据的精度,据分析NHC的最佳路径34 kt大风风圈半径资料误差在10%~40%之间[20]。本文采用的大风风圈半径数据自身也存在一定误差,从而影响了模型精度。