吴永涛,陈金车,徐延欣,柴俊伟,张 鑫
(1.甘肃省张掖市气象局,甘肃 张掖 734000;2.兰州大学大气科学学院,甘肃 兰州 730000;3.甘肃省张掖市肃南裕固族自治县气象局,甘肃 张掖 734400;4.兰州理工大学电气工程与信息工程学院,甘肃 兰州 730050)
气温预报是天气预报业务中不可或缺的一部分,作为预报中基本气象要素之一,气温变化既与天空状况、天气现象、下垫面、风等因子有关,又受到海拔高度、纬度等要素影响[1]。气温对于霜冻、干旱等灾害性天气的发生有着密切的关系,同时气温变化在城市冬季供暖、交通运输以及电力负荷等方面都起到重要的作用[2-5]。近年来,由于全球气候变化的影响,极端天气现象的发生频率越来越高,如高温、严寒、短时强降水等[6],这些极端天气现象给民众带来了极大的困扰,人们对天气预报也提出了新的挑战和要求,特别是对极端气温,其预报是否准确及时,将直接影响人们的生产生活。随着科学技术的迅猛发展以及社会经济水平的不断提高,现有的气温预报已经无法满足社会发展需求。虽然在现代天气预报业务中,温度预报是最基础的一项预报内容,但是对于更准确、更精细化的温度预报仍然是气象人员重点研究的内容。其预报水平的提高,一方面依赖于数值模式预报产品释用和各种客观预报方法的集成发展,另一方面预报员的经验和主观分析能力对温度预报的订正也发挥着重要作用。
最近几十年来,社会和科技的进步促使气温预报得到了快速的发展,其预报方法不断改进,特别是如今的数值预报、集合预报等方法的应用,使得气温预报的准确性大大提高,预报质量尤其突出的是24 h 最高、最低气温预报,已基本取得预期结果。多年来,许多气象学者在数值预报产品基础上做了大量研究,卡尔曼滤波、MOS、完全预报(PP)法、支持向量机(SVM)以及相似预报法等方法在科研和业务应用中得到了完善和发展[7]。熊世为等[8]基于ECMWF 细网格输出产品,以优化的BP-MOS 模型预测最高最低气温并进行对比分析,结果表明优化的BP-MOS模型预测效果良好;智协飞和黄闻[9]对基于卡尔曼滤波的气温和降水的多模式集成预报进行研究,研究表明卡尔曼滤波方法预报效果优于消除偏差集合平均(BREM)和单模式预报,但对于地面气温,预报效果有一定的差异性。
张掖市位于甘肃省西部,河西走廊中段,其气候特点是夏季短而酷热,冬季长而严寒,干旱少雨,且降水分布不均,昼夜温差大,风能、太阳能资源丰富。张掖盛产小麦、玉米、水稻、油菜、胡麻等农作物,为全国重点建设的12 个商品粮基地之一。其境内有张掖丹霞等丰富的旅游资源。因此,通过研究温度预报来提高预报准确率,以期为张掖市旅游资源和太阳能资源利用、农业生产过程调整提供参考。
张掖市的气象数据来源于甘肃省气象局气象信息中心,包括了场面气压、海平面气压、3 h 变压、24 h变压、最高气压、最低气压;气温、最高气温、最低气温、24 h 变温、露点温度、相对湿度、水汽压;2 min 平均风速、2 min 平均风向,10 min 平均风速、10 min 平均风向;0 cm 地温、80 cm 地温、320 cm 地温和能见度的逐小时数据。时间段为北京时间2019 年6 月1 日0:00—2019 年6 月30 日03:00,采用邻域平均法将缺失的气象数据补齐。
SVM 是一种应用广泛的机器学习算法,该算法既可以用于分类,又可以用于回归。ATE-T Bell 实验室研究小组于1963 年首次提出了支持向量机的理论方法。但在当时,没有得到重视,这使得SVM 的进一步发展受到了阻碍。到了20 世纪90 年代,神经网络等机器学习算法的研究遇到了局部极小点以及过学习与欠学习等一些重大的问题,这些原因使得SVM 得到了迅速发展与完善的机会,并且在许多科学问题中体现出了优势,目前已经在气象与环境等领域里广泛应用。杭月荷和孙鑫[10]应用支持向量机回归方法(SVR),选取内蒙古2015—2018 年自动气象站和欧洲中期天气预报中心(简称EC)数值预报历史资料,建立逐时次、逐站点的乡镇最高、最低气温预报模型并进行检验,结果显示SVM 模型相较于EC 模式预报准确率大幅提升,其次在乡镇高低温预报上,该模型优于内蒙古指导产品。但是该模型的建立是基于内蒙古乡镇气象资料,其检验效果是否适用于其他地区还需要进一步的推广验证。
构建预报模型时,以张掖市2019 年6 月1 日0:00—2019 年6 月30 日03:00 的气象数据为基础,选取了前500 条数据用来训练模型,后200 条数据用来进行测试,共计700 条数据。基于支持向量机的温度预报模型构建过程如图1 所示。
图1 基于支持向量机的温度预报模型构建流程
用场面气压、海平面气压、3 h 变压、24 h 变压、最高气压、最低气压、气温、最高气温、最低气温、24 h 变温、露点温度、相对湿度、水汽压、2 min 平均风速、2 min平均风向、10 min 平均风速、10 min 平均风向、0 cm 地温、80 cm 地温、320 cm 地温和能见度共计21 个变量的数据作为输入变量,下一时刻的气温、最高气温、最低气温、24 h 变温、露点温度和0 cm 地温6 个变量,分别作为输出变量分别构建张掖市的温度预报模型。
用平均绝对误差(MAE)、均方根误差(RMSE)、确定系数(R2)和准确率(P)来检验张掖市温度的预报效果,它们的计算方法如公式(1)~(4)所示。其中,Y 为预报值,O 为实际观测值,k 为试报个数。
图2a-f 分别表示气温、最高气温、最低气温、24 h 变温、露点温度和0 cm 地温6 种常见温度指标预测值与实际观测值随时间的变化。从图2 中可以看出,气温、最高气温、最低气温、24 h 变温、露点温度和0 cm 地温预测值的曲线都能很好地反映真实值的变化趋势和大小,预测值和实际观测值十分接近。
图2 张掖市温度的预报值和实际观测值对比
张掖市温度预报结果的误差分布见表1,气温、最高气温、最低气温、24 h 变温、露点温度和0 cm 地温预报结果的误差都较小,预报准确率都超过了90%。其中最低气温的预报准确率最高,为97.85%,露点温度和0 cm 地温的预报准确率最低,为91.39%和91.41%。支持向量机对张掖市温度预报有较强的预报能力,误差较小。
表1 张掖市温度预报结果的误差检验
利用支持向量机对张掖市6 种常见温度指标进行了预报,并对预报结果进行了误差检验,评价该预报模型对张掖市温度的预报性能。
(1)对于张掖市温度的预报而言,支持向量机预报结果的预报值与实际观测值之间有良好的线性对应关系,因此,将支持向量机回归模型应用于张掖市温度的预报中是可行的。
(2)最低气温的预报准确率最高,为97.85%;最高气温紧随其后,露点温度和0 cm 地温的预报准确率最低,这可能与预报因子的选取有关。