基于机器学习的宁海县气温降尺度推算研究

2021-04-05 00:50申子彬郁懋楠吴泽亮岳梦琦
现代信息科技 2021年17期
关键词:宁海县尺度数值

申子彬 郁懋楠 吴泽亮 岳梦琦

摘  要:针对当前气温预报精细化程度无法满足经济发展及人民群众的需求,利用宁海县22个气象站2013—2016年的逐日气温资料、EC数值模式气温预报资料以及各站点的地理信息资料,实况资料作为输出,数值预报、地理信息资料作为输入,构建DBN神经网络气温预报模型。经过训练的神经网络模型对数值预报气温资料有正的订正作用,对站点平均预报准确度缩小1.18 ℃,该模型可以用于气温降尺度业务实际。

关键词:机器学习;EC数值预报模式;地理信息资料;气温降尺度

中图分类号:TP181    文献标识码:A 文章编号:2096-4706(2021)17-0022-04

Abstract: In view of the fact that the current refinement of temperature forecast can not meet the needs of economic development and the people, the daily temperature data of 22 meteorological stations in Ninghai County from 2013 to 2016, the EC numerical mode temperature forecast data, the geographic information materials of each station and factual information are used as the output, and the numerical forecast and geographic information materials are used as the input, the temperature prediction model based on DBN neural network is constructed. The trained neural network model has a positive correction effect on the numerical temperature prediction data, and the average prediction accuracy of the station is reduced by 1.18 ℃. This model can be used in the practice of temperature downscaling.

Keywords: machine learning; EC numerical prediction model; geographic information materials; temperature downscaling

0  引  言

天气与人类社会的工农业生产、日常生活、军事行动等各方面联系密切,而气温则是天气的重要因素,是表征大气冷热程度的物理量,其变化不仅仅能直接影响到公众的日常生活,同时也对经济活动有着显著影响。2016年1月20—25日,受几十年一遇的寒潮天气影响,宁海出现罕见的低温雨雪冰冻天气,全县农、林、渔、交通、城市设施、人民生活等均受到不同程度的影响,其中宁海农业支柱产业白枇杷几乎全军覆灭,橘树也有不同程度的冻害,大面积的水管、水表冻裂也对人民生活造成了很大影响。目前气象监测站点的建设密度有限,从空间分辨率上、精准度上远远无法满足经济发展及人民群众对气温精细化监测预报的需求。所以对气温监测数据以及预报数据的降尺度越来越迫切。

目前国内外已有较多的气温降尺度研究,如Hofer等[1]利用EOF和多元回归法将NCEP/NCAR气温数据降尺度到冰川站点上;Huth[2]利用典型自相关、多元回归等方法降尺度NCEP/NCAR冬季日均温到中西欧的气象站点上;钞振华[3]利用基于背景长协方差的最优插值法将ERA-40气温数据降尺度到中國西部0.125°网格上。这些方法主要利用了再分析资料与观测数据之间的统计关系,未考虑地表特征的差异,具有一定的不确定性。众所周知,影响山区气温空间变化的因素很多,从气候上说,主要包括宏观地理条件、海拔、地形和下垫面条件等。宏观地理条件主要指气象站点所在的经纬度、距离大水体远近、所在山系走向及宏观气候背景等;地形主要涉及地形类别、坡度、坡向以及地形遮蔽;下垫面条件包括土壤、植被状况等[4]。也有不少研究在气温降尺度中考虑了地形对气温的影响,如杨青等[5]基于EOF特征向量和DEM建立的推算模型、蔡迪花等[6]建立的基于DEM多元线性回归插值法、杨昕等[7]建立的基于DEM 地形修正模型和张洪亮等[8]建立的地形调节统计模型(TASM)等,这些气温校正的基础仍然是空间内插(如多元回归法、样条插值法、气温垂直订正法)后的结果。忽略了海陆差异、地形变化对气温的影响。

随着计算机技术的迅速发展,机器学习技术的出现,从技术理论上使得气象科研工作者可以从大量气象数据中寻找理想的气温降尺度方法。本文将充分利用宁海县域内22个气象观测站近4年的日气温观测资料、近4年的EC数值模式气温预报资料,县域地理信息系统DEM高程资料,通过机器学习构建包含局地气象特征的气温降尺度模型,最终实现宁海县域内气温监测数据以及预报数据的降尺度,形成气温精细化预报模型。

1  资料

1.1  气象资料

本文采用了宁海县国家气象站以及宁海县域内21个区域自动气象站共计22个站的2013至2016年4年逐日08时、20时气温资料;EC数值模式2013至2016年4年逐日未来12小时预报场08时、20时气温预报资料;全县22个气象观测站的基础信息资料包括经纬度、海拔高度、坡度、坡向、距离海岸线距离等资料。

EC数值模式2013至2016年4年逐日未来12小时预报场08时、20时气温预报资料,预报资料为网格化资料,每一个预报时次为一张有一定分辨率的网格化数据。根据站点的经纬度,通过插值法,可以获得数值预报在每个测站位置的预报数据。

1.2  地理信息资料

地理信息资料为国家地理信息中心提供的浙江省基础地理背景数据,提取200 m×200 m分辨率的宁海县数字高程模型DEM及经纬度、海拔高度数据。利用ArcGIS自带函数,计算200 m×200 m分辨率的坡度、坡向数据。再利用DEM数据、海岸线矢量图计算各网格点距离海岸线距离:

式(1)中x、y为各网格点的坐标值,x0、y0为海岸线矢量点的坐标值,通过ArcGIS距离分析计算,得到各网格点距离海岸线距离最小值形成栅格数据,再按点提取离海岸线距离。

2  研究方法

2.1  DBN神经网络模型

2006年,Hinton[4]提出了逐层贪婪预训练受限玻尔兹曼机的方法,开启了深度神经网络发展的新时代。Hinton将这种基于玻尔兹曼机预训练的结构称为深度置信网络结构(DBN),DBN神经网络模型是目前研究和应用比较广泛的深度学习结构,是由多个受限玻尔兹曼机(RMB)层层叠加而成,而受限玻尔兹曼机(RBM)是一种具有随机性的生成神经网络结构,它本质上是一种由具有随机性的一层可见神经元和一层隐藏神经元所构成的无向图模型。它只有在隐藏层和可见层神经元之间有连接,可见层神经元之间以及隐藏层神经元之间都没有连接。并且,隐藏层神经元通常取二进制并服从伯努利分布,可见层神经元可以根据输入的类型取二进制或者实数值。

DBN 模型它既可以被看作成一个生成模型,也可以被当作成判别模型,其训练过程是使用非监督贪婪逐层方法去预训练获得权值。其核心思想是:

(1)预训练:对DBN进行分层,分别单独无监督地训练每一层RBM网络,将其结果作为高一层的输入。

(2)微调:预训练结束后,DBN可以利用带标签的数据及BP算法去调整网络结构的性能。RBM网络训练模型的过程可以看作是对一个深层BP网络权值参数的初始化,相当于DBN的BP算法只需要对权值参数空间进行一个局部的搜索,这使得DBN克服了BP网络因随机初始化权值参数而容易陷入局部最优和训练时间过长的缺点。在贪婪的学习算法过程中,生成模型使用Wake-Sleep算法进行调优。

2.2  资料预处理

(1)将EC数值预报产品网格数据插值到22个站点的经纬度上,确定22个站点4年内逐日两次预报数据。

(2)将每个站点每个时次的预报数据、站点经纬度、海拔、坡度、坡向、距离海岸线距离、实况气温观测数据整合为一条数据,22个站点4年时间一共形成(365×3+ 366)×2×22=64 284条数据,将其近似分为5等份。

(3)将每等份数据进行归一化处理,使用min-max标准化方法,将所有数据的值映射到[0—1]之间。函数为:

X*=(X-min)/(max-min)                 (2)

3  DBN模型在气温降尺度插值中的应用

3.1  建立DBN神经网络气温降尺度模型

气象数值模式的预报产品、县域内的地理因素均与实际气温有着良好的相关性,所以可以利用其相关性的特征建立DBN气温降尺度模型,构建一个输入层因子为EC模式预报气温、站点经纬度、海拔、坡度、坡向、距离海岸线距离,2层隐藏层的DBN模型,同时将对应站点、对应时间点的实测气温数据也作为输入训练DBN模型。得到一个基于EC数值模式气温预报产品的气温订正模型。具体训练以及实验步骤可分以下几步:

(1)将4年里的各站点EC数值模式气温预报数据、站点经纬度、海拔高度、坡度、坡向、距离海岸线距离、实况数据按站按时次随机分为5份。

(2)以其中任意4份数据为训练数据,另一份留作测试数据,分5次訓练DBN模型。

(3)训练完毕后,成功构建一个基于DBN模型训练的气温预报产品的气温订正模型,将5次训练后的另一份数据作为测试数据输入模型中;输出模拟值与实况气温值。

3.2  检验结果分析

将测试组数据代入形成的订正模型中,生成的模拟值与实况数据进行对比发现,训练组数据经模型模拟得到的模拟值与实况值的平均误差是1.61度,将模拟值与实况值进行相关分析,R2=0.977 7;而如不经过DBN模型,将EC数值预报的气温产品直接与实况值进行对比发现,平均误差为2.79度,R2=0.9614。数据的对比可以发现,基于DBN模型训练的订正模型在一定程度上对气温预报数据有修正作用。经模型模拟的数据、未经模拟的数据与实况对比,如图1所示。

利用宁海县域内20 m×20 m分辨率的地理信息数据、2016年2月5日EC数值模式气温预报场插值到200 m× 200 m的格点上,将每一个格点的数据代入上述训练模型中,即可得到宁海县域2016年2月5日20时200 m×200 m的精细化气温分布情况,如图2所示。

4  结  论

气温精细化预测是一项很有挑战性的研究,随着整个人类经济社会的快速发展,人们对气温预测的时空分辨率要求越来越高,气温对生产生活有着非同一般的影响,近几十年来,气象预报数值模式得到了长足的发展,但对小范围、局地性的温度变化难以预测预报,在数值模式中,整个宁海县域1 900多平方公里的地方可能也就寥寥十几个格点,无论数值模式的精度如何发展,仅仅靠数值模式的预报肯定无法满足经济社会对气温精细化预报的需求。本文着眼于解决气温精细化预报的难点,选择了利用机器学习的方法对海量的气温数据、地理信息数据学习和挖掘,最终得到气温精细化预报的模型。主要的工作与结论有以下几点:

(1)气象观测数据、气象数值模式预报数据以及测站的地理信息数据真实性和可靠性是深度学习实验的基础,本文使用EC细网格数值模式气温预报数据来源于欧洲中期天气预报中心,数据质量控制较好。通过数据归一化预处理,将复杂的各类数据转化为实验可用的数据格式。

(2)本文使用机器学习模型进行气温精细化预测研究,将6万多个数据源分为5份,4/5的数据作为训练源,1/5的数据作为测试数据,最后验证,经DBN模型构建的模型有实用价值,模拟值准确度高于数值预报产品,探明了机器学习方法在气温精细化预报上的优势。

(3)随机选取了一个时次2016年2月5日20时的EC气温预报场代入构建的模型计算,得到精细化的宁海县域气温分布图,气温分布图较好的预报了没有测站区域的气温,也为精细化气温预报提供了可行的新方法。

(4)本文考虑影响气温的因子有限,没有包含全县植被覆盖资料等其他可能影响气温的因子;对机器学习的深入程度还不够,未选择更多机器学习模型进行对比实验,还需在下一步研究中更进一步探讨。

參考文献:

[1] HOFER M ,M?LG T,MARZELON B,et al. Empirical-statistical downscaling of reanalysis data to high-resolution air temperature and specific humidity above a glacier surface (Cordillera Blanca,Peru) [J/OL].Journal of Geophysical Research:Atmospheres,2010,115(D12):[2021-07-24].https://doi.org/10.1029/2009JD012556.

[2] RADAN H. Statistical Downscaling of Daily Temperature in Central Europe [J].Journal of Climate,2002,15(13):1731-1742.

[3] 钞振华.中国西部地区气温资料的统计降尺度研究 [J].干旱区研究,2011,28(5):879-884.

[4] 翁笃鸣,罗哲贤.山区地形气候 [M].北京:气象出版社,1990.

[5] 杨青,史玉光,袁玉江,等.基于DEM的天山山区气温和降水序列推算方法研究 [J].冰川冻土,2006(3):337-342.

[6] 蔡迪花,郭铌,李崇伟.基于DEM的气温插值方法研究 [J].干旱气象,2009,27(1):10-17+28.

[7] 杨昕,汤国安,王春,等.基于DEM的山区气温地形修正模型——以陕西省耀县为例 [J].地理科学,2007(4):525-530.

[8] 张洪亮,倪绍祥,邓自旺,等.基于DEM的山区气温空间模拟方法 [J].山地学报,2002(3):360-364.

作者简介:申子彬(1992—),男,汉族,湖南邵东人,科员,工程师,理学学士学位,研究方向:天气预报与应用气象。

猜你喜欢
宁海县尺度数值
秦九韶与高次方程的数值解法
体积占比不同的组合式石蜡相变传热数值模拟
数值大小比较“招招鲜”
宁海县潘天寿中学
尺度
宁波市宁海县美术教师作品选登
宁海县美术教师作品选登
以长时间尺度看世界
9
抓贼啊~!!神出鬼没的减法故事