基于MLP神经网络的机场能见度预测模型

2018-06-28 10:33朱国梁
科技创新与应用 2018年18期
关键词:人工神经网络能见度

朱国梁

摘 要:文章选取乌鲁木齐机场2007年至2016年10月至次年3月的逐小时观测资料,尝试使用MLP神经网络方法,建立主导能见度的回归预测模型,通过对预测效果检验可以看到,该模型预测主导能见度的平均绝对误差为706m,对小于1000m的主导能见度平均绝对误差为325m,并且该方法能够较好的预测主导能见度的变化趋势,可以为主导能见度的定量客观预报提供参考。

关键词:多层感知器;人工神经网络;能见度;回归预测

中图分类号:V321.2 文献标志码:A 文章编号:2095-2945(2018)18-0001-04

Abstract: In this paper, the hourly observation data of Urumqi Airport from October to next March of the years from 2007 through 2016 are selected and the regression forecasting model of leading visibility is established using MLP neural network method. The average absolute error of leading visibility is 706 m, and the average absolute error of dominant visibility is 325 m as regards less than 1000 m. This method can predict the trend of dominant visibility and provide reference for quantitative and objective forecast of leading visibility.

Keywords: multi-layer perceptron; artificial neural network; visibility; regression prediction

1 概述

随着国民经济的快速发展和民航运输的日益普及,机场运行对能见度的依赖日益突出,由雾、霾等天气引起的长时间低能见度天气,会造成机场大范围的航班延误、取消,对航空公司、机场带来巨大损失,也对公众出行造成影響。同时能见度与飞行安全关系密切,低能见度现象也是引发飞行事故最常见的因素之一。乌鲁木齐国际机场作为新疆区域的枢纽机场,承担着新疆区域及中亚地区的航班运行。已有的气候资料统计显示[1,2],乌鲁木齐机场能见度低于1000m的年平均日数为60天,大部分低能见度日数发生在冬半年(11月至次年3月),可达57天,造成低能见度的天气现象主要为雾和烟。

提高能见度的预报水平是保障机场安全稳定运行的重要措施,目前对于烟、雾等天气造成的低能见度预测,仍然以经验预报和统计预报为主,尽管随着数值预报的发展,现在也有数值释用和雾模式预报,但许多试验记过表明:雾模式仅有一定的机理分析用途,难以进行实际预报,因此对大气能见度的预报研究仍然是近年来气象预报中的一个难点和热点[3-11]。MLP作为处理非线性问题的方法,在上世纪80年代的时候曾是相当流行的机器学习方法,拥有广泛的应用场景,譬如语音识别、图像识别、机器翻译等等,但自90年代以来,MLP遇到来自更为简单的支持向量机的强劲竞争。而到2006年以后,由于深度神经网络的快速发展和大规模的应用,具备深层结构的MLP又重新得到了关注。本文尝试利用乌鲁木齐机场近10年逐小时的观测资料,探索人工神经网络在天气预测领域的应用,为气象预报人员提供新的能见度回归预报产品。

2 多层感知器MLP简介

传统的线性统计模型在处理实际问题,如温度预测、图像识别等包含非线性因素的问题,通常是无能威力的。而神经网络通过构建合适的模型,可以描述出输入数据和输出数据间的复杂关系,而它的强大之处在于这种关系可以是线性的,也可以是非线性的。

MLP(Multilayer Perceptron),即多层感知器,是一种常见的神经网络模型,它是一种有监督学习模型,在训练它的过程中我们需要给它提供完整的输入、输出,模型基于一定长度的历史数据,不断训练、学习,构建出输入和我们期望的输出之间的最优模型,而后利用这个最优模型来进行预测。图1就是三层MLP网络的的示意图,MLP可以被看做是一个有向图,由多个节点层组成,每一层全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。MLP是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱点。

3 预测模型的建立

3.1 资料预处理

本文使用乌鲁木齐机场2007年至2016年10月至次年3月的每天24小时观测资料,包含逐小时的主导能见度、温度、露点温度、相对湿度、平均风向和平均风速,通过整理和数据质量控制,共得到43752条数据记录,由于各因子由不同的气象要素组成,为了避免各个因子之间的量级差异,在作为人工神经网络的输入因子前,需要对其进行归一化处理,使其数值限定在[0,1]之间,具体算法见公式1。

data=(data-min(data))/(max(data)-min(data))(1)

3.2 预报因子的筛选

对于时间序列的回归预测,最简单的方法就是构建基于历史数据的非线性函数,结合对主导能见度的预测,我们构建两种类型的因子:第一类预报因子仅包含过去时次的主导能见度(Vis),具体见公式2;由于主导能见度与风、温度、相对湿度等要素也有一定的关联,故构建第二类预报因子不仅包含过去时次的主导能见度,还包括过去时次的温度(T)、露点温度(TD)、相对湿度(RH)、风向(WD)和风速(WS),具体见公式3。

Vist=f(Vist-1,Vist-2,……Vist-n) (2)

Vist=f((Vis,T,TD,RH,WD,WS)t-1,(Vis,T,TD,RH,WD,

WS)t-2,……,(Vis,T,TD,RH,WD,WS)t-n) (3)

其中主导能见度为Vist为当前时次的主导能见度,为验证不同时间长度的因子对主导能见度的预测效果,此处n设置多个进行建模运算,用于评估不同时间长度样本下模型的预测效果差异。

3.3 构建样本序列

本文以乌鲁木齐机场逐小时主导能见度为预测对象,使用近十年10月至次年3月的观测记录,按照预报因子的选取,分别建立两类共28个样本序列,具体见表1。其中每个样本序列,为了进行预测模型训练和预测效果检验,随机选取43752条历史资料中的80%作为训练样本,其余的作为测试样本。

按照上述两类因子选取方式建立的28个样本序列,使用Keras中的MLP模型分别进行建模运算,并使用测试样本进行测试,最终得到28个不同的对主导能见度预测模型,下面将详细讨论模型的预测效果:

4 预测效果检验

本文构建的预测对象为乌鲁木齐机场逐小时主导能见度,共包含近4.5万条记录,通过对预测对象进行分析,可以看到乌鲁木齐机场能见度变化范围在0~10000m之间,26.9%的主导能见度为10000m,而对民航机场运行影响较大主导能见度低于1000m的记录占12.3%,具体分布见图2。通过使用MLP模型对主导能见度进行回归预测,得到逐小时的主导能见度预测结果,下面我们从两类不同的预报因子组成的模型检验本方法的预测效果。

4.1 以主导能见度为预测因子的模型

本类型模型仅包含过去时刻的主导能见度,未加入其他气象要素,构建单纯依赖历史时刻主导能见度的预测模型,以当前时刻的主导能见度为预测对象,分别用过去1、3、6、9、12、24、36、48、60、72、84、96、108、120小时的主导能见度为预测因子,建立预测模型。

从图3的预测效果分析显示,使用不同时间长度的历史主导能见度作为预测因子,对主导能见度的平均绝对误差在966m至706m之间,其中使用当前时刻前1小时的预测效果最好,平均绝对误差在706.98m,不同时间长度的预测因子构建的模型预测效果存在差异,且随时间长度增加,误差缓慢增加。

为充分检验不同因子的模型对主导能见度,下面通过统计5000m以内的主导能见度预测平均绝对误差,分析模型对不同量级主导能见度的预测能力,从表2可以看到,本类型的模型对1000m以内的预测平均绝对误差在325m至520m之间,训练样本与测试样本的平均绝对误差区别较小,其中使用过去1、3小时两种的因子预测效果较好,随着预测因子中时间长度增加,主导能见度的平均绝对误差逐渐增加。另外随着预测对象量级的增加,主导能见度在[4000,5000)区间内的平均绝对误差明显大于[0,1000)范围内的平均绝对误差,达到1200m左右。

4.2 以多气象要素作为预报因子的模型

由于导致低能见度天气出现的原因较多,且能见度与温度、相对湿度等要素都有一定的相关性,因此本文尝试将预报因子扩展至包含过去时次的主导能见度、温度、露点温度、风向和风速,建立模型对主导能见度进行预测。通过对预测结果进行分析可以发现,使用多要素预报因子的模型,在不同时间长度的模型预测平均绝对误差在799m至827m,不同模型的平均绝对误差稳定在10m左右,其中使用过去24小时的多要素预报因子构建的模型预测效果最好,绝度误差为798.87m,具体见图4。

为充分检验不同因子的模型对主导能见度,下面通过统计5000m以内的主导能见度预测平均绝对误差,分析模型对不同量级主导能见度的预测能力,模型对主导能见度在1000m以内的预测效果最好,平均绝对误差在450m至550m之间,其中使用过去72、120小时因子构建的模型预测效果较好,随着主导能见度量级的增加,模型预测的误差逐渐增大,达到1100m左右,详细数据统计表格此处省略。

4.3 实际预测效果建议

结合本文讨论的两类预报因子构建的模型预测效果,单要素构建的预测模型对能见度低于1000m的预测效果较好,多要素构建的预测模型对能见度高于2000m的预测效果较为稳定,故此处同时选用这两类模型,并考虑到能见度变化的连续性,选取采用过去12h的预报因子的模型进行实际预报。

主导能见度预测效果检验

这里选取乌鲁木齐机场2016年12月31日的能见度进行预测,当天机场能见度变化较大,11时之前维持1000m以上,之后迅速下降维持两个小时的100m,而后16时突然好转至2000m,然后下降维持在100m,具体見图5,此次低能见度过程包含持续性的低能见度,以及能见度的突然好转,对模型预测的能力有着较高的考验。

通过模型预测可以看到,两类模型均能够预测出当日能见度下降、转好的趋势,在实况能见度大于1500m的时候,多要素模型的预测误差相对较小,当主导能见度小于1000m时,单要素模型的预测效果相对更好,尤其是在长时间持续能见度小于300m时,单要素预测的能见度平均绝对误差达到86m。因此通过将两类预测模型配合使用,可以为预报人员提供能见度预测的定量参考。但是通过此次实际个例的模拟也可以看到,模型在预测主导能见度转好或转差的时刻具有一定的滞后性,且能见度大于1500m后误差明显增大。

5 结束语

由于导致低能见度天气出现的因素较多,影响系统较为复杂,尤其是预报低能见度的起止时间难度较大,因而如何尽可能地预报出低能见度天气出现、消散的时间,是乌鲁木齐机场冬季服务保障的重点。

本文尝试使用人工神经网络进行机场能见度预测,利用近十年的资料进行建模预测,通过分析模型预测结果表明,它能够较好地反映乌鲁木齐机场主导能见度的变化趋势;平均绝对误差最小能够达到706m,其中对小于1000m的预测平均绝对误差最低可达325m;同时可以看到多要素因子预测模型的预测结果较为稳定,后续我们将尝试将本模型投入实际业务,并进行持续检验,改善本方法在主导能见度的定量预报能力。

該方法虽然有较好的预测效果,但是在详细分析其预测结果也发现一些不足,例如预测能见度转好或转坏的时次具有一定的滞后性,主导能见度大于2000m以上的预测平均绝对误差较大,主导能见度小于1000m的预测效果不稳定等问题。后续我们将配合低能见度天气发生下的天气形势,尝试结合能够反应低层层结条件、高空风场以及地面气压场等要素作为预报因子,确保预报因子能够较好的包含导致低能见度天气发生的条件,改善模型的预测效果。

参考文献:

[1]朱蕾,朱国栋.乌鲁木齐机场近30年低能见度天气特征分析[J].中国民航飞行学院学报,2012,23(5):27-30.

[2]朱蕾,朱国栋.支持向量机方法在机场跑道视程预报中的应用[J].暴雨灾害,2010,29(2):171-175.

[3]李沛,王式功,尚可政,等.基于神经网络逐级分类建模的北京地区能见度预报[J].兰州大学学报(自然科学版),2012,48(3):52-57.

[4]王恺,赵宏,刘爱霞,等.基于风险神经网络的大气能见度预测[J].中国环境科学,2009,29(10):1029-1033.

[5]陈会芝,郝丽萍,谢娜,等.信息数字化与雾的细化预测[J].自然灾害学报,2009,18(5):151-156.

[6]朱国栋.基于SVM方法的乌鲁木齐国际机场多要素预测[J].沙漠与绿洲气象,2011,05(4):40-43.

[7]彭士涛,胡焱弟,周然,等.人工神经网络在城市能见度短期预报中的应用C//中国颗粒学会第六届学术年会暨海峡两岸颗粒技术研讨会论文集,2008:606-609.

[8]邵振平.郑州机场能见度变化特征及雾的成因分析[J].气象与环境科学,2014,37(1):75-82.

[9]贺皓,罗慧.基于支持向量机模式识别的大雾预报方法[J].气象科技,2009,37(2):149-151.

[10]曹治强,吴兑,吴晓京,等.1961~2005年中国大雾天气气候特征[J].气象科技,2008,36(5):556-560.

[11]李秀连,陈克军,王科,等.首都机场大雾的分类特征和统计分析[J].气象科技,2008,36(6):717-723.

[12]Y.Bengio. Learning deep architectures for AI. in Foundations and Trends in Machine Learning,2009,2(1):1-127.

[13]G.Hinton,S.Osindero,and Y.Teh. A fast learning algorithm for deep belief nets. Neural Computation,2006,18:1527-1554.

猜你喜欢
人工神经网络能见度
基于人工神经网络的故障诊断专利浅析
揭阳潮汕国际机场能见度特征分析
人工神经网络发展历史与训练算法概述
能见度与NOx、NO2日变化关系分析研究
浅析常州市PM2.5对能见度干扰
基于人工神经网络的优化配置研究
ANN、ANFIS和AR模型在日径流时间序列预测中的应用比较
南京市气溶胶和相对湿度对能见度的影响
人工神经网络在旅游人数预测中的应用研究
基于人工神经网络的经济预测模型