机场能见度预测模型研究

2024-10-01 00:00刘晴潘子宇李银洁魏莱陈丹妮
无线互联科技 2024年18期

摘要:在雾霾天气下,基于图像处理的能见度检测方法仍然在不断研究中,对能见度估算值的精度依然具有提升空间。文章以大数据为基础,改进VGG卷积神经网络提取视频数据的特征并利用Adam进行算法优化,充分挖掘监控视频数据信息,以达到提高精度及降低设备成本的目的。相比于ResNet,这一方法充分利用了视频数据的时空信息,在预测过程中表现出较高的精度和准确性。这项研究对提升机场能见度预测的效果提供了借鉴。

关键词:能见度预测;卷积神经网络;机场监控视频

中图分类号:TP183 文献标志码:A

0 引言

根据飞行安全统计,机场能见度低是造成飞行事故的原因之一。目前,许多学者将机器视觉和深度学习应用于能见度预测中。周开鹏等[1]对比神经网络模型和多元逐步回归法的预报准确率,表明神经网络对低能见度的预测更接近实际变化。千月欣等[2]对比了基于Squeezenet的迁移学习模型和15层深度卷积神经网络,表明搭建的15层深度卷积神经网络模型更适用于机场能见度预测。徐悦等[3]提出了一种基于U-Ne深度学习的雾天夜间机场能见度预测方法。祁媛等[4]选用ResNet卷积神经网络提取机场视频数据的特征向量进行预测,模型精度达80.3%。黄晋等[5]探讨了视频数据与能见度估计的VGG卷积神经网络深度学习模型,模型精度则达到了88.3%。

因此,本文选用VGG卷积神经网络对视频数据进行深度学习,充分挖掘视频中的时空信息,并在对图像进行分类前,对图像进行有针对性的增强和降噪,以达到使模型具有更好鲁棒性的效果。

1 视频数据预处理

1.1 数据预处理

在大雾条件下,本文获取了摄像头拍摄的视频,并同时收集了同一时间段的机场能见度数据,包括RVR、MOR、VIS、光照强度、风、温度和湿度等信息。为了便于分析,将视频按帧截取图像,设定间隔为22帧,获得了2020年3月13日0时—7时59分00秒的27941幅影像。然后从每一分钟内的15 s、30 s、45 s和00 s提取图像,生成了1860张图像,构成了机场能见度预测数据集。视频中的数据与收集的能见度数据形成了一一对应的关系。能见度有气象光学视程(MOR)[6-7]、主导能见度(VIS)[8]、跑道视程(RVR)[9]3种。综合比较MOR、VIS、RVR,本文在后续的研究中将会使用MOR值作为参考项进行分析。

对本文所需的视频图像数据进行必要的预处理,根据得到的能见度数据,结合能见度等级表,使用等级分析法对能见度进行分级,粗略地划分为4个等级:MOR≤50 m;50 m<MOR≤200 m;200 m<MOR≤500 m;500 m<MOR 。将这4个等级作为4种类别,建立基于视频数据的能见度估计深度学习模型。

1.2 数据增强

考虑到数据集中各个能见度等级样本数量的不平衡,本文对MID和HIGH等级的样本进行重点增强。通过应用各种图像变换技术,如旋转、缩放、裁剪等,本文生成了额外的样本,如表1所示,以平衡数据集中各类别的样本数量。

同时,为了进一步提高模型的鲁棒性和泛化性能,本文还对图像进行了降噪处理。经过实验比对后,选取了Retinex方法进行图像增强,并选择中值滤波作为图像降噪技术。增强后的图像降噪可以显著改善图像质量,消除或减轻图像中的噪声,提高图像的视觉效果。

2 VGG卷积神经网络

卷积神经网络是一种新兴的具有深度学习能力的人工神经网络系统,并且得到了广泛的关注。卷积神经网络具有适应性强、善于挖掘数据局部特征、全局训练特征抽取器和分类器等优点,因此,被应用到模式识别中的各个领域并取得了很好的成果。与传统的图像分类方法相比,卷积神经网络能够直接将图像数据作为输入,不需要人工的预处理及特征提取等操作,通过局部感受野、权值共享、池化层下采样减少了很多参数,尽可能保留了重要参数,同时具有一定程度的平移、旋转、尺度和非线性形变稳定性,可以保留邻域的联系和空间的局部特点。因此,本文选取VGG卷积神经网络,该模型可以在保证整个网络结构简洁的前提下,在保持相同感受野的同时能够减少参数量,达到不错的效果。

3 基于卷积神经网络的能见度预测

机场能见度的高低与大雾的形成消散过程密切相关。通过计算机图像处理和判断可以避免主观和任意性,能够在连续的时间范围内描述大雾的整个变化过程,具有成本低、连续性强、操作简便和覆盖范围广的优点。本文利用机场视频数据结合地面气象观测数据分析得到能见度的大小,根据视频中的特征信息将其与能见度数据建立对应的关系,建立深度学习模型,分析得到能见度也就是雾的浓厚程度,评估能见度并进行精度验证。

3.1 建立深度学习模型

在基于VGG16特征提取网络的基础上,本文对全连接层进行了优化。在深度学习中,全连接层是神经网络中最基本的组成部分,负责连接2个节点,实现数据的传递和计算。全连接层的优化是深度学习性能提升的关键。原网络中的全连接层使用4096个神经元,不仅增加了算法的复杂度和参数量,还会致使训练时不易收敛。由于本文仅须要对4类图像进行分类,所需参数相对较少,本文采取参数减少的策略,将2个全连接层的神经元数量从4096个分别减少至256个和128个,显著降低了参数量,使模型的速度和精度均获得了提升。

同时,为了充分利用已训练好的大型网络的特征提取能力,本文采用了迁移学习的思想。这使得模型能够迅速适应新的任务,同时保持较高的性能。VGG16的主干特征提取部分经过大量数据的训练,已经具备了良好的鲁棒性和特征提取效果。因此,本文直接使用VGG16特征提取网络的预训练权重和参数,并在训练过程中仅对全连接层进行微调。具体步骤如图1所示。

激活函数在深度神经网络模型中占据着核心地位,其特性通常表现为非线性,这一性质使得神经网络能够有效地对实际问题中非线性分布的数据进行建模[10]。同时激活函数的选择也会直接影响到整个模型是否能够成功收敛及其收敛效果[11]。其中Sigmoid、Tanh、ReLU都是常用的激活函数,但是有不同的函数特性。

Sigmoid函数的输出范围为0~1,导致其在输入很大或很小时梯度接近于0,这会导致反向传播过程中的梯度消失或饱和问题。Tanh函数虽然相对于Sigmoid函数在输出范围上有所改进,但仍然存在类似的问题。相比之下,ReLU函数在输入大于0时不存在梯度饱和,如图2所示,几乎不会造成梯度弥散[12]。且神经元的稀疏性有助于减少过拟合的发生。

综合以上ReLU函数的优点,故本文在全连接层选用ReLU函数作为激活函数。

3.2 模型优化

模型训练过程采用了学习率调整器、早停机制和Adam优化算法。学习率调整器根据验证集性能动态调整学习率,加速训练并提高验证集性能。早停机制监控验证集损失,避免过拟合。Adam算法自适应估计低阶矩,为每个参数设置不同的学习率,提升预测速度和准确性。

在实际应用中,Adam算法往往展现出卓越的性能,相较于其他自适应学习率算法,其收敛速度更快,学习效果更佳。算法的有效性在很大程度上取决于数据特点是否与算法特性相匹配[13]。Adam将随机梯度下降法2种扩展的优势结合在一起,其在梯度下降中的优化过程如下。

(1)初始化参数:初始化模型的参数。

(2)计算梯度:使用随机梯度下降(SGD)计算当前批次样本的梯度。

(3)更新一阶矩估计变量mt和二阶矩估计变量vt:

mt=β1mt-1+(1-β1)gt(1)

vt=β2vt-1+(1-β2)g2t(2)

式中,gt表示当前梯度;β1和β2是可调节的指数衰减率,一般取值分别为0.900和0.999。

(4)mt和vt的初始均为零向量,因此衰减率在初始时间可能会偏向零向量,故需要进行偏差校正,公式如下:

的梯度带权有偏方差。

(5)更新模型参数θt。

式中,θt表示模型的参数;ε是一个很小的数,用于避免除零错误;η为学习率。

4 网络训练及预测

4.1 评价指标

本文主要采用损失函数、混淆矩阵来对模型进行评价。其中,损失函数为交叉熵,损失函数模型学习的过程就是模型的权重不断更新的过程,直到损失函数值趋于稳定[14]。其计算公式为:

式中,n是样本数;yi是第i个样本的真实标签;pi是样本i预测的概率。

从混淆矩阵当中可以得到更高级的分类指标。

(1)Accuracy(精确率)。用来表示模型分类正确的样本占总样本的比例,即:

(2)Precision(正确率或者准确率)。表示预测为正类的样本中真正为正类的样本所占的比例,即:

(3)Recall(召回率)。表示在实际正样本中,分类器能预测出多少正样本,即:

4.2 实验结果分析

本文的实验基于一个包含5251个样本的数据集,其中90%被用作训练集,剩余的样本被用作测试集。模型的实现基于Tensorflow框架,在训练期间,单次传递给模型用以训练的数据(样本)个数为16个,使用Adam优化器进行训练,学习率设置为0.001。

运行出的结果如图2所示,展示了损失函数值和准确率随训练次数的变化情况。损失函数值随训练次数的增加而不断下降,趋于收敛。损失函数的横坐标是训练的迭代次数(Epochs),纵坐标表示模型在每个训练迭代的损失值。精度图的横坐标表示训练的迭代次数(Epochs),与损失函数图的横坐标相同,纵坐标表示模型在每个训练迭代上的预测精度。

实验发现,设置Epoch为50个进行训练时,模型的效果最好。在50个Epoch内,模型共进行了36次迭代训练,当损失函数值趋于稳定时,停止训练。

通过绘制混淆矩阵,如图3所示,验证VGG16模型在能见度变化规律的量化分析与预测中的有效性和可行性[15]。混淆矩阵的行表示真实标签(True Label),列表示预测标签(Predicted Label)。根据混淆矩阵的分析,可以观察到优化后的模型在区分LOW和HIGH 2种类别上表现较为优越。这2种类别在图像特征上具有显著区别,因此模型相对容易做出正确分类。相比之下,MID和VERY_HIGH 2种类别则更容易被混淆,可能导致错误分类的情况发生。以此可得出模型评估参数,如表2所示。

由表2可知,在本次基于视频数据估计能见度的研究中,VGG16能够获得较好的预测精度。

5 结语

本文使用VGG16卷积神经网络深度学习模型来评估机场能见度,并对模型算法做出改进,使模型精度跟效率都得到提升,最后利用损失函数和混淆矩阵对能见度估计效果进行精度分析评价。本文所采用基于卷积神经网络和迁移学习的深度学习模型,能够获得较好的预测精度,训练准确率最高达到了90%。后续选取测试集对模型效果进行评估,精度达到89.7%,证明了模型估计能见度的准确性。

参考文献

[1]周开鹏,黄萌,樊旭,等.基于逐步回归和神经网络的北京市能见度预报对比[J].兰州大学学报(自然科学版),2020(4):522-526.

[2]千月欣,王永忠,李佳骏,等.基于深度学习的机场能见度预测研究[J].云南民族大学学报(自然科学版),2021(6):615-620.

[3]徐悦,袁宝玺,米辰,等.基于深度学习的雾天夜间机场能见度预测方法[J].电子制作,2021(23):60-62.

[4]祁媛,樊辉,张瑞华,等.基于ResNet卷积神经网络的机场能见度预测[J].自动化应用,2023(24):206-209.

[5]黄晋,李保强,吕明燕,等.基于VGG卷积神经网络的机场能见度预测[J].集成电路应用,2022(3):58-59.

[6]黄仪方.航空气象[M].西安:西安交通大学出版社,2011.

[7]刘敏,赵普洋.气象光学视程(MOR)在民用航空地面气象观测中的应用[J].气象水文海洋仪器,2012(1):78-80.

[8]张高杰,强晓西,董爱民,等.西安机场低能见度天气下RVR与VIS替代关系研究[J].科技创新导报,2020(14):117-118.

[9]杨帆.一次雪后跑道视程(RVR)数值偏低原因分析[J].成都航空职业技术学院学报,2021(1):46-48.

[10]李玥辰,赵晓,王若男,等.基于改进卷积神经网络的中药饮片图像识别[J].科学技术与工程,2024(9):3596-3604.

[11]牟晋娟.深度神经网络中激活函数的研究[J].电脑编程技巧与维护,2019(12):21.

[12]刘宇晴.一种新型自适应神经网络激活函数用于深度学习研究[D].吉林:吉林大学,2020.

[13]张益.基于卷积神经网络算法的海水循环冷却污损生物分类模型[EB/OL].(2024-04-01)[2024-05-03].https://doi.org/10.19965/j.cnki.iwt.2023-1122.

[14]刘峰.融合神经网络和优化算法的网络安全态势评估及预测模型研究[J].微型电脑应用,2024(3):19-22.

[15]梁旭,王玲,赵书涵.基于残差神经网络的鸡蛋分类识别研究[J].河南农业大学学报,2024(3):456-466.

Research on airport visibility prediction model

Abstract: In hazy weather, visibility detection methods based on image processing are still under continuous research, and the accuracy of visibility estimation is dependent on the accuracy of visibility estimation There is room for improvement. Based on big data, this paper improves VGG convolutional neural network to extract features of video data and uses Adam for algorithm optimization to fully mine surveillance video data information, so as to achieve the purpose of improving accuracy and reducing equipment cost. Compared with ResNet, this method makes full use of the spatio-temporal information of video data, and shows higher precision and accuracy in the prediction process. This study provides a reference for improving the effectiveness of airport visibility prediction.

Key words: visibility forecast; convolutional neural network; airport surveillance video