基于卷积残差网络的水下主动目标回波 图像分类方法研究

2021-04-19 01:47:28王磊陈越超王青翠王方勇
声学与电子工程 2021年1期
关键词:声呐残差卷积

王磊 陈越超 王青翠 王方勇

(第七一五研究所,杭州,310023)

海洋信道具有时空变化,平台亦有自噪声干扰,加上强烈的混响以及海洋中大量且复杂的杂波干扰,使得水下主动目标识别十分困难。传统的识别处理方法多从特征提取入手,但不可避免地会丢失一部分关键信息,影响识别正确率。上世纪已经有众多专家学者开始将机器学习以及一些浅层神经网络应用于水下目标识别中来,如支持向量机(Support Vector Machine,SVM)、K-最近邻算法(K-Nearest Neighbor,KNN)[1]和BP(BackPropagation)神经网络等,且在被动检测与识别处理方面应用较多[2-3]。一般的处理多为先人工提取一部分特征,之后输入机器学习分类器,可被总结为特征提取、特征选择、设计分类器。2006 年Hinton 等人提出了深度学习的概念[4],可以解决很多浅层神经网络所不能解决的复杂问题,迅速成为了机器学习领域的热点,近年来发展十分迅速,在计算机视觉、医疗诊断、语音信号处理和文本处理等方面取得了诸多成功[5-6]。在水声工程领域中,已有众多学者将深度学习方法引入到水下目标的探测与识别中来,并取得了一定的成果[7-8]。

卷积神经网络(Convolutional Neural Network,CNN)是一种深度前馈神经网络,为深度学习领域的核心理论之一,目前在图片分类、目标检测、目标分割等相关领域应用广泛且较为成功,具有局部连接、权值共享等优点,擅长处理图像信息。发展至今,研究人员已发明了多种优秀的卷积神经网络结构,如AlexNet[9](Alex Krizhevsky Network)、VGGNet(Visual Geometry Group Network)、ResNet(Residual Network)等。

主动声呐基阵信号经过波束形成以及匹配滤波处理后,会产生方位-距离图像,图中混响、杂波的亮点区域较为分散,目标的亮点区域则能量较为集中,操作员可利用经验对其加以区分判别。本文针对主动声呐图像中的回波亮点分类问题,研究了基于ResNet 网络的主动声呐目标回波图像的亮点分类方法,并利用实际海试数据进行了验证,将深度学习技术应用于差异性提取,提高了识别系统的智能化水平。

1 目标回波亮点模型

亮点最初是光学的定义,汤渭霖教授将这一概念引入声学领域,建立了主动声呐回波的亮点模型[10]。根据亮点结构模型,目标回波可以看成是多个亮点回波的迭加,按照线性迭加原理,总的传递函数为

已有国内外的实验测试及理论证明[11-12],潜艇目标的亮点主要由3~6个突出亮点和一些随机的背景亮点组成。突出亮点主要包括:艇体表面镜反射形成的亮点,该亮点在正横方向入射时强度较大;艇艏部位以及艇艉螺旋桨等位置存在的一些线状边缘产生的棱角散射回波亮点,亮点强度与入射方位角有关。

由上述理论可知,目标的亮点产生有相应的机理,而混响、杂波的亮点产生则较为随机,经过波束形成、匹配滤波处理后,二者在图像上会存在一定的差异性,可为后续的判别提供相应的依据。

2 ResNet 网络模型

ResNet 网络于2015 年被提出[13],具有超深的网络结构,一般可以突破千层,创造性地提出了残差(residual)模块。同时在训练过程中丢弃了传统的dropout 方法,使用了批量标准化(Batch Normalization,BN)处理,使得每批数据的feature map满足均值为0、方差为1 的分布规律,可以加速网络的收敛过程并提高训练过程的稳定性。残差模块可以将靠前若干层的某一层数据输出直接跳过多层引入到后面的数据层输入部分,即后面特征层的内容会有一部分由其前面的某一层线性贡献。深度卷积残差网络的设计是为了克服由于网络深度加深而产生的学习效率变低与准确率无法提升的问题。残差模块如图1 所示。

图1 残差模块

该模块的提出可以解决深度神经网络中梯度消失问题,设网络的损失函数为F(X,W),则网络的反向传播的梯度为

设n 为神经网络的层数,根据链式法则可以推断出第i 层的梯度为

可以看出误差在回传的过程中,网络的梯度在逐渐减小。而残差结构的引入,如图1 所示,则输出层从原来的 F (X ,W )变为 F (X ,W)+ X,则其梯度变为

从上式可以看出,随着网络层数加深,可以解决梯度消失的问题。

BN(Batch Normalization)在2015 年被提出,广泛应用于深度网络的训练中。它可以通过一定的规范化手段,将神经网络中任意神经元输入值的分布转化为均值为0、方差为1 的标准正态分布,避免输入值过于偏离激活函数的敏感区域而造成的梯度消失现象。很明显这样可以保持对神经网络的参数有较高的调整效率,从而加速收敛。

设一批次的输入值为 φ= {x1,… , xm},调整过程为

式中,μ、2σ 分别为网络在正向传递过程中统计得到的该批次样本的均值和方差,γ 和β 则在反向传播的过程中训练得到。

在训练模型的过程中,引入了Adam(Adaptive moment estimation)优化器[14],这是一种自适应优化算法,它结合了AdaGrad(Adapative Gradient)和RMSProp(Root Mean Square Prop)的优点,对梯度的一阶矩估计和二阶矩估计综合考虑,为每一个参数设计独立的自适应学习率。

3 实验分析

本文利用实际海洋环境下的主动声呐试验数据,对ResNet-34 网络模型用于主动目标回波图像亮点分类的可行性和效果进行了分析。水听器阵列接收信号经波束形成、匹配滤波等时空处理后,可得到方位-距离的二维能量输出伪彩图。浅海环境下,图像中不仅含有感兴趣的目标回波亮点,还存在着大量的杂波与混响。本文主要以不同亮点的局部图像作为输入,构建训练和测试样本。实验选取包含目标强能量点的图片区域作为正样本(图2),负样本为包含混响、杂波干扰的强能量点和少量的背景图片(图3)。样本分辨率皆为128×128 的三通道图片,样本总数约为1000 张,正负样本的比例为1:4,随机抽取其中800 张作为训练集,200 张作为验证集,即比例保持在4:1。同时为了避免训练样本出现有偏性,抽取时应使两类样本保持既定的比例,即随机抽出正负样本各4/5 组成训练集。

图2 正样本

图3 负样本

为了避免过拟合,需要对输入的数据图像进行预处理并数据增强。在进行训练前,可以对原始图片做随机裁剪并依概率p=0.5 进行随机水平翻转来丰富训练集,更好地提取出图像深层次的特征,提高模型的泛化能力。之后对整体数据进行归一化处理,再传入网络的输入层进行训练,可以加速网络的收敛过程并减少后续的运算量。

训练中设置学习率为10-5,激活函数为Relu,采用Adam 优化算法,使用交叉熵(Cross Entropy)计算损失函数,训练的迭代次数设为5000 次。

在ResNet-34 网络模型中,训练的正向传入过程为先经过一个卷积层(Conv)与最大池化下采样层,依次传入后4 个layer,每个layer 层是由多个卷积层叠加而成。后续再通过平均池化下采样以及全连接层处理,最终通过softmax 函数分类。

表1 ResNet-34 模型参数

由于需要识别的类型为两种,所以最终输出层节点设置为2。对第一个卷积层至最后一个layer的卷积层特征进行可视化,取出每一卷积层的前四个结果,可视化结果依次如图4 所示。

图4 特征图

从图4 中可以看,出浅层网络提取出来的多是纹理和细节信息,随着网络层次的加深,图像的分辨率逐渐降低,可以提取出图像的最强特征,具有很强的辨别性,即提取的特征更具有代表性。实验设置的迭代次数为5000 次,由图5 可以看出训练损失逐渐减小,训练2000 次后趋于平缓,逐渐达到收敛状态。图6 展示了训练5000 次后ResNet-34网络的最终输出层结果的散点可视化图,其中的蓝、黄两种颜色分别表示正负样本经网络处理后的输出结果,横纵坐标表示二者的离散程度,为无量纲量。从图中可以直观地看出两种类别具有明显的可分性。

图5 训练损失

图6 卷积残差网络输出结果可视化

最终实验结果如表2 所示,可以看出ResNet-34网络对识别目标与混响、杂波图像具有良好的效果,平均准确率基本可以达到90%以上。

表2 识别准确率

4 结论

本文针对主动声呐目标识别问题,提出基于卷积残差网络的回波图像亮点分类方法,并利用实测主动声呐数据验证了基于ResNet-34 网络进行回波图像亮点分类的可行性,测试结果表明,ResNet 网络可有效学习和深度挖掘主动声呐方位-距离图像中回波、混响和杂波的微弱差异性信息,并实现较高的分类准确率。

初步研究结果表明,深度学习方法在主动声呐目标识别应用中具有较好的应用前景,后续还可通过数据积累、优化网络结构等进一步提高性能。

猜你喜欢
声呐残差卷积
探索大洋的“千里眼”——声呐
基于双向GRU与残差拟合的车辆跟驰建模
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于残差学习的自适应无人机目标跟踪算法
一种便携式侧扫声呐舷侧支架的设计及实现
声呐
基于递归残差网络的图像超分辨率重建
自动化学报(2019年6期)2019-07-23 01:18:32
从滤波器理解卷积
电子制作(2019年11期)2019-07-04 00:34:38
基于傅里叶域卷积表示的目标跟踪算法
平稳自相关过程的残差累积和控制图
河南科技(2015年8期)2015-03-11 16:23:52