崔福彬,张茜,雷俞承志,尹伟石
(长春理工大学 理学院,长春 130022)
合成孔径雷达(SAR)利用相干成像原理,具有全天候、全天时的观测能力以及穿透地表植被和云层的能力,是一种重要的观测设备。在军事侦查和遥感领域有着重要的应用。近年来,随着合成孔径雷达图像分辨率的逐渐提高,对合成孔径雷达图像的解析成为了研究热点。
已经有一些较为传统的SAR-ATR(合成孔径雷达图像自动目标识别)系统被开发,例如美国陆军实验室(ARL)的SAR-ATR系统。近年来,随着机器学习算法的发展,一些机器学习的算法被应用于SAR图像识别的研究[1]。文献[2]提出了基于Gabor滤波器以及局部纹理特征的算法,文献[3]提出了基于多信息字典及稀疏表示的SAR图像识别方法。以上算法提取的特征由人工设定,需要相当的先验知识,而且识别效果不佳,泛化性较差。而基于仿生学理论的的卷积神经网络(Convolutional neural network,CNN)则能够自动提取图像中的深层特征,且与传统的深层神经网络相比,卷积神经网络具有稀疏连接,权值共享等特点,有效地减少了模型的复杂程度。文献[4]提出了一种应用卷积神经网络的SAR图像识别算法,并将类别可分性度量引入了神经网络的代价函数,提高了分类效率,神经网络采用Sigmoid函数作为激活函数,而该函数在训练时容易产生“梯度弥散”现象,另外没有对SAR图像做任何预处理。针对上述特点,本文提出了一种基于改进的卷积神经网络的SAR图像识别算法:首先利用布特沃斯滤波算法对SAR图像进行滤波处理,减少图像的相干噪声;然后构建多层卷积网络,并在网络中采用改进的的线性修正单元[5],采取Dropout[6]增强网络的的泛化性,使用Adam优化算法对网络参数进行更新,以更高效地训练网络。
合成孔径雷达作为一种高分辨率的对地成像观测设备,因其基于相干成像的成像机理,图像不可避免地会包含噪声,严重地影响到了对图像的解析。因此对图像进行滤波预处理也就成为了SAR图像预处理的关键步骤,滤波效果的好坏对后期图像处理的影响很大。因此本文利用布特沃斯低通滤波器来实现对SAR图像的滤波。截止频率位于距原点D0处的n阶布特沃斯低通滤波器的传递函数定义为:
其中,D(u,v)是频率域中点与频率矩形中心的距离。即:
布特沃斯低通滤波器的通频带内频率响应曲线十分平坦,起伏较小。作为一种频域滤波算法,布特沃斯低通滤波滤波能提取本质特征。
本文利用美国国防部支持的MSTAR计划所公布的数据集进行了图像滤波实验,滤波算法的实际处理效果如图1所示。
图1 布斯沃特滤波算法效果
由图1可以看出,经过滤波算法处理之后,图像的质量得到了较大的提高,特征更加明显图片中目标区域的对比度得到了增强,目标的边缘轮廓更加的清晰,有利于下一步的图像处理。
卷积神经网络是一种特殊的前馈网络。传统的卷积神经网络一般由卷积层、池化层及全连接层组成。卷积层和池化层交替连接以提取图像的深层特征,再由分类器根据提取的特征进行分类。原始图像经过多个卷积核卷积后形成多张特征图,特征图的长与宽基本不变,但深度增加,随后经过下采样减少特征数量。经过多次卷积与下采样后形成高维度的特征图,再进入分类器进行分类。卷积核对图像进行卷积运算的公式为:
随着数据量的增加,神经网络的深度也在不断增大,以获取更好的分类能力。但神经网络加深后就容易出现过拟合现象,也就是模型在训练中表现较好,但在验证数据集上表现有所降低。为了避免过拟合,提高卷积神经网络的泛化性。Hinton提出了Dropout策略,即以一定的概率P随机使某些神经元失效,被失效的神经元可暂时认为不在网络的内部,但其权重仍将保留,当该节点重新参与运算时将继续更新参数。Dropout方法可以理解为将一个大的神经网络分成多个独立的子网进行训练,最后多个网络进行平均。从而有效减小过拟合现象,提高了网络的泛化性。
为了提高网络对抽象特征的提取能力。在卷积与池化操作之后,需要引入激活函数。针对Sigmoid函数会导致所谓的“梯度弥散”现象的缺点,可以采用线性修正单元(RELU)作为激活函数。
RELU函数相较于Sigmoid函数有以下的几个优点。首先,使用RELU函数不会发生梯度弥散的现象,而且Sigmoid函数包含了除法以及指数运算,求微分较为复杂,增大了训练时的计算量,而RELU函数求导简单,并且由于RELU函数将小于零的输入置零,在神经网络不断循环计算的条件下,可以理解为RELU增强了数据的稀疏性,但这也体现了RELU函数的缺点,即输入小于零时神经元处于‘死亡’状态。当学习率较大时,可能会导致大量的数据节点不被激活,梯度也永远为零。所以,本文引入了Leaky ReLU函数:
在输入值大于零时,Leaky ReLU函数与RELU函数相同,但修改了输入值小于零的部分,α是一个极小的常数。这样梯度便能继续传播。
Adam(Adaptive Momentum Estimation)本质上是带有动量项的RMSprop,它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。Adam的优点主要在于经过偏置校正后,每一次迭代学习率都有个确定范围,使得参数比较平稳。公式如下:
Adam优化器的特点是:能够针对不同的参数调整学习率,同时对内存的占用较小。文献[7]表明,在众多神经网络的优化算法中,Adam优化器具有较好的效果。
本文使用了美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据进行试验。该数据大多是静止车辆的SAR切片图像,包含多种静止车辆目标在各个方位角下获取到的目标图像。本文选取了数据集中T72(坦克)、BTR70(装甲运兵车)、BMP2(步兵战车)、ZILI131(卡车)、ZSU234(自行防空炮)五类目标作为训练数据集进行模型训练。其中T72、BTR70数据集中包含了同一种类图像的不同变体。对应着不同的目标状态(如天线是否展开等),训练时只采用部分(在表格中标注)。训练后采用包含变体数据的T72、BTR70、BMP2、三类目标数据进行测试。
本文首先对图片进行截取,获得其中央部分,随后对图像进行滤波处理。滤波处理后的图像即可生成训练数据集进行神经网络训练。网络共有五次卷积层进行卷积运算,并在其中的第一、三、五卷积层后添加池化层进行下采样操作。通过卷积运算提取特征之后,构建一个三层的全连接神经网络。使用softmax分类器进行目标分类。
图2 模型流程图
图3 算法整体流程
各层具体参数如下:
(1)卷积层,96个卷积核,卷积核大小为11×11,步长为4,激活函数为Leaky ReLU。
(2)池化层,窗口大小为2,步长为4。
(3)卷积层,256个卷积核,卷积核大小为5×5,步长为1。采用Leaky ReLU函数进行激活。
(4)池化层,窗口大小为3,步长为1。
(5)卷积层,384个卷积核,卷积核大小为3×3,步长为1。采用Leaky ReLU函数进行激活。
(6)卷积层,384个卷积核,卷积核大小为3×3、步长为1。采用Leaky ReLU函数进行激活
(7)卷积层,256个卷积核,卷积核大小为3×3,步长为1。采用Leaky ReLU函数进行激活。
(8)池化层,窗口大小为3×3,步长为1。
(9)全连接层,4096个神经元节点。
(10)全连接层,4096个神经元节点。
(11)输出层,softmax进行分类,五个神经元节点。
本文采用包含 T72、BTR70、BMP2 ZILI131 ZSU23五类目标的数据集进行训练,训练后用包含变体数据的T72、BMP2、BTR70图片进行测试。结果如表1和表2所示。
表1 MSATR数据集三类(含变体)目标的测试结果
表2 平均识别率对比
从表1-2可以看出本文提出的算法具有较好的识别效果,对于训练数据集中的同型目标识别率较高,而对不同类型的目标的识别率略有降低。但总体的识别率仍然较高,高于文献[3]的96.60%,以及文献[2]的92.90%。
卷积神经网络能够自动提取图像中的深层抽象特征,从而避免了人工设置分类标准。为了能够更好地进行SAR图像的目标识别,本文构建了基于改进的卷积神经网络的SAR图像目标识别算法。SAR图像因其特殊的成像机理不可避免地会在图像中引入相干噪声,对后续处理造成了不利影响,故通过布特沃斯滤波算法滤除相干噪声。并在卷积神经网络中引入了修正的线性修正单元以及Dropout方法,增加了网络的泛化能力。使用Adam优化器对模型参数进行优化,取得了较好的训练结果。在MSATR数据集上的实验表明,通过对SAR图像进行滤波处理,并且构建改进的卷积神经网络对SAR图像进行识别,实验取得了较好的效果,对同型目标的识别率可达98%-99%,对三类(含变体)目标的综合识别率达到了97%以上。表明深度学习方法在图像处理方面有着较强的特征提取能力和较好的应用前景。