马 智 田 斌
(西安电子工程研究所 西安 710100)
合成孔径雷达(Synthetic Aperture Radar, SAR)由于其特殊的成像机制,SAR图像总是伴随着相干斑噪声,这种噪声大大降低了SAR图像的质量,对后续的图像分割、目标检测、目标识别等任务[1]带来了严峻的挑战。所以,如何抑制相干斑噪声是SAR图像处理中最重要的一步,值得下功夫去研究。
传统的SAR图像去噪方法分为两类[2],一类是空间域滤波,它的代表方法有Lee滤波、均值滤波、Frost滤波等;另一类是变换域滤波,它的的代表方法是基于小波变换的阈值滤波方法。第一类方法采用局部处理的思想,虽然能去噪,但是不能很好地保留图像的边缘和细节。科研人员为了解决这个问题又提出了非局部均值(NLM)[3]算法,NLM算法在去除相干斑噪声的同时也很好地保留了图像的细节,但其效率很低,不容易推广。SAR-BM3D算法[4]结合了两类方法的优点,是目前最好的去噪方法之一,但其效率也较低,很难大规模的应用。
本文在卷积神经网络的基础上,提出了一种新的SAR图像去噪方法。把带噪SAR图像输入到本文设计的网络中,利用网络的卷积层读取SAR图像的深层特征,接着池化层进一步处理以使深层特征降维,再通过反卷积层得到与输入图像尺寸大小一样的结果,并将其与原无噪图像对比,以两者的误差作为神经网络优化器的输入,驱动网络更新各层参数使误差函数最小。为了缩短网络训练收敛的时间,引入ReLU激活函数和批归一化处理,经过少次训练后,网络输出的结果就能接近原始SAR图像。实测数据试验结果表明,与传统SAR-BM3D和SAR-NL去噪方法相比,新方法去噪能力更强,图像视觉效果更好。
卷积神经网络是仿生人脑神经系统局部感知特性和权值共享特性得到的人工神经网络结构。卷积神经网络中低层的神经元把感知的局部信息在高层融合获得全局信息。这两个特性使得网络的训练参数减少,网络的训练速度得到提升。
一个典型的卷积神经网络LeNet-5如图1所示,该网络一共7层,其中卷积层和池化层各2层,全连接层3层。本文所提方法重点应用卷积层和池化层,除此之外,还在网络中加入了反卷积层用于图像重建。下面分别对卷积层、池化层和反卷积层进行介绍,并对卷积神经网络的训练过程进行说明。
图1 LeNet-5卷积神经网络
卷积可以看作是输入和卷积核之间的一种数学运算。通常把卷积运算得到的输出称为特征映射,每个卷积核可获得一个特征映射,一个二维卷积运算示例如图2所示。
图2 二维卷积运算过程示意图
由图2可以看出,卷积操作将周围几个像素的取值经过计算得到一个像素值,具有很强的特征提取和表示能力。
池化操作对卷积后得到的特征进行进一步降维处理,池化会把一定大小区域内的像素值用一个元素替代。平均值池化使用区域内像素的平均值替代,最大值池化使用区域内像素的最大值替代,这两种池化方式如图3所示。
图3 最大值池化和平均值池化
反卷积的主要作用是将特征图放大恢复到原来的尺寸,其与原有的卷积操作在计算方法上并没有差别,而主要区别是在于:反卷积是卷积的反向过程,转置卷积可以保证在尺寸上做到卷积的反向过程,但是在内容上并不能保证完全做到卷积的反向过程,二维反卷积的工作示意图如图4所示。
整个训练过程分为两个阶段,分别阐述。
1.4.1 前向传播
1)从训练集中随机抽取一个样本输入到网络中;
2)网络计算得到该样本的输出。
图4 反卷积示意图
1.4.2 反向传播
1)比较网络输出和真实值之间的偏差;
2)通过反向梯度下降算法调整网络各层参数。
基于卷积神经网络的SAR图像去噪方法的基本工作原理是:第一步,将带噪SAR图像输入神经网络;第二步,利用卷积层获取带噪SAR图像的深层特征信息;第三步,利用池化层对获取得到的深层特征信息进行降维处理;第四步,利用ReLU激活函数和批归一化处理加速网络训练过程,其中ReLU函数用于解决梯度消失,批归一化处理用于缓解梯度弥散问题;第五步,通过反卷积层得到与输入尺寸大小一样的结果;第六步,将第五步产生的处理结果与原始无噪图像对比,利用产生的误差驱动网络优化器朝着使误差函数最小的方向更新各网络参数;第七步,循环上述操作,直至SAR图像残差满足约束条件。本文设计的网络结构如下图所示,其中包括卷积层、激活函数层、批归一化层、池化层和反卷积层,下面对每层具体实现过程进行详细介绍。
图5 本文方法的网络结构图
1)卷积层
网络中卷积层的卷积核大小为3×3,第一至三层的卷积层输出通道为64,第四至五层卷积层的输出通道为128,第六层卷积层的输出通道为256。
2)池化层
网络中的池化层都使用最大值池化,池化核的大小为2×2,步长为2。
3)反卷积层
网络中的反卷积层采用3×3的卷积核,输出通道数与卷积层输出通道数恰好相反。
4)激活函数层
在没有激活函数情况下,卷积层仅包含一个线性运算——内积。这样卷积层就只能学习输入数据的线性变换,这种学习非常有限,无法利用多个卷积层的优势,因为多个线性层叠加并不会拓展特征空间,它实质上仍是线性运算。为了充分利用多层表示的优势,可添加非线性或激活函数使网络得到更丰富的特征空间。常用的激活函数有S(Sigmoid)型函数、双曲正切(Tanh)函数、线性修正单元(Relu)函数等。具体公式和函数图像如公式(1)至公式(3)及图6所示。
(1)
(2)
ReLU(x)=max(0,x)
(3)
如图6所示,ReLU激活函数只保留大于0的输出,其余输出全设置为0。因其函数关系简单,计算速度很快,所以本文设计的网络大都使用ReLU激活函数,只在最后一层使用Sigmoid激活函数。
图6 常用激活函数图像
5)批归一化层
梯度在网络反向传播的过程中可能存在爆炸或者消失的问题,导致网络不能收敛。引入批归一化层就是为了解决这个问题。
网络从k-1层传到k层称为前向传播,公式为
(4)
其中,hk表示第k层的节点;hk-1表示第k-1层的节点;ωk表示第k层的权重。
网络从k层传到k-1层称为反向传播,公式为
(5)
其中,Δk为网络反向传播中第k层的偏差值。
当网络从k层反向传播到m(m (6) 批归一化的处理过程如下,假设在某层中每批的训练输入数据为x1,x2,…xm,则有 (7) (8) (9) (10) 前两步计算输入数据的均值和方差,第三步做归一化处理,其中ε是一个很小的正数,为了防止方差趋于0,导致结果溢出。经过处理后大部分数据会分布在激活函数的线性段,而非线性变换在神经网络中非常重要,为了平衡非线性变换和梯度,第四步引入两个参数对输出数据进行调整。γ起到尺度变换的作用,β起到平移变换的作用,这两个参数是网络在训练的过程中自动学习得到的。 6)网络训练及网络去SAR噪声过程 本文设计的网络使用均方误差作为损失函数,公式为 (11) 其中,N为每一批数据的数量,y0为网络的实际输出,y为原始无噪图像。 网络的训练过程如下图所示,通常来说SAR图像为单通道图像,相干斑噪声服从瑞利分布,训练时在原始SAR图像中添加乘性噪声作为训练集训练网络。 将带噪SAR图像输入到卷积神经网络中,经过网络的计算,输出网络映射后的图像,把它和原始SAR图像做对比,产生的误差通过损失函数驱动网络的优化器更新每层的参数。重复以上步骤,直至网络的输出与原始SAR图像的误差达到最小,网络训练结束。将训练好的网络作用到测试集上,网络输出即为去噪图像。 图7 基于卷积神经网络的SAR图像去噪流程图 本节,采用本文所提方法对实测SAR图像数据进行相干斑噪声抑制处理。网络训练过程中损失函数值与训练次数的关系如图8、图9所示,由图8、图9可以看出,在训练3次后,损失值已达到了0.001左右,网络收敛速度快,效果明显。 图8 训练损失值与训练次数关系图 另外,为了对比抑制效果,还采用经典SAR-NL方法[5]和SAR-BM3D方法[6]对图像进行处理,三种方法处理结果如图10所示,其中,图10(a)为原始SAR图像;图10(b)为SAR-BM3D方法去噪后的图像;图10(c)为SAR-NL方法去噪后的图像;图10(d)为本文方法去噪后的图像。 图9 验证损失值与训练次数关系图 从图10中可以看出,三种方法在不同程度上都能实现SAR图像中相干斑噪声的抑制,提高SAR图像的质量。然而,从处理效果上来看,与两种经典的SAR图像去噪方法相比,本文所提方法去噪效果更好,SAR图像质量提升度更高。容易看出,经本文方法去噪后的SAR图像,建筑物边缘的纹理结构和局部位置的轮廓更加清晰,更能如实地反应实际场景分布情况。 图10 不同去噪方法对比结果图 本文提出了一种基于卷积神经网络的SAR图像去噪方法。新方法在传统卷积网络中引入ReLU激活函数层和批归一化层,加快了网络的训练速度,提高了去噪后SAR图像的质量。实测数据处理结果表明:新方法除能够有效抑制SAR图像中相干斑噪声外,同时还能较好保留图像的纹理和细节信息。3 实测数据试验结果
4 结束语