改进卷积神经网络SAR 图像去噪算法

2020-07-17 08:20张向阳李仁昌

计算机工程与应用 2020年14期

钱满，张向阳，李仁昌

南昌航空大学信息工程学院，南昌 330063

1 引言

合成孔径雷达（SAR）是一种相干波雷达，它可以对目标进行高分辨率成像[1]。它具有全天候、昼夜成像、高分辨率等特点，在遥感领域具有重要的应用价值，在军事和民用领域都发挥着重要作用。然而，在相干辐射作用下图像会出现颗粒噪声，即散斑噪声。它是由于雷达每个分辨率单元内的小反射器散射的相干回波的干涉引起的[2]。由于SAR图像中散斑噪声的存在，常常给图片的后续分析和处理带来很大的困难。因此，SAR图像去除散斑噪声是SAR图像预处理中的一项关键任务，也是后续图像处理中的分割、检测和分类任务中不可或缺的一部分。

为了去除SAR图像中的散斑噪声，学者们首先提出了基于空域的去噪算法，如Lee滤波[3]、Frost滤波[4]和非局部均值（NLM）去噪方法[5]。Lee滤波器和Frost滤波器都是基于线性散斑噪声模型的局部空间域滤波器，通过对局部窗口中像素值加权函数的线性组合，得到增强的中心像素。这些滤波器不能较好地保存图像的纹理信息和边缘信息。在此基础上，研究人员又提出了NLM滤波器利用子块相似性对图像进行去噪[6-7]，特别是基于概率块的（PPB）算法已经被证明非常适合于SAR图像的去噪。然而该方法存在计算量过大的问题。

与空间域降噪相比，在变换域干净信号和噪声信号更加易于分离。基于变换域的去噪算法主要有Wavelet域去噪[8]和Shearlet域去噪[9]等方法。其中基于Wavelet域图像去噪算法是假设噪声主要存在于高频小波分量中，因此可以将变换域中的高频小波系数过滤从而消除噪声。该方法在降低加性高斯白噪声方面取得了很好的效果。但该方法存在非稀疏性和方向选择性不足。为克服这些困难Shearlet变换[10]被提出，它由合成膨胀仿射系统构造的一种新型变换，可以对图像进行稀疏表示，并具有灵活的方向选择性。然而，它也有一些缺点，如平移鲁棒性差和图像边缘会出现伪吉布斯纹理。

随着深度学习技术的应用推广，近年已有基于深度学习方法应用到图像去噪中，并取得了很好的效果[11]。其中，Chierchia等人[12]在DnCNN[13]模型的基础上提出了基于卷积神经网络SAR图像去噪方法SAR-CNN。该方法的卷积层由批量归一化（BN）和线性整流函数（ReLU）组成，其中ReLU作为卷积层的激活函数。SAR-CNN为了去除SAR图像中的乘性噪声，该方法采用对数变换和指数变换结构，将SAR图像中的乘性噪声转换为加性噪声，再使用残差学习方法去除噪声。这种非线性去噪方法相比传统的线性去噪方法有更好的效果，能够去除再去噪的同时保存图像的细节纹理和边缘特征，但该方法存在去噪效率较低的问题。为了克服这些问题，本文在文献[14-15]的基础上提出了一种基于改进的卷积神经网络用于SAR图像去噪。该方法通过构建图像下采样、卷积操作、跳跃连接和残差学习卷积神经网络结构，在含噪声的SAR图像和干净的SAR图像之间实现非线性端到端映射以提高网络的性能。实验结果表明本文方法相比SAR-BM3D、SAR-Shearlet和SAR-CNN去噪方法有更好的去噪效果和较高的计算效率。

2 相关工作

在本章中，首先对SAR图像噪声模型进行了介绍，然后对卷积神经网络的基本原理进行了介绍。

2.1 SAR图像斑点噪声模型

SAR图像的噪声是影响SAR图像成像效果的主要原因，其噪声与常见的加性高斯白噪声（AWGN）数学模型并不相同，它是乘性噪声。所以SAR图像噪声相比一般图像中的加性高斯白噪声更难去除[16]。令Y∈ℝW×H为SAR观测图像，X∈ℝW×H为干净图像，N∈ℝW×H表示乘性噪声。然后用下面的乘性噪声模型[17]来描述SAR图像噪声：

其中，SAR图像中乘性噪声的幅值信号服从伽马分布：

其中，L>1，N>0，Γ(⋅)表示Gamma分布函数，L是等效外观视数（ENL）。

其中，Xˉ和var分别代表SAR图像的均值和方差。

2.2 卷积神经网络基本原理

卷积网络是基于神经网络的局部感受区域仿生特性和权值共享的特点而构造的人工神经网络结构。与生物视觉皮层的神经元局部接受信息特点相似，卷积神经网络中每个神经元只对局部图像进行感知，通过在更高层将局部信息综合获得全局信息。神经元将提取的局部特征映射为一个平面，而同一平面中的神经元共享同一权值，局部感知和权值共享两个特点减少了训练卷积神经网络所需的参数。

一个典型的卷积神经网络LeNet-5的结构主要包含三层：卷积层、池化层和全连接分类层。本文方法只用到了卷积层，没有用到池化层和全连接层。

3 基于卷积神经网络SAR图像去噪

本文构建了一个14层网络和5个跳跃连接结构的卷积神经网络，该网络结构如图1所示。第1层可逆下采样层，第2层包括卷积与激活函数，第3至12层包括卷积层、批归一化和激活函数，第13层是单独的一层卷积层，第14层为可逆上采样层。其中网络的第2层到第13构成了一个非线性映射结构，其结构如表1所示。

去噪方法过程如下：首先将含噪的图像Y大小裁剪为256×256，再将噪声图像下采样变为四个大小为原图像四分之一的子图像作为非线性映射结构的输入。经过非线性映射层映射后得到估计的噪声分布图像，再使用残差学习方法将含噪子图像减去估计的散斑噪声图像，从而得到干净的子图像。最后，利用图像上采样方法将四个干净的子图像上采样合成一个与原图像大小相同但不含有噪声的去噪图像X̂。

3.1 图像下采样

图1 SAR-DSCN网络结构

表1 网络非线性映射结构

由于算法去噪效率是评价SAR图像去噪算法的重要指标。传统基于卷积神经网络SAR图像去噪提高算法效率的方法主要是减小网络的深度。但是，这会导致算法的去噪能力下降。为了提高算法去噪效率，该方法引入了可逆下采样[18]结构。算法利用下采样算子将输入的尺寸为W×H×C图像转换为四个尺寸为下采样子图像，其中C为图像通道的个数，在下采样以后使用卷积运算来提取图片的特征信息。

图像下采样方法还可以有效地扩大感受野。例如，利用一个15层的卷积神经网络与大小为3×3的卷积核，最终输出层将得到感受野大小为62×62。相比之下普通的15层和卷积核大小为3×3的卷积神经网络最终得到的感受野大小只有31×31，只有本文所提出方法的一半。

为了证明下采样方法能够大大提高去噪效率速度。因此，本文使用UC Merced land-use数据集作为实验的训练数据集，并在训练集图像中加入不同等级的噪声(L=1,L=8)用于模拟SAR图像去噪实验。对于灰度SAR图像去噪，实验训练了一个与本文所提出的方法有相同网络深度但没有下采样算子的卷积神经网络。在相同情况下使用图像下采样的卷积神经网络的去噪速度大约比没有使用图像下采样的卷积神经网络的快2.5倍。

3.2 跳跃连接

为了获取图片更多的数据特征，常用的方法是通过增加卷积网络的网络层来提高网络的提取特征能力。但网络层过深会导致网络存在梯度消失问题，使得网络的训练变得更加困难。于是Mao等人[19-20]使用了跳跃连接，将前一层的特征信息直接传递到后面的网络层，这种结构可以避免或减少深度网络中的梯度消失问题。假设在网络中有k个跳跃连接，对于网络的第i层，设L(i)为输入图像。则网络的第(i+k)层的输出为：

由于输入数据和输出数据之间的关系通常是非线性的。因此，F(⋅)要采用非线性函数ReLU作为激活函数如式（5）所示。网络参数W和b需要通过反向传播（BP）算法进行更新。

跳跃连接层是由两个卷积层和一个跳跃连接结构组成（如图2所示），本文整个网络中共有5个这样的结构。

图2 网络的跳跃连接层结构

3.3 残差学习

由于随着网络层数的增加，网络会出现明显退化，常用的网络难以用Conv-BN-ReLU非线性层的叠加来逼近相同的映射，并且网络训练损失函数存在收敛过慢问题，为了加速收敛，提高网络性能。因此本文采用了残差网络学习[21]，使用残差学习可以更快更容易地寻找到接近于最优网络的参数，这就允许向网络中添加更多可训练的网络层。

通过更深网络层数和非线性特征提取，使网络的学习结果更接近图片中的SAR图像的噪声分布特性。然后从含噪的SAR图像中减去训练得到的噪声分布，得到去噪后干净的SAR图像。其中，期望的残差图像与噪声输入估计残差之间的平均均方误差（MSE）作为网络的损失函数，其可以表示为：

其中，Θ表示网络结构参数。{(Yi-Xi)}Ni=1表示N对噪声-干净图像，R(Yi,Θ)表示网络学习到的噪声分布特性。

3.4 网络训练过程

由于真实SAR图像不可避免地存在相干斑噪声，本文采用光学图像模拟SAR图像训练网络。可以利用普通图像和相干斑噪声合成带斑点噪声的仿真SAR图像，并使用仿真图像作为网络的训练集来训练网络。

本文在网络训练过程中主要采用ReLU[22]、批量归一化（BN）[23-24]、Adam算法[25]和BP算法。网络的训练过程如图3所示，卷积神经网络的训练主要分为两个部分：

（1）前向传输部分

①从训练集中选择一个样本(x,y)，将干净图像x作为模型的输入。

②计算该样本的实际输出y0去噪后图像。

（2）后向传播部分：

①计算实际输出图像y0与样本理论值y的偏差。

②按照最小化损失函数方法，通过反向传播方法和Adam算法来调整网络参数。

其中，Adam算法是代替随机梯度下降算法（SGD）作为梯度下降优化方法：

Adam算法动量参数 β1与 β2分别设置为0.9和0.999，停止参数ε=10-8,θt为网络中第t次迭代可训练的参数。

网络的初始学习速率α设置为10-3，训练过程中网络学习速率下降到10-4网络会停止训练；或损失函数减少到设定的阈值时，网络也会停止训练。

4 实验结果与分析

训练并测试网络，利用仿真和实测数据验证本文提出方法的有效性。接下来介绍实验设置和实验结果。

4.1 网络训练数据集与条件

为了验证本文方法的有效性，本文使用UC Merced land-use数据集作为模拟SAR图像去噪的训练数据和测试数据，该数据集包含21个场景，每个场景包含100幅图像。所有的图像大小都被调整为256×256。图像块的大小取40×40。在网络训练过程中，随机从数据集中选取400幅图像作为训练集，并在训练集图像中添加噪声。为了提高网络性能、增强网络的泛化能力，对训练图像进行数据增强，采用镜面翻转操作、垂直翻转和顺时针90°的旋转操作。

实验采用MatConvNet框架，在MATLAB R2016a环境下进行，CPU采用六核AMD Ryzen 5 2600、频率是3.60 GHz。GPU采用Nvidia GeForce RTX-2060、内存8 GB。

4.2 实验比较算法和评价指标

为验证本文算法的优越性，这一节将本文算法与Frost-Filter算法、SAR-BM3D[26]方法、基于Shearlet域的SAR图像去噪方法、SAR-CNN方法和文献[15]算法进行比较。在模拟图像实验中，采用常用峰值信噪比PSNR（Peak Signal to Noise Ratio）和结构相似度SSIM（Structural Similarity Index）作为定量评价指标评估去噪效果，其中PSNR越大，表示图像质量越好，SSIM越大表示去噪后图像与原图像的相似度越高，去噪效果越好。在实际SAR图像去噪实验中，还采用了ENL作为图像去噪评价指标，ENL被认为是评价SAR图像去噪后均匀区域的平滑度，其值越大表明均匀区域越平滑。

4.3 实验结果

本节在普通光学图像中加入4种不同强度噪声，模拟含噪SAR图像，添加的噪声强度从低到高分别是L=1,2,4,8。为了验证本文去噪方法的去噪性能，使用模拟含噪SAR图像和真实SAR图像进行去噪实验。图像去噪后的峰值信噪比（PSNR）和结构相似度指数（SSIM）的相应实验结果如表2所示。

图3 网络训练图

从表2可知，与其他五种去噪方法相比，本文方法得到去噪后图片的PSNR值在大多数情况下更大，说明本文方法的去噪效果比其他五种方法的去噪效果更好。并且在噪声等级增大时，PSNR并没有大幅度的降低，说明该方法对高强度噪声不敏感，在噪声较大时时，也能达到不错的去噪效果。而且在相同噪声情况下本文方法去噪后的SSIM值大部分情况下也是最大的，仿真图像实验结果理论上说明本文方法的去噪后图像与去原图像的结构相似度最高，这说明该方法保存图像细节能力最好。

此外，视觉评价也是定性评价算法去噪性能的另一种方法。为了测试各种方法去噪效果，本实验噪声强度等级设置为L=4，本文方法与经典的Frost-Filter方法、SAR-BM3D方法、SAR-Shearlet方法、较新的SAR-CNN方法和文献[15]方法的去噪效果对比如图4所示，其中图（a）为原始不含噪声图像，图（b）为模拟带噪声图像，图（c）为Frost-Filter方法去噪后图像，图（d）为SARShearlet方法去噪后图像，图（e）为SAR-BM3D方法去噪后图像，图（f）为SAR-CNN方法去噪后图像，图（g）为文献[15]方法滤波图像，图（h）为本文方法去噪后图像。从图中可以看出，Frost-Filter滤波方法去噪效果最差，去噪后图片不但仍然存在噪声，还使得图像边缘细节信息丢失。这是因为Frost-Filter滤波方法是根据图像的局部块的统计特性去噪，这会造成图像的点状目标处的噪声难以很好地滤除。Shearlet域滤波方法在去噪同时仍能保留图像细节纹理信息，但会在图像的边缘产生一些伪吉布斯纹理，这是因为Shearlet变换的平移鲁棒性较差。而SAR-BM3D和SAR-CNN方法具有良好去噪效果，但这两种方法同时存在图像过度平滑问题，导致图像的一些边缘细节和纹理特征丢失。文献[15]方法虽然有较好去噪效果，但是图像出现轻微的模糊。这是因为文献[15]方法的卷积层只有7层，对图片的特征提取能力较低。对比观察红色标注的区域，可以发现采用本文方法去噪后的图像与原始无噪声图像相似度更高，并且在体育馆顶部的纹理结构和局部位置的轮廓更加清晰。本文方法在去除相干斑噪声的同时，更好地保留了图像的边缘细节和纹理信息。同时本文方法在图像去噪同时还避免在图像的边缘处引入伪吉布斯纹理。

为了证明本文方法对于真实的SAR图像的去噪效果也优于其他五种方法，实验采用巴西雨林地区和阿尔卑斯山脉地区的SAR图像对训练好的网络进行去噪评估。先将图像大小裁剪为256×256，再分别使用Frost-Filter方法、SAR-BM3D方法、SAR-Shearlet方法、SARCNN、文献[15]方法和本文方法进行去噪实验。并且本文还使用等效视数（ENL）来衡量不同图像去噪方法的性能。ENL值是从图5中两个红色均匀区域内估算的，阿尔卑斯山SAR图像去噪后的效果图和计算的ENL值结果如图6和图7所示。从图6中可以看出，Frost-Filter滤波的去噪效果比较差，图像去噪后依然存在许多斑点噪声信息。Shearlet域滤波方法能够较好地平滑噪声图像，但会在图像的边缘产生一些伪吉布斯纹理。SARBM3D算法和SAR-CNN算法的去噪效果比较好，均匀区域比较光滑，但也存在少量的信息丢失。文献[15]SAR图像去噪方法和本文SAR图像去噪算法都能很好地抑制斑点噪声，并且在保留纹理信息上也处理得很好。但文献[15]方法的去噪结果存在背景轻微模糊问题，而本文算法能够较好地解决这个问题，在SAR图像去噪同时并保持图像的清晰度。从图7中可以看出本文去噪算法去噪后的ENL值是最大的，这也说明本文去噪算法对SAR图像上的相干斑噪声的抑制能力是最强的。

表2 在噪声等级L=1,2,4,8情况仿真图片去噪后PSNR和SSIM结果

图4 仿真SAR图像去噪实验对比图

图5 巴西雨林地区去噪效果图

4.4 运行时间的比较

图7 各种算法去噪后巴西雨林的ENL结果

对于图5和图6这两幅真实SAR图像去噪的平均运行时间如表3所示。从表3可以看出，本文方法的运行时间相较于其他五种方法要快很多，处理一幅大小大256×256的SAR噪声图片，本文方法大约仅需要0.65 s，大约是SAR-CNN方法的五分之一和文献[15]SAR图像去噪算法的四分之一。这主要是因为本文所提出的去噪方法采用了图像下采样方法和残差学习方法。

表3 256×256SAR图像去噪平均耗时

5 结束语

为了提高SAR图像质量，在消除SAR图像中的相干斑噪声同时并保留图像中的细节和纹理信息，本文提出了一种基于卷积神经网络的SAR图像去斑方法。该方法使用卷积运算来提取图像特征，与传统的卷积神经网络不同，该方法采用下采样算子和残差学习结构，既可以加速学习过程，又可以提高去斑性能。此外，该网络还使用了跳过连接结构来保留图像的详细信息，并避免深度卷积神经网络中存在的梯度消失问题。与传统的去噪算法相比，本文提出的算法的仿真和真实图像实验表明，该方法具有比其他去斑方法更好的去斑点性能。因此，该方法在SAR图像应用中更具竞争力。但是，所提出的去噪方法对于多极化SAR图像去噪较为困难，其噪声模型比单极化SAR要复杂得多。所以，基于改进卷积神经网络对于多极化SAR图像去噪将是今后研究的重点。