王 杰,徐国明,2,*,马 健,2,王 勇,李 毅
(1. 安徽大学 互联网学院,安徽 合肥 230039;2.安徽大学农业生态大数据分析与应用技术国家地方联合工程研究中心,安徽合肥 230601;3. 陆军炮兵防空兵学院 偏振光成像探测技术安徽省重点实验室,安徽 合肥 230031;4. 安徽文达信息工程学院 智能技术研究所,安徽 合肥 231201)
偏振成像是一种新型的探测技术,在获取目标物体信息的同时测量其偏振态,可突破自然场景中目标检测的局限性。由于目标与背景存在偏振特性差异,该技术可在复杂背景下凸显检测目标的纹理、轮廓和粗糙度等信息[1],从而被广泛地应用于生物医学图像分析、三维物体识别、遥感图像处理、目标识别与追踪等领域[2]。传统的偏振成像探测方式一般可分成分时和同时探测两类,空间调制型全偏振成像是继传统偏振成像技术后新兴的成像方式[3]。胡巧云等[4]研究了空间调制型全Stokes 偏振成像系统的原理并实现了数值仿真模拟成像。王成等[5]分析系统传输矩阵的特性,设计了全偏振大气偏振模式成像系统并对系统存在的误差进行了优化。成像距离、大气扰动等因素的干扰使得成像系统投影在焦平面上的图像极限分辨率严重下降[6](即远小于光学成像系统的衍射极限分辨率),导致采集的偏振图像的空间分辨率较低。此外,偏振图像的空间分辨率还受限于所使用探测器的像元数目。
高分辨率的图像在成像探测和识别领域具有重要的价值。随着计算机技术、数字信号处理技术和机器学习的发展,新兴的计算成像技术应运而生[7]。超分辨率(Super-Resolution,SR)方法是图像处理技术和工程应用中常见的技术手段,同时也是底层视觉任务的研究热点。这种以信息驱动和模型计算为中心的计算成像方法可以获得高于成像系统分辨率的图像。经典的超分辨率重建任务独立于成像系统,而新的计算成像技术综合考虑成像全链路过程,这为超分辨率技术直接应用于成像系统提供了契机。图像超分辨率是一种从低分辨率(Low-Resolution,LR)图像重建高分辨率(High-Resolution,HR)图像的计算机视觉任务。徐国明等[8]针对空间调制型全偏振计算成像特点,融合异源图像与空间一致性,提出基于卷积神经网络的场景特征迁移SR 计算成像方式。Zhang 等[9]通过和差重构对重建算法进行了改进。孟祥超等[10]基于多角度偏振成像仪展开研究,通过融合HR 的全色影像和LR 的高光谱影像,重建生成高空间分辨率的遥感影像。基于深度学习和样本特征融合的高光谱偏振图像SR 研究近年来受到了广泛关注[11-12],但在实际应用中仍亟需设计轻量化、高效的高分辨率全偏振成像系统。
近年来,基于卷积神经网络(Convolutional Neural Network,CNN)的方法在SR 任务中表现出色[13-14]。从三层卷积的SRCNN[15]到160 层以上卷积层的MDSR[16],网络的深度和整体性能都随着时间的推移而急剧增长。许多结合注意力机制且具有先进性能的深度SR 网络被提出,例如RFANet[17]和RCAN[18]等。而 这 些SR 网 络 通常会遇到计算资源负担过重的问题,这也限制了其在现实世界的广泛应用。因此,针对图像超分辨率网络的轻量化设计近年来备受关注。轻量级网络在图像超分辨率任务中表现出了显著的性能[19-21]。构建轻量级网络的常用方法可分为两种:构建一个浅网络模型,例如ESPCN[22]和FSRCNN[23]算法,或者通过递归机制共享参数策略。Ahn 等[24]设计了一种基于级联结构的残差SR 网络,该级联结构加快了训练时间且避免无效的递归学习,但重建性能有待改善。Hui 等[25]提出了一种信息蒸馏网络,以实现高效、快速的重构。Kim 等[26]提出了深度递归卷积网络(Deeply-Recursive Convolutional Network,
DRCN),通过递归网络来减少冗余参数。Tai等[27]将递归结构与残差网络相结合,提出了深度递归残差网络(Deep Recursive Residual Network,DRRN)来改进DRCN 结构。Wang 等[28]设计了一种轻量级、高效的自适应加权超分辨率网络(Adaptive Weighted Super-Resolution Network,AWSRN)。
以上方法都取得了不错的重建效果,但大多数网络模型倾向于采用一个标准的框架,即卷积层的简单堆栈,每一层选择特定大小的卷积核且很少考虑图像的分层特征。针对上述问题,本文提出了一种轻量级注意力级联网络的偏振计算成像超分辨率方法(Lightweight Attention Cascading Network,LACN),在保证高性能的同时减少网络的计算复杂度和参数量。具体而言,本文网络的整体框架采用级联连接和融合连接的方式,以减少网络的参数量。同时结合注意力机制赋以不同的权值来提取关键的空间内容特征。本文设计了一个空间金字塔网络结构,从多感受野的角度分析特征编码。通过不同扩张率的空洞卷积来提取偏振图像局部域信息。上采样模块采用参数共享的策略来融合浅层与深层次的重建效果并计算生成高分辨率偏振图像。最后通过信息细化块在网络的末端学习更精细的特征并增强重建图像质量。
随着大数据和图形处理单元(Graphic Processing Unit,GPU)的快速发展,CNN 在单幅图像超分辨率方法(Single Image Super-Resolution,SISR)中得到了广泛的应用。基于CNN 的SR 技术主要包括以下三种:使用高频特征训练SR 模型[27],使用低频特征训练SR 模型[23]和结合高频和低频特征训练SR 模型[14]。基于卷积神经网络的级联结构能够更好地表征上述三种方法。借助级联多级网络逐步地提高分辨率,以明显地改善SISR 重建性能。Tian 等[29]通过在堆叠的特征提取块中使用异构卷积提取低频特征,然后利用特征优化块学习更精确的高频特征得到高分辨率 的 重 建 图 像。级 联 密 集 网 络[30](Cascading Dense Network,CDN)从每个卷积层中提取分层特征,然后将这些特征通过级联密集方式连接起来,解决了梯度消失问题从而提高了图像超分辨率重建的性能。将两个子网络级联起来增大网络宽度可以优化鲁棒性进一步提高网络模型的重建质量。此外,通过级联结构对深度网络进行压缩,能有效地提高SR 模型的训练效率。级联残 差 网 络[24](Cascading Residual Network,CARN)通过级联方式连接递归块,实现了高精度的重建效果。CARN 网络中使用了卷积核大小为1×1 的卷积层。该级联结构减少参数的同时极大地节约了训练时间。Ahn 等[31]将特征通道进行分组并同时开始学习新的特征映射,以提高SISR 的训练效率。该级联网络通过将群组卷积和权重分类输入残差网络,以获得处理LR 图像的最高效率。受上述工作的启发,本文设计了一个轻量级注意力级联网络来快速、准确地提取特征并实现高性能。
注意力机制在现代计算机视觉任务中受到了越来越多的关注,如图像字幕、图像和视频分类、图像超分辨率重建等。它可以被解释为一种引导,将可用资源分配给输入信号中信息量最大的部分。Hu[32]等提出了一种压缩和激发网络(Squeeze-and-Excitation Network,SENet)。利用通道间的相关性,在图像分类方向取得了显著的效果。注意力机制在图像处理领域已被广泛研究并显示出强大的优势。近年来,一些基于注意力机制的SR 模型被提出,进一步提高了图像超分辨率重建效果。目前,大部分的图像超分辨率方法主要关注通道注意力机制和空间注意力机制。Zhang 等[18]提出了一种残差通道注意力网络(Residual Channel Attention Network,RCAN),将通道注意力机制引入到改进的残差结构中。该机制使用全局平均池化的方法提取通道统计量,称为一阶统计量。Dai 等[33]提出了一种新颖的二阶注意力网络(Second-order Attention Network,SAN),利用二阶特征统计量来探索更丰富的信息区域。Liu 等[17]提出了一种残差特征聚合网络,该框架通过结合增加的空间注意力机制来聚合信息丰富的残差特征,以产生更有代表性的特征。假设给定一个目标特征p和一个关键特征c,注意力函数yp通过衡量目标特征与关键特征配对的相关性得出注意力权重然后自适应地聚合关键内容[34]。该注意力机制表征过程可表示为:
其中:n表示注意力函数对应的个数,Ωp表示目标特征选取的关键区域,An(p,c,fp,lc)表示第n个注意力函数输出的注意力权重,fp表示目标特征的内容,lc表示关键特征的内容,Wn和W'n表示可学习的权重。通常,注意力函数的权重在目标特征 选 取 的 关 键 区 域 内 归 一 化 ,即满足(p,c,fp,lc)=1。
图1 所示为本文所设计的轻量级注意力级联网络结构。该结构主要包括:浅层特征提取模块、非线性特征映射模块、重建模块和信息细化块。首先,网络输入的低分辨率偏振调制图像ILR将经过一个卷积核大小为3×3 的卷积层来提取浅层特征H0并过滤部分低频特征,即:
图1 轻量级注意力级联网络结构Fig.1 Network architecture of lightweight attention cascading network
H0=f0(ILR), (2)其中,f0(⋅)表示输入偏振图像ILR的浅层特征提取函数。
提取的浅层特征H0通过级联注意力网络学习非线性映射并在残差结构中提取深层特征。非线性特征映射模块由若干个级联注意力块(Cascading Attention Block,CAB)、多尺度注意力块(Multi-scale Attention Block,MSAB)和长跳跃连接构成。深层特征H1的提取过程可表示为:
H1=δ(H0), (3)
其中:δ(⋅)表示非线性特征映射阶段的深层特征提取函数。然后,提取的深层特征通过参数共享的上采样重建模块。值得注意的是,不同于其他方法,该上采样层采用双路径,通过融合浅层特征与深层特征的重建效果计算生成高分辨率偏振图像。该过程可表示为:
H2=fup(H1)⊕fup(ILR), (4)
其中:fup(⋅)表示上采样函数,⊕表示不同的特征逐像素相加操作,H2表示本文网络计算生成的高分辨率特征图。
最后,通过信息细化块对计算生成的粗高频特征进行细化,得到更精确的高分辨率特征,以实现良好的重建性能,即:
ISR=fIRB(H2)=fLACN(ILR), (5)
其 中:fIRB(⋅)表 示 信 息 细 化 块 的 函 数 功 能,fLACN(⋅)表示所提超分辨率网络的函数功能,ISR为本文LACN 网络的输出偏振图像。
为了使模型更加轻量化,网络采用了多尺度学习的方法。借助该策略可使用一个单一的训练模型处理多尺度空间域。这有助于在移动设备上应用SR 程序时减轻沉重的模型参量负担。图2 展示了多尺度注意力块的空间金字塔网络结构,该结构从多感受野的角度分析特征编码。通过结合空间注意力和通道注意力机制进一步优化网络的表征能力。考虑到不同感受野下的局部空间分量差异,本文设计了不同扩张率的空洞卷积(DiRate)来提取多尺度特征。该空间金字塔结构使用了四个并行的卷积核大小为3×3 的空洞卷积来计算多尺度局部域信息,其卷积层的感受野大小分别为1、2、4 和8,该过程可表述为:
图2 空间金字塔网络结构Fig.2 Network structure of spatial pyramid
Fr=fr k×k(F0), (6)
其中:F0表示空间金字塔网络的输入特征;fr k×k(⋅)表示卷积核大小为k×k的空洞卷积的功能函数,其中r表示扩张率;Fr表示经过空洞卷积层后的输出特征。
空间注意力模块网络结构如图3 所示。通过调整特征空间的权重,以突出细节更多和纹理复杂的可用区域且抑制平滑区域,从而获取已知区域的重要空间信息。将空间金字塔网络与空间注意力块(Enhanced Spatial Attention,ESA)结合使用,可提高空洞卷积提取局部域信息的效率。此外,借助空间注意力机制将多尺度特征集中在关键的空间内容上,以获得更具代表性的特征,即:
图3 空间注意力块的网络结构Fig.3 Network structure of enhanced spatial attention block
Fs=Fr⊗χ(Fr), (7)
其中:χ(⋅)表示空间注意力机制的功能函数,Fs表示经过ESA 注意力块后的输出特征,⊗表示元素相乘的操作。然后,将并行提取的多尺度特征连接为Fg=[F1s,F2s,F4s,F8s,F0]。
对于深层特征,空间注意力更关注每个通道中的局部特征,而通道注意力从多空间角度全局地分析所有的特征图。图4 展示了通道注意力网络结构。通过全局平均池化操作将特征通道的全局空间信息转换成对应的通道描述符。该机制可显式地建模通道之间的相互依赖关系,以提高表征能力并保留有效的特征。考虑到特征通道之间的相关性,本文网络将输出特征Fg发送到通道注意力模块,可自适应地调整通道特征强弱。经过通道注意力块后的输出特征Fc,即:
图4 通道注意力机制网络结构Fig.4 Network structure of channel attention mechanism
Fc=ϑc(Fg)⊗Fg, (8)其中,ϑc(⋅)表示通道注意力机制的函数。
最后,使用一个卷积核大小为3×3 的卷积层来减小通道维度,并进一步整合加权多尺度特征。输出特征F1可表示为:
F1=f(Fc), (9)
其中:f(⋅)表示卷积核为3×3 的卷积层特征提取功能。
大多数图像超分辨率方法通过增加更多的非线性网络来增强模型的表征能力,这意味着需要搭建更多的卷积层和激活函数。然而,这种方案不可避免地降低了计算成像的速度。为简化结构和提高特征利用率,本文将重点放在探索层与层之间的连接模式上而非盲目地堆叠网络深度。级联注意力块CAB 的网络结构如图5 所示。CAB 选用了三个3×3 标准卷积层。对于输入部分,前一个卷积层抑制的特征不能再被后续卷积层学习。为解决该问题,本文引入了级联连接,将CAB 的输入特性作为每个卷积层输入的补充。对于输出部分,仅使用最后一层的输出导致鲁棒性不足。因此,本文采用融合连接方式传输卷积层产生的分层特征,并利用1×1 卷积层聚合分层特征。LeakyReLU[35]激活函数建立在ReLU函数的基础上,当x小于0时引入极小值γ作为梯度,可以避免神经元坏死。该过程可表示为:
图5 级联注意力块的网络结构Fig.5 Network structure of cascading attention block
其中,f(⋅)表示卷积核为3×3 的卷积层特征提取功能;η(⋅)表示LeakyReLU 激活函数功能;⊕同公式(4)中含义;Fi表示CAB 中第i个标准卷积层的输出特征,其中i的取值为1,2,3;Fm-1与Fm分别表示级联网络的输入与输出特征;Fg表示不同Fi的连接融合特征;f1(⋅)表示卷积核为1×1 的卷积层特征提取功能;β(⋅)表示增强空间注意力机制的函数功能。
以往的工作[27]验证了结合高频和低频特征来重建高分辨率图像的方法能取得不错的效果。但常见的SR 方法往往仅使用LR 图像来提取低频特征,然后通过上采样重建模块将获得的低频特征转换为粗高频特征,这会导致粗高频特征可能缺乏高频特征的详细信息。为解决该问题,本文提出一种信息细化块来学习更精确的SR 特征,并重建生成高质量超分辨率图像。信息细化块由4 层Conv 结 合ReLU 和1 层Conv 组 成。Conv 结 合ReLU 层包括一层标准卷积层和一个ReLU 激活函数,其卷积核大小为3×3,输入和输出通道数均为64。最后一层卷积层的卷积核大小为3×3,输入和输出通道数分别为64 和3。
常见的图像目标优化函数包括MSE、L1和L2。使用MSE 和L2优化函数的SR 方法往往导致超分辨率图像产生过于平滑的纹理。为了避免引入不必要的训练技巧并减少计算量,本文利用L1损失函数对SR 网络进行优化。假设给定一组训练集,其中包含N个LR 输入图像及与之配对的HR 图像,通过研究在不同下采样倍数下的HR-LR 配对映射关系来建模训练模型。训练LACN 网络的目标是实现L(θ)损失函数的最小化,即:
其中:φ(⋅)表示本文SR 网络的函数功能,θ表示LACN 网络的参数集,‖ ‖1为1 范数。通过随机梯度下降的方法来优化L(θ)损失函数。
本研究是为自行研制的非制冷像元耦合的空间调制型双通道高光谱全偏振相机提供超分辨率模块,实验的偏振数据集由该设备在多种场景下获取。光谱偏振相机由前置光路组件、空间调制模块、液晶可调谐滤光片、成像光路组件和面阵探测器模块五个部分构成。在给定谱段下,该相机可对探测目标进行完整偏振状态的高效、快速测量,如图6 所示。成像系统利用Stokes 矢量的空间调制原理[8],将Stokes 矢量(S0~S3)同时调制在一幅图像中。一次采集便可获取探测目标4 个Stokes 矢量的调制信息。采集的调制图像可解析出不同的偏振参量图像。本文采用600 幅自建的全偏振数据集同时加入公开数据集DIV2K[36](800 幅)进行模型训练,并通过随机旋转90°、180°、270°和水平翻转的方式进行数据增强。选用多种目标场景下的偏振调制图像(分辨率为640×512)评估模型性能。对高分辨率的偏振训练样本进行不同倍数的双三次下采样处理并同时添加噪声与模糊,以获取对应的低分辨率偏振图像。实验的主要内容是通过研究不同超分辨率尺度下的HR-LR 映射关系来建模训练网络模型,并分析网络的关键模块同时与其他SR 方法进行对比实验,以验证本文算法的有效性。
图6 光谱偏振相机Fig.6 Spectral polarization camera
实验平台的CPU 为Intel(R)Core(TM)i9-10900X,128 GB RAM,GPU 为NVIDIA Quadro RTX 6000(24 GB),Cuda11.2。模型训练的环境为Python 3.6,编程框架为Pytorch 0.4.1。采用MATLAB R2019 测试评估网络性能。
实验通过客观定量分析、主观定性分析两方面进行评价。将偏振图像转换到YCbCr 空间[37]的Y 通道(即亮度分量)上进行测试。采用峰值信噪比(Peak Signal-to-noise Ratio,PSNR)和结构相似性(Structural Similarity,SSIM)来评估不同对比方法的重建图像质量。
本文网络结构中,CAB 的数量设置为12,CAB 中默认设置三个3×3 标准卷积层。网络的输入通道数为32。最小训练批次的大小设置为16,在每批次训练中,提取大小为48×48 的LR偏振样本作为网络的输入并对网络进行1 000 个回合(epoch)的迭代训练。对于不同的超分辨率尺度(包括×2、×3、×4),本文分别训练相应的模型,共花费约72 小时。所提的网络模型由Adam 优 化 器[38]训 练,初 始 学 习 率 为10-3。每 训 练200 个epoch 之后(即2×105次迭代),反向传播迭代的学习率会衰减一半。选择L1损失函数对网络进行训练。
如图7 和图8 所示,本文选取机载光谱偏振相机对地观测采集的部分建筑物和合肥南站的短波红外偏振图像作为测试样本集。在本节中,通过消融实验讨论LACN 不同组成部分的作用。
图7 建筑物的偏振图像Fig.7 Polarization images of building
图8 合肥南站的偏振图像Fig.8 Polarization images of hefei south railway station
4.3.1 CAB 模块中注意力机制分析
为了分析ESA 模块在级联结构CAB 中的作用,本文在CAB 没有ESA 模块的情况下进行网络训练。实验选用建筑物的偏振图像集进行4 倍SR。如表1 所示,与原始LACN 模型相比,没有ESA 模块的网络的PSNR 降低了0.07 dB,SSIM也有所下降,说明ESA 模块可以提高模型的重建性能。
表1 空间注意力网络对重建结果的影响(×4 SR)Tab.1 Effect of enhanced spatial attention network on reconstruction performance(×4 SR)
4.3.2 MSAB 模块对重建结果影响
为了验证提出的MSAB 模块的有效性,从本文的网络模型中移除MSAB 块并重新训练网络。表2 为网络模型在建筑物的偏振数据集上进行4倍SR 的结果。可以看出,MSAB 模块确实有利于SR 性 能。4 倍SR 的PSNR 从38.87 dB 上 升到38.93 dB,SSIM 也有所提高。
表2 MSAB 模块对重建效果的影响(×4 SR)Tab.2 Effect of MSAB module on reconstruction performance(×4 SR)
4.3.3 信息细化块对重建结果影响
非线性特征映射模块强调低频特征的作用,重建模块具有将低频特征转化为粗高频特征的能力,忽略了高频特征的影响。在此基础上,本文设计了信息细化模块。具有4 个Conv结合ReLU 的信息细化块可以从重建模块中提取更精确的高频特征,从而减小了预测的SR 图像与目标HR 图像之间的差异。再通过一次卷积操作即可重建高质量的SR 图像。实验选用建筑物的偏振数据集进行4 倍SR。从表3 可以看出,信息细化块对LACN 网络的性能有很大的提高,说明有信息细化模块效果更好,改进了重建性能。
表3 信息细化块对重建性能的影响(×4 SR)Tab.3 Effect of information refinement block on reconstruction performance(×4 SR)
4.3.4 重建模块的优势
为了验证所设计的重建模块的优越性,本文采用常见的亚像素卷积单路径操作[15](路径1)来代替所提的双路径方式(路径2)进行实验分析。表4 为不同路径重建模块的模型在建筑物的偏振图像上进行4 倍SR 的结果。可以看出,改变重建模块后,4 倍SR 的PSNR 从38.93 dB 下降到38.85 dB,SSIM 也略有下降,说明所提重建模块确实有助于改善重建效果。
表4 不同路径的重建模块客观效果对比(×4 SR)Tab.4 Objective comparison of reconstruction modules of different paths(×4 SR)
4.3.5 网络模型深度选择
为了检验网络深度对重构性能的影响,本文在深层特征提取阶段深化了网络层。考虑到超分辨率网络的轻量化设计,本文简单地在非线性特征映射模块增加CAB 块的数量来研究网络性能的变化。实验选用合肥南站的偏振图像集进行3 倍SR,PSNR 和SSIM 的客观评价结果如表5 所示。可以看出,随着网络深度的增加,模型参数量逐渐增加,PSNR 也呈逐渐增加的趋势。但是,网络的深化必然会导致计算复杂度的增加且占用更多的内存。为了在精度和参数之间取得平衡,12 个CAB 块的网络模型似乎是更合理的选择。
表5 不同网络深度对重建效果的影响(×3 SR)Tab.5 Effect of different network depths on reconstruction performance(×3 SR)
为验证本文算法的有效性,实验选取一组全偏振图像集进行测试,如图9 所示。测试实验的客观评价指标为PSNR 和SSIM。PSNR 的数值越大表明重建性能越高,SSIM 度量图像相似性,其数值越大说明相似性越高、重建效果越好。将本文方法与SRCNN[15]、FSRCNN[23]、MSRN[39]、AWSRN[28]等方法进行对比实验,验证2 倍、3 倍、4 倍超分辨率性能。
4.4.1 客观定量分析
从表6 的实验结果可直观看出,本文方法在2 倍、3 倍、4 倍超分辨率上都展现了良好的性能。相较于浅层轻量级网络的SRCNN、FSRCNN 方法,本文方法的PSNR 和SSIM 值都大幅度提高,明显提升了重建效果。LACN 模型与计算成本较高的模型相比,也得到了可观的结果。相对于深度网络MSRN,本文方法的评价结果也基本保持最优或者接近,所提的模型参数量仅约为MSRN 模型的9%。AWSRN 为一种轻量级、高效的超分辨率网络。本文方法的模型参数量仅约为AWSRN 模型的38%,且优于该方法的重建效果。实验结果充分说明了本文方法的有效性和优越性。
表6 不同SR 算法在全偏振图像集上的评价指标对比Tab.6 Indicator comparison of different SR algorithms on fully polarization image set
此外,本文将上述代表性的SR 方法进行模型复杂度评估。为了进行合理的比较,实验所有的SR 方法都在图9 所示的全偏振数据集上进行3 倍SR 评估。图10 展示了该数据上不同模型参数量与重建性能的比较。图11 为该数据集上不同模型重建性能与运行时间的比较。值得注意的是,所提出的方法是相对快速的,同时保证了良好的重建性能。实验结果进一步说明本文方法可以在模型复杂度与性能之间实现更好的平衡。
图9 不同的偏振图像Fig.9 Different polarization images
图10 不同模型参数量与重建性能的比较Fig.10 Comparisons of the accuracy and model parameters
图11 不同模型重建性能与运行时间的比较Fig.11 Comparisons of the rebuild performance and speed
4.4.2 主观定性分析
图12~14 展示了不同方法的重建可视化结果。可以观察到,本文模型的图像重建质量在线条、模式及纹理方面优于其他SR 模型。图12 显示了渡江战役纪念塔全偏振图像的2 倍SR 结果。从重建后的图像细节展示即图中标记区域两个“石阶梯”可看出,本文方法重建图像纹理细节更加清晰,视觉效果改善最佳。SRCNN 和FSRCNN 重建后的图像明显背景虚化,图像模糊。MSRN 和AWSRN 方法的重建图像的质量有所提高,仍存在平滑边缘,模糊伪像等问题。图13 展示了采集的合肥骆岗机场跑道全偏振图像的可视化结果。本文方法重建的“条纹”亮度均匀,细节纹理清晰,优于其他方法的重建效果。其他方法恢复高频分量的能力有限,重建出的“条纹”模糊伪影、边缘模糊,而本文方法重建“条纹”图像消除了负面干扰,更加接近HR 图像的质量。图14 为建筑物全偏振图像的4 倍SR 可视化结果。从图中可看出,本文方法对纹理丰富、不规则结构图案的重建效果较为出色,可以最大限度地恢复复杂纹理细节并抑制振铃效应的干扰。而其他算法不能充分提取特征内容,难以恢复高精度的纹理信息,并且重建图像存在边缘模糊、纹理不清晰等问题。本文算法的PSNR 和SSIM值也优于其他SR 算法。
图12 纪念塔全偏振图像上2 倍SR 的可视化结果Fig.12 Visualized results of×2 SR on monument fully polarization image
图13 在机场跑道全偏振图像上3 倍SR 的可视化结果Fig.13 Visualized results of×3 SR on airport runway fully polarization image
图14 在建筑物全偏振图像上×4 SR 的可视化结果Fig.14 Visualized results of×4 SR on building fully polarization image
上述可视化的对比结果表明本文提出的LACN 模型具有强大的表征能力,可抑制平滑分量、重建更多高频细节,有效地改善了视觉效果。
本文提出了一种轻量级注意力级联网络来改善偏振计算成像超分辨率重建效果。所提方