空域协同自编码器的高光谱异常检测

2022-10-21 01:56樊港辉马泳梅晓光黄珺樊凡李皞
中国图象图形学报 2022年10期
关键词:编码器空域光谱

樊港辉,马泳, 2,梅晓光, 2*,黄珺, 2,樊凡, 2,李皞

1.武汉大学电子信息学院,武汉 430072;2.武汉大学宇航科学与技术研究院,武汉 430079;3.武汉轻工大学数学与计算机学院,武汉 430023

0 引 言

高光谱图像(hyperspectral imagery, HSI)是由上百幅窄波段图像堆叠而成的3维立方体,包含比红外和多光谱图像更为丰富的光谱信息,广泛应用于矿物探测、农业和国防(Ma等,2019;Mei等,2019;刘康 等,2020)等领域。异常检测是高光谱遥感探测领域中的一个重要组成部分,目的在于能自动搜寻场景中潜在的目标,尤其在目标的光谱特性无法获取的场景下具有十分重要的研究意义和实用价值。

对高光谱异常检测的算法大致分为基于统计的方法和基于表示的方法两类。基于统计的方法(Reed和Yu,1990;李普煌 等,2018)从概率统计的角度对背景进行建模,通过计算各样本点与模型分布的拟合程度判断是否为异常样本。基于表示的方法(Xu等,2016;朱德辉 等,2020)针对背景和异常各自的特点,通过优化理论求解满足这些特点的矩阵,从而分离出异常。这两类方法模型简单、易于理解,探测效果较好且计算量较小,但仍存在以下问题:1)算法的探测效果取决于模型假设是否符合真实场景的统计分布,当不相符时会导致模型失效(Imani,2017);2)只利用了原始数据的浅层特征(如均值、协方差矩阵等),没有利用更深层次的特征。此外,Chang等人(2019)指出波段冗余现象,尤其对于高维数据,会进一步降低异常与背景之间的可分性。高光谱数据一般包含上百波段,数据冗余导致的异常探测性能下降效应尤为明显。

自编码器(autoencoder,AE)作为一种无监督的神经网络模型,通过最小化重构误差获得更抽象、深层的特征,已成功应用于高光谱图像处理相关领域(Su等,2019;Shi等,2019)。在高光谱异常检测方面,自编码器更倾向于学习到能代表背景样本的低维特征,而忽略小部分代表异常的样本,故可通过样本重构误差对样本分类。然而,高光谱图像不仅包含光谱信息,同时也包含空间信息,具有图谱合一的特点。上述方法只利用了高光谱图像数据的光谱维,而抛弃了目标像素间的空间关系,限制了算法的探测性能。针对以上问题,学者对AE进行改进。Lu 等人(2020)鉴于流形能保持相似样本之间在低维子空间的相似性,将流形约束嵌入到AE的损失函数中,从而保证AE学到的低维表示能保持原数据之间的相似性关系。Xie等人(2019)基于光谱约束下的对抗自编码器,利用像素点的8邻域表示该数据点,并利用对抗自编码器重构原始数据样本,通过重构误差筛选出场景中可能存在的异常。上述方法在一定程度上利用了图像的空间信息,提高了算法在高光谱异常检测方面的性能,但对噪声较为敏感,对微弱目标的检测能力不高。同时,绝大多数基于AE的异常检测算法将整幅高光谱图像视为训练样本,可能致使AE学习到异常的一些特征,不能很好地分离出异常。

鉴于上述分析,本文提出一种基于空域协同自编码器的高光谱异常检测算法,框架如图1所示。首先,为了引入空域信息,借助块图模型以突出弱小目标。具体来说,通过主成分分析(principal component analysis,PCA)对原始图像进行降维处理并分块展开,利用低秩稀疏矩阵分解算法得到稀疏部分,经重构得到异常检测的空间响应D1。在光谱域上,为了给AE提供更纯净的背景训练集,将D1得到的先验探测结果用于指导纯净样本集的构建,经筛选构建出的训练集更适合于高光谱异常检测任务。由该样本集训练AE得到光谱域的探测结果D2。为了将空域信息融合进探测结果,利用D1构建了一种加权方式,进一步突出目标、抑制背景,得到最终探测结果D。本文的创新点主要体现在:1)针对AE模型存在的对训练集的强噪声和异常样本敏感问题,提出从空域角度筛选并构建样本集的策略。引入红外图像处理中的块图模型以抑制背景,保证构建样本集内尽可能只包含背景而不包含异常。2)设计了一种非负权重以进一步抑制背景,该权重在保留异常响应的同时惩罚背景响应。同时,该非负权重还将空域信息引入到最终的探测结果,增大了异常与背景之间的区分度,进一步提升了自编码器算法的异常检测性能。

图1 本文算法流程图

1 本文算法

1.1 自编码器

z=g(1)(W(1)x+b(1))

(1)

式中,W和b分别为自编码器的权重和偏置,g(·)为某种非线性激活函数,本文设置为sigmoid函数。在训练阶段,以重构误差为代价函数,利用梯度下降法及反向传播算法更新权重及偏置参数,直至满足迭代终止条件。在测试阶段,由于AE学习占比更大的背景的特征,对异常的重构结果通常较差。因此,可以利用重构误差作为准则判断某输入样本是否属于异常。然而,传统的基于AE的异常检测算法利用所有样本构建训练集,其中包含异常样本。因此,为进一步降低残差,自编码器会学习异常样本的特征,从而降低背景和异常之间的区分度。同时,传统的AE没有考虑高光谱图像的图谱合一特性,丢失了空域信息,进一步限制了算法的性能。

1.2 块图模型

针对传统自编码器存在的上述问题,本文提出从空域的角度筛选纯净背景像元的策略。由于背景存在非局部自相似性,而目标具有稀疏特性。Gao等人(2013)利用红外图像数据具有的这种结构,提出红外块图(infrared-patch image,IPI)模型,将红外小目标检测问题转化为低秩稀疏矩阵的求解问题。实验表明,IPI模型在信杂比增益(gain of signal-to-clutter ratio,GSCR)和背景抑制因子(background suppress factor,BSF)两个指标上明显优于传统红外小目标检测算法,如最大中值滤波器、局部对比度方法等(王好贤 等,2019)。受此启发,本文将块图模型引入高光谱异常检测算法,用于得到异常像素的空间响应,如图2所示。首先,为避免高光谱数据维度过大导致的计算量问题,对高光谱图像在光谱域进行PCA处理并取前3维,PCA前3维保留了图像大部分空域信息。然后,在空域上通过滑窗取出图像块并展开成列后拼接成矩阵P。记窗口大小为a,移动步长设为b,且a>b。借助背景图像的非局部自相似性以及异常像素点的稀疏特性,这个矩阵可以看做是包含背景的低秩矩阵L与包含小目标的稀疏矩阵S之和。最后,通过重构稀疏部分S,得到异常检测结果。

图2 块图模型及求解过程

上述问题可转化为优化问题的求解,其数学形式表示为

s.t.P=L+S

(2)

s.t.P=L+S

(3)

(4)

式中,〈·〉为矩阵内积操作符,Y为拉格朗日乘子,μ为正的惩罚因子。最小化式(4)可通过ADMM(alternative direction method of multipliers)算法迭代求解。求解过程如下:

1)固定其他参数,更新L。目标函数为

(5)

该问题的解可由奇异值阈值(singular value thresholding,SVT)算子(Cai等,2010)得到。

2)固定其他参数,更新S。目标函数为

(6)

该问题可由软阈值算子(Donoho,1995)求解。

3)固定其他参数,通过梯度上升法更新Y,具体为

Y=Y+μ(P-L-S)

(7)

迭代更新求解目标函数式(5)—(7),直至收敛。

1.3 基于空域协同自编码器的异常检测算法

自编码器以重构误差为判决准则,原理简单且易实现,在数据异常侦测方面的性能与传统算法相当,甚至优于传统算法。但自编码器对高强度噪声及异常数据较为敏感,在训练阶段需要纯净的背景光谱数据。同时,传统的AE框架没有考虑空域信息,进一步约束了算法的探测性能。为避免自编码器的上述缺陷,本文从空域角度筛选背景样本,并引入块图模型抑制背景,用于指导自编码器背景训练集的构建。具体来说,首先从空域角度出发,利用块图模型得到空域异常响应结果D1。按D1各像元值由低到高从原始高光谱数据集中选择占比为k×100%的样本作为AE的训练样本集。由于块图模型具备优良的背景抑制能力,指导选择出的样本有更高的置信度为背景,相比于随机选取训练样本具有更明显的优势。简单起见,k值固定为50,即选取一半样本作为AE的训练集。自编码器利用块图模型指导选择出的样本集进行训练,并以重构误差作为判断准则,得到光谱域的探测结果D2。

为了进一步提升算法的探测性能,充分利用块图模型在空域的结果,构造权重w,满足

w=1-e-10·d

(8)

式中,d为样本点在块图模型探测结果D1对应坐标位置处的响应值。w随空域响应d的变化曲线如图3所示。可以发现,d值越小,该样本点有越大概率为背景,对应的权重越小;d值越大,该样本越可能为异常,权重逐渐趋近于1。因此,权重w可进一步抑制背景,增大异常与背景之间的区分度。

图3 w随空域响应d的变化曲线

综上,得到权重矩阵W,最终的探测结果D为

D=W∘D2

(9)

式中,“∘”为Hadamard积。

本文提出的基于矩阵分解和自编码器的高光谱异常检测算法总体流程如下:

输入:高光谱图像H∈RM×N×L;块图模型相关参数λ、a和b;自编码器相关参数nhid和k。

1)对高光谱图像H从光谱域进行PCA并取前3维,按图2构建块图模型;

2)迭代求解问题(5)—(7),得到稀疏部分S,重构后在光谱维求平均,得到空域异常响应D1;

3)由D1选择值最小的k×100%个像元对应的光谱数据作为自编码器的训练集,更新网络;

4)将高光谱图像逐像素投入训练好的自编码器,以重构残差为准则得到光谱域异常响应D2;

5)由空域响应D1构造权重矩阵W;

6)由式(9)得到最终探测结果D。

2 实验结果及分析

2.1 数据集

图4 3组高光谱数据集的伪彩图像及其异常真值图

2.2 参数分析

影响算法探测性能的相关参数主要包括调节因子λ、图像块尺寸a及滑动步长b、隐含层的节点个数nhid以及选取的主成分个数p。在验证各参数的影响之前,将D1进行滤波器尺寸为3 × 3的最大值滤波。简单起见,引入图像块相关参数c,设置滑动步长b=floor(c×min(M,N)),floor(·)为向下取整符号,图像块窗口大小a=2b-1。

2.2.1 调节因子λ

由优化函数式(3)可知,调节因子λ用于权衡低秩部分和稀疏部分所占整体信息的多少。λ越大,对S的惩罚越重,低秩部分L占有更多的信息;相反,λ越小,稀疏部分S占有更多的信息。图5展示了λ分别取10-4、10-2和100时分解得到低秩部分和稀疏部分的结果。合适的λ能增强稀疏矩阵S对背景的抑制,而过大的λ会丢失目标信息。

图5 λ取不同值时得到的低秩部分和稀疏部分

为进一步分析λ对最终探测结果的影响,设λ从{10-5, 10-4, 10-3, 10-2, 10-1, 100}中选取,参数c设置为0.05,nhid设为100。探测结果如图6所示。纵坐标AUC(area under curve)用来衡量优劣随着λ增大,算法探测性能逐渐提升。因为矩阵分解过程中对稀疏部分的惩罚加重,使得矩阵S保留更显著的目标信息,同时抑制非目标稀疏噪声。但当λ过大时,对S的惩罚加重,使S丢失目标信息,算法探测性能下降。本文将Sandiego-1和Botanical Garden数据集的λ均设置为10-2,Sandiego-2数据集的λ设置为10-1。

图6 λ对最终探测性能的影响

2.2.2 图像块相关参数c

由于不同图像中目标的大小存在差异,块图模型中图像块尺寸会影响矩阵分解的求解效果。同时,图像块尺寸a和滑动步长b决定所构造矩阵的规模,进而影响块图模型背景抑制的能力以及算法的运行效率。本文通过参数c分析a和b对结果的影响。c从0.01按0.01递增直至0.1。算法最终探测结果如表1所示。从表1的结果可知,参数c既影响算法的探测结果,也影响算法的运行效率。因为图像块参数c影响图像块包含目标信息的多少,同时决定了所构造矩阵的尺寸。兼顾算法的性能和效率,本文设置3组数据集的参数c均为0.06。

表1 参数c对最终探测性能的影响

2.2.3 自编码器隐含层节点个数nhid

自编码器的隐含层节点个数nhid决定了隐空间保留的原始数据信息的多少。过少的隐含层节点个数会丢失背景的光谱信息,不利于正常样本点和异常样本点的分离;而过多的隐含层节点个数没有起到提取有区分度特征的作用。结合2.2.1节和2.2.2节,设置调节因子λ在3个数据集上的值分别为10-2、10-1和10-2,图像块相关参数c均取0.06。设nhid从{20, 40, 60, 80, 100, 120, 140, 160}中选取,探测结果如图7所示。由图可知,当nhid≥40时,算法的最终探测结果趋于最佳且相对保持稳定,当nhid<40时,探测性能相对较差。因为过小的隐含层节点个数导致AE无法有效学习到正常样本的特征,导致正常样本的重构误差增大,加大了区分背景和异常目标的难度。简单起见,本文设置3组数据集的参数nhid均为100。

图7 nhid对最终探测性能的影响

2.2.4 选取的主成分个数p

在块图模型中,选取的主成分个数p决定了所保留的信息量的多少。p值过小,会丢失大量原有信息;p值过大,会增加冗余计算。因此,为探究p不同取值对算法性能和耗时的影响,同时兼顾性能和耗时,设置p从{1, 2, 3, 5, 10}中选取,探测结果如表2所示。由表2可知,当选取的主成分个数为1时,探测性能最低。随着选取主成分个数的增加,算法的探测性能变化较小,但耗时增加。因为选取的主成分是用于空域响应提取,当个数达到一定阈值时,得到的空域响应保持一致,但由于待分解矩阵的规模增大,导致耗时增加。兼顾性能和耗时,本文选取的主成分个数设置为3。

表2 选取的主成分个数对算法性能和耗时的影响

2.3 算法架构分析

为验证本文提出的基于空域协同自编码器的高光谱异常检测算法的合理性,设置了多组对比算法进行实验,通过对比不同算法在3组高光谱数据集上AUC值的大小来衡量算法的优劣。本文算法通过块图模型从空域筛选背景数据集,并充分利用空域信息协同自编码器以提升算法检测性能。实验采用的对比算法包括:1)通过属性滤波(attribute filter,AF)替代块图模型以验证块图模型在空域对背景抑制方面的优势,称为AF-AE方法。AF是一种高光谱目标探测的空域算法,并得到广泛的研究和应用(张香萍,2017;Kang等,2017)。2)AER(autoencoder random-sampling)方法。采用随机采样的方式选取自编码器的训练样本,以得到单独采用AE模型得到的异常检测结果。采样的样本个数与本文算法一致,均为样本总体的一半。3)D1和D2,这是本文算法中块图模型得到的空域异常响应及AE得到的光谱域异常检测结果。值得注意的是,这里的D2与块图模型得到的结果D1相关。实验中通过调参使上述算法均能达到最优的异常检测性能,利用高光谱数据集进行性能评估,探测结果如表3所示。由表3分析可知,本文算法在3组高光谱数据集上均能取得最优的探测性能。相比于AF-AE算法,块图模型能够适应复杂的异构背景,更适合于对地遥感监测及相关任务。对比AER和D2的结果可以发现,经过块图模型在空域选择背景样本集的策略,相比于随机选取而言在基于AE探测高光谱图像场景中的异常目标方面具有明显优势。实验结果表明,本文算法充分利用了空域结果,通过权重的方式将空域信息融合到最终的探测结果中,提升了算法的异常检测性能。

表3 各对比算法在3组数据集上的AUC值

2.4 与其他算法比较

为验证本文算法在高光谱异常检测中的优越性,与高光谱异常检测领域经典的GRX(global Reed-Xiaoli)算法(Reed和Yu,1990)、LSMAD(lrasmd-based Mahalanobis distance method)算法(Zhang等,2016)和AE算法以及两种最近提出的具有较高异常检测性能的前沿算法FrFE(fractional Fourier entropy)(Tao等,2019)和FEBPAD(feature extraction and background purification anomaly detector)(Ma等,2021)进行对比。需要说明的是,本节中AE算法使用整个高光谱数据作为训练集,而本文算法参数按2.2节设置。本文算法中自编码器采用的是软件自带的trainAutoencoder()函数。设置学习步长为0.01,不加任何约束项(权重约束项系数和稀疏约束项系数均设置为0),迭代次数为100,batch设置为50,激活函数为sigmoid函数。其余算法参数均按获得最佳探测效果设置。

各算法的探测主观效果图如图8所示。可以看出,各算法均能较为有效地突出目标,并能一定程度上抑制背景。但GRX和LSMAD算法由于没有提取光谱的高维本质特征,其背景抑制效果不明显。而AE和FEBPAD算法在光谱域所张成的子空间或变换域中提取具有区分度的特征,但是由于没有考虑到空域信息,导致算法的异常检测性能受限。本文提出的基于空域协同自编码器的异常检测算法既提取了光谱的低维本质特征,避免数据冗余导致的性能下降,同时保留了空域信息,从而可以更好地抑制背景,易于将异常从背景中分离出来。

图8 不同数据集异常检测主观效果图

评价算法性能的参数为ROC(receiver operating characteristic)曲线图、AUC值和耗时,实验结果如图9和表4所示。从图9可知,对于Sandiego-1数据集,在低虚警率下,本文算法的探测概率低于LSMAD。但在检测出所有目标的前提下(探测率为1),所提基于空域协同自编码器的异常检测算法在3组数据集上均具有最低的虚警率。从表4可以看出,本文算法的AUC值明显高于其他算法,这是因为本文算法同时考虑了块图模型带来的空域信息,以及AE得到的低维本质光谱特征。结合3.3节D2的结果可以注意到,D2的AUC值高于AE算法的结果,分析认为,块图模型良好的背景抑制能力可以为AE模型提供更为纯净的训练集,从而保证AE模型在重构背景样本的同时避免学习到异常样本的特征。表4同时列出了各种算法的耗时,本文算法虽然耗时较长,但在所列算法中探测性能最佳。

图9 各种算法在3个数据集上的ROC曲线

表4 各算法在3个数据集上的AUC值及耗时

值得注意的是,由于本文算法中训练集只占高光谱所有样本数的一半,相比用AE算法直接对所有样本训练,其耗时可缩短一半以上。

3 结 论

本文提出一种基于空域协同自编码器的高光谱异常检测算法。该算法针对AE对训练集中异常样本敏感的问题,从空域角度出发,利用块图模型在背景抑制方面的优势,为自编码器提供纯净的背景训练集。同时,算法通过构造权重的方式以充分利用块图模型包含的空域信息,进一步提升算法的探测性能。该方法主要分为以下3个步骤:1)利用块图模型为自编码器提供纯净的训练样本;2)通过AE提取高光谱图像中目标的光谱域信息;3)利用块图模型的异常响应构造权重以将空域信息融合进探测结果中。实验数据包含3组不同尺寸的高光谱数据集,与经典、前沿的高光谱异常检测算法进行比较分析。实验结果表明,本文算法在高光谱异常探测上得到了最高的AUC值,且能以更低的虚警率实现所有异常像元的探测,说明了本文算法的有效性和优越性。但同时需要注意,该算法需要调整的参数较多,限制了在实际中的进一步应用。因此,在下一步研究中将重点关注如何实现部分参数的自动调整。

猜你喜欢
编码器空域光谱
基于ResNet18特征编码器的水稻病虫害图像描述生成
基于三维Saab变换的高光谱图像压缩方法
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
WV3650M/WH3650M 绝对值旋转编码器
WDGP36J / WDGA36J编码器Wachendorff自动化有限公司
基于3D-CNN的高光谱遥感图像分类算法
基于Beaglebone Black 的绝对式编码器接口电路设计*
我国全空域防空体系精彩亮相珠海航展
台首次公布美空军活动
空中交通管理中的空域规划探讨