极化合成孔径雷达图像相干斑抑制和分类方法综述

2019-09-15 23:58聂祥丽黄夏渊
自动化学报 2019年8期
关键词:极化分类器滤波

聂祥丽 黄夏渊 张 波 乔 红

合成孔径雷达(Synthetic aperture radar,SAR)是一种先进的主动式微波成像传感器,具有较强的穿透性,能全天时、全天候工作.SAR 通过距离向的脉冲压缩技术和方位向的合成孔径原理,可获取大面积的高分辨率地面图像[1].极化合成孔径雷达(Polarimetric synthetic aperture radar,PolSAR)是一种多参数、多通道的新型SAR,通过收发电磁信号的不同极化方式实现对场景目标的极化散射特性的探测.电磁波的极化特性对目标的散射机理高度敏感,而散射机理反映了散射体的材质、湿度、几何形状和粗糙度等性质.因此,与传统的单极化SAR 相比,PolSAR 能够获取更丰富的地物信息和分类特征[2].PolSAR 已成为国内外雷达技术研究的热点,是微波遥感成像发展的主要方向之一.

PolSAR 的发展始于20 世纪80 年代,目前很多国家已经发展了多种以航天飞机或卫星为载体的PolSAR 系统.代表性的机载PolSAR 系统有美国宇航局喷气推进实验室(NASA/JPL)研制的AIRSAR,德国空间中心(DLR)的E-SAR 和FSAR,加拿大遥感中心(CCRS)的CONVAIR-580 C/X-SAR 以及法国的RAMSES 和SETHI,丹麦的EMISAR 和日本的PISAR 等;代表性的星载PolSAR 系统有美国的SIR-C/X SAR 和Mini-RF,欧洲的ENVISAT-ASAR,德国的TerraSAR-X,加拿大的RADARSAT-2,意大利的Cosmo-SkyMed,日本的ALOS2-PALSAR,以色列的TecSAR 和印度的Chandraayan1-MiniSAR 等[2−3].2016 年8月,我国首颗1 米分辨率C 频段多极化合成孔径雷达卫星高分三号成功发射,并于2017 年1 月正式投入使用,实现了我国低地球轨道长寿命、高分辨率SAR 卫星研制技术的里程碑式跨越.

PolSAR 在农林业、地质、海洋和军事等领域具有广泛的应用和研究价值.在农业方面,PolSAR 可用作农作物的种类识别、农作物生长状态监控和土地使用评估等.在林业方面,利用PolSAR 数据可对森林状态进行监控,可及时发现火灾及过度伐木等问题,另外可估计森林中的生物量.在军事方面,PolSAR 可对桥梁、道路、飞机、车辆、油库等战略目标进行检测和识别.在地质方面,PolSAR 可获取地质结构、矿物分布、地表粗糙度、地面覆盖程度、土壤湿度等信息,还可以对地质灾害进行检测和评估.在海洋方面,PolSAR 可用于冰川、海洋和海岸线的监控,对海面溢油和舰船进行检测.在地形测绘方面,PolSAR 可用来测定山脉、河流、城市等地面目标的形状和位置,研究城市规划和变迁、湖泊分布及道路运输状况等[2].

本文综述了现有的PolSAR 图像去噪和分类方法的研究进展,并指出存在的问题和未来研究方向.第1 节介绍PolSAR 数据的形式.第2 节对PolSAR 数据的相干斑噪声抑制方法进行综述.第3节分析总结PolSAR 图像的特征.第4 节对有监督、无监督和半监督的PolSAR 图像分类方法进行综述.第5 节指出现有PolSAR 数据去噪和分类方法存在的问题并探讨将来的研究方向.

1 PolSAR 数据

PolSAR 对目标的测量是通过收发电磁信号的不同极化方式来实现的,获取的数据具有多通道、信息量大的性质.通常的极化散射体的数据表达方式有极化散射矩阵、极化协方差矩阵、极化相干矩阵、Stokes 矩阵、Mueller 矩阵及Kennaugh 矩阵[2],在此主要介绍前三种数据形式.

1.1 极化散射矩阵

PolSAR 发射和接收的是极化电磁波,可分解为水平极化波和垂直极化波.因此,每个分辨率单元都可以用一个2×2 的复散射矩阵S表示,S在线性极化基下可表达为

其中,h和v分别表示水平和垂直极化,shv是垂直发射水平接收的极化波的散射系数,其他元素有相似定义.shh和svv被称为同极化分量,对应入射场和散射场有相同的极化;shv和svh被称为交叉极化分量,相应的入射场和散射场的极化是正交的.

1.2 极化协方差矩阵与极化相干矩阵

在介质互易、收发同置的情况下,散射矩阵S是对称的,即shv=svh.在Lexicographic 矩阵基和Pauli spin 矩阵基[2]的集合下,S可分别分解为如下的散射向量:和kP=其中,可使散射向量和散射矩阵的总功率保持一致.极化协方差矩阵和极化相干矩阵分别定义为

其中,E(·)表示数学期望,是假设随机散射介质各向同性下的空间统计平均,上标H 表示向量复共轭转置.矩阵C和T都是复Hermitan 矩阵,并且两者可以相互转化,即T=V CVT,其中

2 PolSAR 数据相干斑抑制方法

2.1 相干斑噪声的产生机理

合成孔径雷达是一种相干成像系统[1].对于分布式目标,可看做每个分辨率单元中有许多理想点目标,SAR 接收的信号是这些理想点目标的回波的矢量和.因此交叠区会出现某些地方震动加强、某些地方震动减弱或完全抵消的现象,这种现象称为干涉,产生干涉现象的电磁波称为干涉波.由于PolSAR 发射的是相干电磁波,当照射到一个粗糙表面时,返回的信号包含了一个分辨单元内部许多基本散射体的回波,由于表面粗糙的原因,各基本散射体与传感器之间的距离是不一样的.因此,接收到的回波尽管在频率上是相干的,但在相位上不再是相干的.如果回波相位一致,那么接收到的是强信号,如果回波相位不一致,则接收到的是弱信号.因此,散射回波系数会有很大的随机起伏,进而导致图像上出现很多类似颗粒状的斑点,这就是相干斑噪声[4].

相干斑噪声是所有基于相干原理的成像系统如合成孔径雷达、声纳、激光等固有的缺陷,是系统噪声,无法避免[1].相干斑噪声的存在降低了PolSAR图像的质量,使图像变得很难解译,严重影响了图像分类、目标检测和识别的精确性和有效性[2].因此,相干斑抑制是PolSAR 数据解译前的重要预处理.

由于PolSAR 数据的协方差矩阵C或相干矩阵T中包含了极化通道间的统计相关性和相位差等信息,因此PolSAR 图像相干斑噪声抑制应该在整个C或T数据上执行,而非使用散射矩阵S数据[5].由于协方差矩阵的对角线元素是实数并且是乘性噪声,而非对角线元素是复数并且是加性和乘性噪声的混合[6],因此,PolSAR 数据的去噪问题比光学图像或单通道SAR 图像的去噪更难处理.

2.2 评价指标

Lee 等[7]提出PolSAR 数据相干斑抑制需要遵循以下原则:1)协方差矩阵的每个元素应以相同的方式进行滤波处理以保持极化性质;2)对各元素的滤波应相互独立以避免引入通道间的串扰;3)尽量保持图像的分辨率及避免边缘模糊.Lopez-Martinez 等[8]指出只要不引起信息损失并且能改善滤波图像质量,可以松弛前两条原则.总的来说,一个好的PolSAR 去相干斑方法应该具备如下性质:在均匀区域相干斑得到充分的抑制;很好保持图像的空间分辨率和极化性质并且不会引起图像的模糊和降低图像质量[2].下面介绍评估相干斑抑制方法性能的量化指标.

2.2.1 极化信息保持评估

对于模拟图像,极化信息的保持程度可以通过下述指标进行评估,首先计算相对误差其中η是真实值,然后使用中值操作得到一个综合的性能指标[9],这些值越小,极化信息保持得越好.

1)辐射度参数:使用Span 数据|shh|2+2|shv|2+|svv|2计算.

2)复相关参数:首先通过协方差矩阵中元素的不要超界比值,计算相应的幅度和相位,然后分别计算它们与对应的真实值的相对误差并取中值,其度量了三个极化通道之间的相关性.

3)Cloude-Pottier 参数:包括熵、各向异性和平均α角,这些指标的计算方式可参考文献[2],它们与相干矩阵的特征值和特征向量相关.

4)同极化和交叉极化性质:计算方式为[10]

其中,φi和ψi是椭圆率角和椭圆方向角,描述了接收天线的极化性,φj和ψj表示发射情况下相应的量,K是Kennaugh 矩阵,可以从协方差矩阵中导出.同极化信号对应于φi=φj和ψi=ψj,而交叉极化信号对应于φi=−φj和ψi=ψj+π/2.先计算每一类的平均协方差矩阵,在φi ∈[−π/4,π/4]和ψi ∈[−π/2,π/2]的范围内计算这些参数,然后求与真实数据的相对偏差,最后取中值[9].

2.2.2 相干斑抑制评估

等效视数(Equivalent number of looks,ENL)度量了去噪图像在某一均匀区域的相干斑抑制程度,其定义为[11]

其中,µ为数据的均值,σ为标准差,都是在选出的均匀区域上计算的.ENL 越大,表明相干斑抑制得越充分.

2.2.3 边缘保持评估

基于比值平均的边缘保持程度(Edgepreservation degree based on the ratio of average,EPD-ROA)指标对乘性噪声模型度量边缘的保持程度具有很好的鲁棒性,其定义为[12]

其中,I是一个灰度图像的指标集,ED1(i)和ED2(i)分别表示去噪后的图像沿着水平方向和垂直方向的相邻像素值.对于模拟数据与真实数据,EO1(i)和EO2(i)分别表示原始无噪图像与带噪图像沿水平和垂直方向的相邻像素.EPD-ROA 的值越接近1,说明边缘信息保持得越好.

近20 年来,研究人员针对PolSAR 数据的相干斑抑制问题提出了多种方法,包括空域滤波、非局部均值和变分方法等.其中有很多方法是从单极化SAR 的噪声抑制方法发展而来,甚至有不少方法都是将PolSAR 数据噪声模型简化为多通道的单极化SAR 噪声模型来处理,或将其简单推广到PolSAR数据,这在后续的各类方法的总结中会具体介绍.关于PolSAR 数据相干斑抑制,10 年前的相关方法可参考文献[2,13],下面着重介绍近10 年来提出的方法.

2.3 空域滤波方法

空域滤波是使用空域模板进行的一种邻域处理方法,其机理是在待处理的图像中逐点地移动模板,滤波器在该点的响应是通过事先定义的滤波器系数与滤波模板扫过区域的相应像素值的关系来计算[14].具体过程为寻找以某一像元为中心的邻域,使用空域模板对该邻域进行事先设定的运算,将滤波后的像素值作为中心像元的输出值.空域滤波可以分为线性滤波和非线性滤波,线性滤波器将空域模板对应邻域内的像素值加权之和作为中心像素的相应输出,包括均值滤波器、加权均值滤波器等;非线性滤波器的滤波结果直接取决于考虑的邻域像素点的值,包括中值滤波、最大最小值滤波器等.空域滤波方法往往执行简单、速度快,是PolSAR 相干斑抑制中最常用的方法.

Boxcar 滤波是比较早期的空域滤波方法,其对每个像素的邻域窗口内的协方差数据取平均作为中心像元的数据,能有效去除各向同性区域内的噪声,但会显著降低图像的空间分辨率并模糊图像中的边缘和目标点[2].Lee 等[7]提出的修正Lee 滤波使用了边缘对齐的非方形窗口和最小均方误差滤波,通过一组边缘检测模板找出同质区域,并在该区域内进行Lee 滤波.这两种方法都是从单极化SAR 的斑点抑制方法发展而来,修正Lee 滤波能较好地保持边缘的纹理特征,然而其使用span 值来确定同质区域,而span 值未包含充分的像元散射特性信息,因此该方法没有保持各像元主导的散射机制.为此,Lee 等[15]提出了一种基于散射模型(Scattering model based filter,SMBF)的滤波方法,基于极化协方差矩阵的Freeman-Durden 分解得到的面散射、体散射和偶次散射的分量,对像元进行无监督聚类,然后进行类内滤波,能在有效抑制相干斑的同时较好保持像元主散射机制.Vasile 等[16]提出强度驱动的自适应邻域(Intensity-driven adaptiveneighborhood,IDAN)滤波,使用区域增长技术,相邻像素通过它们强度的相似性不断聚合,从而对每个待滤波的像素建立一个自适应的邻域,然后邻域内做简单平均或使用局部线性最小均方误差技术,该方法比使用预定义窗口的方法更灵活,并且更好地保持了空间分辨率,但会产生一定的偏度[17].Lopez-Martinez 等[8]提出了一个基于模型的Pol-SAR(Model-based PolSAR,MBPolSAR)滤波,基于协方差矩阵的乘性和加性混合噪声模型[6],利用不同极化通道的相关结构,将相同的协方差矩阵的对角线和非对角线元素分别处理,能较好保持极化信息.Ding 等[18]针对SMBF 未考虑结构特征的问题,提出了一种基于结构判别和混合四元素极化分解的斑点抑制方法,分解得到的四元素除了面、体和偶次散射外还包含了它们的混合分量,能有效地同时保持数据的极化性质和结构特征.前述的滤波方法往往受限于局部的邻域窗口,双边滤波将窗口扩张到更大的尺寸.D'Hondt 等[19]将传统的图像去噪中的双边滤波器拓展到PolSAR 相干斑抑制中,给出一种迭代的双边滤波方法,充分利用数据的辐射信息和结构信息并基于K-L 散度和测地线距离计算像素的相似性.Lang 等[20]提出一种基于线条–边缘探测器和极化同质度量的自适应窗口的斑点滤波方法,对于异质区域选择小的和非方形窗口以保持细节信息,对同质区域选择大的方形窗口以尽可能抑制斑点噪声.Lee 等[21]提出一种拓展的sigma 滤波,将单极化SAR 斑点抑制的改进sigma 滤波拓展到全PolSAR 数据去噪中,根据相干矩阵的对角线元素对数据进行分类,对强目标不做滤波处理,仅对分布式目标区域选取同质窗口进行sigma 滤波,能很好保持数据的散射特性.

上述方法都仅使用了与场景相关的空间信息,而对于PolSAR 时间序列数据,时间信息的使用也非常重要.Alonso-González 等[22]提出了一种基于二叉树(Binary partition trees,BPT)的PolSAR时间序列数据处理方法.首先根据目标性质构建BPT,通过树修剪得到一组时空均匀区域,在区域内进行数据处理,能同时保持空间和时间域的分辨率而不会引入偏差和失真,而BPT 具有一个多层结构,会带来较高的计算复杂度.Salehi 等[23]提出了一种基于协方差矩阵所有元素的时间统计准则的多时间多维(Multitemporal multidimensional,MTMD)滤波方法,能自适应地使用空间和时间域中具有相同散射特性的像素,并能很好保持数据的极化信息.

2.4 非局部均值方法

非局部均值(Non-local means,NLM)方法是Buades 等[24]于2005 年最先提出,基本思路是在以待估像素为中心的一个很大的搜索窗口中,找出与该像素最相似的一些像素点,相似性通过以这两个像素为中心的像素块进行衡量,最后通过加权平均得到待估像素的值,相似性越高的像素对应的权重也就越大.

针对PolSAR 协方差数据斑点抑制问题,相关的非局部均值方法有Chen 等[25]提出的Pretest 滤波,Zhong 等[26]提出的NL-Lee 滤波,Torres 等[27]提出的随机散度滤波和Deledalle 等[17]提出的NLSAR 方法.这些方法的最主要区别在于相似性像元块的度量方式不同.Pretest 滤波[25]根据协方差矩阵的Wishart 分布的似然比测试得到两个协方差矩阵X和Y的距离度量为

其中,n是等效视数,q是矩阵的行数或列数,通常q=3,|·|表示矩阵的行列式.进一步,可得到以X和Y为中心的两个像元块的距离度量为

其中,k为像元块中像元的数目.两个像元间的权重设为W=exp(−D/Dt),其中Dt为设定的阈值.Zhong 等[26]将这种结构相似度量方法与Lee 滤波的同质相似性度量相结合,提出NL-Lee 滤波.这种组合度量方法能改善非局部平均参数如像素块和搜索窗的尺寸的鲁棒性,同时在相干斑抑制和细节保持之间能达到更好的平衡.随机散度滤波[27]基于统计中的假设检验以及随机散度判断两个样本是否来自同一分布,从而计算出两个像元块的相似度,然后通过P-value 做软阈值操作得到权重,该方法能有效增强极化熵并保持目标散射信息.NL-SAR 滤波[17]给出了一个针对SAR、PolSAR 和干涉SAR数据去相干斑的统一的非局部均值框架.其基于Wishart 分布的广义似然比检验得到对应的两个协方差矩阵X和Y的距离度量为

以X和Y为中心的两个像元块的距离为D=权重设为W=exp(−D/h),其中h为滤波参数.Wang 等[28]用有限混合模型刻画观测场景的变化,并提出一种渐进的混合回归方法用于更好地估计先验目标的统计特性,然后将导出的混合先验估计融合到非局部平均方法中,从而将小图像块之间的局部变化模式纳入到相似性评估中.这种将有限混合模型回归引入到非局部平均的方法在平衡斑点抑制和特征保持上较有潜力,能很好地保持显著的散射机制和小尺度的目标特征.近期的工作还有基于空间–波段信息和协方差矩阵的多波段PolSAR 图像滤波方法[29]和基于恒虚警率边缘检测的自适应滤波方法[30].

这类方法在相干斑噪声抑制的效果上显著优于空域滤波方法,并且能很好保持图像的重复性结构信息.然而,由于需要进行图像块的相似性度量,计算复杂度非常高;另外,在平坦区域噪声严重的情况下,会试图保持某种结构而导致鬼影出现;此外,在相似结构缺乏的区域会出现块状效应.

2.5 变分方法

全变分(Total variation,TV)的概念首先由Jordan[31]于1881 年引入,是用以证明变差有界的不连续周期函数的傅里叶级数的收敛理论.1992 年Rudin 等[32]提出了全变分正则化方法并用于图像去噪问题,相应的模型记为ROF:

其中,∇为一阶有限差分算子,∇hX和∇vX分别表示X沿着水平方向和垂直方向的一阶有限差分.由于受噪声污染图像的总变分比无噪图像的总变分明显的大,因而约束总变分就可以有效抑制噪声,同时能很好保持图像的边缘特征.

近年来,变分方法由于在图像去噪中的优势得到广泛的关注和研究.在PolSAR 数据相干斑抑制方面,2011 年Li 等[33]提出将PolSAR 相干矩阵的对角线元素做对数变换,然后直接使用ROF 模型[32]做相干斑抑制的方法.2013 年Liu 等[34]针对多通道SAR 图像去相干斑提出了两个自适应的矢量变分模型,如下:

其中,Y是观测数据,X是待求数据,V TV(X)是自然矢量全变差.上述两种方法都是将PolSAR 数据噪声模型简化为多通道的单极化SAR 噪声模型来处理,仅考虑协方差矩阵或相干矩阵对角线上的实数数据,而忽略了非对角线上的复数数据,从而导致一些重要的极化性质的丢失,例如极化通道间的相关性、Cloude-Pottier 参数、同极化和交叉极化特征等.

为了解决上述问题,相干斑抑制应该在整个协方差或相干矩阵的数据上执行[5],这涉及到加性和乘性噪声的混合建模及复数优化问题.用于光学图像去加性噪声和单通道SAR 图像去乘性噪声的变分模型不能直接推广用于PolSAR 数据去噪.据此,2015 年Nie 等[35]根据PolSAR 协方差数据的统计特性和贝叶斯最大后验准则,建立了Wishart 全变分(Wishart total variation,WisTV)模型,具体为

其中,Zi是观测的协方差矩阵,Ci是待求的协方差矩阵,λ是正则化参数,表示3×3 Hermitian正定矩阵的集合,表示四阶张量数据C的全变差正则化.Nie 等[36]针对WisTV 方法会导致纹理等细节信息模糊的问题,提出了基于Wishart分布的非局部变分(WisNLTV)模型.该模型是非凸的,而且变量是高阶张量,文中利用共轭函数思想和向前向后算子分裂方法求解.该方法在充分抑制相干斑噪声的同时能很好保持数据的极化性质和图像中的重复性结构信息.之后,Nie 等针对文献[35−36]中的算法在优化过程中未考虑变量的正定约束而是直接把解往正定矩阵集做投影以及模型中的参数对数据敏感的问题,提出基于sigmoid 函数的数据归一化方法和基于矩阵正交分解的优化算法[37].

2017 年,Deledalle 等[38]针对多通道SAR 图像斑点噪声抑制问题,基于协方差矩阵的Wishart分布和矩阵对数变换,提出了多通道对数高斯去噪(Multi-channel logarithm with Gaussian denoising,MuLoG)方法,对应模型为

其中,R(xi)是正则化项,是协方差矩阵Σ 经过矩阵对数变换后的矩阵,K是从维的实值向量到D×D的Hermitian 矩阵的映射,对于PolSAR 数据D=3,(A,b)是一个白化放射变换以去除通道间的相关性,Φ 是一个平衡通道间噪声方差的归一化操作.因此,估计的协方差矩阵通过交替方向乘子法,可以将现有的高斯去噪子嵌入到算法中,因此一组数据可以利用不同的算法做去噪处理,然后通过比较选出去噪效果比较好的.这种方法也为相干斑抑制算法提供了一个参考基准.

除了上述三大类方法外,PolSAR 数据的相干斑抑制方法还有Farage 等[39]提出的变换域滤波器,其是在小波变换域通过熵阈值收缩技术做去噪处理;Foucher 等[40]提出的基于矩阵迹的偏微分方程滤波,其等价于与方向高斯滤波的局部卷积;Sun 等[41]提出的各项异性扩散滤波等.Ma 等[42]近期发表的综述论文对基于偏微分方程和基于机器学习的相干斑抑制方法单独做了总结,并对几种代表性方法做了系统的实验对比.

表1 总结比较了上述三大类PolSAR 数据相干斑抑制方法的优缺点.其中,空域滤波方法运算速度较快,但重构的图像质量一般;非局部均值方法能很好去噪并保持图像重复性结构特征,但运算速度很慢;变分方法能有效抑制噪声并保持图像边缘,但会导致弱目标等细节信息的丢失.本节梳理了PolSAR数据相干斑抑制领域的研究现状,并对一些代表性的方法展开介绍.需要说明的是,上述的归类方式并非是严格的,某些方法可能属于多个类别,例如我们虽然将NL-Lee 滤波归到非局部均值方法中,但它实际上是结合了空域滤波和非局部均值滤波的思想,类似地,WisNLTV 则是结合了非局部均值和变分方法的思想.

2.6 实验对比

本节从各类方法中挑选了几个代表性算法,包括修正的Lee 滤波[7]、SMBF 滤波[15]、NL-SAR 方法[17]和WisNLTV 方法[36],进行对比实验.其中,修正的Lee 滤波和SMBF 滤波分别使用5×5 和7×7 的滤波窗口,这两个滤波器都是使用PolSARpro V5.1 软件执行的;NL-SAR 和WisNLTV 均使用作者提供的代码,NL-SAR 的搜索窗口和像元块的尺寸分别设置为25×25 和9×9;WisNLTV 的像元块尺寸设置为9×9,挑选的最近邻像元个数设置为10.实验使用的数据是由德国空间中心的机载ESAR 系统获取的Oberfaffenhofen 地区的全极化、L 波段、单视数据.

图1 展示了不同方法对应的相干斑抑制结果的Pauli 分解图,可以看出这4 种方法都不同程度地抑制了斑点噪声.但修正的Lee 和SMBF 滤波降低了图像的空间分辨率并且模糊了图像中的一些点和线特征.另外,修正的Lee 滤波会导致像素化效应,见图1(b)中的平坦区域;而SMBF 滤波对黑色斑点的抑制不够充分.NL-SAR 和WisNLTV 滤波在空间分辨率保持方面要优于前两种方法,因为它们都使用了中心像元的邻域像元块进行相似性度量,而像元块可以较好空间结构信息.但NL-SAR 在噪声严重的数据上表现欠佳,并且会导致图像块效应,如图1(d)中的线和点特征出现不同程度的模糊,这是因为在这些结构附近很难找到相似性的像元块.WisNLTV 较好地保持了图像中的结构,如图1(e)中的点散射体和线特征.表2 展示了这4 种方法在相干斑抑制和边缘保持方面的量化对比结果,可以看出修正的Lee 滤波得到了更加光滑的结果,但边缘保持得不够好;WisNLTV 方法在相干斑抑制上比其他方法要稍微弱一些,这需要加大正则化参数进行调节,但得到了更好的边缘保持结果.

表1 各类PolSAR 数据相干斑抑制方法比较表Table 1 Comparison of different types of PolSAR data speckle reduction methods

图1 不同PolSAR 数据相干斑抑制方法的视觉对比结果Fig.1 Visual comparison results of different PolSAR data speckle reduction methods

3 PolSAR 数据特征提取

特征提取是PolSAR 图像分类的关键步骤,本节将对PolSAR 数据的特征进行整理总结,并进行分类.

3.1 极化特征

极化特征包括基于原始极化数据的参数和基于极化目标分解的参数两类.原始参数是直接从PolSAR 数据的元素或其变换中提取的特征[43],包括:协方差矩阵和相干矩阵的对角线元素T11,T22,T33,C11,C22,C33,这些参数包含了同极化后向散射系数;交叉极化后向散射系数的幅度和相位|C12|,|C13|,|C23|,∠C12,∠C13,∠C23,其中|·|和∠分别表示取幅度和相位;极化通道间比值10 ln(C33/C11),10 ln(C22/2C11),10 ln(C22/2C33);去极化率C22/(2C11+2C33);Span 值C11+C22+C33.

极化目标分解是将极化观测数据分解成不同分量,以揭示散射体的物理机制,大致可分为四类[2]:1)基于Mueller 或Kennaugh 矩阵的二分量分解方法,例如Huynen 分解[44],其假定任意目标的Mueller 矩阵可表示为单目标和N目标的矩阵之和,根据Mueller 矩阵得到9 个目标参数,每个参数都包含目标的真实物理信息;还有Yang 分解[45]等.2)基于协方差或相干矩阵的模型分解,例如Freeman-Durden 分解[46],可将目标分解为由一阶Bragg 表面散射得到的面散射、由二面角反射器得到的偶次散射和由植被冠层定向偶极子得到的体散射三类;Yamaguchi 分解[47]是在Freeman-Durden分解基础上引入螺旋体散射,常见于城市区域;还有Freeman 两元素分解[48]和Kusano 等[49]提出的基于广义散射模型的相干矩阵分解方法.3)基于协方差或相干矩阵的特征值或特征向量的分析,例如Cloude-Pottier 分解[50],其根据相干矩阵的特征矢量分析定义了熵、平均α角和各项异性系数,分别反映了散射随机程度、散射性质和次级散射机制的相对重要性;还有van Zyl 分解[51]等.4)基于散射矩阵的相干分解,例如Pauli 分解[50],其系数是|Shh+Svv|2,|Shh −Svv|2和|2Shv|2,其中Pauli 基是完全正交的,简单且具有一定抗噪能力,但只能区分面散射和偶次散射;Krogager 分解[52],其系数为|SRL|,min(|SLL|,|SRR|),abs(|SLL|−|SRR|),其中SRR=iShv+(Shh −Svv)/2,SLL=iShv −(Shh −Svv)/2,SRL=i(Shh+Svv)/2,可区分大导电球、二面角和螺旋体散射;Cameron 分解[53]是基于雷达目标的互易性和对称性做相干分解,提供了散射体结构的物理信息,可有效检测自然目标和人工目标,但会对噪声敏感;此外,还有Touzi 分解[54]等.

表2 不同PolSAR 数据相干斑抑制方法的量化比较表Table 2 Quantitative comparison of different PolSAR data speckle reduction methods

3.2 统计特征

根据第1 节的介绍,PolSAR 的每个分辨率单元都对应一个复散射矩阵S,在介质互易、收发同置情况下是对称的,并可以退化成散射向量kL和kP.一般情况下,kL可以用均值为零的多元复高斯分布进行建模[55]

其中,tr(·)表示矩阵的迹,K(L,3)=π3Γ(L)Γ(L −1)Γ(L −2),Γ(·)表示gamma 函数.同样地,L-视观测相干矩阵且有W=V ZVT,由于V是一个3×3 的满秩矩阵,则W服从均值为V CVT=T的复Wishart 分布,其中T

然而Wishart 分布是基于高斯模型的,只能用于描述均匀区域的统计特性,为更好刻画异质区域如城市或森林场景的统计性质,Freitas 等[57]提出多元多视极化G分布,Khan 等[58]给出了相应的单视极化G分布,Doulgeris 等[59]提出K-Wishart分布.另外,Bombrun 等[60]基于Fisher 分布的纹理模型推导出多视协方差矩阵的Kummer U 分布,能区分具有不同纹理分布的区域.Frery 等[61]在复Wishart 分布基础上分析了Shannon,Rényi 和限制Tsallis 熵的解析表达.

3.3 纹理特征

纹理特征可以描述图像或其中小块区域的空间颜色分布和光强分布,即刻画一个特定类的空间变化性.由于它是基于区域的特征,因此对噪声有一定的鲁棒性.PolSAR 图像的纹理特征一般是基于Span 图像计算,常用的[62]包括:1)基于统计的特征.a)局部二元模式(Local binary pattern,LBP)特征,其具有旋转不变性和多尺度特性;b)边缘柱状图描述子(Edge histogram descriptor,EHD),将图像边缘分为5 个方向,即水平、垂直、45◦对角和135◦对角方向及各项异性方向,然后计算直方图;c)灰度共生矩阵(Gray-level co-occurrence matrix,GLCM),通常提取4 个最有判别性的特征即能量、相关性、对比度和同质性,能很好描述小的纹理和重复性结构模式,如水和森林区域;d)序数共生矩阵(Ordinal co-occurrence matrix,OCM)是GLCM和序数描述子的结合,OCM 在刻画人造目标区域这样的粗糙纹理和不规则模式方面要优于GLCM;e)多层局部模式柱状图(Multilevel local pattern histogram,MLPH)[63]专门用于刻画SAR 图像纹理特征,描述了以各种强度捕捉局部和全局结构信息的移动窗口中出现的明亮、黑暗和均匀模式的尺寸分布.2)基于多尺度变换的特征.a)Gabor 滤波,能很好描述对应于空间尺度、空间位置及方向选择性的局部结构信息;b)小波变换,利用联合的时间–尺度函数分析非平稳信号,并通过伸缩和平移等运算功能对信号进行多分辨率细化分析,具有良好的时频局部化、尺度变换和方向特性[64];c)Wedgelet框架,能以简单和最优的方式表示图像块内的直线边缘,获取图像在不同尺度上的空间结构,同时考虑了局部空间的复杂度[65].

3.4 颜色特征

由于原始的PolSAR 数据未提供一种自然的颜色图像表示,因此颜色特征在PolSAR 图像分类中经常被忽略.而出于可视化的需要,根据散射矩阵可创建伪彩色图像,例如Pauli 颜色编码图像.据此,可以提取:1)色调–饱和度–明度(Hue-saturationvalue,HSV)空间的颜色柱状图,HSV 是一种比较直观的颜色模型,与人的视觉系统类似;2)主导颜色描述子(Dominant color descriptor,DCD),描述图像中任意不规则区域中处于支配地位的颜色信息,即能用少量主导颜色充分描述图像的颜色内容;3)颜色结构描述子(Color structure descriptor,CSD),不仅能反映图像的色彩信息,也能描述图像的局部颜色结构特征.Uhlmann 等[62]证实了从伪彩色图像中提取的这些颜色特征能有效提升PolSAR 数据分类的精度.Xing 等[66]同时利用Pauli 分解和Yamaguichi 分解的伪彩色图,并转化到CIELAB 颜色空间用于聚类.Liu 等[67]基于PolSAR 数据的四分量分解模型,计算了常用的4种颜色空间:YUV、RGB、HSI 和CIELAB,通过引入颜色熵从这些空间中量化选择颜色特征,然后联合纹理特征和散射功率熵进行分割和聚类.

3.5 空间结构特征

如果仅使用单像素点的特征,分类算法会对噪声比较敏感,结果不够鲁棒.通过对PolSAR 数据的空间结构信息的利用,可以有效提高分类的精度和鲁棒性.目前主要有四类空间信息提取方法[68]:1)基于超像素[69−70]和基于区域[71−72]的方法;2)基于纹理特征提取的方法,例如小波变换[73],Gabor滤波[62]和楔波分析[65];3)基于正则化准则的方法,例如MRF[74]和流形正则化[75];4)基于语义同质区域提取的方法,例如层次语义模型[76−77].与基于像素的分类方法相比,这些方法考虑了图像中的局部空间结构信息,可以抑制相干斑噪声对分类结果的影响,使分类图更加准确和清晰,并减少了孤立区域[78].

3.6 基于深度学习提取的特征

上面介绍的特征都是采用传统的人工指导的提取方法,由于依赖手工设计,这些特征往往比较简单,而且手工设计出有效的特征是一个相当漫长的过程.另外,它们主要依靠设计者的先验知识,很难利用大数据的优势.目前出现了基于深度学习的特征提取方法,与传统的提取方法思想完全不同.深度学习可以从大数据中自动学习特征的多层表示,其中可以包含成千上万的特征,这些学习出的特征的表达能力比手工设计出的特征更强.另外,深度学习可以针对新的应用从训练数据中很快学习得到新的有效的特征表示.基于深度学习的方法也被广泛应用于PolSAR 数据的特征提取中,例如基于卷积神经网络(Convolutional neural networks,CNN)[79−80]、基于受限玻尔兹曼机的深度置信网络[81]以及基于多层自编码[82]的特征提取等.下文将详细介绍相关的方法.

4 PolSAR 图像分类方法

PolSAR 图像分类是数据解译的关键环节,也是PolSAR 数据处理的重大研究方向之一.分类的目的是通过PolSAR 传感器获得的测量数据,确定每个像素所属的类别.PolSAR 图像分类精度的常用评价指标包括各子类的分类正确率、总体分类正确率以及混淆矩阵.其中,总体分类正确率是被正确分类的像素总和除以总的像素数目;混淆矩阵是分类结果和地面真实信息的比较阵列,列代表地面检验为该类别的数目,行代表通过分类算法得到的类别数目,通过混淆矩阵可以计算各种精度统计值,例如各子类和总体分类正确率、错分率、漏分率和Kappa 系数等.目前的PolSAR 分类方法主要包括有监督分类、无监督分类和半监督分类.10 年前的相关方法可参考文献[2−3],本文重点梳理和归纳近十几年的研究成果.

4.1 有监督分类方法

有监督分类方法可以使用一定量的有标签样本训练分类器,进而对无标签样本进行分类.有监督PolSAR 图像分类方法包括特征提取和分类器设计两个阶段.针对特征提取方面,第3 节主要从特征本身的角度归纳总结了6 类常用的特征及相应提取方法,接下来从分类的角度梳理基于不同特征类型或多特征融合的有监督分类方法,主要包括:1)基于PolSAR 数据统计特性的方法,如分别使用复Wishart 分布[83]、非高斯分布[59]和多个统计分布[84]的分类方法,以及基于相干矩阵特征值统计分布的方法[85].2)基于极化分解特征的方法,如Alberga 等[86]比较了将相干参数和非相关参数作为输入的最小距离分类器、多层感知机(Multi-layer perceptron,MLP)和基于logistic 回归(LR)分类器的效果,结果显示MLP 和LR 分别在相干参数和非相干参数上的分类精度更高,另外,还有使用极化方向角[87]和使用基于散射机制统计特征[88]的PolSAR 图像城市区域提取方法,基于最优的Touzi分解参数的方法[89]以及基于同极化、交叉极化等多种极化性质融合的方法[90]等.3)基于纹理特征的方法,如基于小波变换纹理特征提取的方法[91],结合小波极化信息、纹理基元和稀疏编码的方法[92],结合纹理和极化信息的方法[64,93],结合时频分析技术和球面不变随机向量乘积模型的方法[94].4)融合颜色特征的分类方法,鉴于之前的方法都忽视了颜色特征的使用,Uhlmann 等[62]从PolSAR 伪彩色图像中提取了颜色特征,并与纹理、极化分解特征相结合,实验证实了颜色特征的加入可有效提高分类精度.5)基于线性或非线性降维的方法,可以从冗余信息中提取更有判别性的低维特征,能有效提升分类效果,如Tu 等[43]将极化分解参数堆叠成一个高维向量,使用非线性流形降维技术即拉普拉斯特征图,获取该高维向量在低维空间的本质特征.然而该方法没有使用样本的判别信息,并且拉普拉斯特征图没有显示表达,因此不能拓展到新样本上,为此,Shi 等[95]使用线性降维技术即基于流形学习的有监督图嵌入算法,获取能保持判别信息的低维特征.然而这两种方法都是基于单像素的,未考虑像素邻域的空间信息,为此,Tao 等[96]结合空间关系并利用Tucker 张量分解和独立主成分分析技术得到低维本质特征集;Huang 等[97]利用空间和极化信息构建三阶张量并提出张量局部判别嵌入方法实现降维.6)基于多视角学习的方法,上述不同属性的特征可以看做不同的视角,目前的分类方法多数是基于单视角数据的,也有基于某几个视角数据的,但往往是排成一个向量进行处理,忽视了特征间的不同属性和视角间的冗余性和互补性等关系,为此,Nie等[98−100]提出基于多视角的在线学习算法,利用协同正则化思想,实现了多视角特征的融合;Huang等[101]结合线性判别嵌入和典型性相关分析提出多视角特征提取算法,有效提升了分类精度.

在分类器设计方面,包括:1)基于贝叶斯最大似然的分类器,如基于散射向量复高斯分布的分类器[102]和基于协方差矩阵的复Wishart 分布的分类器[103].2)基于神经网络的分类器,神经网络技术最初由Pottier 等[104]引入到PolSAR 图像分类领域,后来各种新的神经网络方法又相继被应用到该领域,如动态学习神经网络[105],模糊神经网络[106],RBF神经网络[107],四元数神经网络[108]和概率神经网络[109].3)基于支持向量机(Support vector machine,SVM)的分类器,最初由Fukuda 等[110]引入到PolSAR 应用中,由于SVM 可以利用各种类型的特征并具有良好的分类效果和泛化能力,在该领域得到了非常广泛的应用[92,111−112].4)基于字典学习和稀疏表示的方法,如Zhang 等[113]使用训练样本的特征向量构建过完备字典并得到相应稀疏表示系数,根据残差最小的原子判断最终类别,还有基于监督非相干字典学习的目标检测方法[114]和基于多尺度压缩感知金字塔的分类方法[115].5)其他分类器,如基于Boosting[116]、随机森林[117]、决策树[118]和扩散–反应系统[119]的分类方法.6)基于多分类器融合的方法,如Maghsoudi 等[120]提出根据不同特征子集的SVM 分类器的集成方法;Ma 等[121]提出的利用像素间空间关系的Wishart、SVM、K-均值分类器融合的方法;Masjedi 等[64]将MRF 的能量函数结合到SVM 的优化框架中,同时使用了纹理、极化和上下文特征,并组合了SVM、Wishart和MRF 分类器,使分类精度得到显著提升.这种多分类器融合的方法也是一种发展趋势.

上述介绍的分类器各有优缺点,如贝叶斯分类器对大数据量训练时具有较高的速度,并且结果容易解释,但需要样本的独立性假设,样本相关性较强时会影响效果;神经网络学习能力强,分类精度高,对噪声数据的鲁棒性强,但需要调整的参数较多,学习过程比较长,不能观察中间结果;SVM 可以解决小样本和非线性问题,很好处理高维数据集且泛化能力比较强,但训练过程比较低效且合适的核函数的选择也是一个挑战;稀疏表示分类器对数据缺损不敏感,对测试集中的噪声比较鲁棒,能达到较高的分类精度,但对小样本问题,分类效果一般;boosting 方法很好地利用弱分类器进行级联,比较简单,不容易发生过拟合且不用做特征筛选,但弱分类器数目不好确定且数据不平衡时会导致分类精度下降;决策树可以可视化分析且容易提取规则,运行速度也比较快,但对缺失数据处理困难且容易出现过拟合问题.上面总结的分类算法都是离线学习方法,不能适用于动态大规模PolSAR 图像的分类问题,而在线增量学习算法可以处理这种动态数据流问题,其使用新来样本快速更新分类器,目前这方面的工作包括:Kiranyaz 等[122]提出的二分类器集成网络,能自适应学习新样本、新类、新特征并不需要重新训练所有已知数据,但速度较慢;Nie 等[98−100]提出的在线多视角学习算法,只使用新来样本更新分类器,为多线性分类器组合,执行速度非常快.

4.2 无监督分类方法

无监督方法不需要利用有标签样本进行预训练,主要通过数据的不同特征分离出属于同一类型的像素.目前的方法主要包括两大类:基于目标统计或电磁散射特性的分类方法和基于机器学习理论的方法.

第一大类可划分为三类:基于极化目标分解的算法、基于数据统计特性的算法和基于两者结合的算法.基于极化目标分解的算法主要是根据不同地物的物理散射特性对目标进行分解进而进行分类,如van Zyl[123]提出的基于入射波和散射波间的相位与自旋关系的方法;Cloude 等[124]提出的基于H/α的特征值分解方法,该方法利用极化分解得到的极化熵H和平均散射角α描述散射机理,根据H/α平面将地物分为八类;另外,还有基于目标散射向量去取向理论的分类方法[125],利用目标散射分解的旋转不变参数进行分类的方法[54],基于极化散射相似性的分割方法[126]以及基于交叉散射的方法[127].基于数据统计特性的算法是根据不同的数据统计分布和贝叶斯最大似然准则设计的分割算法,如基于K-Wishart 分布[128]和Kummer U 分布[129]的方法.另外,Frery 等[130]提出基于极化G分布和B 样条的边缘检测方法,Silva 等[131]提出基于Wishart 分布最小随机距离的分割算法,并给出了对应于基于Wishart 分布的Kullback-Leibler,Bhattacharyya,Hellinger,Rényi 和Chi-Square 随机距离的测试统计量的解析表达式.基于两者结合的算法是在极化分解得到的初始分割结果的基础上,利用数据的统计特性进一步进行迭代分类,如Lee等提出的H/α-Wishart 算法[132],将H/α平面的分类结果与Wishart 最大似然分类器结合起来;还有用于多频全极化数据的H/α/A-Wishart 算法[133]和引入模糊概念的H/α分类方法[134].这类方法克服了基于极化分解的分类结果杂乱及类间界限模糊的问题,但分类后的类别丧失了散射机制的可解释性.为有效保持各类目标的物理散射特性,Lee等[135]基于Freeman 分解和Wishart 分类器构建了新的分类算法,首先利用Freeman 分解将地物分成三大类,然后再将每大类分成30 小类,对各子类进行聚类和Wishart 迭代分类,此方法能很好地保持目标的主要散射特性,并且拥有较优的收敛性以及稳定性.

基于机器学习理论的方法包括聚类算法、基于马尔科夫随机场(Markov random fields,MRF)、字典学习[136]、均值漂移(Mean shift)[67]、流形正则化[75]和二叉树[22]的方法等.由于之前的多数方法[132,134]需要预先知道类数,而很多情况下,预设的类数可能并不准确.为此,Cao 等[137]提出了基于Span/H/α/A的凝聚层次聚类算法,根据Span/H/α/A获取初始聚类中心,然后根据Wishart 距离度量进行层次聚类,聚类数目可通过数据的对数似然算法自动估计.之后,Dabboor等[138]提出基于Wishart-Chernoff 距离的层次聚类方法,该算法在分类过程中可以控制类别的自动合并.聚类方法还包括Kersten 等[139]提出的基于模糊C 均值的聚类算法,Ersahin 等[72]提出的谱聚类算法,其借助空间邻近关系,基于区域设置的轮廓信息进行分割,然后通过图划分进行分类,结果优于Wishart 分类器.基于MRF 的PolSAR 图像分割方法最初由Rignot 等[74]提出,由于具有明确的物理意义及良好的效果而得到广泛关注,很多方法也相继被提出,如结合张量空间聚类分析和MRF框架的算法[140],结合区域增长和MRF 边缘增强模型的算法[141]以及基于自动U分布和MRF 的算法[142].针对传统MRF 方法不能自动确定精确的聚类数目的问题,Bi 等[143]结合有监督的softmax回归模型和马尔科夫随机场光滑约束设计能量函数,将类别和分类器同时作为变量进行优化,达到了较高的聚类精度;Song 等[144]提出将Dirichlet 过程混合模型和基于邻域的相似性度量融入到MRF 框架中,与其他基于MRF 的方法相比,该算法能自动识别聚类数目并获得更准确的边缘位置和更光滑的同质区域.除了上述提到的能自动估计PolSAR 类别数目的方法外,还有Liu 等[70]提出的基于超像素的分类框架用于具有自适应类数的PolSAR 图像中,其使用超像素之间的成对相异度信息估计数据的类的数量和每个类的中心,相应的分类结果更加准确鲁棒;Zhong 等[145]在Hermitian 正定的协方差矩阵数据上引入基于稀疏度相似性度量的无监督分类方法,其中最优的聚类数目可通过自调整的谱聚类或同时聚类和模型选择的方法来确定;Kim 等[146]使用四元数自编码器提取极化特征,进而通过无监督的四元数自组织神经网络进行细分组,然后执行标签化处理使得分组对应于人类可理解的地物概念,不需要给定人类预设的土地分类情况,能发现新的和更细的土地类别;Liu 等[147]给出一种具有双重约束的空间变化的Wishart 混合模型用于PolSAR 图像无监督分类,其基于像素块水平以获取空间信息,通过变分推断算法实现参数的闭式形式的更新以及聚类数目的自动确定.

4.3 半监督分类方法

在实际应用中,有标记样本往往难以获取,需要有经验的专家做标注或进行物理实验,非常昂贵和耗时.相比较而言,无标记样本往往非常充足且比较容易获取.半监督学习方法结合有监督和无监督学习,同时使用标记样本和大量的未标记样本进行分类训练.文献[148]结合无监督的确定性模拟退火方法和有监督的多层感知机方法构建了半监督学习方法.Niu 等[149]提出了一种半监督的随机期望最大化(Stochastic estimation maximization,SEM)算法,通过应用自适应马尔科夫随机场(MRF)有效开发了时空上下文信息,此外,提出了学习控制方案确保鲁棒的半监督映射过程以避免不希望的类合并.Uhlmann 等[150]针对小样本问题提出一种基于集成分类器的自训练方法,在小规模数据集上训练的分类器能达到有监督学习算法在显著更大训练集上得到的分类器相似的性能.Wei 等[151]提出一种基于超图学习的半监督分类方法,能有效提升分类精度,但创建超图的过程往往比较耗时.文献[78]给出一种基于图的半监督学习框架,首先做超像素分割,然后利用Wishart 距离做聚类,进而构建空间图结构进行半监督分类,在小样本情况下提升了分类精度.Liu 等[152]提出一种有邻域约束的半监督降维算法,该方法提取的特征不仅具有判别性而且保持了PolSAR 数据的结构,同时对噪声比较鲁棒,但这种邻域约束也会导致分类边界上的像素难以区分.Hua 等[153]提出一种基于改进的协同训练的半监督算法,首先分析两视角数据的充分性和独立性,然后执行带有样本选择策略的协同训练过程,最后通过基于相似性原则和超像素算法的后处理方法改善样本分类的一致性.Hou 等[154]针对有限的手动标记的样本量会限制自动分类方法的性能和手动标记的训练样本受噪声等影响导致质量较低的问题,提出一种鲁棒的半监督概率图分类框架,在半监督学习时使用邻域像素的结构信息,在训练分类器时使用鲁棒的分类损失函数,另外,通过混合的生成/判别分类框架解决有限标记数据不准确问题,其中标记和未标记样本同时被用于学习低质量像素的高级特征,从而保证了方法的有效性.Zhang 等[155]针对经典的半监督SVM 需要估计正负样本的分布问题,提出一种基于不同干扰因素的学习基和聚类评估手段的集成半监督SVM 模型,可以处理未知分布或不平衡数据情况下的半监督分类问题.Liu 等[156]给出一种基于空间多属性图模型的分类方法,根据PolSAR 数据特征组的物理属性构造多个图,然后自动优化每个图的权重,并结合像素的空间信息用于标签传播和分类,可以避免特征堆叠和维数灾难.Geng 等[157]提出一种具有多个决策的超像素约束深度神经网络用于PolSAR 图像分类,通过提取超像素空间特征可降低相干斑噪声的影响,另外,这种半监督方法可有效处理有限训练样本的问题.与有监督学习相比,半监督学习能有效利用无标记样本的信息,从而在少量标记样本情况下获得更好的分类效果.

上述方法都需要先提取人工设计的特征然后利用分类或聚类等算法进行有监督、无监督或半监督学习,而基于深度学习的方法通过深度神经网络的多个隐含层和非线性变换函数,可以从数据中自动学习平移不变的空间特征.目前随着深度学习的发展,具体实现也逐渐产生了有监督[158]、无监督[159−160]和半监督[161]等不同学习策略.基于深度学习的PolSAR 数据分类方法也由于较好的性能正得到越来越多的关注.Zhou 等[79]将PolSAR 协方差或相干矩阵转化为6 维实值向量,然后利用四层卷积神经网络对数据做特征提取和分类.Liu 等[81]提出了一种基于Wishart-Bernoulli 受限玻尔兹曼机的深度置信网络,但该网络模型是非任务主导的并且训练过程会比较耗时.为此,Jiao 等[162]设计了一种Wishart 深层堆叠网络,能快速执行分类任务.Hou 等[82]提出了基于多层自编码和超像素的PolSAR 图像分类方法.Zhang 等[163]采用堆叠稀疏自编码器学习PolSAR 数据的深度空间稀疏特征.Xie 等[164]将PolSAR 数据的Wishart 距离度量用于自编码和卷积自编码神经网络的训练中以实现无监督的特征提取.Liu 等[165]提出一种基于邻域保持的深度神经网络用于PolSAR 特征提取和分类,其使用了空间邻域信息和超像素信息对每个像素进行加权,可保持局部结构并减少了对样本数量的要求.上述这些方法大都仅考虑了PolSAR 数据的幅度信息,而未使用数据的相位信息.为此,Zhang 等[80]提出了一种复值卷积神经网络用于PolSAR 数据特征提取,将卷积神经网络的输入输出层、卷积层、激活函数和pooling 层都拓展到了复数域,能同时处理PolSAR 数据的幅度和相位信息.这类基于深度学习的分类方法对数据有很强的拟合能力和表达能力,可以达到非常好的分类效果,但也存在诸多问题,例如需要大量的样本进行训练,隐藏层的信息难以解释以及容易陷入局部最小值等.

图2 归纳总结了PolSAR 图像的分类中常用的特征类型,以及根据是否有人工指导划分的有监督、无监督及半监督的分类方法.总的来说,有监督学习方法需要有标注样本进行模型训练,充分利用了数据的类别先验信息;无监督学习主要通过数据的不同特征分离出属于同一类型的样本,不需要数据的标签信息,因此很难达到有监督分类的精度;半监督学习结合了前两者,同时使用有标注样本和大量无标注样本训练分类器,在小样本集上的结果能达到有监督学习在更大训练集上相似的效果.本节梳理了PolSAR 数据分类领域的研究现状和发展脉络,并对一些代表性的方法展开介绍,为读者提供参考.需要说明的是本节对相关研究方法的归类并非是严格的,某些方法可能属于多个类别,如基于深度学习的方法既可用于有监督分类,也可用于无监督和半监督分类中.

图2 PolSAR 图像分类方法归类Fig.2 The category of PolSAR image classification methods

4.4 实验对比

本节使用几种有监督的分类算法进行对比实验,包括有监督的Wishart 分类器(Supervised Wishart classifier,SWC)[83]、SVM 分类器、基于局部保持投影(Locality preserving projection,LPP)的方法[43]、实值卷积神经网络(RV-CNN)[79]以及复值卷积神经网络(CV-CNN)[80].前三种算法使用的特征是维数为45 的极化特征,LPP 先通过降维进一步提取特征再使用SVM 做分类.这三种方法都是随机选取1% 的样本作为训练集,其余作为测试集.RV-CNN 和CV-CNN 使用0.9% 的样本做训练,0.1% 的样本做验证,实验结果来自文献[80].

实验使用ESAR 系统获取的Oberfaffenhofen地区的全极化数据,尺寸为1 300×1 200,其Pauli分解图见图3(a).图3(b)展示了对应的真实分类图,其中黑色、灰色和白色区域分别对应城市、林地和其他开放区域.图3(c)∼3(g)展示了不同方法的分类图的对比结果,表3 给出了这些方法的分类准确率的对比结果,从表3 可以看出,SWC 的分类精度最低,其在城市区域有超过一半的像素被错分了.从图3(c)中也可以看到很多的黑色区域被错分成灰色和白色区域.LPP 的结果要优于SVM,因为SVM 直接使用了45 维的极化特征进行分类,而LPP 先提取更有判别性的低维本质特征再用SVM分类.RV-CNN 的结果仅优于SWC,因为它忽略了PolSAR 数据的相位信息.与其他方法相比,CVCNN 的整体分类精度最高,特别地,其在城市区域的分类精度比其他方法高近6%,这也体现了深度神经网络对复杂环境特征提取的优势.

表3 不同PolSAR 图像分类方法的分类精度比较(%)Table 3 Classification accuracy of different PolSAR image classification methods(%)

5 总结与展望

5.1 PolSAR 相干斑抑制

针对PolSAR 相干斑抑制问题,本文在第2 节总结了目前主要的三类方法:空域滤波、非局部均值和变分方法,并对其中的几个代表性方法进行了实验比较.其中,空域滤波方法操作简单、速度快,但会降低图像空间分辨率并导致图像的边缘和细节模糊.非局部均值方法在相干斑抑制和分辨率保持上都优于空域滤波方法,能显著抑制斑点噪声并很好保持图像的重复性结构特征,但计算速度很慢而且会出现像素块状效应.变分方法在较好去噪的同时能很好保持图像的边缘特征,并且计算速度相对较快,但会导致图像中一些细节的模糊.总的来说,每类方法都有各自的优缺点,因此需要根据实际应用的需求选择特定的斑点抑制算法.

图3 不同PolSAR 图像分类方法的对比结果Fig.3 Comparison results of different PolSAR image classification methods

相干斑抑制作为一个预处理过程,对PolSAR数据后续的解译影响很大.因此,去相干斑算法需要能很好保持原数据的极化特征和图像的结构特征,以保证后续分类或识别的精度.另外,随着PolSAR数据的规模越来越大,分辨率越来越高,也需要去相干斑算法具有较高的处理效率.关于未来可能的研究方向,我们认为可从以下几个方面进行考虑:

1)设计快速且效果好的相干斑抑制算法.在目前的相干斑抑制算法中,计算复杂度低的算法重建的图像分辨率往往不够高或细节保持的不好,而重构图像质量高的算法往往计算复杂度也比较高而且需要调整参数.因此设计去相干斑效果好并且处理速度快的算法是实用化的关键.可以借助对PolSAR数据的噪声模型、统计分布或极化分解的最新研究成果,结合现有的优势方法,构建更有效的滤波算法;或充分利用PolSAR 分类的最新结果,设计类内滤波的相干斑抑制算法,对算法进行并行化处理以及设计参数自动选取策略,提升计算效率.

2)设计具有自适应去相干斑能力的算法.不同的PolSAR 系统获取的图像往往分辨率不同,噪声程度也不同,即便同一PolSAR 系统,搭载不同波段的传感器获取的数据也差别很大.另外,由于地形地貌千变万化,PolSAR 数据对应的场景也往往各种各样.因此,针对不同的传感器、不同分辨率、不同程度的噪声以及不同类型的场景,设计能自适应地去相干斑的算法是未来的研究重点.不过设计这样通用且高效的算法往往比较困难,可以针对特定程度的噪声或特定类型的场景,充分利用先验信息,设计高效的算法,然后进行集成,根据场景及应用需求自动选择特定方法.

3)最新的图像处理或机器学习技术将为Pol-SAR 数据斑点抑制提供新的途径.例如深度自编码和深度卷积神经网络等技术在光学图像的去噪中达到了非常好的效果.然而,PolSAR 数据不像光学图像有真实数据做参考,并受数据量的限制,现有的这些新技术很难直接应用到PolSAR 数据处理中.另外,由于PolSAR 数据的噪声是乘性和加性的混合,并且涉及到复数据,这也为最新技术的推广增加了困难.能否通过模拟的PolSAR 数据进行网络训练或将在光学图像上训练的深度神经网络通过迁移学习用于PolSAR 数据的去噪中,还有待科研工作者的深入研究.

5.2 PolSAR 分类

本文在第3 节归纳总结了目前PolSAR 数据的常用特征,包括极化特征、统计特征、纹理特征、颜色特征、空间结构特征和基于深度学习提取的特征.在第4 节总结了目前PolSAR 图像的三大类分类方法:有监督学习、无监督学习和半监督学习,并对每个大类中的方法进行了详细地归纳和分类.

随着PolSAR 系统的发展和应用,获取到的PolSAR 数据的规模越来越大,对海量PolSAR 数据进行快速准确地分类是未来研究的重点问题.目前的分类方法主要集中于特征提取和分类器设计两个方面.在特征提取方面,如何结合PolSAR 数据的特点,利用深度神经网络更有效地自动提取特征,提取能有效反映散射体类型的新特征,以及对冗余特征进行选择以得到低维的更有判别性的特征仍是研究的重点;在分类器设计方面,如何借鉴最新的分类技术或使用多分类器的集成学习等方式,构造精度高、鲁棒性和泛化性强的分类算法也一直是研究的重点.除此之外,关于未来可能的研究方向,我们认为可从以下几个方面进行考虑:

1)实现少量标注样本情况下的高精度分类.PolSAR 图像不像光学数据那么直观,因此判读困难,需要有经验的专家进行标注,这个过程耗时耗力.因此,如何实现在只有少量标注样本情况下的高精度分类是研究的热点问题,半监督学习和主动学习为此提供了解决途径.半监督学习充分利用有标注和大量无标注样本的信息,能在小样本情况下获得不错的分类效果;主动学习可以从大量样本中选择信息最丰富的样本进行标注,以实现对尽可能少的样本进行标注而达到尽可能好的分类效果.目前,针对PolSAR 图像的这方面研究工作并不丰富,但具有重要的应用价值,值得深入研究.

2)设计基于多视角信息融合的分类算法.多视角数据可以是从不同传感器获取的信息或多种属性的特征.目前的一些PolSAR 系统可以提供多个波段的极化数据,甚至一些平台可以搭载除PolSAR外的其他传感器,从而可以获取大量的多视角数据.另外,PolSAR 图像可以通过极化、纹理和颜色等多视角特征集进行刻画,目前的PolSAR 分类方法多数是基于单视角或某几个视角数据的,但往往都是排成一个高维向量处理,忽视了特征的不同属性和视角间的关系.如何充分利用这些视角间的冗余性、互补性和一致性,设计有效的信息融合技术实现多种PolSAR 数据源、多传感器数据或多种属性的特征的融合处理,以提高分类精度也是未来研究的重要方向.

3)设计在线增量算法用于PolSAR 图像实时分类.在实际应用中,PolSAR 数据并非是静态的,而是动态数据流,即PolSAR 系统会不断获取新的数据,因此样本随着时间的累计不断增长.目前的PolSAR 分类方法基本上都是离线学习算法,它们假定数据是静态的且在整个训练集上学习模型并用于后续的分类,当有新的样本到来时不得不重新训练模型,这将非常耗时.而在线增量学习算法能高效地从动态变化的大规模数据流中增量地学习分类模型,并且无需使用之前的数据对模型重训练.在线增量算法能从新来样本中不断学习新信息更新分类器,并且不会遗忘先前学出的分类模型,具有很强的动态环境的自适应性,这将为PolSAR 图像的实时分类提供可能,是未来值得探索的研究方向.

猜你喜欢
极化分类器滤波
认知能力、技术进步与就业极化
极化雷达导引头干扰技术研究
基于干扰重构和盲源分离的混合极化抗SMSP干扰
基于朴素Bayes组合的简易集成分类器①
基于特征选择的SVM选择性集成学习方法
非理想极化敏感阵列测向性能分析
基于EKF滤波的UWB无人机室内定位研究
基于差异性测度的遥感自适应分类器选择
一种GMPHD滤波改进算法及仿真研究
基于自适应Kalman滤波的改进PSO算法