一种改进的全极化SAR图像MCSM-Wishart非监督分类方法

2015-12-25 07:13杜培军
自然资源遥感 2015年2期
关键词:极化分类器聚类

陈 军,杜培军,2,谭 琨

(1.中国矿业大学国土环境与灾害监测国家测绘地理信息局重点实验室,徐州 221116;2.南京大学江苏省地理信息技术重点实验室,南京 210023)

0 引言

全极化合成孔径雷达(polarimetric synthetic aperture Radar,PolSAR)系统是在传统的单极化、双极化和多极化雷达系统基础上发展起来的新型主动微波成像系统,如何通过全极化SAR系统提供的极化信息对地物进行分类已成为全极化SAR图像应用的一个重要方面[1]。传统的单极化和多极化SAR图像处理通过提取纹理信息、极化信息等进行分类,然而,无论单极化还是多极化SAR系统获取的都是部分极化信息;而全极化SAR系统包含同极化、交叉极化等不同的极化信息,可以全面反映地物目标的物理性质。

国内外学者在全极化SAR图像极化特征提取方面开展了大量研究[2-7]。利用极化分解获得的特征可以对全极化 SAR 图像进行分类[8-15]。Lee等[8]首先用H/Alpha分解法提取的特征对图像进行初始聚类,得到8个聚类中心;然后用描述多视协方差矩阵的复Wishart迭代分类器对图像进行分类(简称 H/Alpha- Wishart分类器)。Pottier等[9]提出了H/Alpha/A-Wishart分类器,在H/Alpha分解的基础上加入A特征,将图像聚成16类,再对图像进行复Wishart迭代分类。Lee等[10]进一步结合Freeman分解法对上述方法进行改进,提出Freeman-H/Alpha-Wishart分类器,该分类器通过Freeman分解提取体散射、表面散射和二次散射信息,然后根据H/Alpha/A-Wishart分类器进行分类,分类中要求各类别必须保持纯净性(即各类别内部各像元必须基于相同的散射性质),必须是体散射、表面散射或二次散射中的一种,该分类器已经隐含参考Freeman分解进行分类,但并没有直接利用Freeman分解得到的特征,而是简单地要求分类结果必须具有相同的散射性质,因此还具有一定局限性。

无论H/Alpha-Wishart分类器、Freeman-H/Alpha-Wishart分类器或者 H/Alpha-SPAN[11]分类器,其分类结果均明显依赖于H/Alpha初始聚类结果,导致最终分类精度不高。针对这一问题,本文提出一种改进的分类方法,该方法充分利用了全极化SAR图像的表面散射、体散射、二面角散射、螺旋体散射和线散射等极化特征,在没有人工干预的情况下能够得到较好的聚类结果。

1 H/Alpha/A-Wishart分类方法及改进思路

1.1 分类方法

1.1.1 H/Alpha/A 分解与初始聚类

H/Alpha/A分解主要是提取全极化SAR图像的散射熵H、散射角α(即Alpha,下同)和反熵A信息。其基本原理如下:

极化相干矩阵T可以表示为3个独立的相干矩阵之和[2],即

式中:λi为特征值(i=1,2,3);ei为矩阵T的第i个复特征向量;为ei的共轭矩阵。

在此基础上,Cloude等[2]定义了熵H,用于表示地物散射的随机程度,即

式中Pi为各特征值所占的百分比,即

散射角α代表二面角散射和表面散射的平均散射程度,即

反熵A表示优势散射以外的较弱散射分量间的关系[9],即

根据H和α的不同取值,即可确定图像每个像元在H/Alpha平面(图1)中的位置,从而将像元归入8个不同的类别;对每个类别取平均操作,得到初始聚类结果。加入A后,设置1个阈值,可以得到16个不同的类别。

图1 H/Alpha 分类图[2]Fig.1 Classification image of H/A lpha[2]

1.1.2 基于复Wishart分布的极大似然分类

以1.1.1节初始聚类结果作为中心,进行基于复Wishart分布的极大似然分类。其原理[8]如下:

极化协方差矩阵的概率密度分布函数服从n个自由度的复Wishart分布,其分布函数PT为

其中

式中:n为视数;q代表不同的极化方式,在互易性情况下,q=3;Tr为矩阵的迹;C为极化协方差矩阵;∑=E(C);K为归一化因子;Γ(·)为Gamma函数。对矩阵进行线性变换可以得到极化相干矩阵T。因此,极化相干矩阵的概率密度分布函数也服从n个自由度的复Wishart分布。

进一步对图像进行开窗操作,计算窗口内所有像元的平均极化相干矩阵;然后分别求该矩阵与8个类别中心的距离[8],即

式中:∑i为第i个类别中心的极化相干矩阵;T为窗口内所有像元极化相干矩阵的均值矩阵。比较8个距离,将像元归为距离最小的那一类。

1.2 分类器存在的问题及改进思路

H/Alpha的初始聚类过程是根据图1内H和α的不同取值进行初始类别划分的。而实际上,H和α取值和不同的地物类型并没有严格的对应关系[8]。另外,该聚类在算法实现上也是采用近似的形式,没有完全按照图1内的曲线进行边界划分,因此,由图1得到的初始聚类结果存在一定的偏差。对于基于初始聚类中心的分类算法,初始聚类中心的位置直接影响最终分类结果,若该位置选择不当,必然会降低分类精度。因此,对极化特征分解和初始聚类过程进行改进,有望提高全极化SAR图像的分类精度。

2 改进的MCSM-Wishart分类算法

本研究从2个方面优化初始聚类效果:①引入MCSM分解对全极化SAR图像进行极化分解,提取表面散射、二次散射、体散射、螺旋体散射和线散射等更为全面的基本散射信息作为特征,解决仅使用H,α和A特征进行初始聚类的不足;②使用聚类效果更好的ISODATA聚类算法代替图1中的简单聚类算法,以提高初始聚类精度。

2.1 MCSM 分解

MCSM分解的极化协方差阵[6]为

式中:fs,fd,fv,fh和fw分别为表面(surface)散射、二次(double)散射、体(volume)散射、螺旋体(helix)散射和线(wire)散射系数;α,β,γ和ρ为未知数;α*,β*,γ*和 ρ*分别为 α,β,γ 和 ρ的共轭。求解式(9),即可得到各散射系数及α和β的值;γ和ρ可以通过下式求解[6],即

式中SHH,SVV,SHV和SVV分别表示极化方式为HH,VV,HV和VV的散射矩阵。

根据各散射成分的系数,即可计算各散射功率的值,计算公式[6]为

式中:Ps为表面散射功率;Pd为二次散射功率;Pv为体散射功率;Ph为螺旋体散射功率;Pw为线散射功率。

对极化协方差矩阵进行线性变换可以得到极化相干矩阵。因此,极化相干矩阵同样可以通过MCSM分解得到以上各散射成分的系数。从当前极化目标分解算法的发展和评述来看,MCSM分解的方法能充分提取出各种自然和人工地物的各种散射成分的信息,将这些信息作为特征向量可以较全面地反映图像的物理性质[16]。

2.2 ISODATA 聚类

ISODATA是一种运行速度较快、可以自动合并和分裂聚类结果的非监督分类或聚类方法。与K-means聚类算法相比,ISODATA可以进行类别的合并和分裂,灵活性较好,聚类结果更为合理。大量实验分析表明,ISODATA聚类具有算法实现简单、运算速度快、聚类效果较好等特点。

传统的ISODATA聚类算法多采用欧式距离计算样本与聚类中心的距离。但考虑到极化数据不同于光学数据的概率分布,本文对比欧式距离和马氏距离后,采用马氏距离进行距离计算,即

式中样本si与中心mj分别为

2.3 MCSM-Wishart分类器改进

改进MCSM-Wishart分类器的核心思想是:①引入MCSM分解对图像进行极化分解,提取表面散射、二次散射、体散射、螺旋体散射和线散射等更为全面的基本散射信息作为特征;②使用聚类结果更好的ISODATA算法。因此,MCSM-Wishart分类器的改进主要包括4个部分:图像预处理、极化特征的提取、初始聚类结果的生成和复Wishart分布的迭代分类。具体分类步骤如下:

1)数据预处理。读入全极化SAR图像,进行多视处理,按照通用方法将多视比设为7∶1。设置滤波窗口大小为7像元×7像元,进行Refined Lee滤波,得到图像的极化相干矩阵T。

2)MCSM分解。设置的窗口大小与步骤1)保持一致,对极化相干矩阵T进行MCSM分解,提取表面散射、二次散射、体散射、螺旋体散射和线散射等多种散射成分,将其组合成特征向量,用以表征极化信息。

3)ISODATA初始聚类。设置ISODATA聚类算法的初始条件(最小、最大类别等),对步骤2)产生的特征向量进行迭代聚类,生成初始聚类结果。

4)计算聚类中心。在各聚类内部进行平均操作,计算出初始聚类中心。

5)计算距离并聚类。选择步骤4)生成的聚类中心,设置循环条件,进行基于复Wishart分布的迭代分类;根据式(8)计算图像内所有像元到各聚类中心的距离,将像元归入距离最小的类别。

6)判断是否满足循环终止条件,若不满足,返回步骤4)继续进行计算;否则,完成分类。

3 实验与分析

为验证本文算法,选择南京溧水和盐城滨海研究区2景ALOS的1.1级PALSAR(phased array L-band SAR)图像(全极化方式)的子图像为数据源进行实验。2景图像的获取时间分别为2011年3月22日和2009年4月9日。其中,研究区1(南京溧水)图像大小为400像元×400像元,研究区2(盐城滨海)图像大小为500像元×500像元。研究区内包括水体、建筑物、耕地、林地和道路等地物类型。实验结果采用目视解译数据和Google Earth图像,通过综合对比的方法确定测试样例,进行精度评价。研究区1的Google Earth图像成像时间为2013年4月10日;研究区2的TM图像成像时间为2010年4月29日。2个研究区均属县级行政单位下的乡镇地区,全极化SAR图像、TM图像和Google Earth图像在获取时间间隔内土地利用变化较小,因此虽然在时相上有一定差距,但仍具有参考价值。

实验采用的处理软件为POLSARPro(the polarimetric SAR data processing and educational tool)软件,数据预处理包括多视处理、滤波和极化特征分解等,传统 H/Alpha/A-Wishart分类算法及监督-Wishart分类算法采用该软件自带的功能,改进算法采用C语言实现。

研究区1和研究区2的Pauli基分解[1](极化校准)及假彩色合成图像如图2所示。

图2 研究区Pauli基分解及假彩色合成图像Fig.2 False color com posite images and Pau li decomposition of two study areas

首先进行图像预处理工作,包括多视、滤波和极化特征分解。对图像进行多视处理,多视比设为7∶1;对多视处理后的图像进行窗口大小为7像元×7像元的Refined Lee滤波处理;通过MCSM分解提取出各种散射成分。然后进行初始聚类,ISODATA算法设置的初始条件为:最小类别为8,最大类别为12,类内最小个数为2,类间最小距离为4,最大迭代次数为20,最大类标准差为1。通过聚类结果计算聚类中心,最后进行复Wishart分类,得到分类结果。

作为对比,本文还分别进行了H/Alpha-Wishart和H/Alpha/A-Wishart算法的非监督分类实验,并选择训练样本进行了监督-Wishart分类实验。其他分类器如 Freeman-H/Alpha-Wishart,H/Alpha-SPAN等的分类精度与H/Alpha/A-Wishart分类器的分类精度相似。为便于研究,仅以H/Alpha-Wishart和H/Alpha/A-Wishart算法进行实验。为便于比较分类结果,结合训练样本和监督分类结果对非监督聚类后的结果进行了类别合并(图3和图4)。

图3 研究区1不同算法分类结果Fig.3 Classification results by different algorithms for study area one

从图3(a)可以看出,在研究区1,原H/Alpha-Wishart算法将水体和耕地混分。原因在于,当水体面积较少时,H/Alpha分解提取出的特征不足以反映地物的极化性质,因此影响了最终的精度。虽然对H/Alpha/A-Wishart算法有所改善,但整体精度仍低于改进后的MCSM-Wishart算法精度。通过对比图3(b)与图3(c)可以看出,在研究区1,H/Alpha/A-Wishart算法存在耕地和林地混分、林地和建筑物混分的情况,而MCSM-Wishart算法则较少存在以上混分现象。另外,MCSM-Wishart算法提取出的水体也多于H/Alpha/A-Wishart算法,这是因为,MCSM算法提取出了更多的极化特征用于分类。

图4 研究区2不同方法分类结果Fig.4 C lassification resu lts by different algorithm s for study area two

对比图4(a)(b)(c)可以看出,在研究区2,H/Alpha-Wishart和H/Alpha/A-Wishart算法均不同程度地存在建筑和道路混分、道路和水体混分的情况;而MCSM-Wishart算法则能较好地区分出建筑、道路和水体,图4下部的水体中混有道路的情况得到了改善,图4右上部的建筑物中混有道路的情况得到改进。主要原因是MCSM方法提取出了螺旋体散射、线散射等较多的能反映城市地区地物类型的特征,因此能较好地对城市及周边的不同人造地物进行类别划分。

为比较各算法的分类精度,结合Google Earth图像、TM图像对2个研究区进行人工采样,手工选择了各种地物类型的测试样本如表1所示。

表1 测试样本Tab.1 Test sam p les (像元)

4种算法的分类精度见表2。

表2 4种算法的分类精度Tab.2 Classification results of four kinds of algrithm

从表2可以看出,无论研究区1还是研究区2,MCSM-Wishart算法的分类精度均有较大提升,分别比 H/Alpha/A-Wishart算法提高了4.22%和11.81%;Kappa 系数则分别提高了0.05 和0.16。

与监督-Wishart算法相比,MCSM-Wishart算法精度稍差,说明极化特征提取方法还有需要完善之处。4种算法的执行效率见表3。

表3 4种算法的执行效率Tab.3 Efficiency of four kinds of algorithm(s)

从表3中4种算法的运行时间来看,MCSMWishart算法效率高于H/Alpha/A-Wishart算法。虽然监督-Wishart算法需要的时间更短,但这个时间并未包含选择训练样本的时间、也没有考虑训练样本选择的实际困难。因此总的来看,MCSMWishart算法是一种有效的非监督分类算法。

综上所述,无论总体精度、Kappa系数还是运行效率,MCSM-Wishart算法均较 H/Alpha-Wishart算法和H/Alpha/A-Wishart算法有了明显的提高。

4 结论

1)经典的全极化SAR图像非监督分类主要以H/Alpha/A分解提取的极化特征为基础进行图像分类,但总体分类精度往往较低,不能满足应用要求。造成这种情况的原因是多方面的,如该分解法并不能完全提取反映全极化SAR图像的全部特征,选择的分类器并不能很好地对图像进行分类等。

2)引入MCSM算法是提高全极化SAR图像分类准确性的有效途径之一。本文在传统的极化信息提取基础上,引入多极化特征提取的MCSM算法,全面提取出反映城市地物类型的极化特征;然后通过改进的聚类算法进行初始聚类,以此为基础对原H/Alpha/A-Wishart分类器进行改进。

3)以ALOS的PALSAR图像为遥感数据源进行综合分类实验的结果表明,改进的MCSM-Wishart分类算法较经典的H/Alpha/A-Wishart分类器在分类精度、Kappa系数、算法效率等指标上均有很大的提高。因此,提取全极化SAR图像的线散射等极化特征,然后与二次散射、表面散射和螺旋体散射等经典的极化特征相结合,辅以速度快、精度高的ISODATA聚类算法,可以有效地提高全极化SAR图像分类的精度。

4)下一步的研究将充分考虑从全极化SAR图像中提取其他的特征(如纹理和空间几何信息等),并将其与极化特征相结合,对H/Alpha/A-Wishart分类器作进一步改进。

志谢:感谢欧洲空间局提供开源软件 POLSARPro。

[1] Cloude SR,Pottier E.A review of target decomposition theorems in Radar polarimetry[J].IEEE Transactions on Geoscience and Remote Sensing,1996,34(2):498-518.

[2] Cloude SR,Pottier E.An entropy based classification scheme for land applications of polarimetric SAR[J].IEEE Transactions on Geoscience and Remote Sensing,1997,35(1):68-78.

[3] Freeman A,Durden S L.A three-component scatteringmodel for polarimetric SAR data[J].IEEE Transactions on Geoscience and Remote Sensing,1998,36(3):963-973.

[4] Yamaguchi Y,Moriyama T,Ishido M,etal.Four-component scatteringmodel for polarimetric SAR image decomposition[J].IEEE Transactions on Geoscience and Remote Sensing,2005,43(8):1699-1706.

[5] Yamaguchi Y,Sato A,BoernerW M,et al.Four-component scattering power decomposition with rotation of coherency matrix[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(6):2251-2258.

[6] Zhang LM,Zou B,Cai H J,et al.Multiple-component scattering model for polarimetric SAR image decomposition[J].IEEE Geoscience and Remote Sensing Letters,2008,5(4):603-607.

[7] 王 庆,曾琪明,廖静娟.基于极化分解的极化特征参数提取与应用[J].国土资源遥感,2012,24(3):103-110.doi:10.6046/gtzyyg.2012.03.19.Wang Q,Zeng Q M,Liao J J.Extraction and application of polarimetric characteristic parameters based on polarimetric decomposition[J].Remote Sensing for Land and Resources,2012,24(3):103-110.doi:10.6046/gtzyyg.2012.03.19.

[8] Lee JS,GrunesM R,Ainsworth T L,etal.Unsupervised classification using polarimetric decomposition and the complex Wishart classifier[J].IEEE Transactions on Geoscience and Remote Sensing,1999,37(5):2249-2258.

[9] Pottier E,Lee JS.Application of the H/A/α polarimetric decomposition theorem for unsupervised classification of fully polarimetric SAR data based on the Wishart distribution[J].Proceeding of the Committee on Earth Observing Satellites SARWorkshop.Toulouse:NASA,1999:335-340.

[10] Lee JS,Grunes M R,Pottier E,et al.Unsupervised terrain classification preserving polarimetric scattering characteristics[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(4):722-731.

[11] Cao F,Hong W,Wu Y R.An improved Cloude-Pottier decomposition using H/α/SPAN and complex Wishart classifier for polarimetric SAR classification[C]//International Conference on Radar.Shanghai:IEEE,2006:1-4.

[12] 杨 磊,刘 伟,王志刚.加权全极化SAR图像非监督Wishart分类方法[J].电子与信息学报,2008,30(12):2827-2830.Yang L,Liu W,Wang ZG.Weighted-based unsupervised Wishart classification of fully polarimetric SAR image[J].Journal of Electronics and Information Technology,2008,30(12):2827-2830.

[13] 郎丰铠,杨 杰,赵伶俐,等.基于Freeman散射熵和各向异性度的极化SAR影像分类算法研究[J].测绘学报,2012,41(4):556-562.

Lang F K,Yang J,Zhao L L,et al.Polarimetric SAR data classification with freeman entropy and anisotropy analysis[J].Acta Geodaetica et Cartographica Sinica,2012,41(4):556-562.

[14] 赵伶俐,杨 杰,李平湘,等.极化SAR影像弱散射地物统计分

类[J].遥感学报,2013,17(2):312-310.Zhao L L,Yang J,Li P X,et al.Statistical classification of weak backscattering scatterers of PolSAR image[J].Journal of Remote Sensing,2013,17(2):312-319.

[15] Paladini R,Martorella M,Berizzi F.Classification ofman-made targets via invariant coherency-matrix eigenvector decomposition of polarimetric SAR/ISAR images[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(8):3022-3034.

[16] Zhang LM,Lu D,TangW Y.A GS-based built-up area detection method using polarimetric SAR images[C]//2012 IEEE International Geoscience and Remote Sensing Symposium.Munich:IEEE,2012:5911-5914.

猜你喜欢
极化分类器聚类
认知能力、技术进步与就业极化
极化雷达导引头干扰技术研究
基于干扰重构和盲源分离的混合极化抗SMSP干扰
基于特征选择的SVM选择性集成学习方法
基于K-means聚类的车-地无线通信场强研究
非理想极化敏感阵列测向性能分析
基于深度优先随机森林分类器的目标检测
基于差异性测度的遥感自适应分类器选择
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现