刘利敏,余 洁,燕 琴,刘振宇,朱 腾
(1.武汉大学遥感信息工程学院,湖北武汉430079;2.中国测绘科学研究院,北京100039)
引入纹理特征的SSVM算法在极化SAR影像分类中的应用
刘利敏1,余 洁1,燕 琴2,刘振宇1,朱 腾1
(1.武汉大学遥感信息工程学院,湖北武汉430079;2.中国测绘科学研究院,北京100039)
在极化SAR影像极化特征的基础上,引入影像的纹理信息,利用带核函数的SSVM算法对极化SAR影像进行分类研究。该方法首先利用精致LEE滤波器对极化SAR影像进行去噪处理;然后采用小波变换对去噪后的总功率影像Span进行纹理特征提取;最后将纹理信息和极化信息结合,并采用SSVM方法对极化SAR影像进行分类。利用NASA/JPL AIRSAR获取的L波段San Francisco海湾和荷兰中部Flevoland地区的影像对该方法进行验证,结果表明,SSVM算法可有效地用于极化SAR影像分类,且分类精度和分类效率都优于SVM算法。同时纹理信息的引入使SSVM算法的分类精度得到了进一步提高。
SSVM;小波变换;极化信息;纹理特征
全极化SAR记录了地物4种极化状态的散射回波,完整地包含了电磁波与地物作用时的极化状态信息,较普通单极化SAR影像具有更多的目标信息,在利用遥感对地观测中具有无可比拟的优势[1],可以对地物进行精细的分类[2]。由于遥感影像具有丰富的纹理信息,充分利用影像的纹理信息,也是提高分类精度的一种途径。
基于统计学习理论的支持向量机(support vector machine,SVM)是Vapnik[3]等人提出的一种专门解决小样本分类的有效的监督分类器。该算法利用非线性变换将输入空间中线性不可分的问题转化到高维空间,根据间隔最大化准则构造最优分类超平面,具有良好的泛化性能,对解决小样本、非线性及高维模式识别问题具有独特的优势,已在极化SAR影像分类中得到有效应用[4-5]。
2001年Y.J.Lee和O.L.Mangasarin使用光滑技术,对标准SVM进行改进,提出了光滑支持向量机(smooth support vector machine,SSVM)模型[6]。SSVM模型通过建立一个非光滑无约束近似的光滑无约束问题,将原来不可微的模型变得可微,从而可使用通常的最优算法求解,具有比标准SVM更好的分类性能和效率[7]。近年来,针对SSVM的研究主要集中在参数选择和求解方法两个方面,而对其应用的研究较少,在极化SAR影像处理领域,尚鲜见应用文章。为探讨该方法用于极化SAR影像分类的有效性,本文在Cloude目标分解理论的基础上,采用SSVM算法对极化SAR影像进行了分类研究,同时为了解决多维数据无法线性可分的问题,文中将核函数引入SSVM算法。为进一步提高分类精度,笔者利用小波变换提取极化SAR影像的纹理特征[8],并对引入纹理特征的SSVM算法在极化SAR影像分类中的应用进行探讨。
根据Cloude目标分解理论对具有统计信息的相干矩阵T3进行分解,得到3个独立的相干矩阵之和
式中,λi(λ1>λ2>λ3>0)和ei分别代表实特征值和特征向量,且λi代表3种散射机制中某种散射机制的强度。
根据分解得到的特征值,可以得到目标的散射熵H和表征平均散射机理的角度a。散射熵H表示散射媒介从各向同性散射到完全随机散射的随机性,即3种散射机制的平均信息量;散射角a是不同地物散射角,反映了地物的散射机理,具有旋转不变性,取值范围为0~π/2。其计算公式如下
试验中极化特征选择λ1、λ2、λ3、H、a。
极化SAR影像成像时由于微波波段对地面有一定的穿透能力,影像上的散射回波是地物和土壤散射回波的叠加,即存在混合像元问题,这些都干扰了极化SAR影像的分类效果。所以单纯地利用极化信息进行分类,难以获得较好的分类效果。而纹理特征也是极化SAR影像的重要信息。小波分析是一个时间和频率的局域变换,能有效地从信号中提取信息。极化SAR影像的总功率影像span含有丰富的纹理信息,本文通过小波分析理论对span进行分析,进而提取影像的纹理信息。通过引入一个函数簇
作为小波基,二维小波变换可以看做利用该小波基先对行进行高通滤波和低通滤波变换,再对列进行高通滤波和低通滤波变换。本文对原始影像进行1次小波分解,得到3个细节影像和1个近似影像。3个细节影像含有原始影像的高频信息;近似影像含有原始影像的低频信息。基于小波变换的纹理测度指标一般采用l1范数、平均能量、熵等特征。为简便起见,采用小波分解频带影像的l1范数作为影像纹理测度,计算公式为
式中,M×N为频带影像的大小;x(m,n)表示影像m行n列的小波系数。
在一个给定的n维空间中有m个样本Amn,其中第i行列数据代表第i个样本的第j个特征。将这m个样本分为A+和A-两类,分别记为1和-1。D是M×M的对角阵,Dii代表第i类的类别。该分类的标准SVM模型[6-7]为
对于某个v>0,有
式中,y是当A+和A-不能严格线性可分时,引入的松弛变量;v表示对松弛变量的惩罚参数;w是将两类样本严格线性分开的边界面的n维法线向量。
将式(5)转化为无约束的支持向量机模型
该优化问题的目标函数具有强凸性和唯一解,但不具有光滑性。为了快速求解该模型,Lee和Mangasarian用sigmoid积分函数
作为光滑函数,对上述模型作光滑处理,得到光滑无约束的支持向量机模型SSVM
核函数思想是通过k(x,y)将输入空间Χ映射到高维Hilbert空间H,然后在高维空间划分,寻找最优解的。增加核函数的后的SSVM模型转化为
经过改进后的SSVM模型具有强凸性和光滑性,可以选择快速的求解算法,对该模型的求解有BFGS-Armijo和 Newton-Armijo两种方法。Newton-Armijo算法[7]适用条件是目标函数具有二阶光滑性,且分类效率优于BFGS-Armijo。
为验证SSVM算法在极化SAR影像分类中应用的有效性及影像的纹理特征的引入对分类效果的影响,选取两幅极化 SAR影像进行试验,即NASA/JPL实验室AIRSAR系统在美国San Francisco海湾和荷兰中部Flevoland地区获得的L波段的全极化影像。分别对试验影像采用SVM算法分类、SSVM算法分类,以及结合纹理信息的SSVM算法分类。
试验中选择Newton-Armijo作为SSVM的快速求解算法。带核函数的SSVM模型参数径向基宽度δ=2-5,2-4,2-3,2-2,2-1,20,21,22,23和惩罚因子v=10-1,100,101,102,103,104,105共63种参数组合进行交叉验证试验,获取分类精度最高组合作为最优参数组合。
1.San Francisco分类试验及结果分析
试验选取San Francisco海湾部分极化SAR数据进行分类试验。试验区大小为790像素×630像素,主要地物包括城区、海洋、森林,以及金门大桥、马球场、高尔夫球场等典型地物。Pauli基合成影像与对应地区的光学影像如图1示。
图1 San Francisco地区数据
在极化SAR影像中,城市表现为偶次散射,森林表现为体散射;海洋表现为低熵表面散射;马球场、高尔夫球场及海岸由于是大块的硬质平面区域,散射特性接近于裸地;金门大桥是金属硬目标,散射性质与城区相同。因此试验时,笔者根据地物散射特性的差异,将影像中地物类型分为4类,即城区、海洋、植被和裸地。利用相同的训练样本,分别采用SVM算法、SSVM算法,以及结合纹理信息的SSVM方法进行分类试验。当δ=0.125、v=100,δ=1、v=1000,δ=0.5、v=10 000时,SVM分类方法、SSVM分类方法,以及结合纹理信息的SSVM分类方法分别获得最佳分类效果,结果如图2所示。
图2 3种分类方法的分类结果
图2(a)利用SVM分类的结果中,4种类别区域虽大致得到划分,但是类内分布大量斑点,杂波较多,部分地物结构不完整,尤其是左上角的方框区域,类别不清,山脊结构完全丧失。而图2(b)利用SSVM算法分类的结果中,类内杂斑问题得到改善,方框区域类别更清晰,将SVM算法无法正确分类的区域进行了有效分类。利用SVM算法进行分类,高尔夫球场(椭圆区域)分类效果不理想,只分出了部分区域,而SSVM算法的分类结果中,高尔夫球场的结构完整。SSVM算法分类结果中,虽然地物类别结构完整清晰,但由于SSVM模型本身的限制,使得分类结果丧失部分细节,如城区中的道路,利用SVM算法分类能区分部分道路,但利用SSVM算法分类结果中道路的细节就被消去了。对比图2(a)与图2(b)发现,利用SSVM算法得到的分类结果总体优于SVM分类方法。
对比图2(b)与图2(c),图2(c)结合纹理特征的SSVM分类方法的分类结果杂斑比图2(b)中更少,各类别结构分明,而且影像的左上角区域山脊线很完整,这是由于试验区类别间结构差异大,所以纹理信息的引入可以使类别更好地保持结构的完整性。此外对于方框标识的道路,由于纹理信息的引入,图2(c)中取得较好的分类效果,呈现连通分布完整区域,而在图2(a)、图2(b)中是断裂的。由于试验区纹理信息较为丰富,所以图2(c)中结合纹理信息的SSVM分类结果较另两种分类方法,类别层次更为明显,整体分类效果得到改善。
此外,由于SSVM算法的光滑处理,使得牛顿算法等优化求解算法可以应用到SVM中,从而大大地提高了算法的计算效率。表1给出了3种试验方法的运算时间,采用SSVM算法耗时较短。
表1 SSVM与SVM算法在San Francisco分类试验中的运算时间 s
3个试验对比发现,SSVM算法在进行极化SAR影像分类时,可获得更好的分类性能和效率。这是由于SVM模型是一个非光滑的无约束二次规划问题,在进行拉格朗日对偶转换时,会带来一部分计算错误,而SSVM模型将SVM的非光滑无约束的问题转化为光滑无约束问题,进而可以采用通常最优问题求解方法进行求解,这不但修正了SVM模型中利用拉格朗日求解非光滑无约束问题带来的部分错误,而且加快了计算速度。而纹理特征提供了类别间的差异,补充了单纯利用极化信息的分类的不足,所以有助于分类效果的改善。
2.Flevoland分类试验及结果分析
为对本文方法进行定量评价,采取同样的方法对Flevoland地区数据进行试验。试验区共有7类地物:裸地、土豆、甜菜、苜蓿、草地、油菜籽及大麦。当δ=0.25、v=1000,δ=0.5、v=1000,δ=0.75、v= 100 000时,SVM分类方法、SSVM分类方法及结合纹理信息的SSVM分类方法分别获得最佳分类效果,如图3所示。
图3 3种分类方法的分类结果
表2列举了3种试验方法对不同地物的分类精度和运行效率。表2中 SSVM算法的分类度为86.75%,比SVM算法提高了0.83%,而加入纹理特征的分类精度达到88.13%,比SSVM算法分类精度提高1.38%。此外SSVM算法耗时也比SVM短,进一步验证了本文方法的有效性。
表2 3种分类方法分类精度和运行时间对比
对于散射特性相近的地物,仅利用极化信息的传统分类方法难以取得较好的分类效果。本文利用小波变换获取的极化SAR影像纹理结构信息,结合影像的极化散射信息,采用带核的SSVM算法进行分类试验。由试验结果得到以下结论:
1)由于光滑函数的引入,SSVM算法在进行极化SAR影像分类时较SVM算法具有更好分类性能和更高分类效率,可以有效地运用于极化SAR影像分类研究。
2)在结合影像极化信息的同时,以纹理信息为代表的地物空间结构的有效利用也有助于地物类别的区分。尤其对地物类别的散射机制相似的情况,类别间空间结构关系的研究是一个很重要的研究内容。
[1] 周晓光,匡纲要,万建伟.极化SAR图像分类综述[J].信号处理,2008,24(5):806-812.
[2] 吴婉澜,皮亦鸣,何强.Adaboost算法实现全极化SAR图像分类[J].2009,25(10):1594-1597.
[3] VAPNIK V N.An Overview of Statistical Learning Theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[4] 吴永辉,计科峰,郁文贤.利用SVM的全极化、双极化和单极化SAR图像分类性能的比较[J].遥感学报,2008,12(1):46-52.
[5] 汪洋,鲁加国,张长耀.基于支持向量机的极化SAR图像分类[J].信号与信息处理,2007(4):11-13.
[6] LEE Y J,MANGASARIAN O L.SSVM:A Smooth Support Vector Machine for Classification[J].Computation Optimization and Applications,2001,22(1):5-21.
[7] 袁玉波,严杰,徐成贤.多项式光滑的支撑向量机[J].计算机学报,2005,28(1):9-17.
[8] 郭召玲,郭达志,张海荣.基于小波纹理信息的星载SAR图像与TM图像的数据融合[J].测绘学报,2002,31(4):339-343.
[9] FUKUDA S,HIROSAWA H.A Wavelet-based Texture Feature Set Applied to Classification of Multifrequency Polarimetric SAR Images[J].IEEE Transactions on Geoscience and Remote Sensing,1999,37(5):2282-2286.
Research on PolSAR Image Classification Based on SSVM Algorithm and Texture Feature Introducion
LIU Limin,YU Jie,YAN Qin,LIU Zhenyu,ZHU Teng
0494-0911(2012)08-0007-04
P21
B
2011-10-19
国家863计划(2011AA120404);武汉大学博士基金(201121302020006)
刘利敏(1988—),女,河南驻马店人,硕士生,主要研究方向为极化SAR影像处理。