余莎莎,余 洁,2,3,4,朱 腾,王彦兵,2,3
(1. 首都师范大学资源环境与旅游学院,北京 100048; 2. 首都师范大学城市环境过程与数字模拟国家重点实验室培育基地,北京 100048; 3. 首都师范大学三维信息获取与应用教育部重点实验室,北京 100048; 4. 首都师范大学资源环境与地理信息系统北京市重点实验室,北京 100048; 5. 广东工业大学机电工程学院,广东 广州 510006)
全极化合成孔径雷达(polarimetric synthetic aperture Radar,PolSAR)通过记录4种极化状态的散射回波,能够获取地物更加丰富的信息,在目标检测、识别及地物分类领域作用突出[1]。全极化SAR影像分类已经成为SAR影像处理的研究热点之一[2]。
针对全极化SAR影像分类方法的选择,近年来,已有很多学者展开了大量的研究。常用的分类器有支持向量机分类器(support vector machine,SVM)、SSVM分类器、K-means分类器、C均值分类器、Wishart分类器、随机森林分类器、神经网络分类器及近年来在诸多领域取得成功应用的深度学习分类器等[3-4]。基于群智能的优化算法由于其优秀的随机全局优化能力在遥感图像分类领域也备受关注[5]。由于全极化SAR影像成像的复杂性带来的高维数大数据量问题导致影像分类的复杂度不断提高,由Kennedy等提出的粒子群优化算法(particle swarm optimization,PSO)[6]具有自适应、自组织的智能特性及强大的全局寻优能力,并且能够对SAR影像面临的高维数及大数据量问题快速寻找最优解,在SAR图像处理领域已有一些应用。
相比传统单极化SAR影像仅利用强度数据进行分类,全极化SAR影像丰富的极化特征信息可以有效提高极化SAR影像的分类效果[7]。极化特征提取通常采用的方法为进行极化目标分解。极化目标分解分为相干与非相干目标分解,相干目标分解多用来提取稳定目标的极化特征,由于自然界物质的复杂性,目标散射特性呈现很强的变化性,因而提取自然界目标的极化特征多采用非相干目标分解方法[8]。非相干目标分解主要有基于模型的分解及基于特征值的分解两大类,基于特征值的分解方法有H/α分解及H/α/A分解[9],常用于极化特征的提取,但是这两种分解方法分解的类型依赖人工经验,容易造成类别模糊;基于模型的分解方法目前有较多研究进展,Freeman等提出的3分量分解[10],利用了地物的极化特征,但只适用于满足反射对称性的地物目标,而不适用于不满足反射对称性的城市区域或一些复杂地区;张腊梅等[11]考虑自然界很多地物散射过程可以看作5种散射机理的不同组合,提出一种同时适用于描述人造地物散射特性的多成分散射模型分解方法(multiple-component scattering model,MCSM)。该方法利用了相干矩阵的全部元素,更为全面地提取了地物的极化特征。
基于以上所述,本文拟采用分类器PSO算法和MCSM多分量散射模型分解方法进行全极化SAR影像分类。考虑全极化SAR影像相邻像素间具有空间相关性,利用权重的概念能够很好地表征影像像元间的空间连续性,本文提出将加权Wishart距离作为PSO算法中的适应度判别函数以判断粒子优劣来改进PSO算法,以提高最终获得的聚类中心的估值精度。同时,由于基于特征值的目标分解中的散射熵可以用来表征媒质散射的随机性[9],通过H值的大小可以反映目标去极化效应的程度,从而能够较好地确定影像每个像元的极化散射特性。因此,本文将从MCSM所提取的5种极化特征与影像散射熵分量相结合,对地物进行基于非相干目标分解的初分类。
相比单极化SAR影像,全极化SAR影像通过记录4种极化状态的散射回波,获取更多能表征地物特征的极化信息。充分提取全极化SAR影像的极化特征将有效提高影像分类效果,本文采用多分量散射模型分解方法(MCSM)与散射熵结合,充分利用6种极化特征进行影像初分类过程。
由于自然界很多地物散射过程都可以看作是由表面散射、偶次散射、体散射、螺旋体散射及线散射这5种基本散射机理组成的。张腊梅等[11]提出了基于这5种散射机制的极化目标分解方法。将获取的目标协方差矩阵表示为
C=fsCs+fdCd+fvCv+fhCh+fwCw=
(1)
式中,fs、fd、fv、fh、fw分别为表面散射、偶次散射、体散射、螺旋体散射及线散射系数;α*、β*、γ*、ρ*为未知数,为α、β、γ、ρ的共轭。其中
(2)
式中,SHH、SVV、SHV、SVV为全极化SAR影像4种极化方式所对应的矩阵。
根据式(1)和式(2),最终可计算出各散射功率的值,计算公式为
(3)
式中,Ps、Pd、Pv、Ph、Pw分别为表面散射、偶次散射、体散射、螺旋体散射及线散射功率值。
由于极化相干矩阵可以与极化协方差矩阵进行线性转换,因此,利用极化相干矩阵同样可以进行MCSM分解提取5种分量的功率值。通过MCSM分解能够充分提取全极化SAR影像的各种散射成分信息,从而较全面地反映地物的特征[11]。
1986年,Cloude等[9]提出了基于特征值分解的极化目标分解方法,将相干矩阵T分解为3个独立的相干矩阵之和
(4)
式中,λi和ei分别表示特征值和特征向量;*表示共轭转置。Cloude等在此基础上定义了一个物理量即散射熵(entropy),用来表示媒质散射的随机性。
(5)
群智能算法中的粒子群优化算法具有优秀的随机全局优化能力,在影像分类领域作用突出,能够快速寻找高维数的全极化SAR影像分类聚类中心最优解。因此,本文采用该方法进行最终聚类中心的寻优,同时由于全极化SAR影像的极化散射矩阵服从Wishart分布,并且遥感影像相邻的像元之间具有相互关系,属于同一类别的像元往往聚集在某一区域范围内,因此本文提出将加权Wishart距离作为判定粒子优劣的适应度函数,以进一步提高最终聚类中心的估计精度。
粒子群算法(PSO)是Eberhart等提出的一种群智能优化算法。它是将每个需要进行优化的问题的解作为搜索空间中的一个粒子,所有粒子都有一个由目标函数决定的适应值,每个粒子还有一个速度参数决定它们搜索的方向和距离。通过全局最优历史纪录及个体最优历史纪录,粒子在解空间中进行搜索。
假设在D维空间中初始化n个粒子,第i个粒子的位置为xi={xi1,xi2,…,xij,…,xiD},速度为vi={vi1,vi2,…,vij,…,viD},粒子个体最优位置为pi={pi1,pi2,…,pij,…,piD},全局最优位置为g={g1,g2,…,gj,…,gD},群体中的所有粒子将通过式(6)和式(7)更新其速度及位置
vij=wvij+c1r1(pij-xij)+c2r2(gj-xij)
(6)
(7)
通过全极化SAR数据获取的协方差矩阵或相干矩阵服从Wishart分布,在进行聚类的过程中,粒子的适应度函数采用基于最大似然准则的Wishart距离表示。考虑全极化SAR数据本身相邻像素间具有空间相关性,属于同一类的像素往往会聚集在某个区域内集中出现。应给类别划分准确程度高的像素给予更高的权重,给易受干扰的划分准确程度不高的像素较低的权重。因此,为使得最终获得的粒子更能代表每个类别的聚类中心,引入加权Wishart距离作为粒子适应度判别函数,从而来判定粒子优劣。
2.2.1 权值ε的计算
考虑全极化SAR具有丰富的纹理特征,而纹理特征对影像分类具有很好的辅助作用,因此本文采用Lee提出的12个模板检测图像的纹理[12](如图1所示),依据图像纹理选择一个合适的模板,计算窗口内所有黑色方格对应的像素与窗口中心像素类别相同的点的总和M,窗口中心处的像素对应的权重值ε即为M与窗口中黑色方格对应像素的总数的比值。
图1 检测图像纹理的7×7模板
(8)
2.2.2 改进的适应度判别函数
本文在采用复Wishart距离公式作为适应度函数的基础上,考虑像元间的空间位置分布关系及相邻像元的空间相关性,引入加权Wishart距离函数进行判定粒子优劣。具体如下。
令Kn为某一类别的聚类中心,根据最大似然准则可以得到任一像元到聚类中心的距离为
(9)
式中,P(n)为类别n的先验概率,一般情况下,认为n个类别的先验概率P(n)相等,式(9)可以简化为
(10)
当某一像元的极化相干矩阵满足
d(〈T〉,Kn)≤d(〈T〉,Kj)j=1,2,…,N,n≠j
则把该像元归为类别n。
粒子适应度函数用所有像元到其对应中心的加权距离之和来表示,即
(11)
式中,Ti表示第i个像素的T矩阵的值;K为第i个像素所属类别的聚类中心,由属于该类别的所有像元的极化相干矩阵的平均值得出;εi为第i个像素对应的权重值。若求得适应度函数值越小时,说明粒子的位置越好。
为了验证改进MCSM/H-PSO分类方法的有效性,采用AIRSAR机载L波段美国旧金山的全极化SAR数据进行试验。数据的大小为900×1024像素。该区域包含的地物类型为建筑、植被、裸土及海洋等。图2、图3分别为试验区PauliRGB合成图及对应的Google Earth影像图。图4为MCSM/H-PSO方法与改进的MCSM/H-PSO方法非监督分类结果。
图2 PauliRGB合成图 图3 Google Earth影像图
图4 两种非监督分类方法结果
参照图2试验区PauliRGB合成图,对比两种非监督分类方法。图4(a)MCSM/H-PSO分类方法类别划分相比图4(b)改进MCSM/H-PSO分类结果较为杂乱,图2方框圈出的区域在图2中表现为同一地物类别,图4(a)划分成多种类别的混合,图4(b)正确划分为同一种颜色的地物类别;图4(a)左上角圈出的区域划分的类别颜色与图4(a)右边圈出的区域划分的类别颜色有一部分相同,而图4(b)中相同区域未出现,参照图3 Google Earth影像图,可知图4(a)中左上角框圈出的区域出现误分的地物类别。从整体分类结果上看,图4(b)分类结果对细节刻画更加精确,划分的类别也更加准确。
参照图3 Google Earth影像图,将以上两种分类方法结果进行合并得到4种地物类别,如图5所示,结果见表1。对比图5(a)、(b),图5(a)中左上角圈出的区域一部分植被被错误划分为建筑,还出现了海洋与裸土的混分,在影像中间建成区部分,存在少许建筑被错分为海洋的杂斑,而且海滩与海洋的边界划分不清晰;而图5(b)与图5(a)相同的左上角圈出的区域明显改善了建筑与植被的混分,海洋与裸土的混分程度也减少了很多,海滩与海洋的边界划分清晰,中间建成区也没有出现错分为海洋的杂斑,整体分类效果较好,空间连续性更强。
图5 两种分类方法合并结果
从表1精度评价结果可以看出,MCSM/H-PSO分类方法的总体精度和Kappa系数结果均低于改进的MCSM/H-PSO方法,改进的MCSM/H-PSO方法主要提升在于建筑与植被的划分;MCSM/H-PSO分类方法分出的植被精度为88.84%,改进的MCSM/H-PSO方法植被的分类精度达到93.12%,相比高出4.28%;对建筑的分类,改进的MCSM/H-PSO方法较MCSM/H-PSO分类方法高出4.49%;对于裸土的划分,改进的MCSM/H-PSO方法较MCSM/H-PSO分类方法高出1.83%,采用本文改进的MCSM/H-PSO分类方法,分类整体效果有了明显改善。
表1 2种分类方法精度评价分析 (%)
本文在利用粒子群算法具有优秀的随机全局优化能力,能够快速获取高维数、高复杂性的全极化SAR影像分类的聚类中心的基础上,考虑影像相邻像素间具有空间相关性,对PSO算法进行了改进,提出了利用加权PSO算法,以获取影像最终聚类中心。试验结果表明,改进MCSM/H-PSO方法具有更好的聚类中心寻优能力,能够在全极化SAR影像分类中取得较好的分类效果。