蒋 丹 丹,卢 刚,陈 成
(1.中国矿业大学环境与测绘学院,江苏 徐州 221116;2.江苏省测绘工程院,江苏 南京 210013)
基于单极化TerraSAR-X影像提取建筑区研究
蒋 丹 丹1,卢 刚2,陈 成2
(1.中国矿业大学环境与测绘学院,江苏 徐州 221116;2.江苏省测绘工程院,江苏 南京 210013)
基于多时相单极化TerraSAR-X影像,提取后向散射系数特征影像、变差函数纹理特征影像、干涉特征影像,并对其波段组合,在基于eCognition软件多尺度分割的基础上,选择训练样本对象,充分挖掘样本对象的光谱、纹理特征信息,通过建立特征分离性指标,降低特征维数,最后应用面向对象的分类方法实现了建筑区的自动提取,提取精度达93.50%。这一研究表明特征组合影像具有较大的分割优势,特征的优化选择在减少特征冗余的同时维持了较高的信息提取精度,且弥补了eCognition软件纹理特征计算慢的不足。
TerraSAR-X影像;建筑区提取;影像分割;降低特征维数;面向对象分类
近些年,随着城市扩张和城市建设的迅猛发展,运用遥感技术手段进行城市地理国情监测具有重要的应用价值。建筑区作为城市地理国情监测的一个重要的地理空间要素,实现城市建筑区的提取在城市规划、土地利用分析、灾害监测等方面具有重要意义[1]。在多云、多雨、多雾的天气状况下,难以获取清晰的光学影像,而合成孔径雷达(Synthetic Aperture Radar,SAR)具有独特的全天候、全天时数据获取能力,数据质量几乎不受天气状况与云层覆盖的影响,这就从一定程度上弥补了光学影像的缺陷[2]。随着高分辨率SAR卫星(TerraSAR-X、COSMO-SkyMed、ALOS-2、Sentinel-A)等的成功发射,获取高分辨率SAR影像变得越来越方便,SAR影像也开始广泛应用于城市土地利用调查中,建筑区作为城市结构中一个典型的地物类型,利用高分辨率SAR影像进行建筑区提取的研究得到关注。
目前,许多学者基于SAR影像进行了建筑区提取研究。Ban等[3]结合多景时间序列的Radarsat-1幅度图像与纹理信息,应用最大似然分类器和人工神经网络分类器对城市目标进行了分类。吴樊等[4]利用灰度共生矩阵计算高分辨率SAR图像的纹理特征,采用非监督聚类分析的方法提取居民区。赵凌君等[5]提出一种基于变差函数纹理特征的高分辨率SAR图像建筑区提取方法。徐佳等[6]提出一种综合利用灰度和纹理特征的高分辨率星载SAR图像建筑区提取方法。张舞燕等[7]基于SAR的相干系数图像对硬目标相干系数较高的特点,进行了城市建成区边界的提取。但以上方法较少使用SAR影像非灰度特征参与影像分割并进行面向对象的建筑区提取;另外,在挖掘SAR影像对象特征时,以上研究很少进行特征的优选,容易引起一定的数据特征冗余。
针对以上问题,本文以常州市武进区为研究区,提出了一种基于单极化TerraSAR-X影像提取建筑区的方法。在常规的多尺度分割方法的基础上,尝试特征影像辅助分割,通过优选样本对象特征,采用面向对象的分类方法,实现建筑区轮廓的提取,为城市建筑区的变化监测提供一定的技术参考。
1.1 研究区概况
研究区位于江苏省常州市武进区东南部,地处长江三角洲太湖平原西北部,属于我国工业化和城市化发展较快的区域,地理位置为31°36' ~ 31°39'N 、119°29' ~ 120°1'E,该区域紧邻太湖,自然条件优越;地势较缓,以平原为主;主要土地利用类型有建筑用地、道路、植被、水体等。该区域的建筑以高密度低矮房屋为主,零星分布有多层及高层房屋、独立房屋等。
1.2 数据源及预处理
本研究选用的是研究区的TerraSAR-X影像、DEM数据、资源三号多光谱数据。其中,TerraSAR-X影像选用的是TSX SAR L1B多时相单视斜距复影像,具体数据说明如表1所示;DEM数据是“十一五”期间生产的江苏省5 m分辨率的数字高程模型;资源三号多光谱影像数据作为目视解译检验样本的参考数据。本文数据的预处理主要是利用SARScape 5.1软件完成对多时相TerraSAR-X影像的后向散射系数图的生成,其基本过程包括:多视处理、影像配准、多时相滤波、地理编码与辐射定标、影像裁剪。其中地理编码与辐射定标的过程要辅以预处理后的参考DEM数据参与,参考DEM数据的预处理主要是对原始的DEM数据先进行上采样至3 m分辨率,然后进行坐标系的转换,生成WGS-84坐标系下的DEM数据。
表1 使用的TerraSAR-X数据
Table 1 TerraSAR-X data applied
获取时间成像模式极化方式轨道方向入射角(°)距离向分辨率(m)方位向分辨率(m)2013.01.06StripMapHHDescending21.483.213.302013.01.17StripMapHHDescending21.463.213.302013.03.02StripMapHHDescending21.453.213.302013.07.01StripMapHHDescending21.463.213.30
本研究主要包括影像特性分析与提取、影像分割、特征提取与优选、精度评价等,首先在预处理TerraSAR-X影像的基础上,从影像的特性出发,提取影像的特征影像并对其波段组合;然后基于eCognition 8.7软件进行多尺度分割,将影像分割为一个个互不重叠的同质对象,选择训练样本,提取影像对象特征并进行特征优化组合,选择合适的监督分类方法实现研究区建筑区的自动提取;最后以研究区样本点的目视解译结果为参考数据,对建筑区的提取结果进行精度评价,主要技术流程如图1所示。
图1 技术流程
Fig.1 Methodological flowchart adopted in this study
3.1 后向散射特性分析
随着TerraSAR-X影像获取时相的改变,观测地物目标参数随之改变,从而影响雷达后向散射的性能,利用这些变化或者不变的特性可以将不同的地物类型区分开来。研究区的建筑区在2013年1-7月时段保持稳定的形态,而对于其他地物很难保持时间上的相干性,所以本研究选取3个时相(2013-01-06、2013-07-01、2013-03-02)的水平极化的TerraSAR-X影像进行红、绿、蓝彩色组合显示。本研究分别选取不同地物类型的感兴趣区SAR影像样本,求取后向散射系数的平均值(图2),建筑区的后向散射系数最高,植被次之,水体最低,并且建筑区因其稳定的结构与介电常数使后向散射特性随时相变化不大,具有一定的时相稳定性,因此后向散射特性可以作为建筑区、非建筑区区分的一个可选特征。
图2 不同地物的平均后向散射系数
Fig.2 The mean backscatter coefficient of different land cover types
3.2 纹理特性分析
3.2.1 变差函数理论 变差函数,又称为半变差函数(Semivariogram Function),定义二维平面内的实值区域化变量{f(x),x∈D},即定义于二维空间R2内子集D的实值随机过程,区域化变量f(x)与f(x+d)(同时包含两点的距离与方向信息)两点之差的方差的一半,即:
(1)
式中:两个区域化变量的值仅仅与两个点间的空间距离相关,γ(d)为变差(或半变差)函数,即指区域化变量f(x)在空间上距离为d的位置x和x+d两处的差值方差的一半。
对于离散的栅格数据,实验变差函数定义为:
(2)
式中:P(d)指观测窗口内距离为d的点对数目,估计值γ*(d)是实验变差函数,变差函数刻画了空间样本间的相关性,可反映图像数据的随机性与结构性[8]。
3.2.2 变差函数计算方法 变差函数用于纹理分析的计算,确定步长d、窗口宽度M、计算方向,利用式(2)计算窗口M内所有间距为d的点对的变差函数值,取其平均值作为计算窗口中心点的变差函数值,最后遍历整幅影像得到影像的变差函数纹理特征图。对于影像而言,一般计算4个点对方向(0°、45°、90°、135°)的变差函数均值[5]。以窗口M=5,像素间距d=1为例,图3给出了0°、45°、90°、135°方向变差函数纹理特征计算的示意图。图3中虚线框为计算窗口的大小,窗口宽度为M,黑色实心方块代表当前的像素(x0,y0),即计算窗口的中心,黑色箭头代表的是参与计算的像素点对数目。
图3 变差函数纹理特征计算示意
Fig.3 Calculation of semivariogram function texture feature
3.2.3 变差函数分析建筑区的周期性纹理 建筑区在高分辨率城区SAR影像上呈现有一定周期规律性的纹理,而道路、植被、水体等区域的纹理相对均匀。在预处理后的2013年1月6日的单极化TerraSAR-X影像上选取建筑区、道路、植被、水体,分别计算其变差函数值。图4显示了建筑区、道路、植被、水体样本在单极化高分辨率TerraSAR-X影像上的变差函数曲线。从图4中可以发现,建筑区属于强散射的不均匀区域,具有很强的非相似性,其变差函数曲线要远远高于植被区、道路、水体,并且随着间距d的增加周期性地出现峰值与谷点,类似于正弦函数曲线的周期性;道路的变差函数值要低于建筑区,并且会上下波动;植被区的变差函数曲线随着间距d的增加,先缓慢上升后趋于平稳;水体因为镜面反射回波很弱,像素的灰度值较低,随着间距d的增加,变差函数曲线逐渐趋于直线。因此,SAR影像的变差函数纹理特征可以作为区分建筑区、非建筑区的一个可选特征。从地物类别的可分离程度方面考虑,变差函数曲线在d=5的时候达到第一个峰值,此时建筑区与非建筑区(植被、水体、道路)的变差函数数值差异最大,对建筑区与非建筑区的区分性较强,则选择变差函数的变程d=5。窗口内点对数目太小容易影响变差函数值的准确性,窗口宽度至少为3d~5d,本文选择窗口宽度M=5d=25,此时的窗口图像能够突显建筑区明暗相间的纹理特征。
图4 不同地物的变差函数曲线
Fig.4 Semivariogram function of different land cover types
3.3 相干性分析
雷达数据包含有强度与相位信息,雷达的相位信息主要应用在利用雷达干涉技术提取数字高程模型、地表形变监测等。干涉相干作为一个关键的量值,被越来越多地应用在土地利用分类、目标识别与检测中。复数SAR影像之间通常采用相干系数度量影像间的相似程度以及干涉条纹图的质量,它反映了地面各种散射体的重要信息[9,10]。城市环境中,相干系数图像对硬目标(建筑物、道路)具有相干系数高的特点,对非硬目标(植被、水体)具有相干系数低的特点,因此可以利用不同地物类型相干系数图像的特点进行类别的区分。
选取实验区时间基线为12 d的两景水平极化的TerraSAR-X影像单视复数(SLC)数据(2013-01-06为主影像, 2013-01-17为从影像)在SARScape5.1软件中进行干涉处理,生成相干系数图。建筑区的相干性比较稳定,相干系数较大。为了更直观地分析不同的地物类型的相干性,本文选取了典型地物样本(建筑区、道路、植被、水体)进行相干系数的统计分析(图5)。从图5可以发现,建筑区的相干系数明显高于非建筑区(道路、植被、水体),平均相干系数值接近0.8,因此相干系数特征也可以作为区分建筑区与非建筑区的一个可选特征。
图5 相干系数统计
Fig.5 Interferometry coherence statistics
4.1 影像分割
将提取得到的后向散射特征图、变差函数纹理特征图、相干性图进行特征波段组合,得到研究区含有5个波段的影像图,各波段图层有:3个时相的后向散射系数图层(2013-01-06、2013-07-01、2013-03-02)、变差函数纹理值图层、干涉系数图层。选用eCognition8.7软件对该影像数据进行多尺度分割试验,利用集成在该软件中的工具(Estimation of Scale Parameter,ESP)确定分割参数,该工具是通过分割后影像对象的平均局部方差(Local Variance,LV)与相邻尺度平均局部方差变化率(Rate of Change,ROC)曲线提取最优分割参数的参考值[11]。本文多尺度实验参数设置为:影像各波段权重设为1,初始的分割尺度(Scale)为5,分割尺度的递增步长为5,循环次数为40,光谱因子(Colour)与形状因子(Shape)的权重比为0.9∶0.1,光滑度因子(Smoothness)与紧致度(Compactness)因子的权重比为0.5∶0.5。多尺度分割完成得到的ROC和LV曲线如图6所示,一般情况下,最优分割尺度出现在ROC-LV变化剧烈的地方,其参考值出现在局部方差的峰值且局部方差变化率开始趋于下降的地方[12]。特征组合影像表现出了较大的分割优势,从图6中可以看出最佳分割尺度的可能值为70、105、180,分割的局部效果如图7(见封3)所示。从建筑区提取的角度,当分割尺度Scale为70时,建筑区被分割得过于零碎,存在过分割现象;当分割尺度Scale为105时,建筑区分割较为完整,为建筑区的最优分割尺度;当分割尺度Scale为180时,建筑区与周围的植被聚合在一起,存在少量欠分割现象。
图6 ROC和LV变化曲线
Fig.6 Graph of ROC and LV with a increasing scale parameter
4.2 特征提取与优选
在多尺度分割的基础上,研究区的影像被分割成1 267个对象,选择对象总量的3%作为样本,包括建筑区、道路、植被、水体4类样本。eCognition软件提供了很多对象特征,包括光谱特征、纹理特征、形状特征、邻域特征、语义对象关系等,本文提取的特征有光谱特征和纹理特征。光谱特征包括最大差分、亮度以及影像各波段的均值和标准差;纹理特征包括基于灰度共生矩阵(Gray Level Co-occurrence Matric,GLCM)的均值、方差、对比度、非相似度、同质性、角二阶矩、熵、相关性,以及基于灰度差分矢量(Grey Level Difference Vector,GLDV)的角二阶矩、熵、对比度、均值,这些纹理特征的计算方向包括0°、45°、90°、135°、全方向。利用选择的样本对象,基于提取的72个特征进行面向对象分类的一个重要步骤就是对这些特征的筛选,但是直接在eCognition软件对纹理特征的计算耗费时间太长,本文采用导出这些样本对象的特征方法,利用改进的SEaTH(Separability and Thresholds)算法进行特征的优选,其核心思想包括两个方面:其一是去除特征之间的相关性,其二是综合考虑类内距离和类间距离的特征选择[13]。
(1)去除特征之间的相关性。通过设置相关系数阈值,调节入选特征的数目。阈值设置越小,则入选的特征个数越少;反之,则入选的特征个数越大。当两个特征间的相关系数大于阈值时,则舍弃与其他特征具有较强的相关性且方差较小的特征。从图像信息量的角度,方差越大,则说明特征中含有的分类信息越多;方差越小,则说明特征中含有的分类信息越少[14]。通过反复试验,确定本次实验的相关系数阈值为0.95。
(2)综合考虑类内距离和类间距离的特征选择。根据不同类别的样本特征值计算类内距离,依据同类样本特征值计算类内距离[15]。假设去除相关性的特征子集为Fs=(f1,f2,…,fs),对象类别为Ct=(C1,C2,…,Ct),从各类别中选取的样本对象个数为Nt=(n1,n2,…,nt)。以C1和C2两类为例,对其特征选择过程进行详细描述。
①计算类间距离J。计算C1和C2两类样本对象的某个特征(如fj,j=1,…,s)的均值mi与方差σi,i=1,2,代入式(3)和式(4),得到特征fj对应的C1与C2的类间距离J,选取类间距离较大的前10个特征构成特征子集,从而进行下一步的筛选。
(3)
(4)
②特征归一化处理。由于所选的特征值在数量级上表现不同,需要对上一步所选的特征进行归一化处理,使其取值范围为[0,1],计算公式如下:
(5)
③计算加权类内距离D。遍历C1与C2类中的所有样本,计算每个样本和其他同类样本的某个特征值(如fj,j=1,…,s)的距离并累加,分别获取到C1与C2的类内距离d1和d2,如式(6)所示,依据类别C1与C2的样本数目赋予类内距离d1和d2相对应的权重,从而得到加权类内距离D,如式(7)所示。
(6)
D=(n1d1+n2d2)/(n1+n2)
(7)
④构建特征筛选指标Jf。根据类间距离J大、加权类内距离D小的准则,构建筛选指标Jf,如式(8)所示。Jf值越大,说明特征之间的分离性越好;反之,说明特征之间的分离性越差。对Jf值进行降序排列,选择排在前3个的若干特征参与分类。
(8)
通过试验,最终得到建筑区样本对象与其他类样本对象进行类别区分的5个优选特征:GLCM对比度(45°)、GLCM标准差(135°)、最大差分、变差函数纹理均值、干涉系数均值(表2)。
表2 优选特征指标值
Table 2 Selected best feature indexes
两两类别优选特征类间距离(J)加权类内距离(D)筛选指标(Jf)建筑区-道路最大差分1.90400.027569.2364变差函数纹理均值1.65890.051532.2117GLCM对比度(45°)1.47730.047031.4319建筑区-植被最大差分1.99990.0143139.8531 变差函数纹理均值1.99860.029467.9796干涉系数均值1.90680.053135.9096建筑区-水体变差函数纹理均值1.99930.023186.5498最大差分1.94410.027171.7380GLCM标准差(135°)1.86530.032557.3938
4.3 建筑区提取与精度评价
根据优选出的特征构建特征空间,选择支持向量机(SVM)的面向对象分类方法,将研究区划分为建筑区与非建筑区,分类结果如图8a(图8见封3)所示,其中红色区域表示建筑区。根据研究区的地理范围,平均划分为400个矩形样方,取样方的中心点为检验样本点,检验样本点分布如图8b所示。以研究区的资源三号卫星多光谱影像为参考数据,对这些检验样本点进行人工目视解译,确认检验样本的类别属性,建立混淆矩阵,计算相关精度评价指标评价研究区的建筑区结果,如表3所示。
表3 总体分类精度统计
Table 3 Overall classification accuracy statistics
用户类参考类建筑区非建筑区合计用户精度建筑区12071270.94非建筑区192542730.93合计139261400生产者精度0.860.97总体精度=93.50%Kappa系数=0.85
本文针对高分辨率单极化TerraSAR-X影像,从影像的基本特性出发,组合影像特征波段,在面向对象的多尺度分割技术的基础上,选择训练样本,充分挖掘影像对象的光谱、纹理、干涉信息,建立分离性指标,确立优选特征,采用支持向量机的面向对象分类方法,实现了研究区建筑区轮廓的自动提取,分类的总体精度为93.50%,Kappa系数为0.85。
本研究的提取方法一方面可以满足一般性研究分析的精度要求,另一方面有助于城市建筑区的变化监测,同时也为其他高分辨率SAR影像进行城市建筑区提取提供一定的参考依据。但本研究只是针对单极化TerraSAR-X影像对以高密度低矮房屋为主的建筑区进行了提取,对于更加复杂的建筑区的提取方法还有待完善,同时多极化的TerraSAR-X影像进行建筑区提取还有待进一步研究。
致谢:江苏省测绘工程院提供了实验数据,此致谢忱!
[1] FENG T,ZHAO J.Review and comparison:Building extraction methods using high-resolution images[A].Information Science and Engineering (ISISE),2009 Second International Symposium onIEEE[C]2009.419-422.
[2] 温礼,程博,柴渊,等.SAR遥感数据监测土地利用变化的研究[J].测绘科学,2014(6):65-69.
[3] BAN Y,WU Q.Radarsat SAR data for land-use/land-cover classification in the rural-urban fringe of the Greater Toronto area[A].8th Conference on Geographic Information Science[C].Estoril,2005.43-50.
[4] 吴樊,王超,张红.基于纹理特征的高分辨率SAR影像居民区提取[J].遥感技术与应用,2005,20(1):148-152.
[5] 赵凌君,高贵,匡纲要.基于变差函数纹理特征的高分辨率SAR图像建筑区提取[J].信号处理,2009,25(9):1433-1442.
[6] 徐佳,陈媛媛,黄其欢,等.综合灰度与纹理特征的高分辨率星载SAR图像建筑区提取方法研究[J].遥感技术与应用,2012,27(5):692-698.
[7] 张舞燕,刘清臣,孟秀军.基于SAR相干系数图像的城市边界提取[J].测绘与空间地理信息,2014,37(5):56-59.
[8] 王燕红,程博,尤淑撑,等.基于改进变差函数的高分辨率SAR图像建筑区提取[J].遥感信息,2014,29(2):1-6.
[9] 舒宁.微波遥感原理(修订版)[M].武汉:武汉测绘科技大学出版社,2003.
[10] 王超,张红,刘智.星载合成孔径雷达干涉测量[M].北京:科学出版社,2002.
[12] 陈铁桥,陈杰,梅小明,等.基于多层次场聚类的高分辨率遥感影像分割方法[J].地理与地理信息科学,2013,29(6):10-13.
[13] 余晓敏,湛飞并,廖明生,等.利用改进SEaTH算法的面向对象分类特征选择方法[J].武汉大学(信息科学版),2012,37(8):921-924.
[14] 张秀英,冯学智,江洪.面向对象分类的特征空间优化[J].遥感学报,2009,13(4):664-669.
[15] 王贺,陈劲松,余晓敏.面向对象分类特征优化选取方法及其应用[J].遥感学报,2013,17(4):822-829.
Built-up Areas Extraction Based on Single Polarization TerraSAR-X Images
JIANG Dan-dan1,LU Gang2,CHEN Cheng2
(1.School of Environment Science and Spatial Informatics,China University of Mining and Technology,Xuzhou 221116;2.Jiangsu Province Surveying & Mapping Engineering Institute,Nanjing 210013,China)
This paper shows a object-oriented method that the extraction of urban built-up areas based on multi-temporal single polarization TerraSAR-X images.Firstly,the backscattering coefficient images,variogram texture image and interferometric coherent image were combined,and the combined image was segmented with a multiresolution segmentation algorithm based on eCognition software.And then choosing the train samples,extracting the spectral and textural features of sample objects,sample objects separability index was established in order to reduce feature dimensions.Finally,the built-up areas were extracted automatically with a object-oriented classification approach,and total accuracy is up to 93.50%.The results indicates that combined image has great advantage of segmentation,optimal selection of features reduces redundant features,maintains the high accuracy of information extraction,and makes up for the inadequacy that texture characteristics calculation is slow based on eCognition software.
TerraSAR-X images;built-up areas extraction;image segmentation;reduce feature dimensions;object-oriented classification
2015-05-25;
2015-08-24
国家高技术研究发展计划(863计划)项目(2013AA122003)
蒋丹丹(1990-),女,硕士研究生,研究方向为遥感数据处理。E-mail:jddcumt@163.com
10.3969/j.issn.1672-0504.2016.01.012
P237
A
1672-0504(2016)01-0060-06