基于阈值分割与决策树的SAR影像水体信息提取

2021-03-26 12:16宁文怡
地理空间信息 2021年3期
关键词:散射系数决策树阴影

经 波,宁文怡

(1.广西壮族自治区自然资源信息中心,广西 南宁 530023)

水体约占地球表面总面积的75 %,陆地水约占地球表面总水量的3.469%。陆地水蕴含着丰富的自然资源,在人类生活和生产中发挥着重要作用。利用遥感技术快速、自动化、大面积地提取水体信息对于水资源管理、抗灾减灾、用水安全保障等方面具有重要意义。随着遥感科技的快速发展,国内学者利用遥感技术提取水体信息的研究与应用较为深入[1-5],如杨存建[6]等在地形数据的支持下,实现了SAR图像的水体半自动提取;郑伟[7]、潘祖燕[8]等利用光学遥感数据与SAR数据相融合的方法进行了洪水淹没范围研究。

GF-3号卫星是国产分辨率达到1 m的C波段多极化合成孔径雷达(SAR)成像卫星,其不受云雨等天气条件的限制,可全天候全天时对地观测,已广泛应用于防灾减灾工作[9]。

1 数据来源与实验区域

GF-3号卫星的空间分辨率为1~500 m,幅宽为10~650 km,是世界上成像模式最多的SAR卫星,具有单极化、双极化和全极化等成像模式[10]。

本文采用GF-3 L1级影像,精细条带1(FSI)的HH、HV双极化模式,成像时间为2017-07-02,分辨率为5 m;采用DEM作为辅助数据;采用成像时间为2017-09-26,同一区域范围的光学GF-2号原始影像作为对比分析数据。

2 水体信息提取流程

基于GF-3 SAR影像特有的成像结构,首先对其进行基础极化处理,再进行散射特征分析,然后通过KI二值化阈值分割法生成最佳分割阈值,建立决策树模型进行水体信息提取,最后利用DEM地形建模方法得到阴影范围,对地形起伏度较大的部分进行阴影去除,进而得到柳州市水体信息的精确范围(图1)。

图1 基于阈值分割和决策树的SAR影像水体提取流程图

2.1 GF-3 SAR基础极化处理

本文对GF-3 SAR原始数据的基础极化处理内容包括辐射定标、幅度转换、多视处理、影像滤波、地理编码等。

1)辐射定标。GF-3 SAR影像的每个DN值都表示唯一确定的后向散射强度功率值。为了得到地物特征在不同空间与时间上的精确差异,定量计算散射系数的过程称为辐射定标。由于存在不同的误差源,SLC数据存在辐射误差,为了能精确反映地物回波特性,需要进行辐射定标处理[11],将输入信号转化为雷达后向散射系数。经过辐射定标的后向散射强度信息不受SAR数据观测几何的影响,相当于归一化到统一标准下,可以进行对比和分析。

2)幅度转换与多视处理。GF-3 SAR影像的复数数据是最高分辨率的原始数据,但将单个像元散射的雷达同波信号相干叠加,会导致影像的强度信息存在很多噪声。为了提高影像的视觉效果以及每个像元后向散射的估计精度,需要对影像进行多视处理,即对目标的多个独立样本进行平均叠加,得到的结果是多视后的数据。多视处理既能使影像几何特征更接近地面实际情况,又能在一定程度上降低斑点噪声。多视处理即为对邻域像素相干和的平均,计算公式为:

3)影像滤波。由于SAR发射相干电磁波,因此地物的回波具有相互干涉性;而雷达记录的是随机不定的地物微波后向散射值,这种现象在SAR影像上表现为斑点噪声。多视处理缩短了距离向线性调频的频宽等,降低了空间分辨率。为了减少GF-3 SAR影像上的噪声,本文采用一种环形对称的Enhanced Frost Filter滤波器对GF-3 SAR影像进行处理,滤波窗口为3×3个像元。经过滤波处理,能很好地保留边缘信息,并提高水陆边界两侧的分割精度。

4)地理编码。GF-3 SAR系统观测到的是电磁波后向散射的雷达脉冲强度和相位信息,该信息编码在雷达坐标系统下,为斜距坐标系。本文将GF-3 SAR影像数据从斜距坐标系转换到地理坐标系,即地理编码。本文采用椭球纠正编码方法进行地理编码,编码后成果(L3)如图2所示(波段组合为b1,2,2)。

图2 基础极化处理结果

将基础极化处理后的GF-3 SAR影像与DEM数据进行匹配,选取均匀分布在GF-3 SAR影像和DEM数据上容易准确定位的明显同名地物点作为控制点(如河流交叉点、拐弯处、道路交叉点、水库、坑塘等边上拐点,共选取30个控制点),利用三次多项式的数学方法将GF-3 SAR影像与DEM数据进行匹配,匹配精度控制在1个像元以内。

2.2 散射特征分析

由GF-3 SAR影像的辐射特征可知,水体的后向散射系数由极化方式、波长、斜视角、地物形状、复介电常数、粗糙度等雷达参数决定。将GF-3 SAR影像用于水体分析提取时,主要考虑地表粗糙度对后向散射系数的影响。粗糙表面主要是漫反射,后射回波强,影像呈灰白色和灰色;地表水水体粗糙度相对于GF-3 C波段属于平滑面,主要表现为简单的镜面反射,回波功率较小,因此在影像上表现为暗色或黑色[12];建筑物在影像上为高亮显示,植被次之。本文选取影像水体(蓝色区域)、建筑物(红色区域)、植被(绿色区域)3个典型地物感兴趣区,每种地物约为65 000个像素。其后向散射系数分布情况如图3~5所示。

图3 GF-3 SAR影像上3种地物后向散射系数分布

图4 GF-3 SAR影像HH极后向散射系数

图5 GF-3 SAR影像HV极后向散射系数

由图4、5可知,研究区水体后向散射系数在HH极化的浮动范围主要为-7~-15,在HV极化的浮动范围为-20~-31。

2.3 水体精细提取

本文采用KI二值化阈值分割法进行图像分割,并通过构建知识决策树模型来提取水体信息。KI二值化阈值分割法以图像的概率分布为特征,以代价函数为辅助,当满足总体分类的代价函数最小时,即可得最小错分率的结果。高斯分布下的判别标准为:

式中,P为先验概率;当U(T)取得最小值时,T则为最佳分割阈值。

本文基于KI二值化阈值分割法确定的阈值构建知识决策树,进而完成水体提取。知识决策树通过规则对数据进行逐步细化和二次划分,最终得到目标类别信息的多层分类器[13]。其在水体提取的实用性表现为:①决策树是基于简单特征的地物提取,是解决简单分类问题的有效途径,如水体单类分类;②GF-3 SAR影像水体具有明确的后向散射系数范围,可将该范围作为决策规则,构建分类器,实现水体的快速提取。本文在分析水体后向散射系数的基础上,构建决策树模型中的规则,进而构建水体信息提取知识决策树,如图6所示。

图6 水体信息提取的知识决策树

2.4 DEM地形建模

根据雷达成像原理,利用DEM进行地形建模时,主要的影响因素为本地入射角大小[14]。本地入射角的计算公式为:

式中,θ为雷达入射角;θA、θC为分辨单元在距离向和方位向的坡度角。

由于雷达图像一般是斜距图像,因此以地面格网进行地形建模时,应考虑地距和斜距间的关系,计算公式为:

2.5 利用DEM构建地形模型阴影图剔除阴影部分

首先利用空间分析地图代数法生成山体阴影;再对利用DEM地形建模图[15](图7)提取的阴影与基于决策树方法的水体提取结果进行空间分析,去除误提为水体的山体阴影(图8),提高水体提取精度;最后精确提取水体信息,如图9所示。

图7 地形建模阴影效果图

图8 误提为水体的山体阴影(红色部分)

图9 柳州市洪水水体信息提取结果

2.6 基于光学GF-2号影像的水体指数法提取水体信息

本文基于与GF-3 SAR相同区域、成像时间为2017-09-26的光学GF-2号影像,利用水体指数法进行水体信息提取。经反复试验,选取阈值范围为[-1 -0.18]的提取结果,如图10所示。水体指数法的计算公式为:

图10 基于光学GF-2号影像的水体信息提取

从基于光学GF-2号影像的水体指数法的提取结果来看,虽然能较完整地提取水体,但存在部分建筑物误提的现象,精度较差。

3 精度分析与评价

3.1 评价方法

基于随机生成的263个样本点(图11),结合高分辨率多光谱影像、其他专题资料等,通过经验丰富的内业人员判读样本点的地物类别,再利用所确定的样本点进行精度评价。

图11 样本点分布图

3.2 精度评价

本文主要从混淆矩阵、总体精度和Kappa系数3个方面评价分类精度。混淆矩阵如表1所示。通过混淆矩阵计算得到的水体信息提取总体精度为89.22 %,Kappa系数为0.71。

表1 混淆矩阵

4 结 语

本文研究了基于GF-3 SAR影像的水体信息自动化提取方法。首先利用基于KI二值化阈值分割法确定的阈值构建知识决策树完成水体提取,再利用DEM数据正射影像产品和山体阴影的掩膜文件剔除山体阴影区域影响,最后精确提取水体信息。本文在柳州市城区展开实验,得到的主要结论为:

1)利用水体在雷达波束表现为镜面散射的机制,在GF-3 SAR影像上采用KI二值化阈值分割法进行水体信息的提取。

2)基于KI二值化阈值分割法确定的阈值构建决策树,进而精确快速地提取水体范围。相较于传统的基于面向对象、监督分类、非监督分类的方法,其在时效性上有一定的改进,能快速响应灾害应急措施。

3)由于山体起伏变化将产生阴影,可利用DEM构建山体阴影的掩膜文件去除被误提的水体,从而提高水体提取精度。

4)将GF-3 SAR影像的水体信息提取结果与相同区域的光学GF-2号影像水体信息提取结果进行对比发现,本文方法的提取结果优于基于光学影像的水体指数法,能达到较高的实验精度,对洪水等自然灾害的监测以及GF-3 SAR影像的快速业务化应用具有重要意义。

猜你喜欢
散射系数决策树阴影
等离子体层嘶声波对辐射带电子投掷角散射系数的多维建模*
你来了,草就没有了阴影
北部湾后向散射系数的时空分布与变化分析
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
让光“驱走”阴影
基于决策树的出租车乘客出行目的识别
阴影魔怪
基于肺癌CT的决策树模型在肺癌诊断中的应用