基于GF-3数据的不同背景水体提取方法对比研究

2023-06-11 08:40谢以梅陈冬花郭坤刘赛赛常竹李虎杨宏伟

谢以梅 陈冬花 郭坤 刘赛赛 常竹 李虎 杨宏伟

摘 要:针对雷达遥感影像存在相干斑噪声、面临不同背景下水体信息提取方法适用性等问题,本文选择受人为因素干扰严重的建成区和地形起伏明显的山区两种不同背景下的水体信息提取进行研究。以安徽省芜湖市为实验区,基于DEM数据建立阴影掩膜文件,通过统计直方图对高分三号(GF-3)影像进行阈值分割,优选出巴氏距离最大的三个纹理特征进行主成分分析。选取前两个主分量,并与原影像进行波段合成,利用不同分类方法分别探讨在两种不同背景下水体提取研究中的优势与不足。结果表明:在建成区背景下,面向对象阈值分割法提取效果最好,总精度为89.20%,Kappa系数为0.7639;在山区背景下,面向对象SVM分类法能够准确识别水体信息,水体提取总精度为94.10%,Kappa系数为0.8821。

关键词:高分三号;SAR影像;水体提取; DEM

中图分类号:TP79文献标志码:A文章编号:1001-2443(2023)01-0068-009

引 言

水资源对灾害防控、土地开发、农作物生长等方面以及人类活动具有十分重要的影响[1-3],利用遥感手段快速、精确地提取水体信息,在水资源调查[4]、洪涝灾害评估[5-6]和水体动态变化分析[7]等方面具有重要意义。合成孔径雷达(SAR)影像因其具有全天时、全天候数据获取及独特的穿云透雾能力,一定程度上突破了传统光学影像的局限性。当前基于SAR影像提取水体信息多数仅集中在中低分辨率SAR数据,难以满足精确提取水体信息的需求。随着我国高分三号(GF-3)卫星的成功发射,大大弥补了国内高分辨率SAR影像的研究空白,因此,构建一套基于GF-3SAR影像的水体信息提取方法具有十分重要的意义。

目前,相关学者在基于SAR图像的水体信息提取方面开展了大量研究。申邵洪等[8]基于一种改进的KI算法自动提取了SAR图像中的水体信息。李景刚等[9]通过改进最大类间方差法,获取最优分割阈值实现水体信息的提取。为了更精确高效地提取水体信息,有学者通过利用SAR影像的纹理特征达到减弱图像相干斑噪声的影響。胡德勇等[10]通过利用纹理信息与支持向量机(SVM)达到水体和居民地信息提取的目的。Gong等[11]基于强度和纹理信息,采用RPCA方法提取了水体信息。汤玲英等[12]基于Sentinel-1A数据采用面向对象方法实现了洪水淹没范围的提取。邓滢等[13]结合纹理与极化分解特征,采用面向对象方法对分割区域进行投票提取水体信息。由于SAR成像机理的原因使得山体阴影等的后向散射特征与水体特征相似,导致图像存在失真现象,严重影响了水体提取的精度。因此有学者在水体粗提取的基础上,利用DEM数据剔除山体阴影的影像,实现水体信息的精确提取。栾玉洁等[14]根据SAR卫星成像机理利用DEM数据进行地形建模,提取了水体信息,证明了该方法的有效性。庞科臣等[15]利用改进的Otsu法对DEM数据进行分割,将高程值大的数据与水体粗提取的数据进行匹配,达到准确提取水体信息的目的。

综合以上研究发现,大多学者都是针对某些特定场景或单一场景,而对于受人为因素干扰严重的建成区以及地形起伏明显的山区两种不同背景的对比研究较少。毕海芸等[16]基于landsat5 TM数据分别选取3种常用的水体提取方法,对比分析在武汉平原地区和宜昌山地地区水体提取中的优势与不足。Acharya等[17]采用六种机器学习算法,提取了丘陵、平原地区以及冰雪、阴影覆盖的喜马拉雅山脉地区的水体信息。与此同时,以上数据源仅限于光学数据,而对于不同背景下SAR数据水体提取的研究鲜有报道,因此本文基于GF-3卫星数据,分别选取建成区和山区两种不同背景,对比分析了阈值分割法、基于纹理特征算法和分类器模型法等方法的优势与不足,为不同背景下的水体信息提取提供一定的借鉴。

1 研究区概况和数据介绍

1.1 研究区概况

实验区1,2分别为建成区背景和山区背景,均位于安徽省芜湖市境内(图1)。实验区1为芜湖市弋江区,经纬度范围是31°15'-31°33'N,118°28'-118°45'E,海拔高度-45-76m,以城市建筑为主,实验区内除分布有长江部分段、荆山河、漳河、孤山湖和南塘湖等大型水体外,高唐坝、原亩塘等细小坑塘水体也分散于各处。

实验区2为芜湖市繁昌区,经纬度范围是30°96'-31°20'N,117°96'-118°36'E,海拔高度37-421m,以山地分布为主,研究区内除长江部分段、黄浒河和周大滩等大型水体外,山间有钳口和乐冲等较小的水库和水洼,整体呈现多山、水库水洼等较小水体间或的分布格局。

1.2 数据来源

1.2.1 实验数据 采用GF-3精细成像模式FSII数据中HV影像(图2),下载自中国资源卫星应用中心网站(中国资源卫星应用中心 (cresda.com)),成像时间为2020年7月24日,景中心经度118°21',纬度31°35',入射角范围为19-50°,标准空间分辨率达10米,方位向分辨率为10米,成像幅宽达100平方米。采用空间分辨率为30m的ASTER DEM作为辅助数据。

1.2.2 参考影像 获取了研究区内最近时间2020年8月高分一号(GF-1)WFV模式影像,为了定量评价分类方法水体信息提取的精度,基于Google Earth、GF-1影像和野外实地采样数据,在EVVI中利用Magic Wand工具随机选取水体、非水体区样本,经arcgis转点后获取实验区1内水体样本点2330个,非水体样本点1927个,实验区2内水体样本点2429个,非水体样本点1724个,其中将水体-非水体样本点的70%用于分类方法的训练,30%用于实验结果精度评价的验证,如图3所示。

2 研究方法

首先对GF-3影像数据进行预处理,结合DEM数据提取阴影并进行掩膜处理,然后根据选取的水体-非水体样本,通过统计灰度直方图进行后向散射强度分析,并通过阈值分割获得初步的水体-非水体信息分布图;其次,采用3×3窗口大小提取影像的纹理特征,优选出巴氏距离(BD)最大的三个纹理特征,利用主成分分析法(PCA)进行去相关处理,选取前两个主分量并与原始灰度图像合并成一幅新影像;最后,分别利用阈值分割法、SVM分类法和面向对象分类法,探讨在两种不同背景下水体提取研究中的优势与不足,如图4。

2.1 影像预处理

SAR影像预处理包括数据导入、多视、滤波、辐射定标与地理编码等。利用DEM数据将GF-3影像转换至地理坐标系下,经过Lee滤波生成10米的SAR影像,分别裁剪出1564像元×1964像元的建成区和3796像元×2676像元的山区,并利用ASTER DEM数据以阈值小于0.75生成阴影掩膜文件。

2.2 纹理特征提取

Haralick等在20世纪70年代提出了14种基于灰度共生矩阵的纹理特征统计量[18]。本文选取灰度量化级为16级,以3×3的移动窗口,步长为1遍历整幅影像,计算GLCM采用8种纹理特征统计量提取目标地物的纹理特征,包括均值、方差、均质性、对比度、相异性、熵、角二阶矩和相关性。

为了更好地表达目标地物的纹理特征,需要对特征统计量进行优选。巴氏距离(Bhattacharyya Distance,BD)可以用来表示两个样本之间的离散程度或者用于测量两种概率分布的可分离性。其计算公式为

其中,[μ],[σ]分别为同一特征上两个样本类别的均值和标准差,BD值越大,表示地物类别间的离散程度越高,地物可分性越好。选取均值、方差和对比度,三者能够较好地反映目标地物的纹理特征(表1)。

2.3 阈值分割

地物的后向散射系数主要与雷达本身的系统参数和地表地物的物理特性有关[19]。在对GF-3SAR影像进行水体信息提取时,由于地表水体易发生镜面散射,后向散射强度较弱,影像中多呈现暗色或黑色。因此,本研究分别选取水体和非水体区,通过统计灰度直方图,选取合适的分割阈值提取水体信息。如图5,水体ROI共89519像元,非水体ROI共60460像元。

从图5可以看出,在阈值为-28时,水体与非水体直方图重叠面积最小,二者分离效果较好,因此GF-3SAR影像以小于-28时为水体信息,大于-28时为非水体信息。

2.4 分类器提取

2.4.1 支持向量机(Support Vector Machine,SVM) 支持向量机的基本思想是通过非线性变换将输入空间映射到一个高维的特征空间,寻找最优分类超平面,实现目标地物的分类。其中核函数的选择是SVM重要的组成部分,经过多次反复对比实验,最终选择RBF核函数、Gamma系数为1,惩罚系数为100,金字塔等级为0,分类可能性阈值为0进行目标地物的分类。

2.4.2 面向对象分类法 面向对象分类法是以由多个像元组成的包含相同信息的同质“对象”为基本单元的分类方法,同时综合考虑了影像的相邻关系、纹理和光谱统计特征等一系列相关信息。其中影像分割是面向对象信息提取的关键,本文在城区选取分割尺度25,合并尺度75;在山区选取分割尺度50,合并尺度80。ENVI中面向对象分类法主要包含面向对象阈值分割、面向对象SVM和面向对象K最邻近算法(KNN,K-Nearest Neighbor)。

2.4.3 KNN KNN算法的核心思想是对于一个已知的特征空间样本集合,如果某個样本与这个特征空间样本集合中的某K个最邻近样本的大多数同属一个类别,则该样本也被标记为这个类别,且具有相同的特征。

2.5 精度评价

以GF-1WFV模式影像与Google Earth影像,结合野外实地调查数据为真实水体数据,采用混淆矩阵进行精度验证,以错分误差、漏分误差、总体精度、Kappa系数为精度评价指标。

3 结果与讨论

3.1 建成区水体信息提取结果

3.1.1 阈值分割法 从图6(a)可以看出,-27~-30阈值均可提取出水体轮廓信息,但是随着阈值的减小,分割效果差异较为明显。图6(b)中红色区域为Google Earth影像中真实水体信息,从图中可以看出,排列规则的建筑物以及建筑阴影的存在使得大量碎斑信息误提以及沟渠等细小水体信息漏提,同时河流中大量有机物、泥沙等杂质严重影响水体信息提取的精度。当分割阈值为-28时,分割效果最好,总体精度达到88.23%,错分误差为0.98%,漏分误差为15.94%,Kappa系数达0.7451(表2)。

3.1.2 建成区不同方法对比结果 由图7可以看出,面向对象法和阈值分割算法的水体提取精度均高于SVM,SVM总体精度最差,仅为82.43%, Kappa系数仅为0.6409,漏分误差高达24.92%。面向对象阈值分割法的总体精度最高,漏分误差相对于SVM得到明显的改善,漏分误差为14.54%,能提取较为连续的水体信息,但由于建筑物和建筑阴影等干扰因素的存在,导致提取精度受限,总体精度最高为89.20%,Kappa系数为0.7639(表3)。由于本文所选建成区背景面积较小,需要进一步细化选取大量的样本数据进行计算,对水体提取结果错分和漏分现象寻找出解决方法,在一定程度上提高了水体提取的精度,使SVM分类法更具科学性。

3.2 山区水体信息提取结果

3.2.1 阈值分割法 与建成区背景下的复杂地物不同,山区背景地物相对单一,地物影响因素较小,从图8(a)可以看出,-27~-30阈值提取的水体信息轮廓均较为完整,水体的漏分现象明显。其中在钳口水库和蓄电站水库附近(图8(b)),这四个阈值均能很好的提取水体信息轮廓,随着分割阈值的减小,水体错分现象逐渐减弱,但是当阈值过小时,水体的漏分现象愈发显现。综合以上,当阈值为-28时,水体信息提取的总体精度最高,达到93.54%,错分误差仅为0.82%,漏分误差为12.05%,Kappa系数达到0.8709(表4)。

3.2.2 山区不同方法对比结果 相比建成区,山区水体面向对象KNN法提取水体信息的能力较弱,提取精度最低,为90.8%,提取结果漏分现象严重,漏分率高达17.88%,而阈值分割法、SVM、面向对象阈值分割法和面向对象SVM分类法,能有效提高水体提取精度,漏分现象能够得到明显的改善,能够准确提取细小水体信息,但错分误差相比面向对象KNN法较高。其中面向对象SVM分类法水体提取精度最高,达到了94.10%,Kappa系数也达到了0.8821,能够完整的提取水体信息(见图9和表5)。

3.2.3 建成区与山区提取结果对比 由表3和表5可见,山区水体提取精度均在90%以上,而建成区背景下面向对象阈值分割法提取精度最高,但最高仅为89.20%,可知山区水体提取精度均高于建成区。

4 结 论

基于Google Earth、GF-1遥感影像和野外实地调查获取的样本数据,探讨了阈值分割法、SVM、面向对象阈值分割法、面向对象SVM分类法和面向对象KNN分类法等五种方法,在建成区和山区不同背景下水体提取研究中的优势与不足,并对以上五种方法分别建立混淆矩阵进行精度评价,主要结论如下:

(1)阈值分割法无论在建成区还是山区均能够较好地提取水体轮廓信息,其中建成区阈值分割水体提取的总体精度达到88.23%,山区高达93.54%,但该方法无法准确区分水体信息和建筑以及建筑阴影,导致建成区水体提取精度不高。

(2)SVM虽然能够提取水体信息的轮廓,但在建成区背景下,水体信息提取精度最差,提取精度仅为82.43%,无法准确识别建成区水体,导致水体漏提现象严重,漏提率高达24.92%。而在山区背景下,SVM能够有效识别水体信息,具有较好的水体提取精度,精度为91.96%。

(3)面向对象分类法无论是在建成区还是山区背景下均能够准确识别水体信息,在建成区背景下面向对象阈值分割法精度最高,而山区背景下面向对象法提取精度均高于90%,说明该方法不仅能够在复杂场景下较完整地提取水体信息,且在一定程度上能够克服山体阴影等因素的影响,适用于SAR图像的水体提取。

综合本研究发现在建成区背景下水体识别准确率不高,而在山区背景下能够较为准确地提取水体信息,在今后的研究中应进一步选取大量的样本参与计算,论证分类方法的科学性和有效性。随着近年来深度学习算法的兴起,探讨基于深度学习算法的水体提取是今后研究的重点,以期实现水体快速、精确的提取。

参考文献:

[1] 陈晋.光学遥感震后损毁建筑物提取方法研究[D].兰州:中国地震局兰州地震研究所,2018:1-54.

[2] 陈斌,王宏志,徐新良,等.武汉市主城区用地结构遥感监测及动态变化[J].地球信息科学学报,2019,21(2):293-303.

[3] 郭文茜,任建强,刘杏认,等.统计数据总量约束下全局优化阈值的冬小麦分布制图[J].遥感学报,2018,22(6):1023-1041.

[4] 陈玲,贾佳,王海庆.高分遥感在自然资源调查中的应用综述[J].国土资源遥感,2019,31(1):1-7.

[5] 马建威,孙亚勇,陈德清,等.高分三号卫星在洪涝和滑坡灾害应急监测中的应用[J].航天器工程,2017,26(6):161-166.

[6] 张丽文,梁益同,李兰.基于高分一号影像的武汉市洪涝遥感监测与分析[J].气象科技进展,2018,8(5):51-57.

[7] 張磊.高分四号卫星在洪泽湖汛期水体范围变化监测中的应用[J].航天器工程,2018,27(2):129-134.

[8] 申邵洪,谭德宝,陈蓓青.基于KI算法的多时相ASAR影像水面信息变化检测[J].长江科学院院报,2008(2):29-32+37.

[9] 李景刚,黄诗峰,李纪人.ENVISAT卫星先进合成孔径雷达数据水体提取研究——改进的最大类间方差阈值法[J].自然灾害学报,2010,19(3):139-145.

[10] 胡德勇,李京,陈云浩,等.单波段单极化SAR图像水体和居民地信息提取方法研究[J].中国图象图形学报,2008(2):257-263.

[11] GONG M G, YU L, JIAO L C, et al. SAR change detection based on intensity and texture changes[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2014,93:123-135.

[12] 汤玲英,刘雯,杨东,等.基于面向对象方法的Sentinel-1A SAR在洪水监测中的应用[J].地球信息科学学报,2018,20(3):377-384.

[13] 邓滢,张红,王超,等.结合纹理与极化分解的面向对象极化SAR水体提取方法[J].遥感技术与应用,2016,31(4):714-723.

[14] 栾玉洁,郭金运,高永刚,等.基于Sentinel-1B SAR数据的2018年寿光洪水遥感监测及灾害分析[J].自然灾害学报,2021,30(2):168-175.

[15] 庞科臣,陈立福,王思雨.融合DEM去除山体阴影的水体提取方法[J].电子科技,2016,29(4):76-78.

[16] 毕海芸,王思远,曾江源,等.基于TM影像的几种常用水体提取方法的比较和分析[J].遥感信息,2012,27(5):77-82.

[17] ACHARYA T D, SUBEDI A, LEE D H. Evaluation of machine learning algorithms for surface water extraction in a Landsat 8 scene of Nepal[J]. Sensors (Basel, Switzerland),2019,19(12):2769.

[18] HARALICK R M, SHANMUGAM K, DINSTEIN I. "Textural features for image classification"[J]. IEEE Transactions on Systems  Man and Cybernetics,2010,3(6):610-621.

[19] 郝宇珊. 基于高分三号SAR影像的目标地物特征提取方法研究[D].哈尔滨:哈尔滨师范大学,2019:17-20.

Research on Water Information Extraction from

GF-3 Image under Different Backgrounds

XIE Yi-mei1,CHEN Dong-hua1,2,3,GUO Kun1,LIU Sai-sai2,CHANG Zhu1, LI Hu1,YANG Hong-wei2,3

(1. School of Geography and Tourism, Anhui Normal University,Wuhu 241000,China; 2. School of Computer and Information Engineering, Chuzhou University,Chuzhou 239000,China; 3. Anhui Academician Workstation, Chuzhou College,Chuzhou 239000,China)

Abstract: Based on the problems of speckle noise in radar remote sensing images and the applicability of water information extraction methods in different backgrounds, this paper studies water information extraction under two different backgrounds, namely the built-up urban area seriously disturbed by human factors and the mountainous area with obvious topographic fluctuations. In this paper, Wuhu City, Anhui Province was taken as the experimental area and the threshold segmentation of GF-3 image was carried out by statistical histogram and three texture features with the largest Bhattacharyya distance were selected for principal component analysis. The first two principal components were selected and the band was synthesized with the original image. The advantages and disadvantages of water extraction research under two different backgrounds were discussed by using different classification methods. The results show that the object-oriented threshold segmentation method has the best extraction effect under the urban construction background, with a total accuracy of 89.20% and a Kappa coefficient of 0.7639. Under the background of mountain area, the object-oriented SVM classification method can accurately identify water information, the total accuracy of water extraction is 94.10%, and the Kappa coefficient is 0.8821.

Key words: GF-3; SAR image; water extraction; DEM

(責任编辑:巩 劼)