基于GEE 平台的黄河流域水体指数研究

2023-03-10 10:05孙根云邵宝婕丁孙金衍姚延娟王霓妮
人民黄河 2023年3期
关键词:反射率波段背景

孙根云,邵宝婕,丁孙金衍,姚延娟,付 航,王霓妮

(1.中国石油大学(华东) 海洋与空间信息学院,山东 青岛 266580;2.青岛海洋科学与技术试点国家实验室 海洋矿产资源评价与探测技术功能实验室,山东 青岛 266071;3.生态环境部 卫星环境应用中心 国家环境保护卫星遥感重点实验室,北京 100094)

1 引 言

黄河流域是我国重要的生态安全屏障[1]和经济发展的重要区域,快速、准确地提取流域水体对流域水资源调查、综合治理等具有重要意义。当前,基于遥感技术的水体提取方法已被广泛应用于水资源调查、海岸线动态变化监测等领域[2],水体提取方法主要分为水体指数方法和机器学习方法[3-5]。其中机器学习方法基于人工提取特征,使用分类器来实现水体和背景地物的区分,通常需要大量样本训练分类器,样本质量会直接影响最终的水体提取精度,并且对于大范围的水体,难以获得优质、充足的训练样本[6-10]。相较而言,水体指数方法利用波段间的代数运算来凸显水体与背景地物的差异,此类方法形式简单、处理数据快速有效、分类精度较高,在大尺度水体提取中具有很大优势[11]。近年来,相关研究人员提出了一系列水体指数方法,如:MCFEETERS[12]利用水体在绿色波段反射率高、在近红外波段反射率低的特点,提出了归一化差异水体指数(NDWI),NDWI方法可以有效提取水体,但提取过程中容易将建筑物错分为水体。针对这一问题,徐涵秋[2]采用中红外波段代替近红外波段,提出了改进的归一化差异水体指数(MNDWI),但该方法容易受山体阴影(简称山影)的影响。Jiang 等[13]基于Sentinel-2 影像提出了阴影水体指数(SWI),其对于纯水、浑浊水、盐水和浮冰有较好的提取效果。尽管上述水体指数方法取得了不错的提取效果,但对于大范围复杂水体的提取效果仍有待验证。

对于大尺度流域水体的提取,通常需要大量的遥感影像才可实现区域全覆盖,而传统的遥感处理平台难以实现在某一特定时期、较大范围内对大量卫星影像的快速调用[14]。GEE 是专门用于处理卫星图像和其他地理数据的平台,现阶段已被广泛用于地理数据大规模分析[11,15]。本文基于GEE 平台,在深入分析黄河流域不同背景地物、不同状态水体光谱特征的基础上,提出一种黄河流域水体指数(YRBWI),并与已有的水体指数NDWI、MNDWI和SWI进行对比,验证其去除遥感影像固有山影的有效性以及提取精度。

2 研究区概况与数据选取

2.1 研究区概况

黄河流经黄土高原水土流失区,是我国西北、华北地区的重要生态屏障,为我国北方生态文明建设提供了载体,源区被誉为“中华水塔”[16]。流域面积为79.5万km2,从西到东横跨青藏高原、内蒙古高原、黄土高原和黄淮海平原4 个地貌单元,是我国第二大流域[17]。黄河源头常年积雪,上游河水清澈,大面积沼泽地和湖泊较多;中游流经黄土高原地区,水土流失严重;下游泥沙量大,河道泥沙淤积现象严重[14,16]。流域独特的地貌特征和水文现象决定了常规的水体提取方法无法满足全流域水体自动提取的要求。流域水体提取主要存在以下难点:流域地物复杂、地形多变,山影严重干扰水体提取;流域水体复杂,高含沙量浑浊水体与湖泊、水库等清澈水体的光谱特征差别较大,传统水体指数大多只对清澈水体有较好的提取效果,无法满足流域内复杂水体的高精度提取。

2.2 数据选取

在众多光学数据中,Sentinel-2 影像数据是唯一在红边范围内含有3 个波段(B5、B6 和B7)的数据。选用GEE 平台中2018 年所有可用的黄河流域Sentinel-2 影像,首先通过QA60 波段对云阴影等观测质量较差的像素进行掩膜,再对所有影像进行中值合成,最终将其用于2018 年黄河流域水体提取。结合Sentinel-2 影像和Google Earth 高分辨率遥感影像,选取2 种典型水体(清澈水体、浑浊水体)和6 种典型背景地物(农田、沙漠、山影、植被、建筑物、道路),对每种水体和背景地物分别选取100 个样本点用于绘制光谱曲线。通过分层随机抽样,结合Sentinel-2 和Google Earth 影像进行目视解译生成940 个水体样本和1 073 个非水体样本,用于水体提取结果的精度评价。Sentinel-2 影像光谱覆盖了430~2 300 nm 范围内的13个波段,可见光、近红外波段的空间分辨率为10 m,红边(Red_edge)、短波红外(SWIR)波段的空间分辨率为20 m,卫星重访周期为5 d。

3 技术与方法

3.1 YRBWI 的构建

黄河流域地表水体的反射特性经常受到周围环境(山影、泥沙等)的影响。为研究不同水体及背景地物的光谱特征,分别绘制其光谱曲线(见图1),参考已有研究[13,18],选择Sentinel-2 影像的B5 波段作为红边波段。可以看出,从蓝色波段到红边波段,清澈水体和浑浊水体的反射率变化呈现相反趋势,且二者与背景地物的反射率相近,无法同时实现两种水体的提取。从红边波段到近红外(NIR)波段,背景地物的反射率均表现为上升趋势,而清澈水体和浑浊水体的反射率均表现为下降趋势,水体与背景地物的反射率差异明显,容易进行区分。从近红外波段到SWIR2 波段,水体与部分背景地物的反射率相近且均表现为下降趋势,无法进行区分。

图1 黄河流域不同水体和背景地物的光谱曲线

对图1 分析可知,从红边波段到近红外波段,水体与背景地物的反射率差异明显、变化趋势相反,因此利用这两个波段构造水体指数,以达到同时提取清澈水体、浑浊水体并消除背景地物影响的效果。据此构建的初步水体指数(PWI)如下:

式中:ρRed_edge、ρNIR分别为影像在红边和近红外波段的反射率。

水体与背景地物相反的反射率变化趋势是区分水体与背景地物的关键。然而,根据图1 可知,清澈水体和浑浊水体的反射率在红边波段和近红外波段的下降幅度较小,这可能导致水体提取效果不明显。为凸显这种变化趋势,进一步对PWI进行差异增强处理。对于式(1)中PWI的分子项,使用斜率大于1 的单调递增函数可以增强水体反射率的下降趋势。考虑到各种背景地物在两个波段的反射率都在0~1 之间,选取常用的y=sinx、y=tanx、y=ex、y=lnx这4 种单调递增函数作为增强函数。由于斜率为1 的y=x函数能够反映出背景地物在两个波段原本的反射率差值,因此以y=x作为对照函数,5 种函数在反射率为0~1 之间的函数曲线见图2。以浑浊水体为例,5 种函数处理后浑浊水体在红边和近红外波段间的反射率差值见图3。

图2 5 种函数在反射率为0~1 之间的函数曲线

图3 5种函数处理后浑浊水体在红边和近红外波段间的反射率差值

分析图2 可知,反射率在0~1 之间时y=lnx函数的斜率(增长速率)大于其他函数,且反射率小于0.3时y=lnx函数的增长趋势更加明显,更加有利于加大水体在红边和近红外波段之间的反射率差异。对比图3中不同函数的反射率拉伸效果可知,y=sinx、y=tanx函数几乎没有拉伸效果,y=ex函数的效果稍好,y=lnx函数的拉伸效果最好。因此,选取y=lnx作为拉伸函数,对水体在红边和近红外波段的反射率差异进行增强处理。对于式(1)中PWI的分母项,考虑到PWI分母变大会导致其整体减小,从而造成反射率差异效果的抵消,因此对分母项保持原有形式,不做拉伸处理,最终得到黄河流域水体指数(YRBWI):

3.2 对比水体指数

为验证YRBWI水体指数的有效性,选取NDWI、MNDWI和SWI水体指数进行对比,这3 种水体指数公式分别为

式中:ρGreen、ρSWIR1分别为影像在绿色、SWIR1 波段的反射率。

3.3 精度评价指标的确定

采用总体精度(OA)和Kappa系数评定各水体指数提取水体的精度。总体精度指被正确分类的类别像元数(样本数)与总类别像元数的比值;Kappa系数代表正确分类与完全随机分类产生错误减少的比例。OA和Kappa的计算公式如下:

式中:pkk为被正确分为k类的样本数;p为样本总数;pii为被正确分类为i类的样本数;pi+为分类所得到的第i类的样本总数;p+i为目视解译得到的第i类的样本总数。

4 结果分析

4.1 精度评价

各水体指数的最佳阈值以人工方式确定,将0 作为基本阈值,在此基础上多次调整,选取水体提取精度最高时对应的阈值作为该指数的最佳阈值(T)。经计算,YRBWI、NDWI、MNDWI、SWI的最佳阈值分别为-0.05、-0.10、0.25、0.15,4 种水体指数在最佳阈值下的OA值分别为96.87%、93.64%、95.78%、96.08%,Kappa系数分别为0.937 0、0.872 4、0.914 9、0.921 1,因此YRBWI的OA和Kappa值最大,精度最高。

4 种水体指数在最佳阈值下对浑浊水体、清澈水体和山影的正确分类率见表1,可以看出,与NDWI、MNDWI和SWI相比,YRBWI对浑浊水体和山影有最高的正确分类率,尽管对于清澈水体来说,YRBWI的正确分类率略低于NDWI,但仍取得了99%以上的效果。说明YRBWI在准确提取黄河流域高含沙量水体的同时,还能有效去除流域内大量的山影噪声,YRBWI能够很好地适应该流域的广阔范围和特殊的地理环境。

表1 4 种水体指数对浑浊水体、清澈水体和山影的正确分类率

4.2 水体指数增强性能

为比较不同水体指数对水体与背景地物之间差异的增强性能,不同水体和背景地物的各水体指数均值见图4(a),图4(b)是对图4(a)中NDWI、MNDWI和SWI均值的放大图。与其他3 种指数相比,不同水体和背景地物的YRBWI均值的差异最大,说明YRBWI有最好的增强性能。另外,清澈水体、浑浊水体的YR⁃BWI均值均大于0,背景地物均值均小于0,说明YRBWI的分类效果较好。分析图4(b)可知,NDWI、MNDWI和SWI对于水体与背景地物之间的差异有一定的增强效果,但浑浊水体的NDWI均值小于0,说明NDWI存在把浑浊水体错分为背景地物的情况;山影的MNDWI和SWI均值大于0,说明MNDWI和SWI存在把山影错分为水体的情况。由此可知,与其他3 种指数相比,YRBWI对水体与背景地物之间差异的增强效果明显,具有较好的分类效果。

图4 不同地物类型的各水体指数平均值

4.3 不同水体指数的提取效果对比

为验证YRBWI在全流域内不同区域的提取效果,选取3 个代表性区域(见图5),不同区域的各水体指数提取结果见图6~图8。图6 中细长的线状部分是水体,YRBWI提取的水体清晰明亮且与周围背景地物差异明显;MNDWI和SWI提取的水体较为细小,存在部分水体的缺失;NDWI提取的水体虽然较为完整,但是周围山影噪声较多,水体边界不清晰。图6 中红框部分是山影,YRBWI提取的水体几乎不存在山影噪声,而NDWI、MNDWI和SWI提取的水体均存在大量山影噪声,错分情况严重。图7 中绿色椭圆部分是清澈的湖泊,蓝色椭圆部分是浑浊的黄河水体,YRBWI、NDWI和SWI提取的清澈水体、浑浊水体都较为完整,相比之下,MNDWI提取的浑浊水体略有缺失;图7 中的红框部分是城市区域,YRBWI、MNDWI和SWI能够在错分极少的情况下很好地提取城市中较为细碎的水体,而NDWI存在严重的背景地物错分现象。图8 中绿色椭圆部分是黄河支流,YRBWI和NDWI提取的黄河支流水体清晰明亮,MNDWI和SWI能够识别黄河支流但是水体缺失严重;图8 中的红框部分是大量积雪和部分山影,YRBWI对于积雪和山影噪声的去除效果很好,NDWI提取的水体存在少量积雪,而MNDWI和SWI对于积雪的去除效果极差,积雪的明亮程度甚至超过绿色椭圆部分的水体,说明积雪错分情况严重。综上来看,与其他3 种水体指数相比,YRBWI对黄河流域的水体提取效果最好。

图5 黄河流域内选取的3 个代表性区域

图6 A 区域的各水体指数提取结果

图7 B 区域的各水体指数提取结果

图8 C 区域的各水体指数提取结果

4.4 阈值敏感性分析

为比较各水体指数对于阈值的敏感性,计算4 种水体指数在不同阈值下的精度值。根据上文确定的YRBWI、NDWI、MNDWI、SWI的最佳阈值分别为-0.05、-0.10、0.25、0.15,以0.05 为间隔选取最佳阈值附近的8 个阈值。其中:YRBWI的阈值范围是-0.10~0.25,NDWI的阈值范围是-0.20~0.15,MNDWI的阈值范围是-0.05~0.30,SWI的阈值范围是-0.10~0.25。各水体指数在不同阈值下的OA和Kappa值的变化见图9。可以看出,随阈值的增大,4 种水体指数的OA和Kappa值都呈现先增大后减小的趋势,但精度值的变化范围有所不同。以OA为例,YRBWI的OA值在最佳阈值后虽有所下降,但总体上变化较为平缓,在-0.10~0.25阈值范围内其OA的最大值和最小值相差仅5%左右。而NDWI在-0.20~0.15 阈值范围内其OA的最大值和最小值相差约20%,MNDWI和SWI在各阈值范围内其OA的最大值和最小值均相差15%以上。由此可见,YRBWI的水体提取精度随阈值变化的波动较小,对阈值变化不敏感,抗干扰性强。而其他3种水体指数尤其是NDWI的水体提取精度随阈值变化波动较大,对阈值变化较敏感,抗干扰性弱。

图9 4 种水体指数在不同阈值下的精度变化

此外,在-0.10~0.10 阈值范围内,YRBWI的精度最高,而阈值分别大于0.10 和0.15 时,其精度分别低于SWI和MNDWI的精度。以SWI为例,结合图4(b)可知,山影的SWI均值大于0,说明大部分山影的SWI值大于0,因此在阈值大于0 的基础上适度增大阈值可以去除SWI提取结果中山影噪声的影响,从而提高SWI的提取精度。而对于YRBWI,结合图4(a)可知,水体的YRBWI均值大于0,背景地物的YRBWI均值小于0,因此在大于0 的基础上增大阈值会使YRBWI存在水体漏分现象,从而导致精度降低。

5 结 论

针对黄河流域的复杂水体信息,提出一种新的水体指数YRBWI用于黄河流域的大尺度水体提取,结论如下。

(1)使用红边和近红外波段构造PWI,在对比多个增长函数后选择y=lnx函数对PWI进行增强处理得到YRBWI。与NDWI、MNDWI和SWI这3 种水体指数相比,YRBWI在黄河流域水体提取中表现优异,既能有效增强浑浊水体和清澈水体与背景地物的光谱差异,准确提取高含沙量浑浊水体,也能解决大部分指数存在的山影问题,可实现快速、自动、高精度的水体提取。

(2)相比于其他指数,YRBWI对阈值变化不敏感,具有良好的抗干扰性。在未来研究中,可考虑结合水体的时间序列信息来进行黄河流域水体提取和变化研究。

猜你喜欢
反射率波段背景
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
“新四化”背景下汽车NVH的发展趋势
《论持久战》的写作背景
晚清外语翻译人才培养的背景
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
炼焦原料煤镜质组的反射率及分布
基于SPOT影像的最佳波段组合选取研究