陈伟 张秀霞 党星海 樊新成 李旺平 徐俊伟
摘要:准确识别水体信息是分析地表水时空动态变化的重要技术手段。针对目前各种长时序水体信息提取方法精度低的问题,基于Landsat遥感影像,选用1986~2022年5 484景黄河源区遥感影像,分别运用卷积神经网络结合面向对象(CNN-OBIA)和多指数水体检测规则(MIWDR)两种方法提取了黄河源区的地表水体,并对两种方法的提取精度进行了对比分析。在此基础上,探究了1986~2022年黄河源区水体信息的时空变化特征,并对其主要气候因素进行相关分析。结果表明:① CNN-OBIA的总体精度和 Kappa系数分别为96.78%和0.93,MIWDR的总体精度和 Kappa系数分别为94.28%和0.88,总体而言,CNN-OBIA的提取精度高于MIWDR方法。CNN-OBIA的提取结果可以很好地保持水体边界完整性和有效去除山体阴影,可以较好地对细小河流进行提取。② 研究区水体总面积呈现出先减少(1986~2001年)后增加(2001~2022年)的变化趋势。③ 相关性分析表明,降水和气温与水体面积的变化均表现出显著正相关。
关键词:水体面积提取; 卷积神经网络; 面向对象; 驱动力分析; 黄河源区
中图法分类号: P237;P332
文献标志码: A
DOI:10.16232/j.cnki.1001-4179.2024.04.018
0引 言
黄河源区位于青藏高原东北部,源区内有着上千个大大小小的湖泊,由于其地域广阔、人口稀少,因此受人类活动的影响较小,能够真实反映地表水体面积变化与气候变化间的响应关系[1-2]。近几十年里,黄河源区在气候变暖条件下发生了强烈的气候转型[3],尤其在1990年以后,降水量与气温总体呈上升趋势[4],使该区域水文响应过程的波动更加频繁,研究地表水体面积的时空变化及其驱动因素分析,对于黄河源区生态环境的保护具有重大意义[5]。此外,黄河源区海拔较高,地形起伏大,自然环境恶劣,导致水文资料的获取难度增大。因此,运用遥感影像技术监测黄河源区地表水体,不仅对水资源利用和水文研究具有重要意义,而且可以为整个黄河流域水资源的可持续利用提供科学依据。
随着遥感技术的发展,利用卫星遥感影像对大区域陆表水体面积进行长时间监测具有便捷高效的优势[6-7]。针对遥感影像水体提取问题,国内外学者进行了大量研究工作。目前常用的水体提取方法主要有以下3种:① 水体指数法[8],如归一化水体指数(NDWI)[9]、修正的归一化水体指数(mNDWI)[10]和改进的新型水体指数(NNDWI)[11],因其计算方法简便,计算时间较短而在各项研究中得到了广泛应用。然而,其仍面临着阈值不确定和分类结果不稳定的挑战。② 面向对象影像分析(OBIA),该方法以对象为分析单元,能充分利用影像的光谱、空间、纹理信息,特征描述能力显著增强[12]。与水体指数法相比,面向对象能降低“椒盐现象”的出现。然而,OBIA所使用的知识规则对专家知识的依赖性强且时空普适性较差。③ 几种特殊的水体分类方法,例如色调、饱和度和数值算法[13]或基于离散粒子群优化的光谱匹配算法[14]。这些算法是基于经验进行优化的,具有很高的提取精度,但其操作的复杂性使得对区域内进行长时序水体提取没有较高的普适性。
近年来,随着深度学习在目标人工智能识别算法领域的迅猛发展[15-16],一些新型水体提取算法和技术不断涌现。何海清等[17]提出了一种将归一化差分水体指数与深度学习相结合的遥感水体提取方法,实验结果表明该方法优于常用的NDWI、SVM等水体提取方法;王雪等[18]采用全卷积神经网络模型对水体信息进行有效的提取,其结果具有良好的稳健性和泛化能力。然而,深度学习一般不能精细地捕捉水体轮廓,并且因其输出特征的高抽象性,存在“椒盐现象”。
为了克服OBIA时空普适性低,深度学习提取结果边界模糊和样本需求量大的问题,本文采用卷积神经网络(CNN)结合OBIA进行遥感长时序水体识别。结合水体与非水体样本点矢量数据,对遥感影像进行多尺度分割,在分割结果的基础上制作训练样本,然后创建和训练CNN模型,并利用CNN模型获得水体分类结果,结合OBIA进行提取结果优化,提高水体提取精度。
1数据来源和研究方法
1.1研究区概况
黄河源区位于青藏高原东北部(34°10′ N~35°23′N,96°56′ E~99°18′E),总面积约1.90万km2,源区海拔范围在4 134~5 244 m,平均海拔4 405 m,地形中部较低、四周较高,地势起伏较为平缓。黄河源区属于典型的高原大陆性气候[19],主要受西风、印度季风和东亚季风的影响[20],寒冷干燥,冷热两季交替,干湿季分明,年均气温为-8~-1 ℃,年降水量为300~750 mm。源区内水资源丰富,分布着大量的高原湖泊,其中包括分布在中国玛多县海拔最高的淡水湖泊。该区域生态环境受人类活动影响较小,是黄河流域主要的产流区和中国生态屏障区。黄河源区的海拔高度和气候条件如图1所示。
1.2数据来源
基于GEE云平台在线调用经过大气校正及辐射校正的Landsat 5/7/8 SR数据集,对研究区影像进行最小云量筛选,拼接合成1986~2022年的遥感影像。基于PIE云平台下载高分一号多光谱地表反射率产品。表1为本文用到的数据及其来源。
1.3研究方法
1.3.1多指数水体检测规则(MIWDR)
基于GEE云平台利用Landsat遥感影像,采用多指數水体检测规则(MIWDR)[21]提取地表水体。当像元满足逻辑关系[(mNDWI>EVI)或(mNDWI>NDVI)]和(EVI<0.1)时被判定为水体,否则为非水体,多指数比单个指数识别更稳定[22]。该方法适合长时序、大尺度的Landsat水体制图,可以有效降低植被在湿地水体识别中的影响。目前,长时序水体时空变化研究多采用此方法[23-25]。不同指数计算方法如下
1.3.2卷积神经网络结合面向对象
卷积神经网络(CNN)是一种多层前馈神经网络[26],由卷积层和池化层组成,主要是特征提取层和特征映射层,被设计用于从像素级开始的图像视觉识别。CNN采用局部感知野与权值共享的方式减少参数的个数,网络结构对图像的倾斜、平移和比例缩放等变形具有很高的不变性,能够学习到数据的深层特征,但难以得到水体的精确边界。此外,CNN以影像块为训练样本,以固定的感知野窗口提取特征,不利于挖掘地物间的空间关系。
面向对象分类(OBIA)处理过程包括影像分割、特征提取、影像分类等[27]。其中,分割是OBIA中最为核心的一步,它按照异质性最低和同质性最高的原则将影像划分为不同尺寸和特征信息一致的區域。目前使用最广泛的分割方法是多尺度分割,其参数和尺度的选择直接决定分割的质量,本文利用ESP2尺度参数估计工具[28]得到最优分割尺度。
基于最优分割结果制作CNN训练样本,可获得同质像素组成的训练样本集。
本文采用卷积神经网络结合面向对象方法提取水体。CNN以空间上毗邻的均质像素集为感知野,相比传统的窗体形状的影像块感知野,均质像素集感知野更能表征地物的空间关系、边界信息和本身的光谱特性。具体提取过程为:① 基于研究区遥感影像采用目视解译方法共采集1 000个样本点,其中水体和非水体样本点各500个;② 在ESP2分割工具的辅助下确定最优分割尺度并以样本点为约束,实现了原始影像的多尺度分割与分类;③ 计算多尺度分割后形状的重心点,以重心点为中心,生成适合CNN输入端口的同质像素影像块训练样本;④ 基于eCognition软件构建CNN模型(图2),将训练样本输入模型进行训练;⑤ 使用训练好的模型对研究区长时序的Landsat影像进行分类,生成水体提取结果;⑥ 基于CNN分类结果,结合NDWI水体指数和坡度信息进行结果优化。
1.3.3精度评价
本文利用混淆矩阵验证研究区内地表水体的提取精度。具体指标由生产者精度(Pay)、用户精度(Uay)、总体精度(Oay)、Kappa系数(Kc)4个参数组成。其中,生产者精度(Pay)是指分类时对水体类别地面实际参考数据进行正确分类的概率;用户精度(Uay)是指分类器在把像元分类为水体后,参照现有数据实际分类到水体中的概率;总体精度(Oay)是全部正确分类的样本点与总样本点数之比;Kappa系数(Kc)综合考虑了分类结果与参考数据间的一致性,一般情况下Kappa系数在0~1之间变化,数值越大说明分类精度越高。Pay、Uay、Oay和Kc的计算公式分别
1.3.4相关性分析
本文通过计算水体面积与年降水量和年均气温变化间的皮尔逊相关系数,来判断地表水体面积与气候因素变化的相关性。对于任意两个变量X=(x1,x2,…,xn),Y=(y1,y2,…,yn),这两个变量的皮尔逊相关系数计算公式为
2结果与分析
2.1不同方法提取结果对比与分析
2.1.1水体提取结果与分析
选择湖泊、干流、支流3种水体类型对比分析JRC数据集、MIWDR、CNN-OBIA的提取结果差异。如表2所示,MIWDR和CNN-OBIA方法均能够准确地提取出大型面状水体,并与JRC数据集相一致。在提取干流时,MIWDR与CNN-OBIA提取结果呈现一致性,均能够准确地提取干流的特征,并且在完整性方面优于JRC数据集。而小的支流提取结果显示,CNN-OBIA方法均优于MIWDR和JRC数据集,其提取结果的连续性较好,很好地抑制断流、孔洞现象,噪声点很少,能很好地区分阴影和水体;JRC数据集出现明显的断裂情况;MIWDR的提取结果有很多斑点噪声,是山体阴影和暗像素的存在对水体提取产生强烈干扰。
2.1.2不同水体提取方法的精度评价
本文利用混淆矩阵验证了研究区内地表水体的提取精度。选取 1988、1996、2004、2012、2020年5期地表水体数据,基于谷歌地球(Google Earth)的高分辨率影像,采用随机采样法进行水体精度验证。通过目视解译分别均匀选取500个水体点和500个非水体点,共1 000个样本点。对比验证MIWDR和CNN-OBIA两种方法的精度(表3)。结果显示,MIWDR平均总体精度和 Kappa系数分别为94.28%和0.88,CNN-OBIA平均总体精度和Kappa系数分别为96.78%和0.93,表明CNN-OBIA方法提取精度优于MIWDR,因此,本文选用CNN-OBIA方法提取的黄河源区长时序水体进行时空变化及其驱动因素分析。
2.2GF-1影像提取结果对比与分析
基于高分一号(GF-1)多光谱遥感影像,采用CNN-OBIA方法提取了黄河源区水体信息,并通过混淆矩阵验证提取精度(见表4)。GF-1影像的提取结果在总体精度和Kappa系数方面均高于Landsat影像,达到了97.52%和0.95。并将GF-1影像与Landsat影像的提取结果进行了比较,见表5。对大型水体而言,Landsat及GF-1影像均具有较好的提取效果,都能准确识别水体边界;在细部水体提取中,GF-1影像的提取结果明显更好,能更好地对细部水体进行识别和提取,表明CNN-OBIA方法同样适合高分辨率影像的水体提取,且随着分辨率越高,其提取精度越高。
2.31986~2022年黄河源区地表水时空变化
利用CNN-OBIA水体提取方法,提取了黄河源区1986~2022年地表水体,并分析了水体面积的年际变化特征。从图4可知,地表水体面积在1986~2022年整体呈增加趋势,总面积从1986年的1 569.9 km2增加到2022年的1 664.97 km2,增加速率为6%。有两个时段变化趋势不同,1986~2001年间,水体面积减少;而在2001~2022年间,水体面积呈现增长趋势。选择多个具有代表性的区域对水体空间变化趋势进行放大(图5)。由图5可知,1986~2001年期间,湖泊整体呈现萎缩的趋势,2001~2022年期间,湖泊面积大部分增加。从干、支流域上看,也具有相同的变化趋势。
2.4黄河源区地表水体变化气候因素分析
2.4.1气温和降水
气温与降水是内陆地面水体面积发生变化的两个主要影响因子。通过对黄河源区1986~2022年年降水量和年均气温进行统计分析,发现两者均呈现波动上升趋势(图6)。其中年降水量平均为371.05 mm,1990年降水量达到最低的270.71 mm,最高年降水量在2009年为496.88 mm。年均气温平均为-4.89 ℃,1992年年均气温达到最低的-6.53 ℃,最高年均气温在1987年为-3.42 ℃。
2.4.2气温和降水与水体面积变化相关分析
对黄河源区地表水体面积与年降水量、年均气温作相关性分析。结果表明,在P=0.05的显著性水平下,水体面积与年降水量、年均气温相关性较一致,相关系数分别为0.327和0.341。由图7明显可见,水体面积与年降水量、年均气温均呈显著正相关关系。因此,气温和降水是影响黄河源区地表水体面积变化的重要因素。
3讨 论
本文针对如何更好地保持水体边界的完整性,克服山体阴影对分类结果的影响,以及提高细小河流提取准确性的问题,使用深度学习结合面向对象的水体提取方法提高精度。
(1) 从实验结果分析可知,CNN-OBIA方法对提取长时序水体有很强的适用性,因为相同区域各年的遥感影像具有相似的光谱特性,模型可直接应用于其他研究年份,获得水体结果。此外,基于多尺度分割后制作的CNN训练样本,更能表征地物的空间关系、边界信息和光谱特征。训练得到的CNN模型不仅可以准确识别水体边界,还能较好克服山体阴影在识别过程中的影响。再加入NDWI指数、坡度信息优化提取结果,可以修正部分误分对象和消除阴影对提取结果的影响。
(2) 通过长时序水体提取试验,发现黄河源区地表水体面积呈先减少(1986~2001年)后增加(2001~2022年)的趋势。这一结论与三江源总水体面积变化趋势相一致[29-30]。水体面积、降水量和温度的年际变化表明,水体面积变化与降水量和气温的变化保持了较高的一致性。相关性分析结果表明,降水量和水体面积相关系数达到0.327,说明降水量和水体面积之间呈正相关变化。年均气温与水体面积的相关系数为 0.341,这表明气温越高,水体面积越大。这些变化与青藏高原大部分地区近年来气候朝着暖湿化发展的趋势基本一致[31]。
(3) 本文使用JRC全球地表水产品数据作为验证数据。将JRC数据集中1986~2020年黄河源区的地表水体面积与本实验提取结果进行一致性检验(图8),结果表明,1986~2020年R2为0.86,表明CNN-OBIA提取的水体面积年际变化与JRC产品数据结果相近,从而佐证了本文结果的可靠性。
4结 论
基于eCognition软件,采用CNN-OBIA水体提取方法,提取了黄河源区1986~2022年所有的地表水体并进行精度评价,分析了地表水体面积变化及其驱动因素。得到以下结论:
(1) 卷积神经网络结合面向对象(CNN-OBIA)水体提取方法比多指数水体检测方法(MIWDR)精度更高。CNN-OBIA提取方法总体精度达到96.78%,Kappa系数为0.93,该水体识别方法精度较高,并快速、简单,可用于长时序水体提取分析。
(2) 基于GF-1影像,利用CNN-OBIA方法提取水体的总体精度为97.52%,Kappa系数为0.95,表明CNN-OBIA适用于高分辨率影像的水体提取。
(3) 1986~2022年黄河源区地表水体面积整体增加,从1986年的1 569.9 km2增加到 2022年的 1 664.97 km2,增加速率为6%。在1986~2001年间,水体面积减少;2001~2022年间,水体面积呈现增长趋势。
(4) 1986~2022年间,黄河源区年降水量和年均气温均呈波动升高趋势。年降水量和年均气温是导致源区内地表水体面积扩大的原因。
参考文献:
[1]皮英楠,刘世英,李宗仁,等.基于GF-1與Landsat卫星数据的青海省湖泊遥感调查及其动态变化分析[J].宁夏大学学(自然科学版),2018,39(2):170-176.
[2]董斯扬,薛娴,尤全刚,等.近40年青藏高原湖泊面积变化遥感分析[J].湖泊科学,2014,26(4):535-544.
[3]白晓兰,魏加华,解宏伟.三江源区干湿变化特征及其影响[J].生态学报,2017,37(24):8397-8410.
[4]TONG L,XU X,FU Y,et al.Wetland changes and their responses to climate change in the “three-river headwaters” region of China since the 1990s[J].Energies,2014,7(4):2515-2534.
[5]杜本峰,穆跃瑄,刘悦雅.生态健康、健康生态与黄河流域高质量发展[J].中州学刊,2021(5):86-93.
[6]仲涛,李漠岩,李建豪,等.伊犁河流域陆表水域面积时空变化及驱动力分析[J].人民长江,2023,54(4):101-107.
[7]卢丽琛,洪亮.云南省九大高原湖泊水体面积时空变化研究[J].人民长江,2021,52(10):128-134.
[8]高炜.小兴安岭沼泽湿地时空格局演变及驱动机制分析[D].哈尔滨:哈尔滨师范大学,2020.
[9]MCFEETERS S K.The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features[J].International Journal of Remote Sensing,1996,17(7):1425-1432.
[10] XU H.Modification of normalized difference water index (NDWI) to enhance open water features in remotely sensed imagery[J].International Journal of Remote Sensing,2006,27(14):3025-3033.
[11]王帆,李崇贵,马婷,等.一种改进的遥感影像水体信息快速提取方法[J].人民长江,2021,52(6):223-228.
[12]程葛鉴,于欢,孔博,等.面向对象遥感影像分析技术应用现状与展望[J].科技资讯,2020,18(16):12-13.
[13]PEKEL J F,COTTAM A,GORELICK N,et al.High-resolution mapping of global surface water and its long-term changes[J].Nature,2016,540(7633):418-422.
[14]JIA K,JIANG W,LI J,et al.Spectral matching based on discrete particle swarm optimization:a new method for terrestrial water body extraction using multi-temporal Landsat 8 images[J].Remote Sensing of Environment,2018,209:1-18.
[15]叶雨阳,吕献林,罗锴澍,等.基于Landsat-8数据的洞庭湖区地表水体提取方法评价[J].水利水电快报,2023,44(8):17-24.
[16]ERKMEN B,VURAL R A,KAHRAMAN N,et al.A mixed mode neural network circuitry for object recognition application[J].Circuits,Systems and Signal Processing,2013,32:29-46.
[17]何海清,杜敬,陈婷,等.结合水体指数与卷积神经网络的遥感水体提取[J].遥感信息,2017,32(5):82-86.
[18]王雪,隋立春,鐘棉卿,等.全卷积神经网络用于遥感影像水体提取[J].测绘通报,2018,495(6):41-45.
[19]陈建军,黄莹,赵许宁,等.黄河源区高寒草地植被覆盖度反演模型精度评价[J].科学技术与工程,2019,19(15):37-45.
[20]XIE J,XU Y P,GUO Y,et al.Detecting the dominant contributions of runoff variance across the source region of the Yellow River using a new decomposition framework[J].Hydrology Research,2021,52(5):1015-1032.
[21]HAN Q,NIU Z.Construction of the long-term global surface water extent dataset based on water-NDVI spatio-temporal parameter set[J].Remote Sensing,2020,12(17):2675.
[22]ZHOU Y,DONG J,XIAO X,et al.Continuous monitoring of lake dynamics on the Mongolian Plateau using all available Landsat imagery and Google Earth Engine[J].Science of the Total Environment,2019,689:366-380.
[23]ZOU Z,XIAO X,DONG J,et al.Divergent trends of open-surface water body area in the contiguous United States from 1984 to 2016[J].Proceedings of the National Academy of Sciences,2018,115(15):3810-3815.
[24]郝金虎,韦玮,李胜男,等.基于GEE平台的京津冀长时序水体时空格局及其影响因素[J].生态环境学报,2023,32(3):556-566.
[25]祁昌贤,任燕,彭海月,等.基于GEE云平台的三江源湖泊面积提取及动态变化研究[J].长江科学院院报,2023,40(7):179-185,190.
[26]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90.
[27]林川,宫兆宁,赵文吉.基于中分辨率TM数据的湿地水生植被提取[J].生态学报,2010,30(23):6460-6469.
[28]马浩然.基于多层次分割的遥感影像面向对象森林分类[D].北京:北京林业大学,2014.
[29]金岩丽,徐茂林,高帅,等.2001~2018年三江源地表水动态变化及驱动力分析[J].遥感技术与应用,2021,36(5):1147-1154.
[30]赵梓琨,田园盛,翁学先,等.1986~2021年黄河流域地表水体面积的时空变化特征[J].应用生态学报,2023,34(3):761-769.
[31]李红梅,颜亮东,温婷婷,等.三江源地区气候变化特征及其影响评估[J].高原气象,2022,41(2):306-316.
(编辑:黄文晋)