基于深度学习的遥感影像地表水时空监测与分析

2023-10-11 08:48厉芳婷周军元尧志青
地理空间信息 2023年9期
关键词:湖北省水体水资源

厉芳婷,胡 菡,刘 韬,周军元,邓 拓,尧志青

(1.湖北省测绘工程院,湖北 武汉 430074)

气候变化和人类活动影响的深入,对水资源时空分布、旱涝极端水文事件产生了显著影响,甚至影响到社会经济可持续发展和生态环境健康。了解水资源时空演变规律是气候治理、应对全球变化和水危机的重要支撑,是自然资源管理的重要基础。遥感科学的不断发展,为地表水体提取和水体面积变化研究奠定了手段基础[1]。遥感技术的应用可扩展监测范围、提高数据检测时效、增加信息获取的全面性,能有效克服传统调查方式耗时费力且结果不准确等问题。单波段阈值法通过不断更改分类阈值来确定区分水体与非水体的最佳阈值,最佳阈值是关键所在,直接影响水体提取结果。该方法构建简单,计算方便,但往往精度不够理想。NDWI 的提出构建了一种遥感水体指数,在此基础上国内外学者进行大量研究,提出了MNDWI、AWEIsh、GNDWI等方法。研究发现阈值设定是水体指数法的难点,这类方法使用时通常需要人为干预,在复杂环境和大范围的应用上存在局限。随着智能算法的迅速发展,其在遥感影像分类中的作用越来越重要[2-5]。基于机器学习的水体分类算法以其人工耗费少、效率和精度高的特点在遥感领域得到了很大发展,主要包括支持向量机(SVM)、随机森林、深度学习3 大类。20 世纪90 年代初,Vladimir N V[6]和Breiman L[7]通过统计学理论实现了一种解决函数拟合和模式识别的智能算法。随着大量标记数据、高性能计算和更先进的网络结构的出现,深度学习在图像识别方面显示出巨大优势。与传统特征提取方法不同,深度神经网络模型能在大量样本中自适应学习特征,具有普适性和灵活性[8-13]。目前的研究工作仍存在以下不足:①需要大量训练样本,耗时耗力且标注精度对训练结果影响较大;②内陆水体分布不均匀,水体特征复杂影响水体提取精度。鉴于此,本文利用遥感数据增强方法,通过随机翻转、高斯模糊、锐化、引入噪声等方法,扩充样本数量;利用U-Net 模型,引入注意力机制模块,从通道和空间两个维度提取特征,从而提高水体提取精度。

1 研究区概况与数据来源

湖北省素有“千湖之省”的美誉,湖泊、河流、水库等水资源丰富。长江、汉江自西向东横贯全省,西北山区有丹江口水库、江汉平原有丰富的湖泊,最大湖泊——洪湖面积超过400 km2。武汉市湖泊库塘星罗棋布,众多河流从南北两岸汇入长江,列入重点保护的湖泊有166个。

本文对研究区进行20 a长时序的水资源研究,主要数据包括:①Landsat多光谱时序遥感影像,空间分辨率为30 m,重访周期为16 d,有较丰富的影像资源可供筛选,具备大区域、高频次的快速监测能力,是样本采集和水体提取的主要数据源;②国产高分辨率遥感影像,选取高分2号等国产高分辨率遥感影像作为水体提取的补充数据源;③发展数据,选取欧洲中期天气预报中心提供的ERA5 Daily Aggregates数据集作为湖北省气温数据,选取CHIRPS数据集作为降雨数据,从2001年、2005年、2010年、2015年、2020年的湖北省统计年鉴中提取城镇人口和经济数据。首先剔除遥感影像数据中云量较多以及有大面积阴影、噪声、异常值的影像,最终选取的年度影像数量见表1;然后对影像进行配准、辐射定标、大气校正、几何校正等处理,并将处理后的影像拼接成每年一版的湖北省遥感影像图。

表1 湖北省各年Landsat系列影像数据统计

2 研究方法

首先通过基于遥感影像的样本采集和扩充,构建训练样本库;然后在U-Net框架中引入注意力机制模型优化深度学习模型;再利用样本库训练后的优化模型对5 期影像进行水体提取,并制作水体图;最后引入气象、经济、社会数据进行统计、叠加分析。

2.1 训练样本数据集

利用监督分类方法区分预处理后遥感影像中的水体和非水体,获取分类图。为解决样本数量问题,利用高斯模糊、拉普拉斯算子等方法模拟遥感影像部分数据丢失产生的效果,引入各类噪声信息使训练样本更加丰富,样本信息复杂化,泛化模型性能。本文采用监督学习方法,需输入有效标签数据帮助模型学习,因此采用监督式SVM结合人机交互的方法进行分类标注。本文将水体样本裁切为224×224像素(图1)。

图1 水体样本标注

2.2 基于深度学习的遥感水体提取算法

本文以U-Net 模型为深度学习算法研究的基础模型,引入注意力机制模块组建成水体提取模型。

1)U-Net 基础模型是在FCN 基础上发展得到的新型神经网络,主要包括编码器和解码器,编码器由多个卷积块操作和多次下采样组成,下采样采用最大池化,其作用是生成从低维到高维的特征;解码器由多个与编码器中相同的卷积块和上采样组成,上采样采用双线性差值方法。解码器通过一个跳跃连接,将编码器中对应层级的特征与解码器中的特征进行融合,使网络既包含浅层的简单特征(颜色、轮廓等),又包含深层的复杂特征,提高了水体提取的准确性。

2)注意力机制模块。本文采用的遥感影像背景复杂、包含的地物种类丰富、光谱范围广泛,基础的U-Net 网络构架不能有效提取复杂遥感影像的像元特征,因此在多尺度融合过程中,添加注意力模块,用于关注更加复杂的光谱特征,实现更精细的提取。注意力机制模块强调通道和空间两个维度的重要特征,可模拟人的视觉,只关注重要特征并抑制非重要特征,利用特征通道间的关系生成通道注意图。由于特征图的每个通道都被视为特征检测器,通道注意力集中在给定输入图像“是什么”。为有效计算通道注意,对输入特征图的空间维度进行压缩。为聚合空间信息,通常采用平均池来有效了解目标物体的范围,而最大池则可关注最主要的特征,从而推断特征所在的通道,实现对水体的“注意”。利用特征之间的空间关系生成空间注意图。空间注意侧重于“何处”是信息部分,与通道注意是互补的。为了计算空间注意力,先沿通道维度进行平均池化和最大池化操作,再将它们连接起来生成有效的特征描述符。沿通道维度进行池化操作可有效突出信息区域,完成水体定位。

利用添加注意力机制的U-Net 深度学习方法挖掘已有高空间分辨率类别图中的水体空间分布先验信息,以更好地描述不同形态水体的空间分布特征,并在学习遥感影像的浅层简单特征(颜色、轮廓)的同时,将深层的复杂特征剥离出来,进一步提高水体识别的准确性。

2.3 水资源变化监测与分析

气候和人类活动是水体变化的主要驱动因素[14-17]。本文计算了研究区内主要水资源面积,利用变化检测算法对主要水体水面积时空变化过程进行监测与分析;并进一步探讨和分析气候变化和人类活动对水资源的影响,分析不同时期水资源变化驱动变量的相对重要性,从而了解研究区内主要水资源变化的主要原因。

3 水体提取结果与精度分析

3.1 样本数据集成果

本文在研究区内采集制作遥感影像样本2 579张,并对其进行人机交互的样本标注。样本分布在山地、丘陵、平原等各类地形上,覆盖农村、城镇等社会环境,包含河流、湖泊、水田、细小水体等水体信息。样本采样分辨率均为30 m,裁切为224×224 像素,样本示例见图2。由于湖北省西南山地地区常年有云层和山体阴影,这些噪声与水体光谱相似,直接影响算法模型对水体的提取精度,因此本文在研究区制作了阴影覆盖样本556 张。为验证本文模型的可行性和精度,保留一部分训练样本作为验证样本。验证样本随机抽取,按照1∶4的整体比例,抽取Landsat5 验证样本203 张,Landsat8 验证样本300 张,具体见表2。

图2 样本采集示例

表2 样本采集数量

3.2 精度验证

为评价样本训练后模型对水体的提取效果,本文基于混淆矩阵,选取总体精度(OA)、生产者精度(PA)、用户精度(UA)和Kappa 系数对水体提取结果进行精度评价;并利用NDWI、U-BET、SVM 三个常用算法模型对同一区域进行水体提取,进行比较分析,结果见表3,可以看出,U-Net 优化模型的OA、Kappa 系数均最高,且引入注意力机制模块的U-Net模型,在PA和UA指标上取得了较好的平衡。

表3 算法模型精度对比/%

3.3 不同水体特征提取结果对比分析

本文利用优化模型进行水体提取,提取的水体类型复杂。为比较优化模型在不同水体类型中的提取效果,本文选取了细长河流、面状湖泊和水田等环境下的典型区域进行了对比,结果见图3~5,可以看出,在河流的细小支流,NDWI 不能连贯识别水体,SVM和U-Net 在下方提取水体不连续,但U-Net 优化模型提取结果的细节更清晰,水体更连续;4 种方法在面状湖泊提取方面差异不大,但边界提取有明显差异,U-Net 优化模型提取的边界更清晰、水体更连续;NDWI 对于较大水田有良好的识别,但几乎识别不出小水体,SVM 能识别较小水体,但边界不清晰,U-Net 在背景与水体的判别上较模糊,U-Net 优化模型能识别水田,边界清晰,对细小沟渠也有较好的识别能力。由水体提取结果对比分析可知,添加注意力机制的深度学习方法,在细小面水体、水体边界和复杂背景下水体提取方面均有较强优势。

图3 细长河流水体提取结果对比

图4 面状湖泊水体提取结果对比

图5 水田提取结果对比

3.4 水资源时序监测结果

本文利用上述方法对2001—2020年5期时序影像进行水体提取,并对提取结果进行制图,获得5年期湖北省水体图;再对湖北省地表水面积进行计算,并分区域、年份进行统计,结果见表4,可以看出,2001—2020 年湖北省地表水面积统计最大值为9 727.48 km2(2010 年),约占湖北省总面积的5.23%;最小值为8 189.89 km2(2015年),约占湖北省总面积的4.41%;湖北省这5年的平均地表水面积为8 925.02 km2,约占湖北省总面积的4.8%;地表水面积整体呈下降趋势,2010年下降趋势最明显,减少了1 095.02 km2。

表4 17个行政区水体面积时序统计/km2

通过监测17个行政区的地表水面积发现,荆州市和武汉市的水资源最丰富,水体面积大于1 000 km2,同时也是缩减最多的地区,缩减面积分别达到9.47%和10.97%。10个行政区地表水呈下降趋势,十堰、宜昌、恩施鄂西3 个行政区地表水面积增加,受水库修建影响,也存在山地阴影识别误差因素。经济和人口相对集中的荆州、武汉、襄阳3 个城市的地表水面积均下降,表现为城镇化影响侵占湖泊、湿地。

3.5 水资源时空变化分析

本文利用皮尔森相关系数方法,分析20 a间湖北省水体面积变化相关影响因素,结果见表5。

表5 水资源驱动因素分析

1)分析20 a 间湖北省年均降水量和地表水面积发现,地表水面积与年均降水量趋势相关,2001—2010 年地表水面积与年均降水量均呈上升趋势,2010—2015年呈下降趋势,2015—2020年再次呈上升趋势。对两组数据进行二阶差分,皮尔森系数达到0.97,表明地表水面积与年均降水量高度正相关,年均降水量增加引起地表水面积增加。

2)比较20 a 间湖北省年均气温与地表水面积发现,皮尔森系数为-0.54,说明平均气温升高将在一定程度上引起地表水面积减少;但从变化趋势来看,二者无明显相关关系。

3)20 a间湖北省人口数量整体呈先增后减的趋势,与地表水面积在2010 年前呈正相关,原因可能是水产养殖伴随人口增加而发展,推动了水田、池塘等小水体面积的增加;在2010 年后呈负相关,2010 年起在人口总数保持相对稳定的同时城镇化率提高,可能从事渔业的人口转为城镇人口,水产养殖规模减少。

4)20 a 间湖北省城镇化率整体呈逐步增加趋势,增加速率稳定。地表水面积与城镇化率未表现出显著相关性。二者的整体皮尔森相关系数为-0.417 5,说明城镇化水平的升高将导致地表水面积的减少;但从整体而言,城镇化率不是水资源变化的主要影响因素。

4 结语

本文利用遥感影像通过增强技术制作遥感解译样本数据超过2 500 张,基于U-Net 深度学习模型引入注意力机制模型进行优化;采用训练后的优化模型对湖北省20 a 间5 期影像进行水体提取,获得湖北省水体监测时序图;通过降水、气温、人口、城镇化率等数据和水体提取结果进行湖北省水资源变化影响因素分析。通过精度验证测试,本文提出的U-Net优化模型的水体提取精度优于其他3 种方法,利用优化模型提取的水体成果可用于时序分析。水资源时空变化驱动因素分析结果表明,年均降水量与地表水面积变化显著正相关,是主要驱动因素;人口变化对小水体面积变化具有一定程度的影响;年均气温和城镇化率对地表水面积的影响不明显。

本文提出的深度学习模型可广泛应用于区域水体研究,适用于山地、丘陵、平原等地形以及大型河流、水库湖泊、细小水体等各类水体。本文分析了湖北省地表水面积变化的影像因素,可作为政策决策依据。由于参考数据有限,本文未对其他潜在驱动因素进行分析,在后续的研究中可继续讨论。

猜你喜欢
湖北省水体水资源
农村黑臭水体治理和污水处理浅探
《水资源开发与管理》征订启事
珍惜水资源 保护水环境
生态修复理念在河道水体治理中的应用
加强水文水资源勘测合理开发利用水资源
广元:治理黑臭水体 再还水清岸美
浅议我国水资源的刑事立法保护
春风化雨 深入浅出——记湖北省优秀理论宣讲员龙会忠
湖北省将再添6座长江大桥
湖北省今年将建成农村公路1.5万km