3D-HRNet网络在珠海一号高光谱影像的自然资源监测应用及生态环境分析

2023-12-28 07:26曹德龙林震唐廷元李楚钰王晓锐
自然资源遥感 2023年4期
关键词:光谱卷积区域

曹德龙, 林震, 唐廷元, 李楚钰, 王晓锐

(1.北京林业大学生态文明研究院,北京 100083; 2.北京市测绘设计研究院,北京 100038)

0 引言

对自然资源进行监测有助于系统掌握自然资源及地表基质的数量、质量、空间分布、开发利用、生态状况、动态变化,科学评价自然资源辅助经济社会发展和生态文明建设中起到关键性支撑和制约作用。全面、清晰地监测、评估自然资源可以有效跟踪不同时间尺度上自然资源的变化趋势,满足区域空间尺度上的生态监测需求[1],从而为维持生态平衡和社会经济发展提供定量数据支持[2-3]。

目前自然资源调查监测中,遥感技术逐渐取代传统的监测方法,成为一种研究热点。高光谱遥感为当前遥感技术的前沿领域,高光谱遥感影像信息提取已成为矿物测绘、农业、环境、林业等领域实时应用的主要来源[4-5],为相关应用的数据分析提供了重要的支撑[6]。深度学习具有较强的泛化能力和高效的特征表达能力[7],可以对海量原始数据自动执行分层特征提取,减少人类对特征规则的定义、降低人工成本[8-9]。深度学习方法可以从高光谱影像中自动提取从低级到高层次的抽象特征,并实现准确的分类。目前,较多的深度学习方法采用2D-CNN提取高光谱影像的光谱和空间信息[10-11],这些方法在图像预处理过程中易造成光谱信息丢失。为了有效利用高光谱影像丰富的光谱和空间信息,越来越多的研究[12-13]引入3D-CNN提取光谱和空间特征,提升高光谱影像分类的性能。Li等[13]提出一种轻量级高光谱影像3D-CNN分类方法,与2D-CNN相比提高了分类精度,说明3D卷积模块可同时提取光谱和空间特征,结合高光谱影像具有较好的应用。遥感技术具有实时、快速、大范围等优点,已深入应用于自然资源分析评估中。自然资源分析评估目的是整体上发现自然资源的现状与变化态势,为生态开发、保护、治理提供支撑。2015年原环境保护部发布修订后的《生态环境状况评价技术规范》(HJ 192—2015)[14],规范中定义了反映区域内整体生态环境状态的生态指数(ecological index,EI)。该指数体系包括生物丰富度指数(biological richness index,BRI)、归一化植被指数(normalized difference vegetation index, NDVI)、水网密度指数(water-network-density index,WNDI)、土地应力指数(land-stress index,LSI)、污染负荷指数(pollution load index,PLI)和环境约束指数(environment regulation index,ERI),这6个子指标分别反映了评价区域内生物丰富度、植被覆盖度、水网密度、土地胁迫强度、污染物压力和环境限制情况。在基于遥感的生态评价研究中,学者们在各个方面都取得了丰硕的成果[15],目前研究重点已从单一的用于生态环境监测的遥感信息发展为对各种遥感信息的综合分析[16]。将卫星遥感数据与社会统计相结合,纳入生态评价模式,也有助于挖掘驱动力,促进生态环境改善,落实生态文明建设行动[17]。

综上所述,本研究为实现自然资源监测、评估的体系研究,以北京市北部部分区域为研究区,以珠海一号高光谱影像为数据源,在HRNet网络中引入3D卷积模块,提出3D-HRNet网络构建用于自然资源调查监测的语义分割模型,并对比说明3D-HRNet网络提取高光谱影像的自然资源的能力; 同时基于《生态环境状况评价技术规范》的EI指数结合遥感数据构建EI生态评价模型,与《生态环境状况公报》进行对比,探究遥感结合EI生态评价模型的可行性。

1 研究区概况和数据源

1.1 研究区概况

北京地处我国的华北地区,是我国的首都、直辖市、国家中心城市、超大城市[18]。北京中心位于E116°20′,N39°56′,总面积16 410.54 m2,常住人口2 188.6万人。北京市的地形以平原、丘陵、山地为主,主要呈西北高、东北低的地势,西、北和东北方向群山环绕,东南方向是缓缓向渤海倾斜的大平原。北京市怀柔区、密云区、顺义区和延庆区区域内有平原、丘陵、山地等多种地形,同时包含大型水库、河流、建设用地、耕地等多种土地利用类型。

本研究为了更好地研究基于深度学习的高光谱智能识别模型以及生态分析研究,以北京市北部怀柔区、密云区、顺义区和延庆区的部分区域为研究区(图1),利用珠海一号高光谱影像数据构建用于自然资源调查监测的深度学习语义分割模型、并进行遥感生态分析研究。

图1 研究区

1.2 数据源及其预处理

珠海一号高光谱卫星数据用于获取北京市怀柔区、密云区、顺义区和延庆区的部分区域自然资源类型,为了更好地反映区域内自然资源的分布特征,本研究综合考虑季节气候、影像质量、云量等因素选择2020年4月2日拍摄的高光谱影像。高光谱影像空间分辨率10 m,光谱分辨率2.5 μm,波长范围400~1 000 μm,共32个光谱波段。获取高光谱数据后进行预处理[19],包括辐射校正、大气校正、正射校正、影像镶嵌等操作,消除传感器、地面物体、大气等因素的干扰,预处理的影像如图2(a)所示。

(a) 珠海一号高光谱影像 (b) 标签数据(土地利用类型图)

为了构建用于自然资源调查监测的3D-HRNet语义分割模型,本研究整合武汉大学遥感信息工程学院的中国30 m土地覆盖及其变化1985—2019年数据集[20]、中国科学院空天信息研究院2020年全球30 m地表覆盖类型产品[21]、谷歌公司10 m全球土地利用数据集[22]3种数据集制作训练标签数据集,标签数据类型包含耕地、林地、灌木、草地、水域和建设用地6类土地利用类型,如图2(b)所示。利用3种覆盖数据集在本研究区域地物类别进行归类合并确定本区域的地物类别,然后将中国30 m土地覆盖及其变化1985—2019年数据集和2020年全球30 m地表覆盖类型产品重采样为10 m空间分辨率,利用投票法对3种数据进行叠加处理,最后制作成训练标签数据集。

2 方法与流程

研究流程如图3所示。

图3 流程图

本研究在HRNet网络[23-24]的基础上引入3D卷积模块提出3D-HRNet网络,构建用于自然资源调查监测的高光谱影像深度学习语义分割模型,与HRNet模型进行对比验证3D-HRNet模型应用于高光谱自然资源调查监测的有效性; 通过生物丰富度、植被覆盖度、水网密度、土地胁迫强度、污染物压力、环境限制等6个角度构建EI生态指标,与北京市生态环境状况公报对比,探究遥感EI生态指标对评价地区生态环境状况的正确性。

2.1 构建3D-HRNet自然资源监测模型

2.1.1 3D-HRNet网络

HRNet网络是一种跨分辨率的信息交互、实现高分辨率丰富的语义特征丰富、多尺度融合的深度学习模型,网络中保持高分辨率信息且并行连接多种分辨率。3D卷积模块中窗口(filter)需在3个维度(输入层的长、宽、高)上滑动进行卷积,识别和输出的结构均为3D结构,相比2D卷积模块能更好地描述高光谱影像中光谱信息和地物立体空间信息的对象关系。目前3D卷积块已结合在3D-CNN网络等相关网络应用于医学影像检验[25]、点云识别[26]等领域,实验均表明3D卷积能较好地识别3D空间信息。

因此,本研究结合HRNet网络的特点并在网络框架中引入3D卷积模块[27],提出了适用于自然资源监测的高光谱遥感影像深度学习语义分割模型,即3D-HRNet(图4为网络结构)。以北京市北部部分区域为研究区域,并与HRNet卷积网络进行实验对比,验证了该网络的有效性。3D-HRNet网络的改进如下: 编码器中,3D卷积模块嵌入输入端后,将3D卷积模块提取的特征与输入端数据相连接至HRNet网络的编码器,主要利用3D卷积层建立高光谱影像不同光谱之间的关系并提取有效的特征信息,同时连接输入端从而减少原始信息的缺漏; 解码器中,将编码器中3D卷积模块输出特征与HRNet编码器输出特征相连接,接入HRNet网络的解码器中最后输出结果,连接3D卷积模块结果可保持网络输出结果的高分辨率。

图4 3D-HRNet网络结构

2.1.2 实验环境和参数设置

实验环境为Intel Core i7-12700F 2.1GHz 12核处理器、配备16G内存和Nvidia GeForce RTX 3060Ti; 软件环境方面,使用Windows 11专业版64位操作系统,编程语言是Python 3.6,模型构建工具是Tensorflow2.0,图形处理单元(graphic processing unit,GPU)计算平台是CUDA 11.0。

在模型训练过程中,批量(Batch)大小设置为16、初始学习速率(learning rate,LR)设置为0.001、优化器使用具有权重衰减的Adam(权重衰减系数为0.001)、迭代(epoch)为100次,并且选择损失函数较低、验证集精度最高的对应模型参数作为最终模型参数。

此外,将影像随机切割成尺寸为256像素×256像素的图片,并进行了水平翻转、垂直翻转、对角翻转和90°旋转的数据增强[28]操作,构建10万张相关数据集,同时在模型训练拟合阶段对数据集以8∶2比例随机划分训练数据集和验证数据集。

2.1.3 精度评估

本研究使用召回率(Recall)、精确度(Precision)、F1分数、总体精度(Accuracy)和Kappa系数5个指标来评估自然资源提取精度,并定量评价所提方法在提取自然资源时的性能。

召回率也称查全率,即研究区域内正确预测的一类自然资源像素数量与实际该类自然资源像素数量的比列,侧重评估提取结果是否遗漏。精确度也称查准率,即研究区域内正确预测的一类自然资源像素数量与预测结果中该类自然资源像素数量的比列,侧重评估提取结果是否被误判。F1分数结合了精确度和召回率的结果,是精确度和召回率的谐波平均值。总体精度是指对每一个随机样本,所分类的结果与检验数据类型相一致的概率。Kappa系数是一种衡量分类精度的指标,既用于一致性检验,也可用于衡量分类精度,代表着分类与完全随机的分类产生错误减少的比例。各指标计算公式为:

,

(1)

,

(2)

,

(3)

,

(4)

,

(5)

式中:TP为预测的结果中被正确标识的数量;FP为预测的结果中被错误地识别为其他类型的数量;TN为预测的其他类型中被正确标识为其他类型的数量;FN为真实类型被错误地识别为其他类型的数量;P0为每一类正确分类的样本数量之和除以总样本数;Pe为真实样本和预测样本在给定样本上随机一致性的概率。

2.2 EI生态评价模型构建

EI生态指数是评价生态环境的综合指数,包含生物丰富度、植被覆盖度、水网密度、土地胁迫、污染负荷、环境限制等子指数。生物丰富度用BRI表示,公式为:

BRI=0.5(0.35A1+0.21A2+0.28A3+0.11A4+0.04A5+0.01A6)/A

,

(6)

式中:A1为区域内林地面积;A2为区域内草地面积;A3为区域内水域面积;A4为区域内草地面积;A5为区域内建设用地面积;A6为区域内灌木面积;A为区域面积。《区域生物多样性评价标准》(HJ 623—2011)中规定BRI的由栖息地质量指数(habitat-quality index,HQ)和生物多样性指数(biodiversity index,BI)决定,而本研究的研究区域无生物多样性变化,BRI仅与栖息地质量相关,因此公式中系数为0.5。

植被覆盖度用NDVI表示,公式为:

,

(7)

式中:Pi为每个像素的NDVI值;n为区域像素个数。

水网密度情况用WNDI表示,公式为:

WNDI=W/A

,

(8)

式中W为水域面积。

土地胁迫强度用LSI表示,公式为:

LSI=(0.4A7+0.2A8+0.2A4+0.2A9)/A,

(9)

式中:A7为区域内严重流失面积;A8为区域内中度流失面积;A9为区域内其他用地面积。根据《水土流失分类分级标准》规定,由土地覆盖类型、坡度、覆盖面非耕作林草3个指标确定,植被覆盖率、坡度与侵蚀程度如表1所示。

表1 植被覆盖率、坡度与侵蚀程度关系表

参照生态环境部发布的《生态环境状况评价技术规范》(HJ 192—2015),得出每个评价指标权重,最终计算区域内的EI生态指数值,其计算公式为:

EI=0.35BRI+0.25NDVI+0.15WNDI+

0.15(100-LSI)+0.10(100-PLI)+ERI。

(10)

由于本研究区内近10 a未发生重大、极端的环境污染事件,PLI和ERI设值为0。

3 结果分析与讨论

3.1 基于3D-HRNet网络的自然资源监测研究

本研究基于HRNet网络引入3D卷积模块提出3D-HRNet模型,以珠海一号高光谱遥感影像为数据集,构建用于自然资源调查监测的高光谱语分割模型,探究高光谱数据在自然资源调查监测中的应用。为了更全面地比较模型提取自然资源调查监测的性能,本研究选取山区(区域一)、平原(区域二)2种地势的区域进行综合比较,并分别利用HRNet模型、3D-CNN模型和3D-HRNet模型提取自然资源。

表2为监测结果对比,由表2可知,HRNet,3D-CNN和3D-HRNet这3种模型都具有较好的提取结果,能保持自然资源的边界完整、清晰,但细节有一定差别。区域一主要为北京北部区域的山区,主要类型包含耕地、林地、水域、草地等。在区域一的HRNet模型预测结果中,耕地类型能完整地提取,出现误判建设用地、漏提水域类型的问题; 3D-HRNet模型预测结果不仅完整提取水域类型,同时对建设用地、耕地这2种类型能相对准确地提取; 而3D-CNN表现介于HRNet模型和3D-HRNet模型之中,说明3D卷积能更好地识别高光谱遥感数据对地物的影响,同时表明3D-HRNet模型比3D-CNN模型识别自然资源能力更好。区域二主要为北京北部地区的平原地区,主要类型包含耕地、草地、大型水库、建设用地等类型。在区域二的结果中,3D-HRNet模型、3D-CNN模型与HRNet模型识别结果相近,对平原地区的耕地、林地等自然资源提取具有较好的结果,但3D-HRNet模型在水域东北部区域错误提取成林地。从区域二真彩色影像可知,水域东北部区域出现与其他区域不同的颜色,疑似区域水体叶绿素较高造成与林地的光谱特性相似。根据结果,3D-HRNet模型提取自然资源优于3D-CNN模型、HRNet模型。

表2 自然资源监测结果对比

模型的精度如表3所示。由表3可知,3D-HRNet模型提取区域一的自然资源结果总体精度、F1分数和Kappa系数分别为0.86,0.86和0.75,区域二结果总体精度、F1分数和Kappa系数分别为0.79,0.79和0.75,平均总体精度为0.83、平均F1分数为0.82、平均Kappa系数为0.73,定量结果表明3D-HRNet模型可有效提取高光谱影像中的自然资源结果。同时与HRNet模型定量结果对比,总体精度高0.04、F1分数高0.04、Kappa系数高0.06; 比3D-CNN模型总体精度高0.04、F1分数高0.05、Kappa系数高0.06,表明3D-HRNet模型提取高光谱影像的自然资源结果更好,3D卷积模块能更好地利用高光谱特性识别自然资源。

表3 模型精度对比表

3.2 北京市北部部分区域的生态分析研究

本研究采用50 m×50 m的格网作为评价单元,利用高光谱影像提取生态环境评价因子,统计每个格网内的指标,从而反映研究区域的生态环境空间分布与差异性,最终计算得到各指标和EI结果图。

北京市北部部分区域的生物丰富度、植被覆盖度、水网密度、土地胁迫强度等结果分布图如图5所示。

(a) BRI (b) NDVI (c) WNDI (d) LSI

1)统计计算得出,2020年研究区的平均BRI为75.0,表明研究区的生态环境整体较好; 由图5(a)中可知,在研究区的中部山区BRI较高、南部城市发展区生物丰富度较低。

2)2020年研究区的平均NDVI为78.9,由图5(b)可知其分布与BRI相似,研究区的中部山区NDVI较高、南部城市发展区NDVI低,说明生物丰富度与NDVI呈正相关。

3)WNDI范围为0~100,颜色越深、水网越密。由于研究区大部分为山区和城市建设区,WNDI分布大部分为0值。2020年研究区的平均WNDI为10.9,由图5(c)可知,水网分布在密云水库、怀柔水库等区域。

4)由坡度与植被覆情况确定侵蚀程度,图中绿色表示侵蚀程度最低,其次为黄色,橙色表示中度侵蚀,红色表示严重侵蚀。2020年研究区的平均LSI为81.6,由图5(d)可见,研究范围内大多数区域侵蚀程度较轻。

图6为研究区EI分布结果。由图6可知,研究区的生态环境状况与地势、城市建设有关,中部山区区域的生态环境状况较好,南部城市建设区域的生态环境状况较低。通过EI指数计算公式得2020年研究区的平均EI指数为68.2,根据生态环境指标等级判定为良好,表明2020研究区生态环境较好,植被覆盖率较高、生物多样性较丰富。而《2020年北京市生态环境状况公报》显示全市生态环境状况级别为“良”、 EI为70.2,与研究结果接近。

图6 EI分布结果

4 结论

以2020年珠海一号高光谱影像为数据源,构建用于自然资源调查监测的3D-HRNet深度学习语义分割模型提取北京市北部部分区域2020年自然资源分类结果,同时采用基于生物丰富度、植被覆盖度、水网密度、土地胁迫强度、污染物压力、环境限制等指数的EI生态评价模型对2020年研究区进行生态状况评价。结果表明:

1)基于HRNet网络引入3D卷积模块提出3D-HRNet模型,提取自然资源具有较好的效果,总体精度为0.83,F1分数为0.83,Kappa系数为0.73。

2)3D-HRNet模型提取自然资源结果比HRNet模型的总体精度高0.04、F1分数高0.04、Kappa系数高0.06,比3D-CNN模型总体精度高0.04、F1分数高0.05、Kappa系数高0.06,说明3D卷积模块对提取高光谱影像中的自然资源有一定提升,3D-HRNet模型提取能力比3D-CNN模型高。

3)EI生态评价模型由遥感数据提取的6个分项指标组成,是反映生态质量指标的良好整合,可以全面反映研究区生态环境质量。2020年研究区的平均EI值为68.2,等级为良好,与北京市生态环境状况公报结论接近。

本研究提出3D-HRNet网络应用于高光谱影像提取自然资源结果,3D卷积模块能较好地识别各地物的光谱特性,但存在光谱特性相似的地物出现错误提取,例如水体中叶绿素较高区域错误识别成林地,后续将继续优化网络模型同时考虑同谱异物现象。同时利用遥感卫星数据构建EI生态评价模型,可快速、全面对生态环境进行评价,本次研究的EI生态评价模型具有较好的表现,与政府环境状况公报结果相近。遥感卫星数据的时序长、范围大等优点以及用于EI生态评价模型的有效性,为北京市生态状况的时空分析奠定基础,为北京市改善生态环境、促进绿色发展研究提供了数据支撑。

志谢:本实验的高光谱影像数据由珠海欧比特宇航科技股份有限公司提供,同时标签数据参考武汉大学遥感信息工程学院的中国30 m土地覆盖及其变化1985—2019年数据集、中国科学院空天信息创新研究院2020年全球30 m地表覆盖类型产品、谷歌公司10 m全球土地利用数据集,在此表示感谢。

猜你喜欢
光谱卷积区域
基于三维Saab变换的高光谱图像压缩方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
分区域
星载近红外高光谱CO2遥感进展
基于严重区域的多PCC点暂降频次估计
苦味酸与牛血清蛋白相互作用的光谱研究
一种基于卷积神经网络的性别识别方法
铽(Ⅲ)与PvdA作用的光谱研究