基于Sentinel-2多光谱遥感影像的森林沼泽信息提取及精度评价

2023-10-23 04:59韦怡
关键词:沼泽卷积神经网络

韦怡

基于Sentinel-2多光谱遥感影像的森林沼泽信息提取及精度评价

韦怡

江西科技学院 信息工程学院,江西 南昌 332020

本文基于Sentinel-2多光谱遥感影像数据,使用监督分类方法、随机森林方法和卷积神经网络方法对江西省森林沼泽湿地进行信息提取。同时,使用混淆矩阵(Confusion Matrix)来判定三种遥感影像数据分类方法的精度。结果表明,三种遥感影像信息提取方法中,监督分类方法的精度相对较差、湿地分类混淆情况较为严重,其次为随机森林方法,卷积神经网络方法最优。本研究能够为地区湿地信息提取与遥感分类提供科研分析依据,为湿地保护和资源开发提供数据支持。

森林遥感; 湿地监测; 信息提取

湿地生态系统涵盖了陆地与水域两个部分,是兼具了陆地性质和海洋性质的存在类型。湿地分为自然湿地和人工湿地两种,为动物、植物和微生物等提供有机、和谐的生态环境。我国自然湿地大多分布在东北地区、长江中下游地区、云贵高原等地区,具有独特的景观分布格局。森林沼泽湿地(Forest Swamp Wetland)是湿地的一种类型,具有鲜明的生态特征。它介于沼泽与森林之间,具备高度的敏感性和脆弱性。当前,我国湿地面积呈现出逐年缩减的态势。森林沼泽湿地占整体湿地比例较小,面积也同样随之减少。江西是长江中下游地区湿地资源最为丰富的省份之一。截至2022年12月,江西省湿地面积为91.01万hm2[1]。本文基于Sentinel-2多光谱遥感影像为基础,使用监督分类方法(Supervised Classification,SC)、随机森林方法(Random Forest,RF)和卷积神经网络方法(Convolutional Neural Networks,CNN)提取江西省全境森林沼泽实地信息,并对三种信息提取结果进行精度评价。本研究能够为区域湿地的时序动态监测和数据分析提供科学的信息提取方法,为提升研究精度和准确性提供有效参考。

1 研究区与方法

1.1 研究区域

江西省湿地主体框架由“五河一江一湖”组成,即长江江西段、鄱阳湖,以及赣江、抚河、信江、饶河、修河五大河流及其支流。全省湿地总面积为91.01万hm2,占全省国土面积的5.45%。湿地空间分布总体为北多南少、东多西少,呈现出以鄱阳湖为核心,向东、西、南三面扩散的放射状形态。江西省自然保护区、湿地公园等自然保护地内受保护的湿地面积为56.41万hm2,湿地保护率为61.99%[2]。江西省属亚热带温暖湿润季风气候,年平均温度在16.3℃至25℃之间。年降水量为1342mm至1948mm之间。江西省内森林沼泽面积相对较小,主要分布在鄱阳湖附近湿地区域,以及高山附近湿地区域,如婺源县饶河源国家湿地公园等。

1.2 数据来源、分类及验证方法

江西省湿地的遥感影像数据来自Sentinel-2卫星系统,下载自Google Earth Engine。该数据共包含13个光谱波段。采用国际《湿地公约》湿地类别分类方法将遥感影像数据进行分类(表1)。本研究湿地的一级分类为分为自然湿地、人工湿地和其他土地(非湿地)。为保证模型计算精确度,需要对遥感影像数据样本进行验证。本研究共获得训练样本1695个。依据其数据分布性和交叉性,按照Luo C等[3]的研究方法对提取样本数据的50%作为验证点(Verificating Points)集合,来判定分类结果整体准确率即湿地分类精度(表2)。为保证分类方法准确,研究组于2022年7月1日至7月31日对实际获得的858个验证点进行野外样地类型实测和记录。

表1 湿地分类方法

表2 训练样本与验证点数据

1.3 方法

1.3.1监督分类方法监督分类是最为传统的一种遥感影像识别分类方法,包括贝叶斯分类算法、最小距离分类法和马氏距离分类法等。以贝叶斯分类算法为例,它假定数据分类为正态分布,通过数学统计方法来判定遥感图像地物类别是否准确。本研究使用ENVI 5.6中文版的IsoData工具对遥感数据进行信息识别提取。

1.3.2随机森林方法随机森林方法(Random Forest)通过建立决策树选择投票对遥感影像进行信息提取和识别。通过分析每个决策树生成的总体特征值参数来判断遥感图像分类。随机森林方法属于集成学习(Ensemble Learning)方法的一种。其优点在于计算过程简单明了、易于理解,具有较高的抗噪功能和自我识别功能。本研究使用ENVI 5.6中文版的Random Forest Classification工具对遥感数据进行信息识别提取。

1.3.3卷积神经网络方法卷积神经网络方法(Convolutional Neural Networks)属于深度学习神经网络算法。它从出初始基础数据出发,分析其视觉分布规律性。它的优势在于建立多个卷积层与池化层弱化降低现存数据规模、减少计算步骤和计算总量、提升最终数据识别精度。本研究使用ENVI 5.6中文版的Deep Learning工具对遥感数据进行信息识别提取。

1.3.4混淆矩阵使用混淆矩阵(Confusion Matrix)来判定3种遥感影像数据分类方法的精度。将不同模型分类方法与分类结果进行比较,最终将结果进行分布统计并建立分类混淆矩阵。从总体精度、Kappa系数、生产者精度和用户精度四个指标衡量最终的验证结果。

2 结果与分析

2.1 监督分类方法分析结果

使用监督分类方法的贝叶斯分类算法对湿地信息进行数据提取与影响分类,并对结果进行混淆矩阵精度评价(表3)。监督分类方法总体精度为79.37%,Kappa值为0.73。整体提取水平较低。其中,耕地(84.43%)、河流湿地(83.82%)和草地(81.71%)的生产者精度最高。林地(92.75%)、草地(82.97%)和耕地(82.62%)的用户精度最高。森林沼泽湿地的生产者精度为77.78%,用户精度为79.54%。与上述类型分类相比,识别精度较低。森林沼泽湿地与林地和水田河流出现了分类识别错误的现象。

表3 监督分类方法数据精度评价结果

2.2 随机森林方法分析结果

对提取数据建立分类树模型并使用展随机森林方法提取森林沼泽分类。经计算,最优的分类数数目为1200,以此数目建立模型病开展计算(表4)。

表4 随机森林方法数据精度评价结果

随机森林方法总体精度为88.64%,Kappa值为0.84。其信息提取精度高于监督分类方法。其中,河流湿地(92.51%)、林地(91.39%)和草地(90.74%)的生产者精度最高。林地(96.40%)、湖泊湿地(93.20%)和河流湿地(89.90%)的用户精度最高。与此相比,森林沼泽湿地的生产者精度和用户精度相对较低,仅为88.77%和85.93%。森林沼泽湿地与河流湿地、湖泊湿地和林地产生了分类识别错误的现象。

2.3 卷积神经网络方法分析结果

通过卷积神经网络方法进行沼泽信息提取和精度分析(表5)。依据混淆矩阵精度评价,卷积神经网络方法总体精度为93.27%,Kappa值为0.92。其信息提取精度高于随机森林方法和监督分类方法。在全部信息提取中,生产者精度最高的为林地、河流湿地和草地,比例为95.78%、95.41%和95.25%。森林沼泽湿地生产者精度为94.27%,排在第四位。用户精度最高的是湖泊湿地、林地和森林沼泽湿地,比例为98.15%、97.33%和95.32%。这是首次森林沼泽湿地的用户精度进入到排名前三位。森林沼泽湿地仅与林地产生了分类识别混淆现象。

表5 神经网络方法数据精度评价结果

3 讨 论

通过监督分类方法、随机森林方法和卷积神经网络方法对惊喜生森林沼泽信息进行提取和精度评价。其中,监督分类方法的精度相对较差、分类混淆情况较为严重。总体精度为79.37%,Kappa值为0.73。信息精度与其他两种方法相比不够理想。游海林等,成淑艳等以及刘翔等[4-6]分别对鄱阳湖湿地、青海湖沙柳河流域土地以及盐城滨海湿地采取监督分类方法进行信息提取,结果发现监督分类方法的精度表现一般,但与其他方法相比资源成本消耗较低。

随机森林方法总体精度为88.64%,Kappa值为0.84。其信息提取精度高于监督分类方法。本研究结果与部分学者研究成果保持一致。韩月等对黄河三角洲湿地、高雨等对滨海湿地、宋怀荣等对盐城湿地、Morrison等[7-10]对美国沃巴什盆地湿地分类均使用了随机森林方法,发现其信息提取精度优于监督分类方法,分类成果显著。

卷积神经网络方法总体精度为93.27%,Kappa值为0.92。其信息提取精度高于随机森林方法和监督分类方法。之前已有学者使用卷积神经网络方法对湿地进行遥感分类,其研究成果认为该方法精度较高,能够为湿地信息提取和分类提供科学数据支持。游佩佩等对江苏滨海湿地、陈琛等对滨海湿地、孟祥锐等对洪河湿地以及White DC等[10-14]对澳大利亚大自流盆地湿地使用卷积神经网络方法进行遥感影响分类,认为该方法要优于监督分类方法和随机森林方法,与本研究结论一致。

4 结 论

基于Sentinel-2多光谱遥感影像数据,本研究应用了监督分类方法、随机森林方法和卷积神经网络方法对江西省森林沼泽湿地进行信息提取和分类,对三种信息提取结果使用混淆矩阵进行精度评价。结果发现,监督分类方法的总体精度为79.37%,Kappa值为0.73;随机森林方法总体精度为88.64%,Kappa值为0.84;卷积神经网络方法总体精度为93.27%,Kappa值为0.92。三种方法相比,监督分类方法 < 随机森林方法 < 卷积神经网络方法。督分类方法的精度相对较差、湿地分类混淆情况较为严重,其次为随机森林方法,卷积神经网络方法最优。换而言之,卷积神经网络方法具有更高的稳定性和显著的信息提取精确性。本研究也具有一定的局限性。比如,在参数设置和悬链样本的选择上具备一定的主观性,尚未对三种模型的光谱特征波段进行更为细致的对比分析。在未来,将进一步扩大研究分类样本、丰富算法模型,从而为湿地动态识别、信息提取和分类精度研究提供更为准确的数据支持。

[1] 夏阳,方朝阳,黄琪,等.四个时期江西省湿地动态及其影响因素研究[J].湿地科学,2022,20(3):348-356

[2] 蔡海生,查东平,张学玲,等.基于主导生态功能的江西省国土空间生态修复分区研究[J].地学前缘,2021,28(4):55-69

[3] Luo C, Liu HJ, Lu LP,. Monthly composites from Sentinel-1 and Sentinel-2 images for regional major crop mapping with Google Earth Engine[J]. Journal of Integrative Agriculture, 2021,20(7):1944-1957

[4] 游海林,徐力刚,吴永明,等.鄱阳湖水文情势过程对典型湿地景观动态变化的影响[J].水力发电,2017,43(2):1-5,26

[5] 成淑艳,曹生奎,曹广超,等.基于高分辨率遥感影像的青海湖沙柳河流域土地覆盖监督分类方法对比[J].水土保持 通报,2018,38(5):261-268,353

[6] 刘翔,刘会玉,林振山,等.基于Landsat OLI影像的盐城滨海湿地分类方法对比研究[J].湿地科学,2017,15(5):689-696

[7] 韩月,柯樱海,王展鹏,等.资源一号02D卫星高光谱数据黄河三角洲湿地景观分类[J].遥感学报,2023,27(6):1387-1399

[8] 高雨,胡召玲,樊茹.高分辨率影像融合算法对滨海湿地土地利用分类精度的影响[J].测绘通报,2022(1):116-120

[9] 宋怀荣,苏国辉,孙记红,等.基于随机森林的盐城湿地近20年景观格局变化[J].海洋地质前沿,2021,37(12):75-82

[10] Morrison RR, Bray E, Nardi F,. Spatial relationships of levees and wetland systems within floodplains of the Wabash Basin, USA[J]. Journal of The American Water Resources, 2018, 54(4): 934-948.

[11] 游佩佩,刘振波,谢嘉伟,等.基于GF-2的江苏滨海湿地遥感深度学习分类算法研究[J].长江流域资源与环境,2021,30(7):1659-1669

[12] 陈琛,马毅,胡亚斌,等.一种自适应学习率的卷积神经网络模型及应用——以滨海湿地遥感分类为例[J].海洋环境 科学,2019,38(4):621-627

[13] 孟祥锐,张树清,臧淑英.基于卷积神经网络和高分辨率影像的湿地群落遥感分类——以洪河湿地为例[J].地理科 学,2018,38(11):1914-1923

[14] White DC, Lewis MM. A new approach to monitoring spatial distribution and dynamics of wetlands and associated flows of Australian Great Artesian Basin springs using Quick Bird satellite imagery[J]. Journal of Hydrology, 2011,408(1-2):140-152

Forest Swamp Information Extraction and Accuracy Evaluation Based on Multispectral Remote Sensing Images of Sentinel-2

WEI Yi

332020,

Based on Sentinel-2 multispectral remote sensing image data, this article uses supervised classification method, random forest method and convolutional neural network method to extract information from forest swamp wetlands in Jiangxi Province. At the same time, the Confusion Matrix is used to determine the accuracy of the three remote sensing image data classification methods. The results show that among the three remote sensing image information extraction methods, the accuracy of the supervised classification method is relatively poor, and the confusion of wetland classification is more serious, followed by the random forest method, and the convolutional neural network method is the best. The results is able to provide scientific research and analysis basis for regional wetland information extraction and remote sensing classification, and provide data support for wetland conservation and resource development.

Forest remote sensing; wetland monitor; information extraction

S771.8

A

1000-2324(2023)04-0490-05

10.3969/j.issn.1000-2324.2023.04.002

2023-01-05

2023-03-06

2021年江西省高等学校教学改革研究:1+X证书制度下《Linux操作系统》的“课证融通”应用研究(JXJG-21-24-12)

韦怡(1988-),女,硕士研究生,高级工程师,研究方向:计算机科学与技术,大数据技术. E-mail:306419526@qq.com

猜你喜欢
沼泽卷积神经网络
基于3D-Winograd的快速卷积算法设计及FPGA实现
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
帮女儿走出“嫉妒沼泽”
沼泽时代
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
Passage Seven