王景发 毛德华 杜会石 王宗明
(1 吉林师范大学旅游与地理科学学院,吉林 四平 136000;2 中国科学院东北地理与农业生态研究所湿地生态与环境重点实验室,吉林 长春 130102;3 国家地球系统科学数据中心,北京 100012)
湿地是最重要的陆地生态系统类型之一,在维持物质循环平衡、保护生物物种多样性和维持生态安全等方面发挥着极其重要的作用(路春燕等,2019)。森林沼泽是指以超过6 m的木本植物作为优势物种的沼泽湿地,碳储量极其丰富,对全球气候变化响应显著(张驰等, 2020)。面对人类活动与气候变化的双重严峻挑战,森林沼泽遥感监测能及时明确森林沼泽的分布界限,反映森林沼泽湿地景观类型现状与转化趋势,对有效保护森林沼泽生态系统健康与维护区域生态系统稳定具有重要意义(Song et al, 2021)。
多源遥感数据整合能最大程度地融合不同类型的传感器遥感数据,有效提高地物类型识别与提取精度,多源遥感数据融合被广泛应用于湿地覆被信息的提取研究中(常文涛等, 2020; Xulu et al,2020; Dong et al, 2020)。随着卫星遥感技术的高速发展,遥感数据源类型不断丰富。Sentinel-1合成孔径雷达(Synthetic Aperture Radar, SAR)区别于被动光学遥感,能有效避免云雨雾和夜晚无光的影响,具有高分辨、双极化、短周期、强穿透、多模式、全天候、全天时和产品生产迅速的优势,可精确确定卫星位置与姿态角,实现全球陆地、海岸带、航线等高分辨率监测与全球海洋的大面积覆盖监测(Mohammadi et al, 2020)。Sentinel-2 A、B卫星系统搭载多光谱传感器(Multispectral Instrument, MSI),可开展可见光、近红外、短波红外、红边等13个波段以5 d为周期的对地监测,特别是红边范围三波段对植被长势与健康状况监测具有巨大优势,较高的时空分辨率与较宽的光谱分辨率使得Sentinel-2遥感影像普遍应用于陆地生态环境演变监测、湿地景观制图、植被作物长势监测与灾害预警绘图制作当中(张磊等, 2019)。由于森林沼泽透视性差、物种类型复杂且交叉难辨、目视解译与实地考察困难,使得对于森林沼泽湿地景观分布与信息识别提取的应用相对较少。森林沼泽景观信息提取方法包括传统的监督非监督分类和深度机器学习等,随机森林分类方法作为机器学习方法的重要分支,是一种利用多棵决策树对遥感影像样本进行提前训练并在此基础上进行精准分类赋值预测的分类方法,随机森林是目前森林沼泽湿地景观信息识别与提取中较为广泛、准确、高效的方法(Yang et al, 2020)。
哈尼湿地是吉林省第3块国际重要湿地,淡水、森林沼泽等湿地资源极其丰富,拥有中国东北最大的泥炭沼泽矿床,在涵养和提供水源、调节气候及泥炭沼泽湿地科学研究等方面具有重要意义。本研究以吉林省哈尼湿地为研究对象,集成应用Sentinel-1雷达和Sentinel-2多光谱影像,充分挖掘Sentinel-1多极化波段特征和Sentinel-2红边指数对森林沼泽遥感识别的潜力,应用随机森林方法实现哈尼湿地森林沼泽分布信息的提取,森林沼泽提取方法可为其他地区森林沼泽制图提供案例指导,并为哈尼湿地的可持续管理提供数据支持。
吉 林 省 哈 尼 湿 地(42°4′12″~42°14′30″ N,126°4′9″~126°33′30″ E)位于吉林省通化市柳河县东南部,南与通化县相邻,东部与白山市区、靖宇县相接,大致呈“东北-西南”条带状走向分布,包括核心区、缓冲区和试验区3部分(图1)。研究区地处温带湿润、半湿润季风气候区,四季分明,夏季高温湿润,冬季寒冷干燥,雨热同期,年平均气温5.01℃,年平均降水量755.52 mm,全年无霜期125~145 d。地貌类型以玄武熔岩山地为主,地势东高西低,平均海拔884.50 m,具有中国典型的高山森林沼泽湿地群,泥炭层储量较为丰富,是哈泥河主要的河水补给库。保护区野生动植物资源丰富,包括东方白鹳(Ciconia boyciana)、紫貂(Martes zibellina)、大天鹅(Cygnus cygnus)等35种国家级重点保护野生动物和东北红豆杉(Taxus xuspidata)、红松(Pinus koraiensis)、紫椴(Tilia amurensis)等7种国家级重点保护野生植物。保护区于1991年建立,于2002年、2009年分别晋升为省级、国家级自然保护区,2018年2月入选国际重要湿地名录(宋雪婷等, 2019)。
图1 研究区示意图Fig.1 Geographic location of the study area
1.2.1 Sentinel数据本研究应用2020年7月13日的Sentinel-1地距(Ground Range Detected,GRD)极化雷达影像数据下载自ESA Opernicus(https://scihub.copernicus.eu),影像采集仪器为SAR-C,收集模式为IW,数据大小约为1.64 G,数据质量较高。利用ESA SNAP Desktop 8.0官方预处理软件对保护区Sentinel-1雷达影像进行轨道校正、热噪声去除、辐射定标、多视处理、相干斑滤波处理、地形校正、分贝化校正以及重采样等处理(杨丹等, 2020)。
Sentinel-2遥感影像以其丰富的光谱分辨率被广泛应用于陆地植被、土壤、水体等监测和粮食估产、湿地景观制图研究等领域,本研究应用的Sentinel-2A多光谱高分辨率遥感影像数据下载自欧空局数据共享网站(https://glovis.usgs.gov/),图幅轨道号为46,投影为UTM 51N。对Sentinel-2 level-1C级产品进行大气校正与辐射定标,利用超分辨率合成工具对各个波段进行超分辨率合成并重采样为10 m(刘海秋等, 2021)。
1.2.2 训练样本与验证点本研究通过目视解译与野外实地GPS考察获取训练样本1 942个,其中林地训练样本数量最多,共502个,水田训练样本数量最少,共105个,训练样本总体符合“空间分布均匀、数量充足”的条件,满足实验分类要求。在训练样本集合选取数量的基础上,选取训练样本数量的50%作为验证点集合,用于检验湿地分类结果的最终精度,验证点共971个,其中森林沼泽验证点数量共91个,训练样本与验证点集合数量分布见表1。
表1 训练样本与验证点数量Table 1 The number of training samples and verification point sets
1.2.3 湿地遥感分类系统参照《湿地公约》对湿地的定义、《全国湿地资源调查与监测技术规程(试行)(林湿发[2008]265号)》和相关文献,建立符合吉林哈尼国家级自然保护区森林沼泽湿地的分类体系(表2)。哈尼国家级自然保护区地物类型一级分类包括天然湿地和人工湿地2类:其中天然湿地主要包括河流、湖泊、森林沼泽和草本沼泽;人工湿地主要为水田。另外,将研究区大面积旱地、林地、草地和建设用地统一划分为非湿地类别。
表2 哈尼国家级自然保护区森林沼泽湿地分类体系Table 2 Classification system of swamp in the Hani Ramsar site
研究过程总体分为数据获取与处理、提取波段与特征组合、随机森林分类与精度评价3部分。数据获取与处理,即对Sentinel-1雷达与Sentinel-2多光谱等数据的获取与地形校正、辐射定标等一系列处理;提取波段与特征组合是指依据不同的特征波段组合形成3种特征组合;最后利用随机森林分类算法对3种组合方案分别提取研究区森林沼泽湿地覆被信息,并对湿地信息提取精度进行综合评价。技术路线见图2。
图2 哈尼湿地森林沼泽技术路线图Fig.2 The flowchart for mapping swamp in the Hani wetland
随机森林(Random Forest, RF)分类算法是一种新兴起、灵活度高、预测准确程度强的计算器机器学习分类算法,普遍应用于地学遥感影像湿地信息的提取。随机森林分类算法适用于处理大数据集合的未知特征,可直接处理高维特征样本并自主估算最优地物特征集合,具有低拟合性、高抗造性与易理解性等优点(Yahiaoui et al, 2021)。
基于Sentinel-1雷达与Sentinel-2多光谱遥感影像,提取Sentinel-1VV、VH极化后向散射系数,通过Band maths波段计算获取Sentinel-2光谱特征、红边指数特征、植被指数特征、水体指数特征和纹理特征等波段特征(表3)。组合成“光谱波段特征+植被指数特征+水体指数特征+纹理特征”“光谱波段特征+植被指数特征+水体指数特征+纹理特征+红边特征”“光谱波段特征+植被指数特征+水体指数特征+纹理特征+红边特征+雷达特征”3种特征组合方案。
表3 特征变量说明Table 3 Description of characteristic variables
利用野外实测获取的971个验证点数据与分类结果建立哈尼保护区2020年湿地信息提取混淆矩阵,计算湿地分类总体精度(OA)、Kappa系数、生产者精度(PA)与用户精度(UA)4项评价指标来对本次森林沼泽信息提取精度进行合理评价。
对训练样本点对应的不同地物类型Sentinel-1 VV、VH极化后向散射系数像元值进行统计分析(表4),结果表明:研究区典型地物类型Sentinel-1 VV、VH极化后向散射系数差异显著,森林沼泽极化后向散射系数介于林地与河流之间,与旱地最为接近,森林沼泽VH后向散射系数均值与林地、河流的差距分别为0.4、3.8;VH后向散射系数均值与林地、河流的差距分别为1.0、3.9,可充分利用Sentinel-1极化波段对森林沼泽湿地信息进行有效提取。
表4 典型地类后向散射系数均值Table 4 Mean value of backscattering coefficient of typical terrain
利用ENVI 5.3随机森林分类(Random Forest Classification)功能模块对哈尼保护区森林沼泽湿地3种组合方案分别采取不同级别分类树地物覆被信息提取,获取不同级别分类树森林沼泽信息提取总体精度与Kappa系数(图3),结果表明:哈尼保护区森林湿地覆被信息随机森林提取总体精度与Kappa系数均呈现出先在10~100分类树阶段增加后趋于波动稳定趋势,组合1、2、3在10~100分类树阶段保护区湿地信息提取总体精度分别增加2.6%、5.5%、3.2%,Kappa系数分别增加0.03、0.06、0.03,随着分类树数目的增加,保护区湿地信息的提取时间也在相应增加。3种组合保护区森林沼泽信息提取最优随机森林分类树数目不同,组合1、2、3最优随机森林分类树分别为100、400、1 200。
图3 不同特征组合下不同分类树数量的随机森林分类精度Fig.3 Varied classification accuracies among the different numbers of classification trees for different feature combinations
对保护区森林沼泽3种组合方案中信息提取最优总体精度、Kappa系数、生产者精度与用户精度进行对比分析(表5),结果表明:融合Sentinel-1雷达VV、VH后向散射系数波段与Sentinel-2红边波段的组合3森林沼泽信息提取精度最高,总体精度、Kappa系数分别高达88.9%、0.85,其中,林地、森林沼泽、旱地、草地的生产者精度分别高达97.9%、93.8%、90.6%、90.1%,林地、水田、森林沼泽、草地的用户精度分别高达96.6%、89.5%、89.4%、86.9%,森林沼泽提取质量相对较高,其次为仅融合Sentine l-2红边波段的组合2,组合1湿地信息提取总体精度与Kappa系数最小。
表5 分类精度对比 %Table 5 Comparison of classification accuracy %
对哈尼湿地森林沼泽的信息提取最优精度方案的提取结果进行分析(表6,图4),结果表明:哈尼保护区总面积约242.5 km2,其中,天然湿地面积30.6 km2,天然湿地类型中森林沼泽面积最大,为27.1 km2,占天然湿地面积的88.6%,占保护区总面积的11.2%,主要分布于保护区东北部海拔相对较高地区;河流面积最小,为0.7 km2,仅占天然湿地面积的2.2%,占保护区总面积的0.3%,由东北向西南贯穿整个保护区;湖泊与草本沼泽面积分别为1.3 km2、1.5 km2,分别占天然湿地面积的4.4%、4.9%,分别占保护区总面积的0.6%、0.6%。人工湿地水田面积为0.9 km2,占保护区总面积的0.4%,主要分布于河流两侧地势平缓地带。保护区内非湿地类型面积相对较大,林地面积最大,高达192.3 km2,占保护区总面积的79.3%;建设用地面积最小,为3.6 km2,占保护区总面积的1.5%;旱地与草地的面积为5.2 km2、9.9 km2,分别占保护区总面积的2.2%、4.1%。
图4 哈尼保护区不同土地覆盖分布格局Fig.4 Land cover distribution patterns in the Hani Ramsar wetland site
表6 分类面积汇总 km2Table 6 Classification area summary km2
森林沼泽生态系统具有强大的服务功能,在全球湿地类型中具有不可替代的作用(杨一等,2017),然而,由于森林沼泽地物类型复杂且枝叶重叠,与森林等其他地物类型之间在传统光谱遥感探测视角上具有高度一致性,且各湿地类型在传统遥感影像数据光谱波长位置、波段数目与宽幅范围内差异性不够显著,使得森林沼泽湿地景观信息的识别与提取成为湿地信息遥感探测领域的难点(生农等, 2021)。Sentinel-2多光谱影像包含中心波长介于703.9~782.5 nm之间的红边波段,是目前唯一的在红边探测范围内含有3个波段的卫星遥感影像数据,可有效监测植被健康生长状态信息且提高森林沼泽信息的提取精度,较高的光谱、空间分辨率与较宽的光谱涵盖范围使得Sentinel-2遥感影像数据成为森林沼泽湿地景观信息识别提取最重要的数据源之一(Bonansea et al, 2019)。传统的光谱遥感影像与Sentinel-2等多光谱影像数据具有较全面的光谱信息,但受研究区昼夜交替、天气与近地表地物景观覆被复杂重叠遮蔽等因素影响,使得森林沼泽湿地景观信息识别与提取精度不够精细(夏晓瑞等, 2014)。Sentinel-1双极化主动遥感雷达数据不受光线和云雾雨的干扰,脉冲能穿透一系列地物到达地面及以下一定厚度的范围内,反馈森林沼泽湿地景观近地表复杂的基本信息,在数据获取、处理及森林沼泽景观精准识别方面具有显著优势(Clauss et al, 2018)。
高光谱遥感影像与极化雷达影像数据被广泛应用于地理景观信息识别提取的研究中,但单一的数据来源不足以明显提升湿地景观信息识别的提取精度,多源数据融合方法能有效结合各单一类别遥感探测数据集合的优势,吸取不同数据源的特点,丰富影像数据信息,明显提高森林沼泽湿地景观制图绘图精度(马瑞峰等, 2020)。严婷婷等(2014)对森林沼泽信息遥感提取方法现状进行了较为全面的解释,研究结果认为随机森林决策树方法是当下森林沼泽遥感信息提取较为高效准确的方法。多源数据融合与随机森林算法相结合成为提高森林沼泽信息提取精度的保障,湿地信息提取算法与遥感数据源分辨率仍有待不断改进与提升,这也成为遏制森林沼泽信息识别提取精度的绊脚石。随着无人机技术的不断发展与成熟,小范围、高精度、长时间序列森林沼泽遥感信息监测与提取成为可能(闻馨等,2020)。下一步将结合无人机高光谱、高精度的拼接影像,对保护区森林沼泽湿地景观信息开展小范围、高精度、长时序变化的识别、监测与分析。
本研究集成应用Sentinel-1雷达和Sentinel-2多光谱影像,充分挖掘Sentinel-1多极化波段特征和Sentinel-2红边指数对于森林沼泽遥感识别的潜力,应用随机森林方法实现哈尼湿地森林沼泽分布信息的提取,并对其信息精度进行综合评估。结论如下:
(1)随机森林方法对森林沼泽湿地的景观信息提取精度受研究区域类型、分类树数目、训练与验证样本选取等多方面因素的制约,哈尼湿地森林沼泽景观信息提取最优随机森林分类树为1 200。
(2)融合Sentinel-1 VV、VH后向散射极化与Sentinel-2红边特征波段能显著提高森林沼泽景观信息的提取精度,哈尼湿地景观信息提取总体精度为88.9%,Kappa系数为0.85,森林沼泽提取生产者精度与用户精度分别高达93.8%、89.4%。
(3)保护区湿地景观类型多样,天然湿地、人工湿地与非湿地景观类型并存,在天然湿地类型中,森林沼泽面积最大,为27.1 km2,占保护区总面积的11.2%,主要分布于保护区东北部海拔相对较高地区,河流面积最小。