应用哨兵2A多时相遥感影像对树种的识别1)

2021-03-09 10:03李煜李崇贵刘思涵马婷吴梦月
东北林业大学学报 2021年3期
关键词:哨兵波段树种

李煜 李崇贵 刘思涵 马婷 吴梦月

(西安科技大学,西安,710054)

森林树种识别及其分布情况制图对于森林管理、森林扰动监测、环境和生物多样性评估以及碳储量和蓄积量估算至关重要[1]。遥感数据(如光学遥感数据、主动式雷达遥感数据等)均可实时获取大量关于森林物种组成的信息,并且与传统的实地监测相比,所需的时间更少,并且可以实现大面积制图以及覆盖到人类难以进入的森林区域。多光谱图像一直是森林物种组成制图中最常用的数据(特别是来自Landsat 8的图像)[2-4],然而,由于混合像素的出现,中等空间分辨率遥感数据的使用面临挑战[5]。一般情况下,中低空间分辨率数据虽然可以绘制森林类型覆盖图,但是分类结果没有详细分析树种组成,不能被森林管理者使用。高光谱影像数据和激光雷达数据的出现使得森林树种精细分类制图成为可能[6-7]。首先高光谱传感器可以对每个空间像元经过色散,形成几十个乃至几百个窄波段以进行连续的光谱覆盖,从而更加细致的捕获到植被的生化变化过程,因此在许多研究中高光谱数据的结果都优于多光谱影像。然而高光谱遥感图像各波段间存在着高相关性和高冗余度,在处理上有一定的困难,高光谱影像也需要更高的计算能力[8]。此外,陆地激光雷达虽然也能用于树种分类,提供关于森林结构的详细的信息,但是由于激光雷达和高光谱数据的操作使用限制以及高额的使用成本,这些数据的适用性在大区域研究或全球范围内仍然是有限的,所以在大区域植被和森林覆盖研究中,哨兵2A(具有相对密集、可自由获取的多光谱影像)是更为优势的数据来源。李哲等[9]利用高分二号影像构建了多种单时相及多时相影像组合,利用支持向量机(SVM)和随机森林(RF)两种分类器,分别实现了不同时相及特征维度的面向对象的8个树种的分类,总体精度为63.5%~83.5%、卡帕(Kappa)系数为0.57~0.81。蔡林菲等[10]基于高分二号影像结合多种遥感及GIS特征因子,比较支持向量机、随机森林和极端梯度提升(XGBoost)等3种分类算法,对龙泉市的阔叶树、马尾松、杉木和毛竹等4种主要优势树种进行分类,采用极端梯度提升分类模型的分类总精度为83.88% ,卡帕系数为0.78,比支持向量机和随机森林分类方法有明显提高。林志玮等[11]以福建安溪县为例,采用无人机获取不同高度的航拍影像,采用卷积神经网络(DenseNet)建立树种识别模型,表明不同航拍高度的树种识别模型,其分类精度均达 80% 以上,最高精度为87.54%。Laurel et al.[12]使用激光雷达数据,对美国加州国家保护区及周边峡谷森林树种进行分类,研究使用支持向量机和随机森林分类器,结果表明所有的分类结果的整体准确率在90%以上,当使用额外的训练样本时,支持向量机的表现优于随机森林,增加训练样本也可以提高支持向量机分类器的个体性能。Nicola et al.[13]研究了哨兵2A在地中海进行森林类型制图的能力,结果表明夏季获取的单个哨兵2A图像无法区分森林类型,需要在不同物候期收集的多时相图像,最佳时相组合影像的准确度大于83%。物候变化可以提高树种间光谱的可分性,物候周期引起的反射率变化有助于森林树种的准确分类。在利用多光谱影像进行森林树种分类,关键问题是多时相数据的选择和组合方法[14]。本研究应用夏季、秋季和冬季的哨兵-2A时间序列影像对树种进行分类,探讨哨兵-2A最佳影像组合、影像采集日期和哨兵-2A各波段对树种分类精度提高的贡献大小。

1 研究区概况

大孤家林场位于清原县东北部,东经124°45′58″~125°8″,北纬42°25′1″~42°15′55″。地势呈东高西低,地貌为低山丘陵,海拔200~600 m。气候属于温带大陆性气候,年平均气温6 ℃,年降水量500~800 mm,降水量主要集中在7、8月份。大孤家林场是国家级的林木良种繁育基地,林场面积230 hm2,树种以日本落叶松(Larixkaempferi(Lamb.) Carr)为主体,兼有红松(PinuskoraiensisSieb. et Zucc.)、白桦(BetulaplatyphyllaSuk.)、水曲柳(FraxinusmandshuricaRupr.)等。土壤为棕色森林土。

2 研究方法

2.1 数据来源

哨兵-2A卫星携带多光谱成像仪(MSI),高度为786 km,可覆盖13个光谱波段,幅宽达290 km,地面分辨率分别为10、20和60 m,卫星的重访周期为10 d,两颗互补,重访周期为5 d,从可见光和近红外到短波红外,具有不同的空间分辨率,在光学数据中,哨兵2A数据在红边范围内含有3个波段的数据,这对监测植被健康信息非常有效[15]。

哨兵-2A遥感数据来源于哥白尼开放存取中心(https://scihub.copernicus.eu/)提供的2018年覆盖研究区的6景不同季节的无云影像(见图1),其他辅助数据包括森林二类调查数据以及研究区行政区划数据。研究中选择了哨兵-2A影像10 m和20 m空间分辨率的波段(见表1)。

图1 以森林为例的哨兵2A影像

表1 本研究使用的哨兵-2A光谱波段信息

2.2 训练样本及验证样本选取

树种分类的样地数据是通过研究区二类调查数据,结合谷歌地球上的多时相影像人工采集得到。即将二类调查数据加载到谷歌地球专业版中,结合谷歌地球的历史影像数据库提供的时间序列遥感影像,通过目视解译选择各类型树种样地,解译生成样本数据。依据二类调查数据资料优势树种属性在研究区域内共采集了包含落叶松、红松、阔叶林、其他常绿针叶、非林地(耕地、建筑、水体)等主要特征地物样本。通过地理信息系统检查空间拓扑关系,删除了覆盖混合像元的样地,以确保样地完全落在单一林种区域,减少因为像元光谱混合造成的分类精度误差。研究中所有样地均设置为0.08 hm2矩形样地。各类树种训练样本统计数据见表2。

表2 训练样本信息

2.3 随机森林方法树种分类

树种分类方法选择随机森林分类器进行,随机森林是通过集成学习的思想将多棵树集成的一种算法,基本单元是决策树,其本质属于机器学习的一大分支——集成学习方法。集成分类器假设是当使用一组弱学习器时,与仅使用它们中的单个分类器相比,可以获得更好的性能。随机森林与其他非参数分类器相比,具有计算速度更快,成本更低的优势。此外,随机森林可以抵抗过拟合问题的发生,并且可以管理许多输入变量而无需删除变量,这些优势决定了随机森林适合时间序列遥感影像分类。实验在Enmap-Box软件的监督分类函数中应用了随机森林算法,将生成的样本数据用作分类的输入数据,并且按照7∶3的比例将其随机分成训练样本和验证样本,然后进行模型训练,生成随机森林模型变量的重要性报告。通过对不同单时相影像和根据随机森林变量重要性报告进行的不同多时相影像组合进行多次分类实验,将具有较高总体分类精度(OA)和Kappa系数的影像或影像组合认为是最佳分类效果。

3 结果与分析

3.1 变量选择

随机森林可以对特征变量重要性进行排序,随机森林模型在得到特征变量的重要性得分后,可以根据特征变量重要性评级得分,按照从大到小的顺序降序排列,完成变量选择过程[16]。并且可以在特征变量选择开始之前设定特征变量子集大小,根据子集的大小选取变量[17-18]。对于每颗树,按照基尼系数和信息熵给变量特征排序,然后对整个森林取平均值[19]。随机森林模型在分类中通常应用基尼系数或信息熵进行特征变量重要性评级。实验计算了60个波段信息的重要性统计信息,这里仅选取20个最重要的特征变量,即20个分别具有最高基尼系数和信息熵值的变量(见图2)。

由图2可知,基尼系数和信息熵统计数据都显示10月18日和11月10日的短波红外2波段和红边2波段在随机森林分类器中对树种分类的重要性最高。总体上,对分类贡献度高的影像大多是秋冬季节,波段分布以红边范围内波段为主,这也符合哨兵2A数据在红边范围设计3个波段用以监测植被健康信息的目的。其次贡献度较高波段为两个短波红外波段以及红光波段,均是对植被比较敏感的监测波段。

图2 对树种分类最重要的20个变量的基尼系数和信息熵

3.2 森林树种分类

结合两种重要性评价方法所得重要性排序图以及单时相影像,共设计分类组别9组,分别对6景不同时相遥感影像、两组按照重要性所得20个波段进行组合的多时相遥感影像以及由6景影像全部波段组合形成的遥感影像应用随机森林分类器的监督分类。

由表3可知,在应用单时相哨兵2A影像进行监督分类实验时,8月2日的影像取得了最高精度,总体精度为82.17%,其次是5月24日以及10月18日的影像,总体精度分别为82.14%和82.09%。在多时相组合图像的分类结果中,总体精度大幅提高。组合了所有影像波段的影像分类效果最好,总体精度高达87.45%。按照基尼系数所得统计信息的影像组合分类总体精度为86.65%,信息熵的影像组合总体精度为84.97%,相较于季相信息丰富的单时相影像没有很大提升。

表3 单时相影像及影像组合的分类总体精度和Kappa系数

应用精度评估数据,最终选择使用所有波段影像获得大孤家林场树种分类专题图(见图3)。

图3 大孤家林场树种分类专题图

4 结论与讨论

以大孤家林场为例,使用2018年获取的6景哨兵2A无云影像,影像获取的时间序列包含了大部分树种关键生长期,因此可以全面获得有关树种光谱值随时间变化的趋势。本研究验证了使用多时相遥感影像可以提高树种分类的精度的结论。使用多时相影像组合的分类精度明显优于单时相影像分类精度,不同季节、不同树种生长期的影像组合能够大幅度提高树种识别率。通过使用多时相影像,一些树种的特定差异会表现的更加明显,比如落叶松与其他常绿针叶的差异。而对于季相差异不是很大的树种,增加不同生长期的波段组合并不能改善分类精度,因为它们的光谱之间具有高度相关性,无法体现出差异。从随机森林模型的变量重要性报告中可知,对总体精度提升贡献最高的影像波段都来自于10月18日(秋季)和11月10日(冬季)的影像,从这两景影像中也可直观看到地物颜色发生了明显改变。物候差异一直都是影响光学遥感影像进行不同植被覆盖分类的重要因素,阔叶林最重要的物候变化来自于10月份的影像,针叶林在生长初期的影像更能进行分辨。

研究发现哨兵2A影像的多个波段都提供了大量有关植被特性的有价值的信息,基尼系数和信息熵的统计数据都表明,并非所有光谱波段都能对树种分类精度提高做出同等贡献。研究中最重要的波段信息都来自于哨兵2A影像的3个红边波段、2个短波红外波段以及近红外波段(窄)、可见光红色和绿色。有类似研究结论也证实了哨兵2A影像短波红外和红边波段的对树种分类重要性[20],这与本研究中选择的对树种分类精度改善提供高贡献度的波段吻合。

基于光学遥感影像的森林树种分类存在的重要问题是森林覆盖区域复杂的环境条件以及生物多样性。一方面,森林覆盖区域的影像受云层覆盖、大气和地形等因素影响,很难获得各树种关键物候期的高质量和无云影像,但哨兵2A卫星具有较短的重访周期克服了该问题。另一方面,林分因子的异质性和破碎化导致不占优势的树种难以收集足够的样本来进行细化,常见的优势树种分类精度更高,而小类别树种更容易错分,这是森林树种的光谱相似性以及样本量不足以形成均质林分导致。后续研究中可以增加小类别树种样地数量以期降低该类别树种错分误差。因此,利用哨兵2A多时相遥感影像以及随机森林方法在森林树种分类应用方面具有较高的精度,可应用多时相遥感影像对林分树种制图与监测。

猜你喜欢
哨兵波段树种
哨兵“后退一步,走”,树立“守规矩”鲜活标杆
树种的志向
树种的志向
哨兵神圣不可侵
基于PLL的Ku波段频率源设计与测试
常绿树种在新疆的应用现状
小型化Ka波段65W脉冲功放模块
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
欧洲“哨兵”-2A上天放哨