基于无人机可见光影像的红树林冠层群落识别

2020-09-17 07:34贾明明李晓燕王宗明钟才荣冯尔辉
森林与环境学报 2020年5期
关键词:红树林群落尺度

闻 馨,贾明明,李晓燕,王宗明,3,钟才荣,冯尔辉

(1.吉林大学地球科学学院,吉林 长春 130061;2.中国科学院东北地理与农业生态研究所湿地生态与环境重点实验室,吉林 长春 130102;3.国家地球系统科学数据中心,北京 100101;4.海南东寨港国家级自然保护区管理局,海南 海口 571129)

红树林(mangrove)是生长在热带及亚热带地区海岸潮间带滩涂或河流入海口的木本植物群落,它在防浪固堤、促淤造陆、净化环境和维持生物多样性等方面有独特的生态价值[1]。然而由于气候变化、人类活动等原因,全球红树林面积大幅度减少,相比于20世纪70年代,截至2000年我国红树林面积减少了一半以上,直至2000年以后才有所恢复[2-3]。红树林群落特征决定了红树林湿地的功能和价值,群落类型和分布的改变直接反映了外界环境的变化[4]。因此,及时、准确地监测红树林群落面积和分布是研究红树林湿地生态功能和价值,红树林湿地对气候变化和人类活动的响应等问题的基础,也是红树林湿地保育和管理的重要依据。

由于红树林分布于潮间带浅滩,可达性差,用传统实地考察的森林资源调查方法进行红树林植物群落调查费时费力、周期长、时效差,且不能获得红树林群落完整的空间分布信息。自21世纪以来,陆续投入使用米级乃至亚米级高空间分辨率遥感数据(如WorldView-2、高分卫星等),因其具有反映精细影像纹理信息的能力,在红树林植物群落分类研究中得到广泛应用[5-7]。然而这些数据大都来自国内外的商用卫星,价格较高;且由于光谱分辨率或空间分辨率的限制,制图精度有时不能满足需求。近年来,无人机技术的蓬勃发展为红树林群落分类提供了新的数据源,以其灵活、云下作业、低成本、厘米级的高空间分辨率等特点,成为卫星遥感的补充,具有广阔的发展前景[8-9]。如冯佳莉等使用可见光波段的固定翼无人机影像,采用面向对象的最近邻分类法,区分了英罗港港湾两侧的3种红树林优势种类,分类精度达90%以上[10];刘凯等对比了固定翼无人机、消费级旋翼无人机和专业级旋翼无人机在区分红树林种类中的精度和效率,3种影像随机森林法分类精度分别为81.1%、84.8%和89.3%,均较高[11]。但这些研究分割尺度的选取大都基于目视判断,且对于随机森林算法而言,未对分类特征以及随机森林的参数[树的棵数(ntree)和节点分裂时抽取的特征个数(mtry)]进行筛选评价。

因此,以海南省典型的红树林区为研究对象,使用无人机获取可见光波段影像,引入可见光波段差异植被指数和最优分割尺度评价模型,并计算评价随机森林分类过程中的最优特征和参数,最后采用面向对象的随机森林分类方法识别红树林群落,以探讨无人机在红树林群落制图中的应用前景。

1 研究区概况

研究区位于海南省澄迈县富力湾红树林国家级湿地保护公园内(图1),该园地处海南省北部,北临琼州海峡,属热带季风气候,年平均气温23.8 ℃,雨热同季,且处于静风环境区,受台风影响较弱。园内有9种真红树植物,包括榄李(Lumnitzeraracemosa)、红海榄(Rhizophorastylosa)、角果木(Ceriopstagal)、桐花树(Aegicerascorniculatum)、秋茄(Kandeliaobovata)、木榄(Bruguieragymnorrhiza)、白骨壤(Avicenniamarina)、卤蕨(Acrostichumaureum)、海漆(Excoecariaagallocha),4种半红树植物,包括苦郎树(Clerodendruminerme)、黄槿(Hibiscustiliaceus)、阔苞菊(Plucheaindica)和水黄皮(Pongamiapinnata)[1]。航拍区域为园区内红树林保护的核心区,红树林种类丰富,由于该区域属于旅游开发区和房地产开发密集区,所以红树林受到人为干扰较多,区内全部为红树林次生林。研究选取群落丰富、影像效果好、无变形的区域作为红树林群落分类研究区,总面积97 057.47 m2。

2 数据来源与研究方法

2.1 数据获取与预处理

无人机影像的获取过程包括前期准备、航拍以及后期的数据处理3个阶段。前期准备是对研究区进行资料收集以及实地调查,规划航拍路线;拍摄时要尽量选择无风或风力较小、晴朗的天气,起飞点选择在空旷的地方,以保持全球定位系统(global positioning system,GPS)信号稳定;后期处理包括数据的传输、影像的拼接和几何矫正。

研究所用的影像来自大疆精灵4pro型螺旋翼无人机,拍摄时间是2018年9月14日10:30—11:00。拍摄当日天气晴朗、阳光充足,无人机飞行高度200 m,航向重叠90%,旁向重叠70%,进行了1个架次航拍,获得93张有效相片。然后使用photoscan软件,经过对齐照片、生成密集点云、生成网格、生成纹理、生成正射影像,得到分辨率为5 cm的RGB影像。

精度验证点一部分使用手持GPS野外实测,记录坐标、群落类型以及其他信息;另一部分使用无人机低空(50 m)飞行影像和当地红树林专家(海南省红树林保护区工作人员)目视判读获得。共得到验证点165个,其中桐花树、红海榄、榄李、海漆各30个,黄槿、榄李+海漆和非红树林各15个。使用eCognition软件进行人机交互,对50 m高度无人机影像进行专家判读,在影像中均匀地获取每类红树林群落50个训练样本,共计300个纯对象作为分类训练样本集,样本点分布见图1。

图1 研究区及样本分布Figure 1 Study area and distribution of samples

2.2 研究方法

结合实地考察结果与研究区的地类特点,分类过程为2个层次。首先,引入可见光波段差异植被指数(visible-band difference vegetation index, VDVI或IVDV)[9]来区分植被与非植被地类;然后,使用随机森林算法对红树林群落进行分类。同时,研究还通过引入最优分割尺度评价模型,计算随机森林分类最优参数和特征重要性来进一步提高分类精度,技术路线见图2。

图2 技术路线Figure 2 Work flow

2.2.1 建立解译标志 通过实地考察与影像判读得出,红树林分布区内主要群落有桐花树、红海榄、海漆、榄李、黄槿以及榄李+海漆,还包括小面积的卡开芦(Phragmiteskarka),红树林分布区外主要有水体、裸地、建筑和其他植被(研究区东南部的绿化植被)。图3展示了不同群落的可见光波段差异植被指数(VDVI)、最大光谱差异度量(maximum difference scale,Max.diff)以及红、绿、蓝波段的光谱亮度均值(Mean_R、Mean_G、Mean_B)归一化后(分别记作VDVInorm、Max.diffnorm、Mean_Rnorm、Mean_Gnorm、Mean_Bnorm)对比结果。红树林分布区内群落影像及特征见表1。

图3 不同群落归一化光谱特征值Figure 3 Normalization values of spectral features for different communities

表1 群落影像及特征Table 1 Images and features of different communities

2.2.2 面向对象方法与最优分割尺度评价 面向对象分类法是依据邻近像元光谱和空间特征的同质性,将满足条件的相邻像元合并为一个分类单元(对象),从而有效避免高分辨率影像基于像元分类时产生的“椒盐现象”,同时增大了影像分类特征的维度[12-13]。适宜的分割尺度是面向对象分类的基础,最优分割尺度是指对象具有良好的内部同质性,而对象间具有较高的异质性[14]。多尺度分割算法是“自下而上”将相邻像元逐步合并,将整幅影像分割为大小、形状不同的对象,直到对象内部的异质性大于给定的阈值为止,这个阈值就是分割的尺度参数。分割尺度太大会产生欠分割现象,同一对象内部有光谱值相近的不同地类混合;分割尺度过小会产生过分割现象,不仅运算速度慢,而且对于厘米级分辨率的无人机影像,分类时同样会产生“椒盐现象”。

本研究用标准差衡量对象内部同质性,用全局莫兰指数(Moran′s index,MI或IM)衡量对象间的异质性。全局分割质量评价值(global segmentation,GS或SG)是对象内部同质性和对象间异质性的综合,GS值越大,影像的分割效果越好。考虑到纹理特征对于高空间分辨率影像分类的重要性,因此将纹理异质性作为一个因子加入到全局分割质量评价中,确定最优分割尺度的具体步骤如下。

(1)使用eCognition软件多尺度分割功能,对研究区红树林执行尺度为10~90,步长为5的17次分割。

(2)计算对象内部的光谱同质性V,公式如下[14]:

(1)

式中:n为分割对象总数;ai表示第i个对象的面积;vi表示第i个对象光谱亮度平均值的标准差。

(3)计算某分割尺度下的全局莫兰指数IM,以此表示对象间的异质性,公式如下[14]:

(2)

(4)对V和IM进行归一化,去除量纲,结果分别记作Vnorm和IMnorm,方法如下[15]:

(3)

式中:X、Xmax和Xmin分别代表某一尺度下V或IM的值、所有分割尺度下V或IM的最大值和最小值。

(5)计算全局分割质量评价值SG,得到尺度间隔为5的SG值序列,公式如下[15]:

SG=ρVnorm+(1-ρ)IMnorm

(4)

式中:ρ为同质性所占的权重,本研究ρ为0.3。

(6)对SG值序列执行3次样条插值,得到尺度间隔为1的SG值序列,这样在保证选取最优分割尺度高效性的同时,也满足尺度选择精度的需求。插值结果SG值最大时所对应的分割尺度即为最优分割尺度。

2.2.3 可见光波段差异植被指数 可见光波段差异植被指数(IVDV)是一种综合红、绿、蓝3个可见光波段的归一化植被指数,对于仅含可见光波段的无人机遥感影像中绿色健康植被具有较好的提取效果,其阈值在0附近[9]:

(5)

式中:MR、MG和MB分别代表分割对象红、绿、蓝波段像元光谱反射率的平均值。

2.2.4 随机森林分类方法 随机森林属于机器学习的一个分支——集成学习,是套袋法与决策树的结合[16]。随机森林分类的基本过程是:(1)对于有n个样本的原始样本集,首先使用套袋法从中有放回的随机抽取m个训练样本集,组成m棵决策树;(2)每个样本集有p个特征,在决策树的节点分裂时,从p个特征中随机选取q个特征,通过计算基尼不纯度(Gini impurity,Gini)[17],从q个特征中选择1个最佳分裂特征以及对应的阈值,直到子节点选出的特征与其父节点的重复,该节点分裂结束;(3)使用(2)中的方法训练m棵决策树,组成随机森林,然后使用该模型进行预测,使用票选法,即取所有树预测结果的众数作为最终的预测类型[16,18]。

随机森林中引入两个随机过程——随机选择样本和特征进行训练,避免了过拟合现象的发生,且具有很好的抗噪能力。随机过程的引入决定随机森林有两个重要的参数,即森林中树的棵数(ntree)和节点分裂时抽取的特征个数(mtry)。随机森林中树的数量太少,分类精度降低,而数量太大运算速度减慢,因此适宜的树的棵数能在达到分类精度要求的同时保证运行速度[16,18]。随机森林算法中,若不进行设置,一般默认节点分裂时抽取特征个数为全部特征数的平方根或1/3[16]。

由于红树林群落间的光谱特征在可见光波段较为相近,因此本研究加入形状和纹理两类空间特征来区分红树林群落。光谱特征包括红、绿、蓝波段的均值,标准差,色调、饱和度和亮度,共计9个;形状特征包括边界指数、似圆度等,共计11个;纹理特征体现了像素及其周围空间邻域的灰度分布规律,能够刻画出图像中重复出现的局部模式与它们的排列规则,具有方向性[19]。本文使用灰度共生矩阵(gray-level co-occurrence matrix,GLCM)来描述影像纹理特征,选取8大类、5个移动方向(即所有方向、0°、45°、90°、135°,依次按1~5编号),共计40个纹理特征。全部特征类别见表2。

表2 分类特征Table 2 Classification features

以训练样本集为基础,选取包括光谱、纹理以及形状3大类,共计60个特征,分别计算节点抽取不同数量的特征、森林中不同决策树的棵数所对应的误分率,误分率最小或稳定时对应的特征数或棵数即为最适宜随机森林参数。此外,不同特征对分类的贡献率不同,在选取最优分裂特征数的同时,需要找到对应的特征。本研究引入节点基尼不纯度平均减小值(mean decrease Gini)[18]作为度量特征重要性的指标。基尼不纯度表示集合的不确定性,基尼不纯度越大,集合的不确定性也就越大,若经过某个特征对集合进行划分,使得划分后集合的不确定性减小值,即基尼不纯度平均减小值越大,则该特征越重要。假设样本T分为K类,则样本T的基尼不纯度为:

(6)

式中:|Ck|是样本T中属于第k类的样本数,|T|是样本总数。

经过特征A划分后样本T的基尼不纯度为:

(7)

式中:|Ti|是样本T中属性A取值为i的样本数。

2.2.5 精度评价 精度评价使用误差矩阵(也称混淆矩阵),它是地面实测的真实值与模型预测值的比较阵列,矩阵的列代表实测值,矩阵的行代表预测值。基于误差矩阵计算分类总体精度(overall accuracy,OA或AO)、Kappa系数(Kappa index,KI或IK)、制图精度(mapping accuracy,MA或AM)和用户精度(user′s accuracy,UA或AU),取值均在0~1之间,值越大,分类效果越好。公式如下[2]:

(8)

(9)

(10)

(11)

式中:p代表样本总和;pii代表误差矩阵中第i行第i列的样本总数,pi+代表误差矩阵中第i行的总和,即第i类地类预测值的总和;p+i代表误差矩阵中第i列的总和,即第i类地类地面实测值的总和。

3 结果与分析

3.1 最优分割尺度

如图4所示,分割尺度在10~90,全局分割质量评价值(SG)先增大后减小,其高峰存在于35~45;当分割尺度大于或等于55时,存在欠分割现象,即1个像元内包含不同种红树林群落,当尺度达到65及以上时,这种现象十分显著;当分割尺度小于35时,存在过分割现象,分割和分类的运算量加大、运算速度减慢;且对于无人机影像,尺度过小时,树冠间的空隙被区分一个对象,造成分类中的“椒盐现象”。根据SG计算结果,分割尺度为41时,全局分割质量最高,为0.81(即对象内部同质性和对象间异质性的结合效果最好),对红树林群落边界刻画的效果最好。

图4 不同尺度的分割效果及分割质量评价结果Figure 4 Segmentation effects and segmentation quality evaluation with different scales

为进一步证明最优分割尺度的有效性,本研究基于目视最优尺度50时的最优随机森林参数和最适宜特征训练新的随机森林模型,并进行了分割尺度50的红树林群落分类(表3),分类结果总体精度为82.42%,Kappa系数0.79,与最优分割尺度41的结果相比分别降低了6.67%和0.08,证明使用最优分割尺度评价模型能够提升对象纯度,从而提高分类精度。

表3 分割尺度50的红树林群落分类结果误差矩阵Table 3 Confusion matrix for mangrove species classification based on segmentation scale 50

3.2 红树林与非红树林分类

通过反复试验和目视判读,可见光波段差异植被指数(IVDV)为0.07可以最好地区分植被和非植被地类(IVDV>0.07为植被)。根据实地考察验证,可以以非植被地类为界限区分其他植被(研究区东南部建筑物周围的绿化植被)与红树林和卡开芦(图5)。影像中小面积的卡开芦通过目视判读,在红树林群落分类前掩膜。

3.3 随机森林参数确定

特征重要性计算结果,即基尼不纯度的平均减小值显示(图6),贡献前20的全部为光谱和纹理特征,其中前5位分别是色调、饱和度和亮度(hue,saturation,intensity,HSI)、 最大光谱差异度量(Max.diff,属于Mean特征)、移动方向90°的对比度(GLCM_Con4)、移动方向0°的相异性(GLCM_Dis2)和移动方向0°的对比度(GLCM_Con2),表明光谱和纹理特征在使用无人机可见光影像区分红树林群落时起主要作用。

图5 非红树林分类结果Figure 5 Classification results of non-mangrove areas

特征数量与误分率关系的计算结果显示(图7),随节点抽取特征数量的增加,误分率先快速减小然后缓慢增加,当每个节点抽取的特征数为15个时,对应的误分率最低。随着随机森林中决策树棵数增加,误分率先急剧减小后趋于稳定,当棵数约为600时,误分率基本稳定。因此,研究中训练随机森林模型时树的棵数设置为600,所用到的特征总数为15的3倍即45个,模型中用到的全部特征如图6所示。

3.4 红树林群落分类结果与精度验证

基于最优分割尺度和使用最优参数、特征训练好的随机森林分类法,富力湾红树林群落分类结果如图8所示。结果显示,研究区红树林总面积73 265.59 m2,水体、裸地、建筑、卡开芦等非红树林地类总面积23 791.88 m2。其中榄李分布最广,总面积31 193.41 m2,主要分布在中高潮带;桐花树和红海榄面积分别为17 767.87和8 358.29 m2,主要分布在水体边缘的低潮带;海漆和榄李+海漆总面积分别为7 849.03和6 099.39 m2,主要分布在研究区中部和南部的中高潮带;黄槿分布最少,总面积1 997.60 m2,主要分布在研究区西南部。

误差矩阵如表4所示,分类总体精度为89.09%,Kappa系数为0.87。分类结果总体精度较高,主要原因可能有以下几点:使用了最优分割尺度,对无人机影像中红树林群落边界的刻画更准确;通过模型计算,获得最适宜红树林群落分类的随机森林模型参数和分类特征,最大限度地提高了随机森林分类结果的精度;虽然同卫星影像相比,可见光无人机影像光谱信息少,但是根据本研究的结果,纹理特征对分类结果的贡献率较大,因此,面向对象的分类方法增加了无人机可见光影像的分类特征维度,有效提高了分类精度。

图6 特征重要性评价结果Figure 6 Feature importance evaluation result

图7 特征个数与误分率关系Figure 7 Relationship between error rate and feature numbers

图8 红树林群落分布Figure 8 Map of mangrove species distribution

表4 分类结果误差矩阵Table 4 Confusion matrix for mangrove species classification

其中水体、建筑等非植被地类分类精度最高,表明可见光波段差异植被指数(VDVI)区分植被与非植被的效果良好。红树林群落中,红海榄制图精度最高,达到96.66%,一方面可能与训练样本的选取有关,另一方面,红海榄的红、绿、蓝波段光谱值和主要的纹理特征值均最小(表5),并且与其他类型相差较大,容易区分。榄李+海漆群落制图精度最低,可能由于混交群落不同对象中不同树种所占比例不同,其对象特征值会有较大的波动,分类过程的不确定性增大。分类结果与实际地物较好地吻合,误差主要来源于西北部红海榄和海漆混生地带和中南部、南部的榄李+海漆、榄李、海漆、桐花树群落的混生地带。

表5 红树林光谱和纹理特征值Table 5 Spectral and textural values of mangroves

4 讨论与结论

本研究基于无人机可见光影像,选用面向对象的分类方法,引入可见光波段差异植被指数区分植被与非植被地类;使用最优分割尺度评价模型准确提取红树林冠层边界;最后通过计算随机森林模型最优参数和最适宜特征,训练随机森林模型,区分富力湾红树林国家级保护公园典型区的6种红树林群落。研究结果表明:

(1)光谱特征和纹理特征在基于无人机可见光影像、使用随机森林算法区分红树林群落中起主要作用,其中贡献率前5的分别为色调、饱和度和亮度、最大光谱差异度量、移动方向90°的对比度、移动方向0°的相异性和移动方向0°的对比度。

(2)使用最优分割尺度评价模型能提升对象纯度,进而提高分类精度。

(3)基于无人机可见光影像的随机森林法红树林冠层群落分类结果精度达89.09%,Kappa系数为0.87,红海榄和桐花树制图精度均高于90%。可见,搭载可见光波段光学相机的无人机获取的高分辨率影像可以非常好的区分6种红树林群落,分类精度达到89.09%,完全能够满足红树林日常管理和监测的需求,且该类型无人机价格低、易携带、对起飞场地和天气要求较低,数据后处理简单,因此作业弹性较大。但是无人机影像数据量大,影像拼接及处理对计算机性能要求较高,且目前无人机续航时间较短,因此,无人机可见光影像适合小尺度(保护区、市县、斑块尺度)、高精度的红树林群落制图,在红树林监测与管理中有广阔的应用前景。

该研究区域内红树林属于红树林次生林,同种红树林分布较为集中,群落分界线较明显。对于林分更复杂、群落类型更丰富、树种充分混交的红树林成熟林(如海南东寨港国家级红树林保护区),其群落光谱和纹理特征变化也更为复杂,因此,未来需要进一步验证该方法对更复杂的红树林群落的识别精度。另外,为了消除树高不一致带来的误差,航拍时设置的相片重叠度较大,拼接过程以生成的数字高程模型(digital elevation model,DEM)数据为基础将影像矫正为正射影像。虽然如此,投影差仍然可能存在,这也是本研究不足之处,未来希望进一步探究如何最大限度消除红树林树高不一致引起的无人机影像的投影差。

猜你喜欢
红树林群落尺度
江垭库区鱼类群落组成和资源量评估
藏着宝藏的红树林
大学生牙龈炎龈上菌斑的微生物群落
喀斯特峰丛洼地小流域不同群落凋落物分解动态及养分释放
合成微生物群落在发酵食品中的应用研究
海岸卫士——红树林
财产的五大尺度和五重应对
走过红树林
宇宙的尺度
9