杨樟平 曹碧凤 谢巧雅 邓洋波 刘健 余坤勇
(福建农林大学,福州,350002) (永安市林业局) (福建农林大学)
毛竹作为典型竹种,在集体林区存在分布范围广、开发程度高等特点。是南方地区林农经济发展的重要来源[1]。毛竹林立竹度是指单位面积的毛竹立木的数量,它是毛竹林生产力重要指标之一,也是群体结构基本的数量特征之一[2]。通过监测毛竹林立竹度变化,能够在一定程度上直观地反应竹林生产力[3],而竹林生产力正是体现毛竹经济效益最直接的指标。然而由于毛竹自身生长和经营特点(择伐),毛竹林立竹度会随着竹林出笋量和采伐量而产生相应的变化,过高的立竹度不仅会影响新竹和鲜笋产量,同时对毛竹的胸径、竹高、干质量、干形等均有影响[4]。根据前人研究表明[5],在一定的立地条件下,毛竹林立竹度存在着最适范围,随着林木发育时期的差异,这个范围存在一定的波动。而维持林地合理的经营密度,不仅改善了竹林空间结构,提高竹林生产力,还充分发挥竹林生态功能[2]。因此,实现毛竹林立竹度的提取,结合竹林生长发育过程中的密度作用规律,调整竹林的密度,提高毛竹林的生产力,充分发挥竹林生态功能,实现对竹林可持续经营管理具有十分重要的意义。
传统的毛竹林立竹度实测调查存在工作艰苦、工作时间长、工作效率低下等几个问题,限制了快速、大面积的林业资源监测以及竹林数据的提取。现如今,研究者们通过遥感的估测方法,能够进行大尺度快速的林地信息的获取。其中无人机遥感具有低成本、体积小、高时效性、高分辨率等优势,所以采用无人机遥感手段进行毛竹林立竹度估测是当前研究的重点方向。由于毛竹存在着毛竹高低的交错效应和尾梢现象,在多光谱的遥感中实现纯单株毛竹识别存在较大难度。鉴于崔少伟等[6]基于QuickBird影像和面向对象分割技术,运用目视手动法和种子区域生长法对研究区内单株树冠进行了提取。王雅佩等[7]基于无人机影像,利用面向对象多尺度分割方法和平均冠幅法估测林分冠层遮挡区域林木株数,实现对天山云杉林分密度有效提取。因此,影像分割获得图斑特征可为遥感识别毛竹立竹度提供基础。
因此,研究以福建三明永安天宝岩国家级自然保护区毛竹林为研究对象,基于图像多尺度分割技术,结合毛竹冠幅几何形状特征和实际毛竹定位,构建毛竹株数识别单元,通过对比分析确定毛竹林立竹度识别单元的最佳分类算法,实现毛竹林立竹度更高精度提取,为毛竹林可持续经营提供理论依据及进一步深入研究无人机影像信息提取竹林资源信息技术奠定基础。
研究区位于福建三明永安竹资源丰富的天宝岩国家级自然保护区(117°28′3″~117°35′28″E,25°50′51″~26°1′20″N)。如图1,与上坪、青水和西洋(乡、镇)接壤,海拔580~1 605 m,地貌特征为“九山半水半分田”。属中亚热带海洋性季风气候,常年温暖湿润,年均气温15 ℃。研究区域生态环境良好,物种丰富,是国内少有的物种基因库之一。此地土壤类型以红壤为主,植被类型主要包括毛竹林、常绿阔叶林、针阔混交林、针叶林等,其中毛竹的面积达到5.85万hm2[12-13]。
图1 研究区位置图
2018年12月至2019年4月在福建省毛竹之乡的永安市进行野外实地调查,采集实验数据。在研究区内共布设了12个10 m×10 m不同密度的毛竹林样地,采用高精度亚米级GPS仪(Unistrong-Z5)获取各个样地坐标,通过每木检尺调查得到每块样地的株数量,按照平均株数量,将这12块样地分成3种不同密度的模式,分别为3 000、2 100、1 200株/hm2。每种模式布设有4块样地,经过多次飞行发现四旋翼无人机搭载多光谱镜头采集航高在150 m的毛竹林影像数据较好。采集时考虑阳光直射效应的影响,选择无风且阳光充足(上午11:00至下午14:00)的时间飞行。无人机飞行参数设置均为航向重叠为80%,旁向重叠率为70%,任务巡航速度为7 m/s。采用Pix4D Mapper软件对3种密度模式的无人机原始影像分别进行信息检测、拼接及几何校正等预处理,同时基于同步采集的白板信息进行影像的辐射校准。
本研究对毛竹林无人机影像进行多尺度分割,并结合实际毛竹定位来构建毛竹株数识别单元。以传统毛竹林立竹度测定结果对不同分类算法立竹度的提取效果进行验证,确定精度最优算法。
影像分析的前提条件是图像分割。图像分割就是将完整的一幅遥感影像分割成若干个与相邻小区差异性显著的区块,从而得到具有一定灰度、颜色、纹理特性的区域。基于特征差异性最小,相似性最大的规则,多尺度分割就是将影像中的一个像元点自上而下的进行区域合并,若异质性变化比阈值小,则合并,反之则不合并;而阈值是与设定的尺度大小相关[14],最后得到异质性最小,同质性高的影像对象斑块,这种斑块也就是影像对象[15]。针对无人机影像,选择能够更加有效的表达光谱特征的波段组合:蓝光波段(band1)、红光波段(band3)、近红外波段(band4)、归一化植被指数(NDVI),纹理特征均值(mean),作为分割对象[16]。分割尺度对分割的影响最大,形状指数次之,紧致度最小[17]。因此,取形状指数取值偏小,紧致度取值偏大,有利于分割结果解析。
几何特征是面向对象方法所特有的特征参数,用于选择分割对象的面积和形状,根据毛竹冠层形状特征,主要选择形状参数有形状紧密性、圆度和面积。有效的构建识别单元的决策,也能更加方便目视解译选择毛竹林立竹度识别单元的基础样本。
面积(A)是通过形成多边形对象的像元数进行计算的,如果影像没有坐标,单位为像元,若影像具有地理坐标,则单位与影像一致。
A=Pi×u2。
(1)
形状紧密性(C)是通过多边形的面积与具有相同周长圆的面积的比率计算得到的,是描述多边形的紧致度,其中圆的紧密性最好,其值为1/Pi。
在线自助游指通过互联网、移动互联网及电话呼叫中心等方式,为个人消费者在自主安排行程的过程中,提供部分行程中的旅游度假产品和服务的行业。
(2)
圆度(R)是通过4倍的对象面积与对象边长最大直径平方和面积的乘积的比值。
(3)
式中:Pi是圆周率;u是坐标系中像元的大小,若无单位则值为1;Av是指基于对象生成的多面形的面积;L多边形外轮廓周长;Dmax是对象边长最大直径。
针对分割后图像信息的提取,存在着许许多多的分类算法。考虑针对不同的目标物提取,分类算法的不同也会导致精度的存在差异性。为确立有效的分类方法,研究挑选以下应用较普遍的3类算法对毛竹林立竹度提取效果进行比较并以混淆矩阵的总体分类精度和Kappa系数作为其分类效果的判断指标[18],进而确定最佳分类方法。
K邻近法(KNN)是一种简单有效的机器学习算法,它是一种lazy-learning算法。该方法实现对样本的分类的思路是基于未知样本、已知样本之间的距离,根据距离大小找到邻近的两种样本,并将已知样本的类别赋予给未知的样本[19]。KNN最初被用于解决文本分类问题,后来被广泛应用于模式识别的各个领域,并且取得了很好的效果,基于前人的研究以及不断的测试误差、本研究参数选择K值为3。
支持向量机(SVM)是一种基于监督学习进行分类的分类器。其算法的实现主要包括核函数和相关参数的选取,通过寻找具有最大间隔的区间超平面,将其当作决策平面分类的数据。在针对于小样本和非线性、高维度的特征空间模式的识别问题上具有一定的优势,且可推广应用其他类型的机器学习中。对比前人研究结果,SVM核函数选用径向核函数、惩罚因子和核函数参数用默认参数。
随机森林(RF)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它对大量分类树进行汇总,提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型[20]。RF不需要顾虑一般多元共线性的问题,不用做变量选择。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用[21]。它不需要先验知识,只要通过对给定的已知样本进行学习形成一定的分类规则,它的构建过程主要由生成训练集、构建决策树及算法的生成3个方面[22]。基于ENVI扩展工具Random Forest Classification不断的误差分析及反复试验,本文RF选择模型参数决策树数量为100、最小样本为1。
基于面向对象分割的结果,结合实际定位数据对识别单元基础样本选取。在目视解译影像中,毛竹数量识别单元有3类,其中以1株毛竹和2株毛竹两种类型的识别单元为主,由于3株毛竹样本数过少,则不进行3株样本的统计分析,仅通过实际定位与目视判别选择样本。1株和2株的识别单元样本进行几何形状特征见图2,识别单元示意图如图3和图4。针对选择的毛竹株数识别基础单元,从1株和2株的识别单元中各随机选取了31个样本,并对其面积、紧密性以及圆度等进行统计分析如表1所示。
图2 样本几何形状示意图
图3 部分1株识别单元几何示意图
图4 部分2株识别单元几何示意图
基于识别单元的几何形状比较,1株毛竹样本的几何面积小于2株,几何面积总体小于等于3 m2,紧密性大于等于0.2、圆度0.6~0.7。2株毛竹基本单元的面积总体在4~8 m2,紧密性都小于0.2、圆度小于0.6;1株的圆度值比2株的圆度值更接近于1;1株的样本的紧密性较2株的样本值更接近于0.3(1/Pi)。由于影像边缘存在纹理、光谱信息的差异,导致1株毛竹和2株毛竹识别单元形状有所不同,但总体的趋势类型存在一致性。1株毛竹样本几何形状更趋近圆形,2株毛竹的几何形状趋近于长椭圆形,3株毛竹总体上近似于长条形。
基于识别单元的几何特征进行统计分析,结果见表1。从表格可以看出,1株毛竹识别单元的面积平均值为2.42 m2,对应的变异系数是25.88%;2株毛竹识别单元的面积平均值为6.69 m2,明显较1株的大,对应的变异系数是34.1%。而1株的紧密型和圆度分别为0.22、0.67,大于2株的紧密性和圆度。
表1 基于150 m高度的识别单元几何特征描述统计
基于面向对象分割和识别单元构建,本研究对比分析了不同分类方法(KNN、SVM和RF)对毛竹林无人机影像目标物识别的效果。通过3种密度模式的毛竹林中均随机选取4个样地,基于实际毛竹定位和样地株数,结合目视解译,在其中两个样地中选取40个不同地物的识别单元样本作为目标物识别的训练样本,得到结果见图5至图7,另外两个样地中选取了70个不同地物的识别单元(样本)用于精度验证,3种方法精度验证结果见表2。
基于图像分割和识别单元判定决策,采用3种分类方法进行毛竹林目标物识别。通过表2可知,在3种密度模式中,KNN与SVM在3 000株/hm2模式提取效果较佳,分别为92.88%、90.84%,Kappa系数为0.861 6、0.817 2。RF则在2 100株/hm2模式提取精度最好,其总体精度达95.99%,Kappa系数为0.931 6。并且RF在其他两种模式中精度分别为94.04%、93.66%,Kappa系数分别为0.878 4、0.915 0,其精度都明显大于其他两者。依据3类算法KNN、SVM、RF提取精度平均值分别为90.70%、89.64%、94.56%,Kappa系数为0.859 7、0.830 6、0.945 6,提取效果排序由大到小为RF、KNN、SVM。可以判断,RF算法是其中提取毛竹立竹度的最优分类方法。
毛竹林立竹度是影响毛竹林生长发育过程的一个重要因素,是竹林经济效益的重点指标之一。因此,研究毛竹林立竹度如何快速,大范围的提取具有重要的意义。为今后能够达到更好更有效的竹林资源的利用与管理奠定基础。本研究基于无人机多光谱遥感数据,利用了图像分割,以毛竹冠幅几何表达特点作为分类依据,构建毛竹林立竹度识别单元,结合不同分类算法实现对毛竹林立竹度的提取,并取得了一定的成果。
根据目视解译影像中毛竹冠层形状结合实际毛竹定位,将毛竹林立竹度的识别单元分成1株毛竹、2株毛竹、3株毛竹。基于图像分割,3类识别单元整体形状表达具有一致性。1株毛竹立竹度识别单元几何参数指标趋近于圆形,2株毛竹的识别单元的几何形状近似于长椭圆形;3株毛竹的识别单元几何形状与2株毛竹相似,但长度相对更长、近似于长条形。这取决于无人机多光谱的影像特征,为实现毛竹林立竹度提取的提供重要基础。本文采用面对对象多尺度分割实现多种地物信息的提取[23],解决了遥感影像中不同类型的地物存在“过分割”和“欠分割”现像,并取得较好结果。与郝泷等[24]基于面向对象分类法提取冠幅信息,实现天山云杉材积的提取具有一致性。为了提高毛竹林立竹度的提取精度,对比分析3种分类方法对立竹度的提取效果,结果证明:RF对毛竹林立竹度提取的平均总体精度高达94.56%,Kappa系数为0.908 3,是这3种分类中提取效果最佳的。不同的分类方法对不同类型数据处理存在一定差异性,KNN的分类实质主要取决于测试示例与训练示例之间的相似度[25],在面对研究区样本容量过大情况,可能导致样本中极少的3株类别被忽视。SVM则是最初在线性可分情况下寻求最优分类面,是为解决二类分类问题提出来,然而面对研究区多普遍存在的多分类问题存在一定困难[26],导致这两类方法分类精度略低。反观RF在数据集表现良好,且精确度比较高,既能处理离散型数据,也能处理连续型数据[27],故结合面对对象多尺度分割和RF算法可以实现毛竹林立竹度更高精度提取,为今后竹林经营提供一定参考。
本研究利用毛竹尾梢几何形状特征与面对对象多尺度分割将遥感影像目标物分成3类识别单元,基于最优算法进行目标物单元识别,既可以避免对于样本选择的主观性,又能够快速有效的选择样本,最终实现了毛竹林立竹度精准提取。通过与实地调查中不同类型毛竹的实际位置进行比较发现绝大部分毛竹株数类型与识别单元具有一致性。然而由于毛竹林中存在的异质性和复杂性、地形差异以及毛竹高低不同,导致毛竹与毛竹冠层间存在交叉重叠,使得极少部分2株毛竹重叠情况未能分割而影响精度。因此,对于毛竹林中存在的冠层重叠现象,尤其是冠幅边缘的精准定位仍存在难点。并且毛竹林广泛分布于400~800 m的丘陵、低山山麓地带,多位于中国南方多低山丘陵地区。此处地形呈现出高低起伏的状态,而空间、生态学和地理学的特征和变化往往伴随着复杂的尺度效应[28],影响结果精度。因此,可以引入不同空间指标(如不同航高)和高精度的DEM数据以减少对毛竹林立竹度提取精度的影响,这还有待进一步的探讨分析。