吴雪娇 王威 王芳
摘要:从林业行业应用出发,针对国产GF-1卫星数据的特点,采用决策树分类方法对影像采伐信息进行提取,探索了国产GF~1卫星数据在森林资源采伐信息提取方面的应用关键技术,为国产卫星数据的行业推广应用奠定理论基础。研究结果表明:决策树分类方法能够更有效地对伐区图斑分类提取,经过Kappa分析,测试区伐区影像提取精度从大到小分别为:水域分类精度96.71%,森林分类精度89.79%,伐区分类精度82.49%,公路分类精度75.30%,农田分类精度71.18%,建筑分类精度56.26%,其他分类精度53.57%。总体分类精度为87.34%。
关键词:决策树分类;GF-1卫星影像;森林采伐;信息提取
中图分类号:P237文献标识码:A 文章编号:1674-9944(2019)14-0225-03
1引言
森林资源状况和消长变化动态数据是国家制定国民经济和社会发展规划、社会可持续发展战略、国家生态安全规划及编制林业规划计划、指导林业生产建设的重要依据,森林资源采伐信息是森林资源监测的重要组成部分。由于森林采伐作业方式不同、不同区域采伐发生的时间节点不同、采伐的位置具有随机性等特点,给采伐信息的获取带来较大的困难,原有的地面踏查获取采伐信息的方法,存在着工作量大、劳动强度大、成本高、周期长、效率低、时效性差等问题,经过多年的研究和实践工作证明,利用现代遥感技术,通过对卫星遥感影像信息提取,能够很好地解决这一问题。特别是近年来,随着国产卫星数据的不断涌现,如何利用国产高分辨率卫星数据服务于林业行业是目前研究的热点。
2研究方法
2.1算法原理
决策树是由连接的节点所组成,存在2种类型的节点:决策节点和叶子节点。决策节点存放被检验的运算表达式,子叶节点存贮的是父节点的运算结果。通过一系列二叉决策分支,将像元归入到适当的类别,每条决策都通过特定表达式,将一系列影像中的像元归为2类。依此类推,决策的最终结果是获取一系列处于子节点上的专题类别。其中,CART(Classification and Re-gression Tree)是一种监督学习算法,充分体现决策树算法理念。CART是Breiman于1984年提出的决策树构建算法,其基本原理是通过对由测试变量和目标变量构成的训练数据集的循环分析,而形成二叉树形式的决策树结构;CART决策树采用二分递归划分,在分支节点上进行布尔测试,判断条件为真时的划归右侧分支,否则划归左侧分支。
2.2训练样本的确定
在决策树分类过程中,训练区选择对分类精度的高低有重要影响。选择训练区的目的是为了估计每一地物类型的特征参数,决策树采伐信息提取时,训练样本的选取注意以下两点:第一,样本点的选择要具有典型性,能很好的代表该地物类型的光谱分布模式。这就要求在选择训练样本时,应该在中心位置选择。第二,样本点的选取要具备完备性,指对于图像中待分类的每一个类型,如果其存在许多亚类,就必须从其所有的子集中选择像,组成复杂的训练样本作为其大类的训练区,使得训练区的统计结果能反映每一类型。研究区地貌,高山地形突出,以林地为主,周边存在部分裸地与道路建筑,河流较少。根据遥感资料的可判读性、研究成果的实用性及研究区域的地域性等基本原则,结合土地分类的地域特点,考虑该地区无明显的河流,所以去掉这一地类;本研究的重点为森林采伐信息,故将林地分为采伐森林(伐区)、森林农田、水体、道路和建筑这6个主要地类,重点研究森林采伐信息的提取(表1,图1)。
3研究结果
研究中决策树的生成过程(图2),在对每个节点进行分支时,首先要确定一个最佳的分支预测变量以及该预测变量的最佳分支阈值点。在每个节点上添加叶子节点并输入运算规则,对规则中所引用的变量需指定链接的波段代号。最后进行类聚合、类统计等后处理。经过分析,最终选取包括校正好的GF-1影像的3个波段,NDVI、PVI、GVI、纹理测度中的方差、對比度,共9个波段参与最终的分类(图3)。
水域分类精度为96.71%,农田分类精度为71.18%,其他分类精度为53.57%,森林分类精度为89.79%,伐区分类精度为82.49%,公路分类精度为75.30%,建筑分类精度为56.26%,总体分类精度为87.34%。
4结论与讨论
研究结果表明,决策树分类方法能够更有效地对伐区图斑分类提取,实验数据森林分类精度达到89.79%,伐区分类精度达到82.49%,能够满足一定精度要求下的森林资源管理工作。研究过程中也发现,特征变量的选取和特征维数的确定对于决策树分类精度有着重要的影响作用,因此,森林采伐信息相关的影像特征变量研究是进一步研究的关键工作。