基于随机森林的高光谱遥感图像分类

2017-06-06 12:00王婷北方民族大学
数码世界 2017年5期
关键词:决策树波段分类器

王婷 北方民族大学

基于随机森林的高光谱遥感图像分类

王婷 北方民族大学

针对高光谱遥感图像分类精度较低的问题,本文提出了基于随机森林的分类算法,首先采用主成分分析法对高光谱遥感数据进行降维,并在降维后形成的主成分空间中利用随机森林分类器进行分类。为了反映该分类算法在高光谱遥感数据方面的优越性,分别与支持向量机(SVM)、随机森林(RF)进行对比分析。实验结果表明,基于主成分空间的随机森林分类模型对分类具有较高的准确率和较优的效率。

高光谱遥感图像 主成分分析 随机森林 机器学习

1 引言

由于高光谱图像的波段数量较多且波段间相关性较高,图像光谱信息所包含的高维特征集,反而可能会导致分类精度随着特征维度的过分增长而呈现下降趋势,因此一般会通过降维或特征波段选择的方式选取有限的波段来参与分类识别。主成分分析(PCA)是通过数学变换将多波段的图像信息压缩到比原波段更有效的少数几个转换波段,降低特征的维数,减少波段之间的冗余,以广泛应用于高光谱图像处理中。随机森林(RF)是一个以决策树为基础分类器的集成分类器。其分类表现优异,能提供在当前流行的同类算法中顶级的准确性,能在类大小分布不平衡的情况下保持分类误差平衡,而且有非常快的运算速度。

2 基于随机森林的高光谱遥感图像分类算法

2.1 主成分分析

2.2 随机森林

图1 肯尼迪航天中心数据集

RF是基于CART决策树的组合分类器。首先,从给定的训练集通过多次随机的可重复的采样得到多个bootstrap数据集并对每个数据集构造一棵决策树。在每个叶节点处通过统计训练集中达到此叶节点的分类标签的直方图经验的估计此叶节点上的类分布。一直迭代到用户设定的最大树深度或者直到不能通过继续分割获取更大的信息增益为止。在分类预测阶段,对一个输入样本迭代地根据训练得到的RF中的各个决策树进行或左或右的分支,直到各决策树的叶节点,各个叶节点的类分布就是这棵树的分类结果。通过(3)式平均各棵树的叶节点上的分类分布就得到了整个随机森林的对此输入样本的分类结果。

其中T是森林中树的数目,c是某一个特定的类,P是概率函数。

3 实验

本文采用AVIRIS获取的美国佛罗里达州肯尼亚中心实验区高光谱遥感图像。图像大小为614*512像素,空间分辨率18m,如图1所示。

本文步骤:对原始高光谱遥感图像数据进行主成分分析,将原始数据投影到主成分方向上;在主成分空间中随机选取70%训练样本训练随机森林分类器。其余30%作为测试样本。通过实验,对SVM、RF、PCA-RF三种算法进行对比分析,分类结果如表1所示:

表1 分类结果

从表1的结果中可得:RF分类精度明显优于SVM,但两种算法运行时间相当。本文提出的算法分类精度优于RF算法,提高了0.62个百分点;与此同时算法时间也比RF快3.25s。实验结果表明本文算法能够有效的提升高光谱遥感图像分类的精度。

[1]张良培,张立福.高光谱遥感[M].北京:测绘出版社,2011

[2]Prasad S, Bruce L M. Limitations of principal components analysis for hyperspectral target recognition[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5( 4) : 625—629

[3]雷震,随机森林及其在遥感影像处理中应用[D].上海交通大学,2012

[4]陈佩.主成分分析法研究及其在特征提取中的应用[D].陕西师范大学,2014

[5]王书民,张爱武,胡少兴.基于随机森林算法的航空高光谱数据分类方法研究[J].科学技术与工程,2016,21(6):83-87

[6]Pal, M. Random forests for land cover classification[J]. IEEE, 2003

王婷(1992—),女,汉族,甘肃庆阳人,工学硕士,单位:北方民族大学计算机学院软件工程专业,研究方向:遥感图像处理。

猜你喜欢
决策树波段分类器
最佳波段组合的典型地物信息提取
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
决策树和随机森林方法在管理决策中的应用
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
基于差异性测度的遥感自适应分类器选择
L波段kw级固态功放测试技术
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖