舒阳,李少丹,李京,2,唐宏,2,史晓霞,杜红悦
(1.北京师范大学地表过程与资源生态国家重点实验室,北京100875;2.北京师范大学环境演变与自然灾害教育部重点实验室,北京100875;3.北京物资学院物流学院,北京100025;4.中华测绘技术服务公司,北京100088)
结合空间像素模板和多类AdaBoost的高分影像分类
舒阳1,李少丹1,李京1,2,唐宏1,2,史晓霞3,杜红悦4
(1.北京师范大学地表过程与资源生态国家重点实验室,北京100875;2.北京师范大学环境演变与自然灾害教育部重点实验室,北京100875;3.北京物资学院物流学院,北京100025;4.中华测绘技术服务公司,北京100088)
高分辨率遥感影像分类是遥感图像理解的基本问题之一,也是许多其他遥感应用的前提。为解决目前基于像素分类方法空间关系描述不足的问题,该文利用空间像素模板构建像素间的空间关系,并结合多类AdaBoost算法实现高分辨率遥感影像的分类。首先利用过滤式特征选择方法自动生成空间像素模板,进而构建考虑空间关系的多维特征向量,最后利用基于指数损失函数的多类AdaBoost方法对多维特征进行分类。对不同场景影像开展实验,结果表明,该文方法利用空间像素模板引入空间信息,可有效实现高分辨率遥感影像分类。与其他方法相比,分类精度显著提高(约20%),能够更好地区分光谱相似地物,同时分类结果“椒盐效应”大大降低,具有良好的空间一致性。
多类AdaBoost;空间像素模板;空间信息;高分辨率遥感影像;分类
随着国内外高分辨率遥感卫星的相继发射以及航空影像获取能力的提高,高分辨率遥感影像逐渐成为对地观测和空间信息获取的重要手段之一[1-2]。高分辨率遥感影像及其成果已广泛应用于测绘[3]、国土调查[4]、环境评价[5]和灾害监测[6]等领域。
高分辨率遥感影像分类是遥感图像理解的基本问题之一,也是许多其他遥感应用的前提。与中低分辨率影像相比,高分辨率遥感影像能提供大量丰富的空间细节,地物表现力大大增强。然而当传统基于像素的分类方法用于高分辨率影像分类时,分类结果表现为类内差异变大,类间差异变小,“椒盐效应”严重。大量研究表明,充分利用高分辨影像的空间信息可以有效提高影像分类精度。面向对象分类是目前最常用的高分影像分析方法,该类方法一般包括两个步骤:首先对影像进行分割以形成均质的区域,即“对象”;然后利用分类算法进行分类。其分析基元为均质的“对象”,可充分利用几何、纹理等多种空间关系[7-8],提高了分类精度。此类方法严重依赖分割结果,而如何形成语义分割对象仍未解决,需要大量的人工交互式干预[9],这限制了该类方法的应用。另一类方法利用邻域像素的信息辅助对中心像素的分类。此类算法以单个像素为分析基元,充分考虑临近像素的空间上下文信息从而获得好的分类结果。目前对基于邻域空间关系的建模进行了大量研究。马尔科夫随机场(MRF)模型通过定义合适的邻域系统对图像进行概率建模,可以充分利用像元间的相互关系进行分类[10]。数学形态学的方法通过开闭运算提取像元邻域的空间信息[11]。目前利用空间邻域信息进行高分辨率遥感影像分类的技术已经在商业软件Feature Analyst中得到成功运用[12]。而如何确定最佳邻域特征成为该类方法的关键问题。
影响遥感影像分类结果的另一个重要因素是分类器的选择。许多机器学习领域的算法被用于高分辨率遥感影像分类,如支持向量机(SVM)、AdaBoost等[13-14]。其中AdaBoost算法由Freund于1995年在Boosting算法的基础上改进而来,其主要特点是将多个弱分类器利用投票方式组合成一个强分类器,从而得到精度较高的分类结果[15]。AdaBoost算法最初是解决两类分类问题,对于多类问题通常转化为多组两类问题进行处理,这限制了其应用。Zhu提出的基于最小化指数损失函数的多类AdaBoost(multi-class AdaBoost,mc-AdaBoost)可直接处理多类问题[16],具有更好的普适性。
基于以上分析,本文提出综合利用空间像素模板和mc-AdaBoost算法对高分辨率遥感影像进行分类的方法,其算法流程如图1所示。首先利用特征选择的方法自动生成度量空间邻域模式的空间像素模板,进而构建具有空间信息的多维特征,最后利用mc-AdaBoost算法直接对像素的多维特征进行分类。
图1 算法流程
本文算法的关键是空间像素模板的选择。空间像素模板定义为一个矩形窗口,用于表征像素间空间相关关系特征的邻域模式。窗口内任意一簇像素组合都是空间邻域特征的一类模式,如图2(a)所示为5×5的窗口的一种空间像素模板,蓝色部分代表被选择的邻域像素。
图2 空间像素模板和特征向量构建
空间像素模板通过选定的周围像素来引入空间关系,而如何选择周围像素成为问题的关键。慎利等[17]在文章中提出基于过滤式特征选择的空间像素模板生成方法,并将其应用于高分辨率遥感影像河流提取。该方法通过定义相关性函数,其充分考虑像素间的空间关系,进而构建有效的邻域模式,为本文选择的方法。
本文选择采用多类AdaBoost对融入空间信息的高维特征向量进行分类。AdaBoost算法是在Boosting算法的基础上改进而来,是组合分类器的典型代表,最初应用于人脸识别[15]。该算法自从提出以来受到人们的广泛关注,目前已广泛应用于手写识别[18]、故障诊断[19]、图像分类[20-21]等领域。其基本思想是将若干弱分类器通过投票方式组合形成强分类器,从而得到具有很高精度的分类结果。研究表明,这种组合分类器的方法比采用单一分类器可以得到更高的分类精度[22]。AdaBoost算法最初只能用于解决两类问题,为了解决多类问题研究人员提出了AdaBoost.M1,AdaBoost.M2,AdaBoost.MH等一系列改进算法。这些改进一般是将多类问题分解为多个两类问题,仅适合处理类别数较少的情况,且具有过程复杂,计算量大的缺点。其中研究表明,AdaBoost.MH算法是现有多类算法中精度较高的,因此本文选择其作为新算法的比较对象。本文引用Zhu[19]提出的基于最小化指数损失函数的mc-AdaBoost,可直接对空间像素模板构建的高维特征向量进行分类。
2.1 实验数据
为验证本文方法在不同场景下的有效性,选用两幅不同场景的高分辨率遥感影像,即一幅北京密云郊区Pleiades 1A卫星多光谱影像(1000像素× 1000像素,4个波段,分辨率2m,如图3(a)所示)和一幅意大利佩斯卡拉城区QuickBird卫星多光谱融合影像(1000像素×1000像素,3个波段,分辨率0.6m,如图4(a)所示)作为实验数据。
通过对两幅影像进行分析,Pleiades 1A多光谱数据为郊区高分辨率影像,主要包括:河流、道路、建筑、植被和裸地等地物类型。QuickBird多光谱数据为典型的城市高分辨率影像,其主要地物包括:树木、草地、建筑、道路和阴影。由于该影像分辨率较高,阴影比较明显,因此将其作为单独一种类型进行分类。
2.2 实验设计
为了验证本文方法的正确性与有效性,本文将其与现有的已经证明比较有效的分类方法进行比较,即AdaBoost.MH和支持向量机(SVM)算法。每幅影像的所有方法采用相同的训练样本(图3(b)与图4(b)所示)。分类与回归树(CART)是一种简单有效的分类方法。本文方法和AdaBoost.MH方法均采用CART作为弱分类器,弱分类器个数设置为300,最大迭代次数均为300,其中CART方法选择最小误分率作为分支度量指标。SVM分类方法选择径向基函数(RBF)作为其核函数,惩罚因子设为100。
2.3 结果分析
(1)郊区场景结果分析
本实验将该遥感影像分为河流、道路、建筑、植被和裸地5类,其中建筑与道路、裸地在光谱值上存在一定的重叠,容易发生混淆。根据图1所示的流程图,利用前文介绍的过滤式特征选择方法自动生成空间像素模板(图3(c)),进而形成考虑邻域像素信息的高维特征向量,然后选择一定数量的训练样本(图3(b)),最后利用样本训练得到的 mc-AdaBoost进行分类。由于影像中主要地物基本呈现条形分布(河流、道路等),因此获得的空间像素模板亦为长条结构。各种方法分类结果分别如图3(d)~图3(f)所示。
从视觉角度分析,由于AdaBoost.MH和SVM方法采用单像素作为分析基元,其分类结果斑块比较破碎,存在严重的“椒盐效应”。相反地,本文方法利用空间像素模板获取不同地物的依存关系,将像素间的空间相关性引入分类过程中,利用邻近像素的类别辅助判定中心像素的类别,因而分类结果具有很高的空间一致性。此外,通过比较发现本文的方法能够很好地区分建筑、道路和裸地,特别是较小的道路也得到了很好的区分;AdaBoost.MH方法中道路分类效果较好,而建筑和裸地发生了混淆;SVM方法中建筑、道路与裸地均发生了严重的混淆。这主要是由于三类地物光谱有重叠,SVM无法找到较好的支撑向量进行区分。而本文方法由于考虑邻域像元的信息,在高维特征上三类地物区分明显,因此可以获得较好的分类结果。
为了对分类结果进行定量评价,本文在原始影像上随机选取1172个样本点,对其进行类别标识后与分类结果比较分析,从而得到定量的精度评价。本文方法与其他方法的精度评价如表1所示,总体精度与Kappa系数的比较见表3。
从表1可以看出,总体上各类方法对水体和植被两类地物分类效果均较好,本文方法较其他两种方法精度略高。本文方法在道路和建筑两类地物分类精度大大高于其他两种方法,而由于两类地物光谱重叠,AdaBoost.MH和SVM方法均将部分建筑误分为道路,导致分类精度降低。3种方法对裸地分类精度均不高,但较之其他两种方法,本文方法对裸地分类精度仍显著较高(约10%)。此外,针对各类地物3种方法分类精度由高到低依次为本文方法、AdaBoost.MH方法和SVM方法。说明本文方法对各类地物均能得到较好的区分,获得比较高的分类精度。从总体上看(如表3所示),本文方法总体精度达到88.99%,Kappa系数为0.8586,显著高于其他两种方法,精度提高约23%,表明本文方法优于其他方法。同时需要指出的是AdaBoost.MH方法比SVM方法具有更高的分类精度,这是由于该类方法通过将弱分类器加权集成为强分类器,使其能够区分较为相似的样本,提高了分类器的泛化能力。
(2)城区场景结果分析
该遥感影像是典型的城区影像,其中树木和草地在光谱上有重叠,容易发生混淆。同时屋顶类型多样,光谱较为复杂,容易与其他地物产生混淆。如图4(b)所示,选择一定数量的训练样本用于分类器学习。根据特征选择的方法生成空间像素模板,如图4(c)所示,由于影像内地物以建筑为主,空间像素模板呈现方形结构。各种方法分类结果分别如图4(d)~图4(f)所示。
从视觉上看,本文方法与其他两种方法相比具有更好的空间一致性。同时,对建筑与道路进行了更好的区分,而其他方法均有许多建筑被误分为道路的情况。这是主要是由于本文方法通过空间像素模板利用邻域像素信息辅助分类,而阴影一般伴随建筑出现,因此本文方法中阴影的信息提高建筑的识别精度。同理,本文方法能够对树木和草地进行有效识别。
通过对随机选择1728个样本点进行类别标注,并与分类结果比较分析获得定量的精度评价。从表2中可以看出,本文方法对各类地物的识别精度均高于其他两种方法。本文方法对草地和树木两类光谱相似地物的分类精度高于其他两种方法。AdaBoost.MH和SVM方法将草地误分为树木,导致精度降低,尤其是SVM方法的草地分类精度极低;本文方法由于考虑阴影信息对树木的辅助分类,因此能对草地和树木进行有效区分。同理,本文方法对建筑和道路的分类精度也较高,而其他两种方法将建筑与道路产生混淆。本文方法中阴影的分类精度也高于其他方法。针对以上各类地物,3种方法的分类精度由高到低依次为本文方法、AdaBoost.MH方法和SVM方法。总体上(如表4所示),本文方法在总体精度和Kappa系数上均优于其他方法,精度提高约24%,充分表明其能有效地实现对高分辨率遥感影像的分类。
图3 原始Pleiades 1A影像、训练样本与不同方法影像分类结果
表1 Pleiades 1A影像不同方法精度评价
图4 原始QuickBird影像、训练样本与不同方法影像分类结果
表2 QuickBird影像不同方法精度评价
表3 Pleiades 1A影像不同方法总体精度和Kappa系数
表4 QuickBird影像不同方法总体精度和Kappa系数
在高分辨率遥感影像分类中,如何利用影像的空间信息以及合适的分类器成为获得良好分类结果的关键。本文针对该问题,提出一种利用空间像素模板和基于最小化指数损失函数 mc-AdaBoost方法用于高分辨率遥感影像分类。为利用空间关系进行高分辨率遥感影像分类,该方法通过过滤式特征选择的方法确定最佳的空间邻域范围,继而形成融入邻域空间关系的高维特征向量,最后利用mc-AdaBoost集成学习算法实现影像分类。本文选择CART做为弱分类器,在不同场景的高分辨率遥感影像上开展实验。实验结果表明,本文方法利用空间邻域信息可有效实现高分辨率遥感影像分类,与其他基于像素的方法相比大大提高了分类精度(约20%),能够更好地区分光谱相似地物。同时分类结果“椒盐效应”大大降低,具有良好的空间一致性。
[1] 李德仁.论21世纪遥感与GIS的发展[J].武汉大学学报(信息科学版),2003,28(2):127-131.
[2] 李德仁,童庆禧,李荣兴,等.高分辨率对地观测的若干前沿科学问题[J].中国科学:地球科学,2012,42(6):805-813.
[3] 张永生,刘军.高分辨率遥感卫星立体影像RPC模型定位的算法及其优化[J].测绘工程,2004,13(1):1-4.
[4] 朱晓华,丁晶晶,刘彦随,等.村域尺度土地利用现状分类体系的构建与应用[J].地理研究,2006,29(5):883-890.
[5] 程承旗,李启青,沙志友,等.城市居住单元环境质量的高分辨率遥感评价方法研究[J].地球科学进展,2006,21(1):24-30.
[6] 胡德勇,李京,赵文吉,等.基于对象的高分辨率遥感图像滑坡检测方法[J].自然灾害学报,2009,17(6):42-46.
[7] STUMPF A,LACHICHE N,MALET J,et.al.Active learning in the spatial domain for remote sensing image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2492-2507.
[8] ZHANG P,LV Z,SHI W.Object-based spatial feature for classification of very high resolution remote sensing images[J].IEEE Transactions on Geoscience and Remote Sensing Letter,2013,10(6):1572-1576.
[9] DOS S J,GOSSELIN P,PHILIPP-FOLIGUET S et.al.Interactive multiscale classification of high-resolution remote sensing images[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2013,6(4):2020-2034.
[10] TSO B,OLSEN R C.A contextual classification scheme based on MRF model with improved parameter estimation and multiscale fuzzy line process[J].Remote Sensing of Environment,2005,97(1):127-136.
[11] PESARESI M,BENEDIKTSSON J A.A new approach for the morphological segmentation of high-resolution satellite imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2001,39(2):309-320.
[12] 牛春盈,江万寿,黄先锋,等.面向对象影像信息提取软件Feature Analyst和eCognition的分析与比较[J].遥感信息,2007,22(2):66-70.
[13] MOUSTAKIDIS S,MALLINIS G,KOUTSIAS N,et al.SVM-based fuzzy decision trees for classification of high spatial resolution remote sensing images[J].IEEE Transactions on Geoscience and Remote Sensing,2012,50(1):149-169.
[14] 龚健雅,姚璜,沈欣.利用AdaBoost算法进行高分辨率影像的面向对象分类[J].武汉大学学报(信息科学版),2010,35(12):1440-1443.
[15] FREUND Y.Boosting a weak learning algorithm by majority[J].Information and Computation,1995,121(2):256-285.
[16] ZHU J,ZOU H,ROSSET S,et al.Multi-class AdaBoost[J].Statistics and Its Interface,2009,2(3):349-360.
[17] 慎利,唐宏,王世东,等.结合空间像素模板和Adaboost算法的高分辨率遥感影像河流提取[J].测绘学报,2013,42(3):344-350.
[18] 丁晓青,付强.一种适用于超多类手写汉字识别的新改型Adaboost算法[J].中国工程科学,2009,11(10):19-24.
[19] 李胜,张培林,佟若雄.基于多类AdaBoost的故障诊断算法[J].电子测量技术,2011,34(8):101-105.
[20] 周红英,蔺启忠,吴昀昭,等.基于AdaBoost的组合分类器在遥感影像分类中的应用[J].计算机应用研究,2007,24(10):181-184.
[21] 许凯,秦昆,杜鹚.基于AdaBoost的高分辨率遥感影像城市绿地提取算法[J].计算机工程与应用,2009,44(20):63-25.
[22] BIGDELI B,SAMADZADEGAN F,REINARTZ P.A multiple SVM system for classification of hyperspectral remote sensing data[J].Journal of the Indian Society of Remote Sensing,2013,41(4):763-776.
Classification of High Resolution Remote Sensing Image by Combining Spatially Correlated Pixels Template and Multi-class AdaBoost
SHU Yang1,LI Shao-dan1,LI Jing1,2,TANG Hong1,2,SHI Xiao-xia3,DU Hong-yue4
(1.State Key Laboratory of Earth Surface Processes and Resource Ecology,Beijing Normal University,Beijing100875;2.Key Laboratory of Environmental Change and Natural Disaster,Ministry of Education,Beijing Normal University,Beijing100875;3.Logistics School,Beijing Wuzi University,Beijing100025;4.China Mapping Technology Service Corporation,Beijing100088)
The classification of high resolution remote sensing image is one of the basic problems in remote sensing image understanding.In order to solve the problem of the classification of remote sensing image based on pixel,a method is proposed in this paper by combining the spatially correlated pixels template with multi-class AdaBoost to obtain the classification of high resolution remote sensing image.Firstly,a specific form of spatially correlated pixels is generated by using the feature selection based on filter.Then,the feature vectors are formed using the spatially correlated pixels template,which contain the spatial information.Finally,a multi-class AdaBoost algorithm based on the exponential loss function is used to classify these feature vectors.Experimental results show that the proposed method is used to classify the high resolution remote sensing images effectively,which builds the spatial information with the spatial pixel template.Compared with other methods,the accuracy of classification results of the proposed method is higher(about 20%).Meanwhile,the result of proposed method has better spatial consistency with lower effect of pepper and salt.The confusing geo-objects which have similar spectral characteristics can be distinguished well by the proposed method.
multi-class AdaBoost;spatially correlated pixels template;spatial information;high resolution remote sensing image;classification
10.3969/j.issn.1000-3177.2015.04.020
TP751
A
1000-3177(2015)140-0115-06
2014-06-05
2014-11-26
国家高技术研究发展计划课题(2012AA121302);国家科技支撑计划课题(2012BAH27B01、2012BAH27B03)。
舒阳(1987—),男,博士研究生,主要研究方向为遥感图像处理与模式识别。
E-mail:sysun@mail.bnu.edu.cn