路开宇,宋 音
(1.河海大学 地球科学与工程学院,江苏 南京211100)
面向对象的刺槐林健康等级分类方法
路开宇1,宋 音1
(1.河海大学 地球科学与工程学院,江苏 南京211100)
以高分辨率IKONOS影像为数据源,将呈区域性分布的刺槐林划分为孤岛、军马场和黄河故道3个地区;采用面向对象的方法,结合随机森林算法,筛选出基于J-M距离确定的最佳窗口和方向的8个纹理特征及2个植被指数特征中较为重要的特征。结果表明,孤岛地区的最佳分割尺度为3、军马场地区的最佳分割尺度为12,尺度9和3在黄河故道地区不同健康类型中有不同的优越性;最佳纹理窗口为13×13,最佳纹理方向为45°。结合实地样方数据进行精度评价得到孤岛地区的总精度为91.15%、军马场地区为87.57%、黄河故道地区为91.57%,与实地样方数据具有较好的一致性。该方法可为森林退化监测制图、防护林恢复及区域生态建设提供科学思路。
面向对象;刺槐林;纹理信息;随机森林
近年来,随着遥感技术的发展,图像分辨率越来越高,传统的基于单个像元获得统计信息的方法已不太适应高分辨率遥感影像分类的需求。刺槐林的健康分布状况是连续性片段的状况,单个像元尺度已不能完整表示一定刺槐区域整体的健康状况;而面向对象的分类方法可以充分利用像元的空间、纹理、上下文等特征信息[1],形成以区域对象特征为处理单元的新方法,突破了传统影像分析方法以单个像元为处理单元的局限。
本文以高分辨率的IKONOS影像为数据源,以黄河三角洲人工刺槐林为研究对象,采用面向对象的方法,结合光谱信息、实地样方数据所确定的纹理信息,通过随机森林算法选出较为重要的特征,再根据尺度信息创建的分类规则集对刺槐林健康状况进行等级分类,以期为黄河三角洲生态过程作用模式及其生态效应的研究提供理论参考。
1.1 研究区概况
黄河三角洲位于渤海南部黄河入海口沿岸地区,山东省东北部,总面积为5 400 km2,主要处于东营市境内(图1),属温带大陆性季风气候,年平均降水量为551.6 mm[2]。研究区原生植被为禾草和灌木类,无乔木。刺槐具有一定的抗旱、耐盐碱能力,是世界主要速生阔叶树种之一,适应力强,生长快,材质好,用途广,繁殖容易,具有防风固沙、水土保持的功能,是黄河三角洲地区主要的造林树种之一[3]。研究区人工刺槐林主要分布在孤岛、军马场、黄河故道和大汶流自然保护区4个地区。除了刺槐林,还种植有白杨、白蜡、榆树、臭椿等乔木,但面积较小。
1.2 研究资料
1.2.1 遥感数据
本文采用2013-06-09获取的IKONOS影像,包括4个波段多光谱影像和1个波段全色影像(空间分辨率分别为4 m和1 m),覆盖研究区面积为140 km2。图像质量很好,无云覆盖,无噪声,该时间为刺槐生长季,光谱特征较明显,适合健康等级划分。
1.2.2 实测数据
5月、6月为刺槐的生长期,野外调查采样时间为2013-05-15~2013-05-26和2014-05-29~2014-06-09。为了能更好地适应影像,实地调查选取有代表性且能到达的3种健康类型的样地进行数据采集。在样地选取时,尽量选择周围刺槐林冠生长状况近似的地区,共采集了75个样地的林冠调查数据,其中健康或轻度枯梢样地30个,中度枯梢样地21个,重度枯梢或死亡样地24个。野外调查采用双层采样方案:首先选取刺槐林生长状况均一的30 m×30 m的正方形样地为第一层样方;再选取样方内的4个角以及正中间的5 个10 m×10 m的正方形作为第二层次样方,总计375个次样方(75×5 = 375),并用差分GPS定位每个样方四角处的坐标。根据美国林业局林冠健康分类指南[4],在每个样方内选择一颗平均木,测量并计算活冠高、郁闭度、冠幅、叶片透光度、树冠死亡率等5个表征林冠生长状况的活力指标,再取5个次样方的平均值作为该样方活力指标统计值。研究区及样地调查位置分布和结构示意图如图1所示。
图1 研究区范围及样地调查范围
2.1 刺槐林范围的提取
利用IKONOS四个多光谱波段与全色波段融合后的影像计算归一化植被指数(NDVI)和土壤调节植被指数(SAVI);再根据野外调查结果,定义相应的阈值提取刺槐林地分布范围,并在ArcGIS中修改;最后作掩膜提取IKONOS影像内刺槐林地的范围。
2.2 影像分割
应用面向对象的方法对高分辨率遥感影像进行分类时,首先要进行影像分割,其实质是产生一个类群[5]。eCognition提供了一个多尺度分割的有效方法:通过识别像元相似性,使相邻相似像元合并,产生影像单元[6]。
本文利用控制变量法依次设置分割过程中的尺度参数、形状参数以及紧致度参数。首先,基于局部方差和自相关性的比较,通过迭代算法[7]的最佳尺度评估工具(ESP)[8]来确定最佳分割尺度;而考虑到研究区中刺槐林主要集中分布在3个区域,各区域刺槐林的树龄等情况不同,使得分割时确定的分割尺度参数有可能不同,所以将研究区刺槐按区域分割成孤岛、军马场、黄河故道3部分,分别确定各区域的最佳分割尺度参数。然后,在确定最佳尺度参数的基础上,对研究区的形状参数和紧致度参数进行设置。
2.3 特征提取
2.3.1 植被指数
植被指数是反映植物生长状况的指标,可定量说明植被的生长状况[9]。目前应用最广泛的植被指数是NDVI,而刺槐林地表尤其是重度枯梢地表所裸出的土壤会对NDVI产生一定的影响,为了修正土壤背景对NDVI的影响,Huete A R[10]通过改善与叶面积指数的线性关系,提出了SAVI。将这两个植被指数相结合,可以更好地反映刺槐林枯梢退化的趋势。
2.3.2 纹理特征
遥感影像的纹理信息不仅反映了影像的灰度统计信息,而且反映了地物本身的结构特征和地物的空间排列关系[11]。纹理变量的选择往往会对分类结果产生较大影响,合理地选择分类变量可提高分类的精度[12]。在本文从多光谱波段中提取的刺槐林健康状况的训练样本的每个统计量中,波段4是区分健康等级的最佳波段。因此,本文利用基于波段4提取的灰度共生矩阵来描述刺槐林健康状态的空间分布特征。
而纹理又是多尺度现象,较小窗口的纹理计算值能反映单个树冠的健康状况,而大的计算窗口则反映了样方林冠信息[13]。此外,考虑到研究区刺槐林为人工种植,具有一定的规整性,不同方向的纹理特征同样能反映出不同的信息。基于条件概率理论的可分离性指标J-M距离能够合适地表达地物特征类的可分性[14],从而选择最佳的纹理窗口大小和方向。
结合实地样方信息,本文分别计算了3个地区不同健康等级之间的J-M距离,从而确定了纹理特征的最佳窗口大小和方向。
2.3.3 特征选择
纹理及光谱特征可以提高遥感影像的分类精度,然而所提取的特征信息越多,产生的冗余量也就越大,降低了计算的效率。因此,选择较少且有效的特征既可提高分类精度,又可提高计算效率。由于随机森林算法可对变量进行重要性评价,掌握各变量的影响度[15],因此本文利用随机森林算法对变量重要程度进行排序,选取较为重要的特征参与分类。
3.1 分割参数的确定
以1为最小尺度,1为步长来运行ESP工具,得到孤岛、军马场、黄河故道3个区域的最佳分割尺度的曲线(图2),当曲线中显示的局部方差较小且局部方差变化率最大时得到的就是最佳分割尺度。图2a中显示孤岛地区的最佳分割尺度为3;图2b中显示军马场地区的最佳分割尺度为12;图2c中显示黄河故道地区最佳分割尺度为9,但在尺度为3的位置局部方差的变化率也存在一个较大的增长。
图2 最佳分割尺度曲线
在确定分割尺度的基础上,将形状参数和紧致度参数分别分级为0.1~0.9,每个值对应的分割结果与参考图层叠加计算误分割指数。对应分割获得的影像对象斑块结果的误分割图斑个数与面积如图3所示,图 3a为总体的形状参数为0.4,图3b为总体的紧致度参数最佳值为0.5。
图3 紧致度参数误分割情况
3.2 纹理特征变量的选择
本文采取控制变量的方法,选定任意一纹理变量后(本文以mean为例),以任意一纹理方向(135°)分别计算其不同窗口大小下的J-M距离,结果如表1所示。当窗口大小为13×13时,纹理变量显示出最大的可分离性。在此窗体大小的基础上,再次分别计算该纹理变量4个方向的J-M距离,结果如表2所示。4个方向的可分离性相差不大,但当纹理方向为45°时,显示出相对较大的可分离性。这样的结果与前期WANG H[16]等通过不同预测变量的组合进行随机森林分类,并对不同变量分类结果进行精度评价所确定的窗口大小和方向完全一致。
3.3 特征变量重要性排序
利用前向选择程序对14个波段(4个多光谱、8 个纹理和2个植被指数)进行重要性排序。
从图4可以看出,纹理变量的重要性相对都较靠前,可见纹理信息特征在研究区刺槐林健康等级划分中有相当重要的作用;2个植被指数也是反映刺槐生长状况的最好光谱指标。
表1 纹理窗口大小选择情况
表2 纹理方向的选择情况
图4 基于光谱和纹理信息的随机森林分类特征重要性排序
3.4 刺槐林健康等级分类
利用前向选择的分割参数、光谱信息以及纹理特征构建分类规则集,分别对3个地区的刺槐林进行健康等级分类。其中,对黄河故道进行分类时,分别采用3和9两个分割尺度来分类,并选择结果中感兴趣区域进行精度评价(表3)。可以看出,尺度为3时的总体精度远远大于尺度为9时的总体精度。但在尺度为9时,健康刺槐林的用户精度可达到100%。因此,本文先以尺度9来分类,提取健康刺槐种类;再以尺度3对中度枯梢、重度枯梢或死亡林地继续进行分层分割。最后,选择3个地区刺槐林健康等级分类结果中感兴趣区域进行精度评价(表4),并将分类完成后的3个区域合并,得到黄河三角洲刺槐林健康等级的分类图 (图5)。
表3 黄河故道地区两种不同尺度精度评价表
表4 3个地区精度评价汇总表
图5 黄河三角洲刺槐健康分类图
从图5可知不同健康等级刺槐林的分布状况,孤岛地区总体健康,但其北部沿神仙沟一带及西南部枯梢情况严重,出现死亡情况;黄河故道地区刺槐林分布破碎,呈条带状,总体枯梢程度相对严重,只有南部及东北部少数地区健康;军马场地区中南部较为健康,北部枯梢严重,几乎全部死亡。
从表4中可以看出,采用面向对象的方法进行分类,以特征区域为研究对象,基本突破了基于像元分类方法不能充分利用高分辨率影像空间信息的局限,较前人的研究结果,明显提高了分类精度。但军马场地区的分类精度还是相对较低,这是由于军马场地区刺槐林分布相对破碎,而尺度分割时也未曾出现合理的多尺度来进行分层分割所造成的。
本文利用IKONOS影像,采用面向对象的方法对黄河三角洲刺槐林健康等级进行了分类,分类结果与实地样方数据具有较好的一致性,充分说明了在监测森林枯梢方面,面向对象的方法能够更有效地挖掘高分辨率影像信息。而本次研究主要选择光谱和纹理特征来对刺槐林进行分类,对不同健康程度刺槐林之间的空间关系特征研究较少,这也造成了在刺槐林分布较为破碎地区的分类精度较低的情况。因此,今后将进一步挖掘空间关系特征的潜力,深化规则集的建立,以获得精度更高的分类结果。
[1] 陈旭,徐佐荣,余世孝.基于对象的QuickBird遥感图像多层次森林分类[J].遥感技术与应用,2009,24(1):22-26
[2] 张建锋,邢尚军,郗金标,等.黄河三角洲可持续发展面临的环境问题与林业对策[J].东北林业大学学报,2002,30(6):115-119 [3] 梁玉堂,龙庄如.刺槐栽培理论与技术[M].北京:中国林业出版社,2010
[4] Schomaker M E. Crown Condition Classification: a Guide to Data Collection and Analysis[R].USDA Forest Service, Southern Research Station,USA,2007
[5] 陈云浩,冯通,史培军,等.基于面向对象和规则的遥感影像分类研究[J].武汉大学学报(信息科学版), 2006,31(4):316-320
[6] 乔程,骆剑承,吴泉源,等.面向对象的高分辨率影像城市建筑物提取[J].地理与地理信息科学,2008,24(5):36-39
[7] Drǎguţ L, Tiede D, Levick S R. ESP: a Tool to Estimate Scale Parameter for Multiresolution Image Segmentation of Remotely Sensed Data[J]. International Journal of Geographical Information Science,2010,24(6):859-871
[8] Drăguţ L, Csillik O, Eisank C, et al. Automated Parameterization for Multi-scale Image Segmentation on Multiple Layers[J].ISPRS J Photogram Remote Sensing,2014,88(100):119-127
[9] 李开丽,蒋建军,茅荣正,等.植被叶面积指数遥感监测模型[J].生态学报,2005,25(6):1 491-1 496
[10] Huete A R.A Soil-adjusted Vegetation Index(SAVI)[J].Remote Sensing of Environment,1988,25(3):295-309
[11] 张策,臧淑英,金竺,等.基于支持向量机的扎龙湿地遥感分类研究[J].湿地科学,2011,9(3):263-269
[12] 祝晓坤.Dempster-Shafer证据推理融合模型在遥感分类中的应用[D].武汉:武汉大学,2005
[13] Dye M, Mutanga O, Ismail R. Combining Spectral and Textural Remote Sensing Variables Using Rrandom Forests: Predicting the Age of Pinus Patula Forests in KwaZulu-Natal, South Africa[J].Journal of Spatial Science,2012,57(2):193-211
[14] 马娜,胡云锋,庄大方,等.基于最佳波段指数和J-M距离可分性的高光谱数据最佳波段组合选取研究:以环境小卫星高光谱数据在东莞市的应用为例[J].遥感技术与应用,2010,25(3):358-365
[15] Strobl C, Zeileis A, Strobl C, et al. Danger: High Power! -Exploring the Statistical Properties of a Test for Random Forest Variable Importance[J].Proceedings in Computational Statistics,2008,2:59-66
[16] WANG H, ZHAO Y, PU R, et al. Mapping Robinia Pseudoacacia Forest Health Conditions by Using Combined Spectral, Spatial, and Textural Information Extracted from IKONOS Imagery and Random Forest Classifier[J]. Remote Sensing,2015,7(7):9 020-9 044
P237
B
1672-4623(2017)01-0090-05
10.3969/j.issn.1672-4623.2017.01.028
路开宇,硕士研究生,主要研究方向为地理信息系统开发与遥感图像模式识别。
2015-11-12。
项目来源:国家自然科学基金面上基金资助项目(41471419)。