梁文海,刘吉凯,陈 琦,陈显栋,钟仕全
(1.广西林业勘测设计院,南宁 530000;2.安徽科技学院,安徽 凤阳 233100;3.广西壮族自治区气象减灾研究所/国家卫星气象中心遥感应用试验基地,南宁 530022)
近10年来,中国对地观测卫星产业迅速发展,先后发射了“资源卫星”(ZY1-02C,CBERS-04,ZY3-02)与“高分辨率对地观测系统卫星”(GF-1,GF-2,GF-4),其中高分二号(以下简称“GF-2”)卫星的发射,标志着中国遥感卫星进入了亚米级的“高分时代”。GF-2卫星观测幅宽45km,星上搭载有2台高分辨率0.8m全色、4m多光谱相机[1]。GF-2同时具有高分辨率、高辐射精度、高定位精度和快速姿态机动能力等特点,在土地利用动态监测、森林资源调查、城乡规划监测评价、交通路网规划及环境保护与监测等领域具有广泛的应用潜力[2]。
吴小娟等[3]以深圳大鹏半岛GF-2卫星数据为例,利用面向对象的方法提取海岸线,表明GF-2对海岸线提取的精度高,效率快。刘肖姬等[4]以云南东川区为研究对象,利用GF-2卫星数据地提取滑坡灾害信息,表明GF-2卫星数据可以较好地提取滑坡灾害信息,基本满足滑坡的灾害识别要求。梁树能等[5]与路云阁等[6]利用GF-2卫星数据开展遥感地质调查与矿山监测应用评价,结果表明,GF-2卫星数据完全能够满足高精度小尺度的遥感地质调查与矿山监测的技术要求。王忠武等[2]以包头市青山区等3个区作为典型试验区,开展GF-2卫星数据在新增建设用地监测中的应用分析。结果表明,基于GF-2卫星数据的新增建设用地监测图斑属性精度、面积精度,以及最小可监测图斑面积,都能满足土地利用动态遥感监测业务相关规范要求。综上可知,目前对GF-2卫星数据的应用主要集中在各行业示范应用,如提取海岸线、地质调查与矿山监测、土地利用动态遥感监测等方面,可查询的文献少,研究层次较低。
林业资源遥感监测是高分数据应用的重要领域之一[7-9],然而查阅文献却发现,针对GF-2数据的林业遥感研究尚未见于报道。因此,本文以广西横县平朗乡为例,采用面向对象的分类方法,使用不同的分类器对GF-2影像进行桉树提取并进行精度评价分析,旨在为广大林业工作者利用GF-2数据进行桉树信息的提取提供参考,也期望能为国产高分数据应用于林业监测提供有益的探索。
横县平朗乡位于广西东南部,北回归线以南,地处22°08′~23°30′N,108°48′~109°37′E。乡域地形四周高、中间低,形成宽谷平原和盆地,地貌以丘陵和平原为主。乡内水热资源丰富,树种繁多,林木生长迅速,是广西桉树产业的优势产区与特色产区[10]。
平朗乡地处南亚热带南缘,水热资源丰富,树种繁多,为减少各种因素对数据处理的干扰,本研究选取云量较少、质量较好的4景GF-2影像,研究数据来源于中国资源卫星应用中心(http://www.cresda.com/CN/),采集时间分别为2015年8月9日和10月22日(表1),级别L1A,空间分辨率全色1m,多光谱4 m。
非遥感数据有:横县森林资源现状数据;研究区1∶30万DEM数据;利用手持GPS仪实测的桉树分布数据(图1)。
表1 研究区影像信息表Tab.1 Images of study area
为了消除遥感数据的误差,提高分类的精度,需要对数据进行预处理。数据预处理包括影像正射校正,融合、镶嵌和裁剪以及主成分分析。
1) 影像校正。以0.5m分辨率的航片作为基准影像,先对全色影像正射校正,校正精度大于1个像元;然后再以全色为参考影像,对多光谱影像正射校正,精度大于0.5个像元。正射校正的模型为有理多项式系数模型。
2) 影像融合、镶嵌和裁剪。对同景全色影像与多光谱影像融合处理,方法选择主成分变换法(Principal Component,PC)。融合完成后,对融合影像作基于地理坐标的无缝镶嵌与匀色处理。镶嵌完成后,按照平朗乡乡界裁剪获得研究影像(图1)。
图1 研究区位置与样本分布
3) 主成分分析(Principal Components Analysis,PCA)。因单个波段经处理后都可得到8个波段的纹理向量,如对GF-2的每个波段都进行纹理提取,将会生成32个向量。同时GF-2波段间相关性高,为减轻工作量,降低信息冗余,对裁剪后的影像进行降维处理。本文对研究区影像进行主成分分析变换,变换后各波段信息量分布如表2所示。主成分的第一个波段(PCA-1)包含了原影像约97.9%的信息,因此采用该波段的纹理信息代表原影像的全部纹理信息。
传统的影像分类方法主要基于像元的方法,但随着遥感影像分辨率的不断提高,对地物细节内容刻画越趋丰富,基于像元的分类方法会产生大量“胡椒盐”等噪声问题,致使分类结果不甚理想[11]。面向对象的分类方法能够弥补传统分类方法的不足,综合考虑像元的光谱信息、对象内部的结构、纹理以及相邻对象之间的关联信息,对高分数据的解译效果要优于基于像素的分析效果[12-13]。本文研究针对GF-2影像,采用面向对象的分类方法(表3),使用5种分类方法进行桉树提取,技术流程如图2所示。
表2 主成分分析波段信息量分布Tab.2 The information distribution of principal component analysis
图2 面向对象的桉树提取技术流程图
分类方法说明参考文献贝叶斯(Bayes)贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,贝叶斯(NaïveBayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。[14]决策树(DecisionTree,DST)决策树是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。[15-16]K最近邻(KNearestNeighbor,KNN)K最近邻分类算法是数据挖掘分类技术中最简单的方法之一。KNN算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。[17]随机森林(RandomTrees,RDT)随机森林指的是利用多棵树对样本进行训练并预测的一种分类器;其输出的类别是由个别树输出的类别的众数而定。[18-19]支持向量机(SupportVectorMachine,SVM)支持向量机是一种建立在统计学习理论(StatisticalLearningTheory,SLT)基础上的机器学习方法。SVM可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类于类之间的间隔最大化,因而有较好的推广性和较高的分类精准率。[20]
面向对象分类方法的基本流程是先将影像分割成为一个个对象,待对象分割完成后再采用各种分类方法对这些对象进行分类。因此,影像分割质量的好坏直接影响着影像解译的结果,分割算法选择多尺度分割(Multi-resolution Segmentation),如何选择合适的尺度至关重要。由图3可知:分割尺度为 60时,图斑分割不彻底,存在一个对象包含了多种地物的情况,难以有效分类;分割尺度为40时,图斑过于破碎,同一个地物被分割成几个图斑,不利于分类;分割尺度为50时,图斑分割合适,其分割线与地物分界线吻合度高,相对兼顾了研究区各种植被的局部细节以及空间几何分布特征。本研究经过多次试验,最后确定分割尺度参数为50,光谱因子为0.9,形状因子为0.1,紧凑度为0.5,光滑度为0.5,蓝、绿、红、近红、PCA-1波段权重比分别是1∶1∶1∶1∶0。
图3 多尺度分割影像Fig.3 Multi-scale segmentation images
根据桉树提取的需要,将研究区地类分为建筑与裸地、农地、其他阔叶树、水域、松树和桉树等6类。通过野外调查,结合横县森林资源现状数据,选取均匀分布于研究区的各种地类样本共120个;其中建筑与裸地20个,农地20个、其他阔叶树20个、水域10个、松树25个、桉树25个。选取研究区影像的光谱特征(包括蓝、绿、红、近红、Brightness,max diff共6个光谱特征)及PCA-1波段的灰度共生矩阵的纹理特征(包括Homogeneity,Contrast,Dissimilarity,Entropy,Angular Second Moment,mean,standard Deviation,Correlation共8个纹理特征)共14个影像特征,分别采用贝叶斯(Bayes)、决策树(DST)、K最近邻(KNN)、随机森林(RDT)、支持向量机(SVM)5种分类器对同一样本行进训练及分类。
使用同一套训练样本,分别利用贝叶斯、决策树、最近邻法、支持向量机及随机森林等5种分类器提取研究区桉树信息,得到桉树空间分布情况如图4所示。通过对比可知,5种分类器提取的桉树空间分布情况相对一致。平朗乡的桉树主要分布在该乡的南部区域,是因为该区域以丘陵为主,海拔均小于160m,且水热资源丰富,利于桉树生长。
图4 5种分类器分类结果
根据实地调查数据,结合横县森林资源现状数据及Goolge Earth高分辨率影像数据选取验证样本,保证样本属性的准确性。根据分类规则,分类结果为桉树和非桉树两大类,因此将验证的感兴趣区设为两类。共选取140个样本点(其中桉树70个,非桉树70个)作为验证样本,样本均匀分布于研究区,以该套验证样本分别对5种不同分类方法分类的结果进行精度评价,构建混淆矩阵,计算5种分类方法的总体精度与Kappa系数,精度评价结果如表4所示。
表4 5种桉树提取方法的精度评价Tab.4 Confusion matrix of Eucalyptus extraction using 5 object-oriented classification methods
由表4可知,利用面向对象的5种分类方法进行桉树分类,均存在一定程度的“错分”、“漏分”现象,错分为桉树的主要是马尾松的成熟林,因两者的纹理较规则、粗糙,特征差异不明显而造成;漏分的桉树主要是桉树的幼林,因其光谱特征与其他植被光谱特征相近而造成。因此,基于面向对象的分类方法虽然较基于像元的方法能提高分类的精度,但也不能完全避免“同物异谱”与“同谱异物”等现象的存在。如何通过这些微小的差异,达到精确识别的精度还有待研究。
5种分类方法对桉树信息提取的精度差异显著,Bayes分类的精度最差,分类总精度仅为67.1%,Kappa系数也只有0.34;SVM分类精度最高,其分类总精度达86.4%,Kappa为0.73。5种分类方法对桉树信息提取的精度排序依次为SVM>RDT>DST>KNN> Bayes,其中分类总精度超80%的方法有DST,RDT和SVM 3种。
1) 本文以广西横县平朗乡为研究区,利用面向对象的方法,对该乡的桉树采用5种不同分类器进行分类。结果表明,5种方法中,支持向量机(SVM)方法提取效果最好,是最适合桉树提取的方法;随机森林(RDT)方法次之;贝叶斯(Bayes)方法最差。
2) 面向对象方法是在林业部门经过长期实践的基础上提出的比较符合桉树(变化)信息遥感监测的方法,为确保较高的桉树信息提取精度,在丘陵和平原地区,可采取决策树、随机森林和支持向量机的面向对象分类方法。对于地块破碎,树种繁多的山地,可采取支持向量机的方法,若地势起伏较大,可先按照DEM数据分区,然后在分区采用支持向量机方法提取桉树信息。
3) 面向对象的方法虽然提高了分类精度,但也不同程度的存在混合像元的问题,如何选择适量的分类特征,结合辅助数据或智能算法,精确提取桉树信息,有待进一步研究。
[1] 高分二号[EB/OL].(2014-10-15)[2017-09-14].
http://www.cresda.com/CN/Satellite/3128.shtml.
[2] 王忠武,刘顺喜,戴建旺,等.高分二号卫星数据在新增建设用地监测中的应用分析[J].航天器工程,2015,24(6):134-139.
[3] 吴小娟,肖晨超,崔振营,等.“高分二号”卫星数据面向对象的海岸线提取法[J].航天返回与遥感,2015,36(4):84-92.
[4] 刘肖姬,梁树能,吴小娟,等.“高分二号”卫星数据遥感滑坡灾害识别研究_以云南东川为例[J].航天返回与遥感,2015,36(4):93-100.
[5] 梁树能,魏红艳,甘甫平,等.“高分二号”卫星数据在遥感地质调查中的初步应用评价[J].航天返回与遥感,2015,36(4):63-72.
[6] 路云阁,樊双亮,李春霖.“高分二号”卫星在西藏矿山遥感监测中的应用研究[J].航天返回与遥感,2015,36(4):73-83.
[7] 李春干,梁文海.面向对象遥感图像森林变化监测的工程化应用方法[J].林业资源管理,2015(6):137-143.
[8] 徐菲楠,祁元,王建华,等.面向对象的黑河下游河岸林植被覆盖信息分类[J].遥感技术与应用,2015,30(5):996-1005.
[9] 郭亚鸽,于信芳,江东,等.面向对象的森林植被图像识别分类方法[J].地球信息科学学报,2012,14(4):514-522.
[10] 孙磊,冯立新.横县林地保护与规划利用研究[J].农业科学,2014,42(4):1189-1191.
[11] 牟智慧,杨广斌.基于TM影像面向对象的桉树信息提取[J].林业资源管理,2014(2):119-125.
[12] 朱俊杰,范湘涛,杜小平,等.面向对象的高分辨率遥感图像分析[M].北京:科学出版社,2014.
[13] 胡荣明,魏曼,杨成斌,等.以SPOT5遥感数据为例比较基于像素与面向对象的分类方法[J].遥感技术与应用,2012,27(3):366-371.
[14] 朱军,胡文波.贝叶斯机器学习前沿进展综述[J].计算机研究与发展,2015,52(1):16-26.
[15] 祖笑峰,覃先林,尹凌宇,等.基于高分一号影像光谱指数识别火烧迹地的决策树方法[J].林业资源管理,2015(4):73-78.
[16] 雷光斌,李爱农,谭剑波,等.基于多源多时相遥感影像的山地森林分类决策树模型研究[J].遥感技术与应用,2016,31(1):31-41.
[17] 薄树奎,荆永菊.基于最近邻的遥感影像单类信息提取[J].计算机科学,2016,43(S1):217-218.
[18] 马玥,姜琦刚,孟治国,等.基于随机森林算法的农耕区土地利用分类研究[J].农业机械学报,2016,47(1):297-303.
[19] 方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38.
[20] 李梦颖,邢艳秋,刘美爽,等.基于支持向量机的Landsat-8影像森林类型识别研究[J].中南林业科技大学学报,2017,37(4):52-58.