于丽柯 于颖 柳向宇 杜一尘 张涵
(东北林业大学,哈尔滨,150040)
基于高光谱影像的树种分类1)
于丽柯 于颖 柳向宇 杜一尘 张涵
(东北林业大学,哈尔滨,150040)
应用环境与灾害监测预报小卫星(HJ-1A)的超光谱成像仪(HSI)高光谱影像,对大兴安岭地区塔河林区进行树种分类。HSI数据经过去条带和大气校正预处理,获取准确的树种光谱信息,分别采用波谱角填图法和线性波谱分离法进行树种分类。结果表明:在树种识别中,基于线性波谱分离的方法较基于波谱角填图法要优越,线性波谱分离方法的总体精度为72.0%,Kappa系数为0.600;波谱角填图法的总体精度为62.5%,Kappa系数为0.459。
高光谱;超光谱成像仪(HSI);树种分类;光谱角填图;线性波谱分离
We classified the tree species in Tahe County in Daxing’an Mountains with the HSI hyperspectral image acquired by the small satellite constellation of environmental and disaster monitoring and forecasting (HJ-1A). The HSI data can only obtain precise tree species spectral information after removing strips and correcting the atmospheric effect of remote sensing image. We classified the tree species by spectral angle mapping (SAM) method and linear spectral separation, respectively. The overall precision of spectral angle mapping was 62.5% with Kappa of 0.459, and that of linear spectral separation was 72.0% with Kappa of 0.60, indicating that the classification method based on linear spectral separation could get better result than spectral angle mapping in tree species classification.
森林作为地球上最大的陆地生态系统,正确地识别森林树种是利用和保护森林资源的基础和依据[1]。20世纪末出现的高光谱遥感技术,在光谱分辨率上具有很大的优势,这种特征能够准确地探测到具有细微光谱差异的各种地物类型,在提高森林树种识别精度上具有重大意义。目前,关于高光谱遥感识别算法有多种,主要分为基于光谱特征、光谱匹配、统计分析方法[2]。基于光谱特征是以植物光谱通常包括一系列的特征吸收谱带,每一树种特征吸收谱带不同,且有较稳定的波长位置和特征形态,通过光谱微分技术得到光谱拐点及最大最小反射率波长位置等各种光谱特征参数,指示出不同树种间的差异;基于光谱匹配是通过对地物光谱与参考光谱的匹配或地物光谱与数据库的比较,求算它们之间的相似性或差异性[3],较为典型的有光谱角度匹配(SAM)、光谱相似匹配(SCM)和交叉相关光谱匹配(CCSM)等;基于统计分析方法是针对高光谱遥感数据的特点,对其进行特征提取,对光谱间相关性进行特征压缩和提取的技术主要包括:最小噪音变换(MNF)、主成分分析(PCA)、典范变量分析等。
在树种识别的研究中,基于光谱特征技术已经比较完善,宫鹏等[4]利用CASI高光谱数据,通过光谱微分技术对美国加州的6种针叶树种进行识别,证实了高光谱遥感在树种识别领域的可行性;陈尔学等[5]利用EO-1Hyperion高光谱遥感数据及外业测量数据,通过几种高光谱统计模式识别方法的比较,发现采用更为精确的二阶统计量方法,能有效的提高树种类型识别的精度;张银涛[6]采用特征波段选择的方法对叶片非成像高光谱数据以及EO-1Hyperion遥感影像进行树种分类,取得了较好的效果;刘丽娟等[7]利用机载Lidar和高光谱CASI数据融合对温带树种进行识别,结果表明,融合后的树种分类总体精度及Kappa系数(83.88%,0.80)均优于利用其中单一数据进行分类的结果。然而,国内很多学者常采用国外高光谱遥感数据进行植被识别与分类研究,基于国内高光谱数据(如环境与减灾监测预报小卫星A的HSI高光谱数据)对树种识别的研究比较少,并且因环境与减灾小卫星发射时间较短,利用现行的分类方法(如最大似然法、决策树分类法、光谱匹配法等)对HSI高光谱数据进行树种分类的研究实例不多。
本研究以大兴安岭地区塔河县内林区的一景HSI影像作为数据源,分别利用波谱角填图和线性波谱分离进行树种识别和分类,并对这2种方法进行树种识别和分类的能力进行评估,以找到更好地适合HSI数据树种分类的方法。
大兴安岭地区塔河林业局(东经123°20′~125°5′,北纬52°7′~53°20′)位于大兴安岭伊勒呼里山北麓,属低山丘陵地形,地势西南部海拔较东北部高。该区属寒温带大陆性季风气候,冬季寒冷漫长,夏季湿热短暂,平均气温-2.4 ℃,年均降水量470 mm,海拔高度为175~477 m。区内森林茂密,森林覆盖率81.05%,主要乔木树种为兴安落叶松(Larixgmelinii)、白桦(Betulaplatyphylla)、樟子松(Pinussylvestrisvar.mongolica),少量分布有山杨(Pobulusdavidiana)、黑桦(Betuladahurica)、云杉(Piceaasperata)等。研究范围如图1所示。
图1 研究区HSI影像
2.1 数据获取
本研究选用环境与减灾监测预报小卫星(HJ-1A)的HSI高光谱数据为基本数据源。HJ-lA携带超光谱成像仪(HSI)拥有115个波段,平均光谱分辨率5 nm,空间分辨率100 m,刈幅50 km,重访周期96 h。
本研究下载了研究区内一景HJ-1A高光谱影像2级产品,影像获取时间为2013年9月1日,产品名称为HJ1A-HSI-454-48-B2-20130901-L20001045757。景序列号为1090824,空间分辨率100 m,波段115个,产品格式为HDF5,产品级别LEVEL2,Path/Row为455/48,景中心经/纬度124.363234/53.053899。同时收集了研究区的二类调查小班数据。
2.2 HSI数据预处理
研究区获取的HSI数据为HDF5格式的2级产品,利用ENVI5.1遥感图像处理软件打开时,影像不显示投影、坐标等信息不能直接对其进行操作,需要先进行格式转换;由于大气的散射、吸收、传感器自身的影响及地面起伏的变化等,使获取的地物光谱信息中某些波段受到较大影响[8],有很大的噪声存在。因此,对所获得的HSI影像必须进行预处理,技术路线如图2所示。
图2 技术路线图
利用中国资源卫星中心提供的HSI产品格式转换软件V1.1,可将其转换成通用的遥感数据GEOTIFF,利用ENVI软件打开时,能使其显示为带有投影等信息的影像。大气校正时,采用ENVI5.1软件中自带的FLAASH大气校正模块进行大气校正。采用“全局去条纹”[9]的方法进行去条纹处理。二类调查小班数据用于提取研究区的植被区。
2.3 提取端元
传统的端元提取方法有纯像元指数算法(PPI)、N-FINDR算法、最小体积变换法(MVT)等。PPI算法是目前较常用的方法,它能求出所有像元的纯净像元指数。通过设定一个阈值,还可将某个范围像元筛选出来。由于波段中存在系统噪声的影响,在PPI计算之前先对预处理后的影像进行最小噪声分离(MNF),实现信号与噪声的分离,这样计算得到的PPI结果准确。本研究中PPI计算的阈值及迭代次数按照ENVI5.1软件默认参数设置。
端元的确定是利用光谱角填图法及线性波谱分离法进行树种分类的关键。目前确定端元的方法主要有两种:第一种方法是通过散点图确定最终端元波谱,即通过波谱在图像特征空间中的分布,估计研究区内端元数目及相应的波谱;另一种方法是尝试法,根据其他资料对研究区的了解分析,先选定几个端元进行光谱混合分析,再对分解结果分析,如果不符合要求,再尝试其它的端元组合方案。本研究选用散点图法,该方法可在ENVI5.1软件中实现,有较强实用性。
对计算的PPI结果,利用软件中ROI的阈值设定(一般尽可能选中全部可能的纯净像元)选取像元,然后导入n维可视化(n-D Visualizer)工具中。经过多角度旋转,n维散点图呈多边形。根据该工具运行原理,在维散点图中,相同地物的点总是集中分布。由此,可通过创建感兴趣区圈定多边形中集中分布的散点来确定端元。结合二类调查小班矢量图,判断研究区内主要优势树种(兴安落叶松、白桦、樟子松),可用来调整端元。结合小班矢量图确定的端元波谱如图3所示。
2.4 树种分类
波谱角填图分类。波谱角填图(SAM)是基于已知的参照波谱(端元波谱)和高光谱影像每个像元波谱曲线的匹配程度对图像进行分类。该算法是通过计算像元波谱与端元波谱间的夹角(将它们看做维数等于波段数的空间向量)大小,判定2个波谱间的相似程度[10]。角度越大,认为两者差异越大。假设进行匹配的2条波谱曲线分别为r1、r2,波段数为N,计算公式可描述为:
(1)
其中:∂为波谱夹角,N为波段数,r1、r2为待匹配的光谱矢量。
图3 提取的研究区端元波谱
线性波谱分离分类。在线性混合模型中,将像元在某一波段的反射率表示为像元中端元组分的波谱的线性组合。假设组成混合像元的几种基本组分的光谱以线性的方式组合成混合像元的光谱[11],模型可描述如下式:
且需满足条件
(2)
式中:ρjk是第j个像元在波段k中的反射率值;fij是第i个端元类型在像元j中占的比重;cik是在波段k中第i个端元类型的反射率值;L是在第j像元中的端元类型数;ε表示残余误差值。
Xiao Jingfeng等[12]利用线性光谱混合模型,对美国新墨西哥州中部地区提取构造的3种不同的端元组合类型进行混合分解,并用高分辨率影像为参考数据进行精度评价,得到较高精度结果。
应用ENVI5.1软件实现线性波谱分离法树种分类,得到端元波谱对应的丰度图像及树种分类结果。
3.1 波谱角填图分类
利用提取的端元波谱采用波谱角填图法对经过预处理的研究区HSI影像植被区进行分类,应用ENVI5.1软件自带的光谱角填图法实现树种分类。光谱角填图法植被分类结果如图4所示。
3.2 线性波谱分离分类
利用提取的端元波谱采用线性波谱分离法对经过预处理的研究区HSI影像植被区进行分类,应用ENVI5.1软件实现线性波谱分离法的树种分类,得到端元波谱对应的一组丰度图像(见图5)及树种分类结果(见图6)。丰度图中,灰度越亮的地方代表分解的丰度影像所对应的纯净像元越多,反之,纯净像元越少。
图4 基于光谱角填图法的分类结果
图5 基于线性波谱分离法的丰度图
3.3 精度分析与评价
在影像分类结果图上,结合地面调查资料和小班矢量化数据,随机选取248个样点,分别计算基于光谱角填图法的混淆矩阵(见表1)和基于线性波谱分离的混淆矩阵(见表2),进行精度评价。波谱角填图法的总体精度为62.5%,kappa系数为0.469;线性波谱分离法的总体精度为72.0%,kappa系数为0.600。比较2种分类方法的总体精度与kappa系数可看出基于混合像元分解的线性波谱分离方法的总体精度较高。
图6 基于线性波谱分离法的分类结果
地物类型白桦兴安落叶松樟子松河流总计白桦75108093兴安落叶松174819286樟子松112012144河流0232025总计103804223248总体精度=62.5% kappa=0.469
表2 基于线性波谱分离法的混淆矩阵
应用2种方法对研究区的主要树种进行分类。有研究表明,李俊明[13]利用HJ-1A高光谱数据通过波段选择的方法进行树种分类,其分类精度达75%~95%;于龙[14]利用Hyperion高光谱数据采用最大似法、波谱角填图及线性混合像元分解等方法进行树种分类,获得分类精度均不低于65%。比较2种分类方法的总体精度与kappa系数可看出,基于混合像元分解的线性波谱分离法优于基于光谱匹配的波谱角填图法,其分类精度与其他研究者的分类结果较一致。这2种方法都存在不同程度的误判和错分,导致这种现象的原因有很多。基于光谱匹配的波谱角填图法需要端元矢量与像元矢量进行角度匹配,匹配角度阈值的设定可能影响了光谱匹配的效果,导致分类精度低;基于混合像元分解的线性波谱分离需要端元波谱对图像进行丰度反演,端元波谱的提取是这种分类方法的基础,对分类结果有直接影响。由于混合像元内的地物分布复杂,用简单的线性组合不能很好的描述真实地物。在数据预处理阶段,经大气校正后的图像中,植被的光谱曲线虽得到较好的校正,但植被反射率值偏低,实际地物同物异谱和同谱异物现象的存在,以及确定端元时也需要研究者的经验,这些均会影响提取的端元波谱,最终影响分类的精度。期望在以后的研究中,能从各个步骤确保光谱曲线的提取精度,并通过野外调查采集地面实测光谱,检验提取的光谱曲线,从而提高分类方法的精度。
[1] 刘旭升,张晓丽.森林植被遥感分类研究进展与对策[J].林业资源管理,2004(1):61-64.
[2] 曾庆伟,武红敢.基于高光谱遥感技术的森林树种识别研究进展[J].林业资源管理,2009(5):109-114.
[3] 朱炜,李东,沈飞,等.高光谱遥感森林树种分类研究进展[J].浙江林业科技,2013,33(2):84-90.
[4] 宫鹏,浦瑞良,郁彬.不同季相针叶树种高光谱数据识别分析[J].遥感学报,1998,2(3):211-217.
[5] 陈尔学,李增元,谭炳香,等.高光谱数据森林类型统计模式识别方法比较评价[J].林业科学,2007,43(1):84-89.
[6] 张银涛.高光谱数据的树种分类波段选择研究[D].临安:浙江农林大学,2014.
[7] 刘丽娟,庞勇,范文义,等.机载LiDAR和高光谱融合实现温带天然林树种识别[J].遥感学报,2013,17(3):679-695.
[8] 李俊明,邢艳秋,杨超,等.基于环境与灾害监测预报小卫星的树种识别[J].东北林业大学学报,2013,41(11):41-45.
[9] 谭炳香,李增元,陈尔学,等.EO-1 Hyperion高光谱数据的预处理[J].遥感信息,2005(6):36-41.
[10] 杜凤兰,田庆久,夏学齐.遥感图像分类方法评析与展望[J].遥感技术与应用,2004,19(6):521-525.
[11] 陶秋香,陶华学,张连蓬.线性混合光谱模型在植被高光谱遥感分类中的应用研究[J].勘察科学技术,2004(1):21-24.
[12] XIAO J F, MOODY A. A comparison of methods for estimating fractional green vegetation cover within a desert-to-upland transition zone in central New Mexico, USA[J]. Remote Sensing of Environment,2005,98(2/3):237-250.
[13] 李俊明.基于HJ-1A高光谱遥感树种识别的研究[D].哈尔滨:东北林业大学,2013.
[14] 于龙.基于高光谱遥感数据的树种组分类方法探讨[D].临安:浙江农林大学,2013.
Tree Species Classification with Hyperspectral Image//
Yu Like, Yu Ying, Liu Xiangyu, Du Yichen, Zhang Han
(Northeast Forestry University, Harbin 150040, P. R. China)//Journal of Northeast Forestry University,2016,44(9):40-43,57.
Hyperspectral; Hyperspectral imager; Tree species classification; Spectral angle mapping; Linear spectral separation
于丽柯,女,1992年7月生,东北林业大学林学院,本科生。E-mail:dyulike@163.com。
于颖,东北林业大学林学院,讲师。E-mail:yuying4458@163.com。
2016年1月5日。
S771.8
1)东北林业大学大学生创新实验项目(201410225154)。
责任编辑:王广建。