郭瑞霞,李崇贵,刘思涵,马 婷,全青青
(西安科技大学 测绘科学与技术学院,陕西 西安710054)
落叶松Larix gmelini是中国大部分林区常见的一种寒温带及温带树种,因其具有速生、材质好、抗性强、适应性广等特点,已成为中国北方主要的造林树种。落叶松人工林能够在一定程度上减轻天然林木材供给需求的压力。随着中国落叶松人工林造林面积的逐年加大,林业重点工程建设的稳步推进,对落叶松人工林资源的调查成为林业调查领域一项新需求,特别是对落叶松人工林空间位置分布的快速提取。落叶松人工林分布范围广,地势复杂,野外调查工作困难,工作量大,费用高,用传统的资源调查方法难以准确定位和勾绘,而遥感技术因其快速、易获取、覆盖范围广等特点,已经广泛应用于林业资源调查。国外学者很早对植被的季相和物候特性进行了研究,并对其在植被类型分类中的作用进行了探讨和分析。BADHWA[1]运用多时相影像进行植被类型分类,结果表明:植被生物物候学信息能有效改善分类效果。在对针叶林树种识别方面,McDONALD等[2]基于Landsat TM数据对森林光谱植被指数的森林信息含量进行了调查,结果表明:当植被覆盖率较低时,全球环境监测植被指数(GEMI)是最有利于针叶林信息提取的指标,当植被覆盖度较高时,土壤调整植被指数(SAVI)和转换型土壤调整植被指数(TSAVI)是最有利于针叶林信息提取的指标。NEMANI等[3]利用NOAA/AVHRR影像的红(R)波段、近红外(NIR)波段、热红外(TIR)波段,通过归一化植被指数的季相特性区分常绿林和落叶林以及用NIR波段反射率的不同来识别阔叶林和针叶林。中国林业遥感分类技术的研究晚于发达国家,从20世纪70年代开始,遥感技术被引入到森林类型分类的研究中。40 a来,遥感技术在不断成熟、更新和发展,而且获得了大量的研究成果。赵东方[4]利用 SPOT 5遥感影像和外业调查数据,运用最大似然、神经网络、马氏距离等分类法对针叶林信息进行提取和精度评价,结果表明:最大似然法在保证针叶林分类精度的同时,其他类型森林分类精度也比较高,能达到较为理想的效果。王敏等[5]基于大比例尺航片分别用监督分类、专家分类和子像元分类的方法对针叶树种进行分类,并用固定样地数据分别对分类结果进行精度评价和对比分析,得到监督分类、专家分类和子像元分类的精度分别为82%、88%和91%。子像元分类精度较监督分类和专家分类高,且操作比专家分类简单,不需要其他先验知识的参与,尤其适用于对先验知识较少的原始针叶林树种进行分类。马延辉[6]利用单时相和时间序列数据针对针叶林遥感信息开展了较为系统的研究,用决策树分类实现了多源数据之间的混合使用,并得到满意的分类结果。但迄今为止,国内外针对落叶松人工林的研究文献多集中于生物量模型[7]、土壤肥力[8-11]、经营状况、落叶松落叶病[12]以及苗圃培育等方面,利用遥感图像分类算法提取落叶松人工林空间位置分布的研究鲜有报道。因此,利用遥感手段研究中国落叶松人工林的分布情况在理论研究和实际应用上都有十分重要的意义。本研究以黑龙江省孟家岗林场的落叶松人工林为研究对象,利用多时相Landsat 8影像、数字高程模型(DEM)数据,借助地面样地调查资料,结合落叶松人工林在不同季相条件下所呈现的规律特性,进行基于多时相特征的落叶松人工林分类方法研究,提取研究区落叶松人工林的空间位置分布。
研究区为黑龙江省佳木斯市桦南县东北部的孟家岗林场(46°20′16″~46°30′50″N, 130°32′42″~130°52′36″E),林场属东亚大陆性季风气候,年平均气温2.7℃,年平均降水量550.0 mm。地处完达山西麓余脉,以低山丘陵为主,坡度较为平缓,地势东北高,西南低,海拔为168~575 m。土壤以暗棕壤为主,林分以人工林为主,占森林面积72.5%,其中落叶松人工林为优势树种,是以经营落叶松树种为主的人工林基地。
落叶松属落叶乔木,夏天繁茂、冬季落叶,与其他常绿树种相比,季相特征明显,反映在遥感影像上,表现为树种间的光谱差异,这对森林植被类型的识别有一定的指导作用。Landsat 8影像空间分辨率较低,但其时间连续性较好、光谱信息丰富、获取成本低,有利于森林植被类型的识别。因此本研究选取3景多时相的Landsat 8影像数据为遥感信息源,用于研究落叶松人工林的季相和物候特性。此外,还使用了2014年全国森林资源二类调查数据和2017年典型森林类型样地补充调查数据用于落叶松人工林分类和分类结果验证,以及地理空间数据云(Geospatial Data Cloud)提供的30 m分辨率数字高程模型(DEM)数据用于辅助布设解译样地。遥感影像参数如表1所示。
表1 遥感影像基本参数Table 1 The basic parameters of remote sensing image
利用ENVI 5.3软件对Landsat 8影像进行辐射定标、FLAASH大气校正,并通过G-S变换方法对15 m全色波段和30 m多光谱波段进行融合处理,最终得到15 m分辨率的ETM+多光谱数据。对DEM数据进行预处理,提取研究区3类坡向(阴坡、阳坡、无坡向)信息。
1.3.1 森林类别光谱特征分析 研究利用选择的解译样本统计各森林类别在影像上的光谱均值,绘制各森林类别光谱曲线图,通过分析各森林类别在多时相遥感影像上的光谱差异和可分性,研究各森林类别特别是落叶松人工林的季相特性,找出能最好区别落叶松人工林的光谱特征波段,并且为保证原始影像的完整性(指Landsat 8影像第1~7波段的完整性),选择其中一个时相的影像作为基础影像,然后在其基础上扩充特征波段。基础影像的选择依据影像NIR波段上各地类的区分能力来定,因为在NIR波段内,植物的光谱特征取决于叶片内部的细胞结构,而植物类别间叶子内部结构差异较大,植物在近红外谱段的反射差异比在可见光区域大,因此对不同时相的NIR波段的地类光谱单独进行研究[13]。
1.3.2 分类模型 不同的分类算法对不同植被的分类效果可能存在一定差异。为探索不同监督分类方法提取落叶松人工林的效果,本研究采用最大似然法、支持向量机法、光谱角法和k最近邻法等。最大似然分类在2类或多类判别中,用统计方法根据贝叶斯判别准则建立非线性判别函数集,假定各类分布函数为正态分布,选择训练区,计算待分类样本的归属概率,把待分像元分到归属概率最大的分类类别中,是一种常用的监督分类方法[14-15]。最大似然分类法对呈正态分布的类别判别函数易于建立,综合应用了每个类别在各波段中的均值、方差以及各波段之间的协方差,有较好的统计特性,被认为是一种稳定性和鲁棒性都比较好的分类方法。支持向量机(SVM)是一种基于统计学习理论的计算机学习方法,将多维特征输入映射到高维的核空间,使原本不可分的数据获得新的特征,更加有利于分类。SVM的关键在于如何选择核函数和设置不同的参数。在特征空间中,待分模式对决策面的可偏离程度由惩罚系数C的变化大小来决定[16-18]。支持向量机在解决小样本、非线性及高维模式识别中表现出许多特有的优势。光谱角分类是一种基于相关/匹配滤波器的分类方法,能充分利用光谱维的信息,强调光谱的形状特征,极大减少特征信息,是目前超光谱图像分类中较常用的方法。其原理是把光谱作为矢量投影到N维空间上,其N维数为试验时选取的所有波段数。在N维空间中,各光谱曲线被看作是有长度和方向的矢量,而各光谱之间形成的夹角为光谱角。光谱角分类的核心思想是同一种地类波谱向量方向应该一致,夹角越小待估计像元与样本类别相似度越大[19-20]。具体计算公式如下:
式(1)中:Xp表示待分像元P的光谱向量,Xj表示类别j的平均光谱向量,αpj为像元P与类别j之间的夹角。k最近邻法(k-NN)分类的判别函数建立在地物光谱特征在特征空间中是按集群方式分布的前提下。它是设法计算某随机特征点X到各样本的距离,取前k个最近的样本,统计这k个最近的样本所属类别,按照众数法确定随机特征点的类别。k-NN方法对于类域的交叉或重叠较多的待分样本集来说,较其他方法更为适合,但当样本不平均时,如一个类别的样本容量很大,而其他类别样本容量却很小时,有可能导致当输入一个新样本时,该样本的k个邻居中大容量类别的样本占多数。另外,k-NN方法计算量较大,因为对每一个待分类的样本都要计算它到全体已知样本的距离,才能求得它的k个最近邻点[21]。
1.3.3 精度评价 遥感图像分类通常使用混淆矩阵来进行分类精度评价,主要采用总体分类精度和Kappa系数2种评价指标,对于单个地物类别的提取效果,可用制图精度和用户精度进行评价,但是在实际分类中,制图精度和用户精度又相互制衡,不能准确判断分类方法和数据的优劣,因此,本研究引入数据挖掘中不平衡样本的F度量整体评价遥感图像中落叶松人工林的提取结果。F计算公式为:
式(2)中:A表示制图精度,U表示用户精度。
依据森林资源二类调查数据和典型森林类型样地补充调查数据,确定研究区域的样本类型为红松Pinus koraiensis人工林、落叶松人工林、云杉Picea asperat人工林、樟子松Pinus sylvestris var.mongolica人工林、天然林、无林地等6类。对于整个研究区而言,典型森林类型样地数据分布不够均匀,因此将二类小班数据按不同龄组(幼龄林、中龄林和成熟林)、不同林种(红松人工林、落叶松人工林、云杉人工林、樟子松人工林、天然林和无林地)渲染分类,与由DEM数据得到的3类坡向图(阴坡、阳坡、无坡向)叠加,综合考虑地形信息和树种信息,根据各森林类型面积权重增加布设样地。样地大小为28.28 m×28.28 m的正方形样地,共计565块,按7∶3比例抽取监督样本和验证样本,用于森林类型分类和精度验证。样地类别及各类别的样本数量见表2。
表2 样地类别及各类别样地的数量Table 2 The category of sample plot and the numbers of each category of sample plot
对各森林类别在不同时相影像上的光谱均值变化进行统计,森林类别光谱曲线如图1所示。在2017年6月16日获取的影像上,无林地光谱均值变化规律与有林地之间差异明显。通过目视解译遥感影像可以看出:此时段内,无林地处于裸露状态,无植被或农作物生长。对有林地而言,各树种处于夏季生长季,光谱变化趋势相似,在近红外波段各有林地类别间区分度明显,天然林光谱均值最高,与人工林光谱差异显著,落叶松人工林此时间段长势较好,光谱均值次之,与其他人工林区分明显。
在2017年8月19日获取的影像上,由于正值初秋季节,研究区以玉米Zea mays、兰花豆Vicia faba为主的田间农作物正处于成熟季,绿色植被丰富,因此无林地光谱变化规律与有林地大致一致,而落叶松人工林叶绿素含量下降,叶片开始变黄。在TM1、TM2、TM3、TM4波段上,各类别区分度都较弱,很难区分。在近红外波段,无林地光谱均值最高,天然林次之,落叶松人工林与其他人工林区分明显,红松人工林和云杉人工林的光谱均值较接近,TM6波段次之,TM7波段较好。
在2017年10月22日获取的影像上,农作物收割,无林地光谱变化规律与有林地明显不同,落叶松人工林和天然林大范围落叶,光谱变化规律较一致,其他人工林属常绿树种,变化规律相对一致,落叶松人工林在TM1~TM7波段与其他森林类别分离度都较好,天然林在TM4、TM5、TM6、TM7波段与除落叶松人工林外的其他人工林分离度最好。
图1 不同时相影像上地类的光谱变化Figure 1 Terrestrial spectral variation of different phase images
对比分析不同时相近红外波段的地类光谱变化,3期影像均以近红外波段各森林类别区别最大。在2017年6月16日获取的影像上,植被叶片生长状况最好,内部结构丰富,各森林类别间区分最明显。在8月19日获取的影像上,各地类区分能力次之,此时正值初秋时节,田间玉米、大豆等农作物成熟,无林地光谱均值升高,而落叶松人工林开始逐渐变黄,各树种类别光谱均值降低。在10月22日获取的影像上,各森林类别区分能力最低,此时落叶松人工林和天然林大范围落叶,光谱均值最低,与其他常绿人工林光谱均值差距较大。
分析不同地类在Landsat 8多时相数据上地类光谱变化规律,以2017年6月16日获取的影像作为基准数据,扩展波段为2017年8月19日获取影像TM5、TM6波段,2017年10月22日获取影像TM3、TM4、TM5、TM6波段,进行多时相特征数据组合。利用ENVI软件对多时相特征数据进行最大似然法和支持向量机法分类,其中支持向量机采用线性函数进行分类;利用C#语言实现光谱角分类法和k最近邻法分类,提取研究区落叶松人工林的空间分布,其中,k最近邻法中k值的确定需要多次训练。研究对k分别从1~10取值进行分类,得到当k=5时,分类效果最好。因为本研究主要针对落叶松人工林信息提取进行研究,因此将除落叶松人工林以外的其他类别进行合并,得到凸出显示落叶松人工林的空间位置分布的分类图,分类结果如图2和表3所示。同时,为凸显本研究实验方法的可行性,采用最大似然分类法对单时相遥感影像进行分类,分类结果精度如表4所示。
图2 基于多时相特征的分类结果Figure 2 Classification results based on multi-temporal remote sensing data
表3 基于多时相遥感数据的分类精度Table 3 Classification accuracy based on multi-temporal remote sensing data
表4 基于单时相遥感数据分类精度Table 4 Classification accuracy based on single phase remote sensing data
利用多时相Landsat 8影像,采用最大似然法、支持向量机法、光谱角法和k最近邻法对研究区落叶松人工林信息进行提取,并与基于单时相数据的分类结果做比较,可以得到:①落叶松人工林具有明显的植被光谱特征,与裸地等地物区分明显,与其他树种类别变化规律相似。在近红外波段,各树种类别光谱可分性最好,落叶松人工林区分明显,对于不同时相遥感数据,森林长势较好的夏季树种类别的光谱差异最大。②落叶松人工林的信息提取受数据源特征信息量的影响,在秋季,落叶松开始落叶,与其他常绿树种光谱差异明显。因此,在单时相影像分类结果中,秋季影像对落叶松人工林信息提取效果较好,F精度为84.513 9%。多时相特征数据综合了落叶松夏季茂盛、冬季落叶的季相特性,其落叶松人工林提取结果明显优于单时相遥感数据提取结果,落叶松人工林F精度提高到87.979 3%。③各分类方法中,光谱角法和k最近邻法的制图精度相同,为91.14%,但最近邻法的用户精度为84.71%,低于光谱角法的用户精度85.71%,因为k最近邻法是计算某随机特征点X到各样本的距离按众数法判别待估计样本类别,样本数量的不平衡及位置分布不均匀使其较光谱角法存在 “过提取”现象。同样,最大似然法和支持向量机法的制图精度相同,为86.02%,但支持向量机法的用户精度为87.12%,低于最大似然法的用户精度90.03%。这是由于最大似然法以训练样本作为中心,而支持向量机以训练样本分析分类边界,导致以相同样本进行落叶松人工林信息提取时,最大似然法存在 “欠提取”现象,支持向量机法存在 “过提取”现象。利用F精度整体评价各方法的落叶松人工林提取精度,光谱角法最好,F精度为88.346 3%,最大似然法次之,精度为87.979 3%,k最近邻法的提取精度为87.807 4%,支持向量机法最低为86.566 5%。
通过实验与分析可以得出:①落叶松人工林有着明显的植被季相特征,利用多时相Landsat 8影像提取落叶松人工林信息的效果相比于单时相影像提取效果好,其提取精度大大提高,精度提高范围为[3.465 4,18.098 6];②本研究所采用的4种分类方法中,光谱角法对落叶松人工林的空间位置分布提取较好,F精度为88.346 3%,即利用多时相遥感影像采用光谱角法可以较好地提取研究区落叶松人工林空间位置分布。本研究对大面积获取落叶松人工林的空间位置分布具有一定的参考价值,对掌握中国落叶松人工林分布并促进落叶松人工林合理种植具有现实意义。