张兆鹏,李增元,田 昕
(1.自然资源部 第一大地测量队,陕西 西安 710054;2.中国林业科学研究院 资源信息研究所,北京100091)
林业是生态建设的主体,履行着建设和保护 “三个系统、一个多样性”(森林、湿地和荒漠生态系统及生物多样性)的重要职能[1-2]。为了对林地资源进行科学管理和有效利用,寻找经济、高效、精确的林地资源信息获取方法是林业工作的重点。航天遥感技术的快速发展,为国家林地资源信息获取提供了有效手段。从不同来源、不同形式的遥感信息中准确快速、高质高效地获取林地类型精细信息,实现森林资源的定期,甚至实时监测,为清查森林资源、预测预报森林火灾、利用和保护森林资源提供了重要基础和依据[3]。目前,国内外学者利用不同遥感数据,在林地类型提取方面通过不同的研究方法进行了大量的研究,以提高林地类型的分类精度[4-7]。随着第1颗提供 “红边”波段的商业卫星——RapidEye卫星的发射,其独特的光谱特征被国际各类遥感卫星研究及应用机构认可与采用。国内外学者通过将具有红边波段的RapidEye遥感卫星数据应用于森林胁迫时空监测、农业和植物分类等方面发现,红边信息在一定程度上可提高监测精度和分类精度[8-9]。中国自行研制的GF-6是一颗只携带一部相机实现超大宽幅(800 km)的高分辨率卫星,且新增的红边、黄边谱段对于大区域的森林、农作物等植被生长状况监测、植被类型识别具有独特的优势。利用红边波段对林地类型精细分类尚未见报道,因此本研究以内蒙古自治区根河市根河森林生态站为例,以携带红边波段且有一定数据获取量的RapidEye数据为主要数据源,采用基于EnMAP-Box的随机森林和支持向量机的分析方法展开研究,通过寻优参数选择和分类器训练等方面的优化设计,将RapidEye数据所携带的红边信息应用于林地类型分类,从独特的波段信息运用和运行速率出发,开展具有较高实际应用价值的林地类型精细识别方法。同时以GF-1数据为对比研究数据,探讨携带红边波段信息的卫星数据对林地类型精细分类的影响,为国产GF-6卫星在林业资源调查方面的深入应用提前探路,为高分辨率成果全面服务于中国林业发展和生态环境建设提供一定的技术参考。
根河市是内蒙古自治区呼伦贝尔市北部的县级市,地处大兴安岭北段。地理坐标为50°20′~52°30′N,120°12′~122°55′E,是中国纬度最高的城市之一,更是中国平均气温最低的旗市。根河市资源以森林资源为主体,森林覆盖率为91.7%,森林面积达174.5万hm2[10],樟子松Pinus sylvestris var.mongholi-ca,兴安落叶松Larix spp.和白桦Betula platyphylla等是该区的主要树种。本研究核心区域为包含内蒙古首个森林生态观测站——“大兴安岭森林气候生态观测站” 在内的矩形区域(51°00′~51°45′N,121°23′~121°43′E), 位于根河市南部。
国产GF-1数据由中国资源卫星应用中心提供[11],RapidEye数据由高分辨率对地观测系统重大专项(民用部分)科研项目(21-Y20A06-9001-17/18)提供。数据详细信息见表1。
表1 卫星数据信息表Table 1 The detailed information of satellite data
其他数据包括:①样地调查数据。2016年8月1-30日,在根河市境内进行实测,获得3种类型样地:Q样地(19个)、复测样地(27个)和航线样地(71个),其中航线样地包括13个方形样地(30 m×30 m)和58个圆形样地(直径30 m);②辅助数据。大兴安岭根河生态站小班数据和二调森林资源分布图作为辅助数据,Landsat8 OLI数据作为基准影像数据,来源于美国地质勘探局(USGS)官网(http://landsat.usgs.gov/);③数字高程模型数据。根河市30 m分辨率的GDEMV2数据,来源于地理空间数据云;④矢量数据。生态站矢量数据和研究区矢量数据作为影像裁剪数据。⑤检验样本。结合外业调查数据和Google影像,在研究区共选取74个分布均匀的样地(外业采集方形样本大小:30 m×30 m,自选方形样本大小:20 m×20 m)作为验证样本,其中:阔叶林和针叶林各18个、灌木林12个、耕地、水体和建筑用地各6个、草地5个、裸地3个。
图像预处理包括辐射定标、大气校正、正射校正、图像融合、地形校正和图像配准等。其中:①大气校正采用FLAASH大气校正;②图像融合。GF-1数据采用融合效果较好的NNDiffuse Pan sharpening法进行图像融合,RapidEye数据不进行此处理;③地形校正。采用广泛应用的C校正模型进行地形校正;④图像配准。以经过辐射定标、大气校正和正射校正的Landsat 8 OLI遥感影像(2017年7月)为基准影像,以GF-1和RapidEye遥感影像分别为待校正影像,通过图像自动配准后的方法进行图像配准处理,配准后GF-1和RapidEye遥感影像的总的均方根误差(RMSE)分别达0.58个像元和0.56个像元,均满足图像配准要求,最终的数据预处理结果如图1所示。
根据国家林业局颁发的《国家森林资源连续清查技术规定(2014)》[12]、研究区的地表覆盖情况和应用需求,本研究将主要地物类型划分为针叶林、阔叶林、灌木林、草地、建筑用地、裸地、水体和耕地8类。
2.1.1 光谱特征 基于Rapid Eye和GF-1 PMS影像上8种地物类型的光谱特征(图2),分析各类别在不同数据源、不同时相影像上的光谱差异和光谱域类别可分性。由图2可知:RapidEye影像上红边波段(red edge,RE)处是植被光谱响应的转折点,差异性明显;GF-1 PMS影像上,针叶林、阔叶林、灌木林、草地和耕地在近红外波段(near infrared,NIR)表现出明显的植被光谱响应峰值。
2.1.2 红边特征 红边波段是介于红光波段和近红外波段之间的波段。植被叶片反射率在红边谱段范围会发生突变,是植物曲线最为明显的特征,是研究的重点光谱区域。红边与植被的各种理化参数紧密相关,可以更好地应用于林业和农业等方面进行植被类型精细识别。归一化红边指数(normalized difference red edge vegetation index,NDRE)是归一化植被指数(NDVI)的改进型,它对叶冠层的微小变化、林窗片断和衰老非常敏感,可用于精准农业、森林监测和植被胁迫性探测等。计算公式为:
图2 RapidEye和GF-1影像不同地物光谱曲线Figure 2 Spectral curves of eight typical ground objects for RapidEye and GF-1 PMS images
式(1)中:INDRE表示归一化红边指数;ρNIR和ρRE分别表示近红外波段(NIR)和红边波段(RE)的反射率。通常,-1<INDRE<1,且当0.2≤INDRE≤0.9时,表示为绿色植被区。
EnMAP-Box是由德国环境制图与分析计划项目组基于交互式数据语言(interactive data language,IDL)开发的一款对高光谱遥感数据处理与分析的工具包[13-14]。
ImageSVM是柏林洪堡大学地理实验室开发的一种利用IDL语言对遥感影像进行支持向量机(support vector machine classification,SVM)分类和回归分析的非商业产品工具[15]。支持向量机法是基于统计学理论,以结构风险最小化为基础,通过最小化经验风险和置信区间,将神经网络结构选择问题转化为较容易的核函数选择问题,对于样本数量较少的研究,具有很好的优势[16]。SVM通过引入核函数,将非线性问题转化为线性问题,有效减小算法复杂度,避免经典学习中过学习和维数灾难等弊端[17],而且具有很好的通用性、鲁棒性。本研究选用的核函数是目前广泛应用的径向基函数。SVM的参数优化功能是基于网格搜索算法,通过网格搜索法在可控范围内寻得适合模型的最优的核函数参数g与惩罚系数C是SVM分类的关键[18-20]。EnMAP网格搜索寻优时,核函数g的范围为:0.0100~1000.0000,惩罚系数C的默认值为0.1,乘数(multiplie,M)的范围为1<M≤10。一般情况下,设置g的最小值为0.01,最大值为10;C的最小值为1,最大值为1000,其对应的乘数Mg和乘数Mc均为1.2~2.0。
ImageRF是一种基于IDL程序的遥感影像分类方法。随机森林(random forests,RF)是利用bootstrap重抽样方法从原始样本中抽取多个样本,对每个bootstrap样本进行决策树建模,然后将这些决策树组合起来,通过投票得出最终的预测或者分类结果[20-21]。随机森林进行分类时预选变量个数m和随机森林中树的个数n是进行参数调优的关键。在ImageRF分类时选用的RFC(Random Forests Classification)模型是一种利用训练样本和内部验证的参考数据集进行参数优化的分类模型[23-24]。EnMAP中随机森林分类主要通过改变树的数量(number of trees)来提高分类精度,其默认值为100,在大多数情况下。该默认值已可以达到很高的分类精度。
利用NDRE独有的特性,将其参与支持向量机分类。首先,在波段计算器中对RapidEye影像数据通过公式(1)进行波段运算,得到RapidEye数据的归一化红边指数图像(单波段)。然后将所得到的单波段归一化红边指数数据和RapidEye遥感数据的5个(蓝、绿、红、红边和近红外)波段通过ENVI提供的“Layer Stacking”工具进行波段组合,最后将加入归一化红边波段信息的RapidEye影像进行SVM分类处理。
经过外业调查与遥感影像对应,针对在本研究区确定的8种不同的目标地物类型,利用影像上地物的特征 (形状、大小、色调及纹理结构等),来确定本研究区的训练样本。利用ENVI 5.4.1软件中Compute ROI Separability工具计算任意2个类别间的差异性程度,即以任意类别间的统计距离来衡量训练样本的可分离性。结果表明:选择的8种类型样本间的可分离性较好,其中参数值大于1.90(合格样本)的占 25/28, 在1.86~1.90的占3/28。
3.2.1 参数寻优结果 利用SVM模型中的网格搜索法,寻得的RapidEye和GF-1遥感影像的最优参数(g,C)如图3所示。图3右边柱状部分为图例,表示最低精度和最高精度的值。观察分析图3可知:g值较小和C值较高时,精度值较高。
图3 寻优参数结果Figure 3 Optimum parameter result
3.2.2 影像分类结果 为了对比分析研究方法的分类效果,用传统的最大似然法(MLC)和SVM法的分类结果为对比。最优参数参与下的ImageSVM法分类和ImageRF法,以及MLC和SVM法的分类结果分别如图4(RapidEye)和图5(GF-1)所示。图中A和B分别为ImageSVM法和ImageRF法的影像分类结果;图4和图5中C和D分别为传统SVM和MLC法的分类结果。通过式(1)对Rapideye遥感影像进行波段计算,获得单波段的归一化植被指数图像,如图6所示。将其与5波段的RapidEye遥感影像通过波段重组(layer stacking),重新生成一个6波段的遥感影像,然后通过SVM分类法对重组后的遥感影像进行分类,得到NDRE参与下的SVM分类结果(图7)。
图4 RapidEye影像分类结果示意图Figure 4 Classification results for RapidEye image
利用外业调查数据和选取的检验样本,通过建立混淆矩阵对RapidEye和GF-1遥感影像不同分类方法的分类结果进行精度验证,精度验证结果分别见表2和表3所示。
图5 GF-1遥感影像分类结果示意图Figure 5 Classification results for GF-1 image
通过表2和表3可知:对于RapidEye和GF-1遥感影像,基于EnMAP-Box的随机森林和支持向量机分类的总体分类精度和Kappa系数均高于传统的SVM和MLC分类。其中:高分辨率的RapidEye和GF-1PMS遥感影像效果更明显,ImageRF和ImageSVM的总体分类精度相对于传统的SVM和MLC均提高了6%以上。
上述分析可知:ImageSVM和ImageRF法在复杂山区林地类型精细识别中精度和可信度高。针对这2种具有同等分类效果的方法,在运行效率和广泛适用性方面进行对比研究,结果如表4所示。
由表4可知:在相同条件(影像类型相同、数据范围相同、运行环境相同),ImageRF分类法相对于ImageSVM分类法,精度基本一致,但其费时少、效率快,是一种快速高效的分类方法。针对大区域林地类型精细识别而言,ImageSVM对运行环境的要求极高,花费时间也较长,广泛适用性较差。同样,对RapidEye遥感影像基于NDRE参与下的SVM分类结果进行精度验证。结果如表5所示。
图6 归一化红边指数(单波段)Figure 6 NDRE(Single-band)
图7 NDRE参与下的SVM法分类结果图Figure 7 Classification result for SVM with NDRE
表2 RapidEye影像分类精度统计表Table 2 Classification accuracy table for RapidEye image
表3 GF-1影像分类精度统计表Table 3 Classification accuracy table for GF-1 image
表5和表2可知:归一化红边指数NDRE参与下的支持向量机分类与传统的支持向量机分类结果的分类精度由84.08%增长到91.69%,提高了7.61%。由此可知,红边波段信息对林地具有很好的区分性,可极大地提高林地类型的精细识别精度。
本研究面向国家森林资源监测调查的行业重大需求,对复杂地形条件下高分辨率遥感影像林地类型精细识别方面展开了深入的研究与分析。主要结论如下:①本研究EnMap-Box支持下的ImageSVM和ImageRF分类方法相对于传统的SVM和MLC分类方法具有较高的分类精度,是一种有效的林地类型信息精细识别方法,具有精度高和可信度高的优势,可满足森林资源调查、变化监测、数字更新等林业应用需求。对于2016年的RapidEye影像,ImageSVM相对于SVM和MLC分类方法其总体分类精度分别提高了6.18%和7.06%,Kappa系数分别提高了0.07和0.08;ImageRF分别提高了5.93%和6.82%,Kappa系数分别提高了0.07和0.08,均能确保森林资源调查成果的精细化、准确性、高效性;尤其是具有红边波段的RapidEye遥感影像在林地类型精细识别方面的显著优势,将在林地类型精准监测、时空变化信息提取以及森林空间结构分析等方面发挥重要作用,为国产GF-6卫星数据在林地类型精细识别和精准监测研究打下坚实的基础。②相对于无红边波段的GF-1遥感数据,携带红边波段的RapidEye数据对林地类型具有较高的识别精度和可分性。其中,ImageSVM法对各类影像的总体分类精度为 90.26%(RapidEye)>90.18%(GF-1); ImageRF 法为 90.73%(GF-1)>90.02%(RapidEye); SVM 法为 84.08%(RapidEye)>81.15%(GF-1); MLC 法为 90.26%(RapidEye)>90.18%(GF-1)。 相同方法, 不同数据情况下,RapidEye数据的总体分类精度均最优。③以RapidEye遥感影像为数据源,通过对比传统支持向量机分类和归一化红边指数参与下的支持向量机分类精度验证结果可知:分类精度提高了7.61%。红边波段信息对林地具有很好的区分性,可极大提高林地类型的精细识别精度。同时,对比基于样本的面向对象分类法和传统SVM和MLC分类法的分类精度可知:该方法的分类精度均高于2种传统的分类方法,满足林地类型精细分类要求,但是其自动化程度低、费时费力、受人为因素影响较大,不适合大区域林地类型精细识别研究。
表4 同一范围相同运行环境下数据运行效率对比研究Table 4 Comparative study on data operation efficiency under the same operating environment of the same range
本研究取得了一定的研究成果,同时也存在诸多的问题与不足:①林地类型的精细识别依赖于影像对象特征具有高度的可分性,但仅依靠影像对象颜色、纹理、几何等低层次特征,还不足以对光谱特征极其相似的不同林地类型进行精细识别。对携带红边波段信息的遥感数据,充分应用归一化红边指数、信息熵、波段均值等特征对林地类型进行精细识别。②根河市生态站具有典型性和代表性,以落叶松为主的针叶纯林、以白桦和杨树为主的落叶阔叶林以及天然灌木林具有明显的时空特征。落叶阔叶林、灌木林及其他林地未进一步细分,且该区域火烧迹地经过多年自然恢复均已变为灌木林,故未精细分出。本研究所采用的方法在其他区域的林地类型精细识别能力及实用性在其他林区还需要进一步的验证与评估。