邢璐琪 张桂莲* 张 浪* 易 扬 林 勇 江子尧 郑谐维
高光谱技术具有光谱分辨率高的优势,在林业、农业、生态、环境等众多领域发挥着重要作用。本文对高光谱技术在植被特征监测中的应用进行了总结,主要涉及植被指数研究、物理生化参数反演、树种识别、生物量估算等内容;同时,以无人机高光谱影像为数据源,对植被指数、特征参数、树种识别等方面进行了案例分析,以期为植被高光谱数据的应用提供参考与借鉴。
高光谱技术;植被指数;特征参数;树种识别
光谱信息可用来表征地物特征,其分辨率的提高有助于实现对地物特征的精准识别和监测[1]。由高光谱技术获取的光谱数据或影像,在400~2 500 nm波长范围内,光谱分辨率一般小于10 nm,能够记录瞬时视场角内几十甚至上百个连续波段的光谱数据[2],可反映不同地物的精细波谱信息,使在宽波段多光谱数据中不可探测的地物能够被识别[3]。
高光谱影像或数据具有高光谱分辨率的特点和优势,混合像元分解[4]、图像融合等方法有效解决了高光谱数据低空间分辨率问题;主成分分析(Principal Component Analysis,PCA)、独立主成分分析(Independent Principal Component Analysis,ICA)、最小噪声分离变换(Minimum Noise Fraction,MNF)、局部线性嵌入(Locally Linear Embedding,LIE)等方法实现了波段提取、波段选择[5],从而解决了高光谱数据冗余问题;半监督学习[6]、光谱-空间特征结合[7]等方法有效解决了Hughes现象;基于面向对象的分类等方法[8]对缓解椒盐噪声问题有良好的效果。目前,高光谱技术已在目标探测、精细分类、定量反演等方面取得了良好的应用成果[1]。
植被作为地表物质及陆地生态系统的重要组成部分,在维护区域生态环境和应对全球气候变化中发挥着重要作用。本文以高光谱技术为基点,简要介绍了高光谱在植被特征监测方面的研究与应用,并以无人机高光谱影像为数据源,对植被指数、特征参数、树种识别等方面进行了案例分析,为植被高光谱数据的应用提供参考与借鉴。
基于光谱信息获取的植被指数,是进行植被特征度量的有效指标和方法,在表征和监测植被特征方面发挥着重要作用。常用的植被指数有归一化植被指数NDVI、差异植被指数VDVI、比值植被指数RVI、垂直植被指数PVI、增强型植被指数EVI、加权差分植被指数WDVI、土壤调节植被指数SAVI、绿度指数GI及一系列改进型植被指数等[9-10],这些植被指数可基于多光谱或高光谱数据快速获取,在植被特征监测方面应用广泛。
高光谱数据在全波段具备更为丰富的光谱信息,可反映植被不同生物物理特性的细微变化[1]。同时,在表征植被典型特征的相关波段范围(如红边、绿峰、蓝边等),高光谱数据具有多光谱数据无法感知的细节光谱信息,因此,利用高光谱数据可以构建更精细有效的植被指数,以加强植被特征提取效果。目前,基于高光谱数据发展或改进的植被指数,如光化学反射指数PRI、改进叶绿素吸收指数MCARI、转换叶绿素吸收指数TCARI、改进土壤调节植被指数OSAVI、改进归一化蓝色指数mDNblue、角度不敏感植被指数AIVI等[11]已应用于相关研究;全谱段指数VIUPD[12-13]利用所有波段的有效信息反映植被的细微变化,以此建立的模型相比基于多光谱数据植被指数精度更高;新型光谱指数NSIs(包括HI(Health-Index)、PMI(Powdery Mildew-Index)、YRI(Yellow Rust-Index)、AI(Aphids-Index))用于叶片和冠层尺度定量区分作物特定病害取得了较为可靠的结果[14]。
高光谱数据能够记录植物体内各种生化组分对不同波长电磁波的选择性吸收特征,因此,可利用高光谱数据进行植被的各种物理生化参数的反演。高光谱数据应用于植被特征参数反演的研究主要包括:生化组分参数反演,如叶绿素Chls(Chlorophylls)、类胡萝卜素Cars(Carotenoids)、氮素N(Nitrogen)等;生物物理参数反演,如叶面积指数LAI(Leaf Area Index)等;植被与环境相互作用因素反演,如日光诱导叶绿素荧光SIF(Solar-Induced Chlorophyll Fluorescence)、光合有效辐射FPAR(Fraction of absorbed Photosynthetically Active Radiation)等[1]。
Chls含量是植被重要参数之一,其大小既表明植被生长状况,又表征其生产能力,是评估植物营养胁迫、光合作用能力以及各生长阶段生长发育状况的重要指标[15]。
利用高光谱技术估算叶绿素含量主要有经验模型和物理模型两种方法。基于高光谱的经验模型主要是通过分析叶绿素与光谱波段反射率及其波段组合、植被指数、特征参数等的相关关系,从而实现经验建模。吴长山等[16]的研究表明植被光谱反射率数据及其导数光谱数据与叶绿素密度具有很好的相关性;JIN等[17]提出的陆地叶绿素指数、双峰冠层氮指数、合并光谱指数提高了叶绿素含量估算模型的精度;光谱“红边”位置、绿峰反射光谱曲线特征边的变化速率及绿峰两边的夹角等变量在叶绿素含量估算研究中也有较好结果[15,18-19];方慧等[20]采用红边位置和绿峰位置参数,构建叶绿素含量定量分析模型,很好地实现了叶片叶绿素含量的估算。
近年来,机器学习方法在高光谱遥感反演植被参数的研究中应用广泛,依尔夏提·阿不来提等[21]通过原始光谱转换、高光谱参数计算,分析叶绿素含量与高光谱参数之间的相关关系,构建估算冠层叶绿素含量的BP神经网络模型,得到了较高精度的叶绿素含量估算结果;陈澜等[22]基于常见植被指数,结合主成分分析和随机森林算法,实现了植被叶片叶绿素含量最佳高光谱估算模型的构建。
基于高光谱技术的物理模型反演方法也可进行植被叶绿素的估算,即根据地物特性来反演冠层光谱,并采用辐射传输等物理模型对其进行解译[21],如SUN等[23]通过高光谱激光雷达技术结合PROSPECT模型对叶绿素含量进行估算;QIU等[24]在PROSPECT模型中增加叶片表面反射因子,降低了叶片反射率变化对叶绿素含量反演的影响,从而实现了叶绿素反演精度的提高。
LAI定义为单位面积上绿色植物所有叶面积总和的一半[25],是陆地植被重要的生理参数之一[26-27],与植物的光合作用、蒸腾作用以及生态系统生产力的形成有着密切关系[28],对于研究陆地植被的碳水循环和能量交换具有重要意义[29-30]。
通过建立实测LAI与光谱数据原始波段,基于波段运算的波段组合、波段变换、植被指数等之间的相关关系,可有效实现植被LAI时空数据的定量估算。基于多光谱数据的LAI估算,光谱波段较少,波段间隔宽,估算模型较简单[31],各种植被指数与LAI的关系具有地域性和时效性[32],同时,植被指数反演估算LAI存在饱和问题。
高光谱数据波段窄且连续,可以更精细地表现植被参数信息,如通过构建对LAI更加敏感的植被指数、对常规植被指数进行连续化处理(如光谱导数等)[32]、或通过作物的红边参数描述植被的LAI或物候变化等[31],高光谱数据的应用将大大提升LAI信息提取精度。相关学者基于高光谱数据及其光谱变换形式,分析光谱数据与LAI之间的相关关系,建立的植被不同时期LAI估算模型均达到较高精度[33-36];云增鑫等[37]利用森林冠层激光点云数据对高光谱数据进行林下植被信息剔除,有效改善森林冠层LAI估算精度;郭云开等[38]以高光谱数据为基础,利用辐射传输模型和随机森林组合模型对路域植被叶面积指数进行了估算。
在植物光合作用过程中,植物光合色素吸收的光能最终转化为3种形式,即主要用于光合作用、少量以荧光释放和热能耗散[39]。SIF是指处于自然光照条件下的绿色植物在进行光合作用时释放一种波长位于650-800 nm的光[40],具有红光(690 nm左右)和近红外(740 nm左右)两个波峰,与基于反射率的植被指数相比,能更直接反映植物实际光合作用的动态变化[41]。SIF作为光合作用的副产品,与植被总初级生产力GPP(Gross Primary Productivity)和植被受胁迫状态密切相关[42],对于精确把握植被生长状态、准确了解全球碳汇分布和进一步理解陆表植被对气候变化的响应具有重要意义[43]。
目前,SIF的反演主要利用夫琅和费暗线“井”填充效应实现,可观测的原始暗线深度及其精细程度决定填充效应的明显程度和SIF反演的鲁棒性,因此,SIF遥感反演需在高光谱分辨率条件下实现[40]。相关领域学者已经就SIF的遥感反演方法开展了一系列研究,许多综述类文章对方法进展进行了详细阐释[40-42,44-45]。
基于高光谱遥感的大气层顶SIF的反演方法主要分为三种。一是基于大气辐射传输方程的SIF反演算法。其经典算法如FLD(Fraunhofer Line Discrimination)算法、SFM(Spectral Fitting Model)算法及改进的FLD系列算法(3FLD(three bands FLD)、cFLD(correct FLD)、iFLD(improved FLD)、eFLD(extended FLD)等,该方法对光谱分辨率要求较低,刘鸥阳等[46]利用3种经典SIF反演方法(FLD、3FLD、iFLD),实现了基于水汽吸收波段的SIF反演性能的检验和对比分析。二是简化的物理模型算法。该方法虽然避免了辐射传输的计算,但对共谱分辨率要求极高,刘新杰等[47]利用日本温室气体观测卫星GOSAT的TANSO-FTS超光谱数据,通过加权最小二乘拟合的叶绿素荧光卫星反演算法,获得了中国区域2010年1月至2011年6月的叶绿素荧光数据。三是数据驱动算法。该方法降低光谱分辨率要求的同时避免了大气传输方程运算,是目前大多数全球SIF产品的生产算法,如中国的Tansat_SIF、欧盟的Sentinel-5-TROPOMI SIF等,其他相关卫星传感器性能信息可参考相关文献[40,42]。
高光谱数据光谱分辨率高,能够探测不同植物之间细微的光谱差异,从而实现物种识别与分类。宫鹏等[48]利用高分辨率光谱仪数据,采用神经元网络算法识别出6种针叶树种,平均精度达到94%以上;肖海燕等[49]结合决策树和高光谱特征分析方法,利用高光谱数据进行红树林群落信息识别与提取;于丽柯等[50]应用HSI高光谱影像对大兴安岭地区塔河林区进行树种分类,线性波谱分离方法获取了较高精度的分类结果(精度为72.0%)。
利用高光谱数据进行树种识别与分类,数据冗余是研究中不可避免的问题之一,需进行特征波段选择以实现高光谱数据降维。宫鹏等[48]采用相邻窄波段逐步加宽的方法,测试不同波段宽度对树种识别精度的影像以获取最佳特征波段;王志辉等[51]利用4种树种叶片光谱数据进行可识别性波段选择与光谱特征参量分析,结果表明区分不同树种的有效波段大都位于近红外波段;李子艺等[52]采用最佳指数法对高光谱数据进行波段选择,研究表明红边区光谱波段包含大量树种识别信息,这与王志辉的研究结果相似。
为提高树种识别与分类精度,光谱信息结合空间信息、波段组合信息等共同参与树种识别的相关研究取得了一系列进展。陈尔学等[53]以EO-1 Hyperion高光谱遥感数据为基础,采用结合空间上下文信息和光谱信息的分类算法,有效提高了树种识别的精度;苗宇宏等[9]通过光谱数据降维、纹理特征提取以及植被指数选择等对高光谱影像进行分析,通过支持向量机(Support Vector Machine,SVM)监督分类实现了植被的精细分类,总体精度可达99.6%;尚坤等[54]结合原始光谱特征、纹理特征及对植被理化参量敏感的光谱指数特征,构建植被特征库并进行优化,提高了植物类别间的可分性和分类效率;赵鹏等[55]对高光谱图像光谱维和空间维的特征数据进行融合后,使用SVM复合核函数对树种进行分类,有效提高了树种的分类精度。
随着高光谱数据空间分辨率的提高,树种分类结果椒盐噪声严重,面向对象分类方法可有效解决基于像元分类方法导致的结果破碎化及椒盐噪声问题。吴艳双等[56]结合光谱特征和不同尺度纹理特征、采用SVM算法进行面向对象的树种精细分类;CAO等[57]利用无人机高光谱图像,通过结合光谱特征、纹理特征和高光谱植被指数,利用k近邻算法(k-nearest Neighbor,KNN)和SVM算法进行基于目标的图像分析技术以实现红树林分类识别。
尽管高光谱数据具有精细光谱信息,但区分光谱特征相似的树种仍然受限[58],将高光谱与其他遥感数据结合,如LiDAR数据,实现优势互补,已成为研究热点[59]。刘丽娟等[58]将机载LiDAR与高光谱CASI数据融合,充分利用垂直结构信息和光谱信息进行温带森林树种分类,融合数据树种分类精度高于仅高光谱数据的精度,总体精度达到83.88%;董文雪等[10]利用机载LiDAR和高光谱数据,通过相关分析法筛选林冠结构参数和光谱指数,采用自适应模糊C均值聚类算法实现的物种丰富度预测精度为R2=0.69;陶江玥等[60]利用机载高光谱和LiDAR数据,采用基于高光谱+激光雷达+结构不敏感色素指数变量组合的SVM分类算法,实现了树种精细分类,其总体精度达到89.12%;SHEN等[61]使用机载高光谱和LiDAR数据,采用随机森林算法对中国东南部亚热带森林中的树种进行分类,结果表明,使用高光谱和LiDAR融合数据进行树种分类比仅使用高光谱数据总体精度提高0.4%-5.6%;ALONZO等[62]将高分辨率高光谱图像与LiDAR数据融合,在基于冠层尺度上对美国某些地区常见的29类树种进行分类,结果表明融合LiDAR数据后,分类精度提高了4.2%。
精确估算植被生物量对全球碳平衡以及气候变化的研究有重要意义,将具备窄波段优势的高光谱数据应用于植被生物量估算,在提高植被生物量估算精度方面实现了进步与突破。
在利用高光谱数据进行植被生物量监测估算时,土壤背景光谱的干扰不可避免,因而生物量的估算精度受到一定影响,针对该问题,张良培等[63]通过对高光谱信号进行一阶导数运算,压缩混合光谱中的土壤光谱信号,进而得到更为可靠客观的生物变量值;李燕丽等[64]利用快速独立分量分析(Fast Independent Component Analysis,FastICA)算法去除土壤对植被光谱的影响,提取净植被光谱,并建立小麦生物量的偏最小二乘回归估算模型,实现了土壤光谱和植被光谱有效分离,显著提高了植被生物量的估算精度。
高光谱数据空间分辨率较低,易形成混合像元,难以获得植被内部细节信息,且在植被覆盖度较高的区存在植被生物量信息饱和现象,多源数据的结合使用,如高光谱数据与高分辨率数据结合,实现了光谱特征信息与空间结构信息的协同应用,可有效提高植被生物量估算精度。KATTENBORN等[65]通过Hyperion高光谱数据和WorldView-2高空间分辨率数据对欧洲温带森林地区地上生物量进行估算,融合了光谱信息和空间信息的预测模型估算精度,比单独使用光谱信息或空间信息的预测模型精度提高约20%;申鑫等[66]利用机载LiCHy传感器获取高光谱和高空间分辨率数据,融合高光谱数据光谱特征变量和高空间分辨率数据单木冠幅统计变量,构建多元回归模型估算生物量,结果表明通过集成高光谱和高空间分辨率数据的生物量反演效果有所提升。
近年来,结合高光谱数据与机器学习方法实现植被生物量估算的研究得到发展与应用,如石雅娇[67]等以玉米地上干生物量为研究对象,分别基于光谱指数法和BP神经网络算法构建反演模型,结果表明,相比基于光谱指数构建的生物量反演模型,BP神经网络模型反演结果更好。
本研究采用大疆精灵无人机、高光谱相机S185(光谱范围为450~950 nm,光谱分辨率为4 nm),于2020年4月拍摄上海市奉贤区邬桥实验基地(121.41°E,30.96°N),样地面积约2.84 hm2,获取高光谱影像。通过对高光谱数据进行处理,实现了样地内植被指数(红边归一化植被指数RENDVI、红绿比值指数RGRI)、植物生理参数(花青素、胡萝卜素、叶绿素)的计算和物种识别。
1. 植被指数RENDVI、RGRI计算结果
2. 植被参数花青素、胡萝卜素、叶绿素计算结果
3. 植被物种识别结果
基于高光谱数据的植被指数、植物生理参数计算,可利用不同波段范围的窄波段光谱数据分别与待反演或监测的植被特征构建模型,以获取植被指数、植物生理参数的最佳计算波段,为其他相关研究提供高精度基础数据。本研究利用高光谱数据计算研究区植被指数和植物生理参数,结果分别见图1和图2。图1中,红边归一化植被指数RENDVI与红绿比值指数RGRI均很好地区分了植被区域与非植被区域(裸地、建筑用地);RENDVI图中,RENDVI值越大(接近1),表明该区域植被覆盖度越大,样地中黄色和绿色区域有植被覆盖,且绿色区域植被覆盖度更大;RGRI图中,RGRI值越小,表明该区域植被覆盖度越大,样地中紫色区域植被覆盖较大;两种植被指表征的植被覆盖情况一致。图2表明了样地中不同植物花青素、胡萝卜素、叶绿素含量的高低,可作为研究植被生化参数的有效基础数据。
本研究利用高光谱数据、面向对象分割方法及光谱角分类方法实现植物物种识别,结果如图3所示。由图3知,在样地范围内,分别提取了香樟、玉兰、七叶树、马褂木、石楠、垂丝海棠、草地等23种物种,其分布与样地实地调查结果较为一致,因此,基于高光谱数据的植被物种识别结果良好。
高光谱技术在植被特征监测及其他众多领域均具有重要作用并已取得了许多创新性成果。然而,高光谱技术还处于发展与提升阶段,存在“曲高和寡”之忧,降低高光谱数据获取、处理、信息提取与应用方面的门槛仍是高光谱技术亟待解决的科学问题[1]。笔者期待并相信,高光谱技术的长足进步与发展将在相关领域的研究与应用中发挥更大的作用。