刘昕 杨光 陈昊宇 于滋洋
(内蒙古农业大学,呼和浩特,010018)(东北农业大学)
土壤与植物在生态系统中均占有重要的地位,土壤与植物的研究一直受国内外学者的重视。土壤的光谱反射率是由多种因素综合反映的结果,例如土壤有机质、颗粒组成、水分、氧化铁、碳酸钙、黏土矿物、盐分等[1]。植被盖度是衡量地表植被状况的重要指标,及时掌握植被盖度的动态变化对生态环境建设具有重要的意义[2]。高光谱遥感是21世纪以来遥感技术的前沿和主要发展对象。近年来,植物地物光谱测量与土壤地物光谱测量不仅是遥感应用分析的基础,是遥感中重要方法之一,同时也是遥感理论研究的重要组成部分[3]。Zhang et al.[4]利用高光谱指数测量矿山粉尘对3种典型沙漠植物生长的影响,提取19个植被指数,检查他们与灰尘的相关性;Du et al.[5]利用偏最小二乘回归将SIS连接到水稻上,主要分析光谱指数在叶片氮素含量中的应用;Liu et al.[6]采用正交试验技术,对不同叶位马铃薯叶片的含水量进行研究,分析了不同叶位的光谱特征与马铃薯植株水分的分布关系;Li et al.[7]利用多尺度遥感综合监测北方典型草原区的植被盖度;马爽等[8]对不同植被指数的植被—土壤混合像元高光谱偏振信息与模型进行研究;李晓锦[9]根据混合像元分解对植被覆盖度进行估算与动态变化分析;陈彦兵[10]利用混合像元分解对潘阳湖湿地进行植被覆盖度提取;王鹏龙等[11]对腾格里沙漠典型植物含水率与地物光谱的关系进行研究与分析;刘云鹤[12]对植被覆盖的各层结构进行光谱特征分析;包刚等[13]利用北京大学“无人机载荷综合试验场”对草地植被覆盖度结合高光谱遥感进行估算研究时,得出利用高光谱数据与模型分析可以反映植被的生长状况,准确地反演植被覆盖度,并对植被覆盖度进行有效的估算。
近年来,植物与土壤在生态系统中的作用愈发突出,混合光谱的研究也引起了学者的普遍重视,研究者着重从混合像元分解提取植被覆盖度、植物含水率等方面进行了研究与探讨,而未说明随地表植物盖度增加光谱反射变化特征。由于土壤类型复杂多样,不同土壤的组成成分各不相同,具有不同反射光谱形式,但对于覆盖中国北方大部分的栗钙土缺少研究;植物种类繁多,而红瑞木(SwidaalbaOpiz)是园林造景的异色树种,为阔叶植物,喜欢潮湿温暖的生长环境,生长速度非常快,植物叶片水分充足,叶形与生长高度比较适合光谱反射测量,因此本文选取栗钙土与红瑞木叶片为研究对象,采集了纯土壤、纯植物和不同面积比例的土壤—植物混合光谱反射率,对比分析了随植物盖度逐步增加,混合光谱变化规律。在此基础上,对光谱特征参数与植物叶片盖度进行了相关分析,建立了光谱特征参数估算植物盖度模型。研究结果可为基于高光谱遥感的混合光谱特性研究提供一定理论依据,为植被遥感监测提供一定的技术支撑。
土壤样本与植物样本于8月份采集于内蒙古农业大学校园内,土壤采集深度0~20 cm土层,采集后将所有土样用粒径为2 mm的土壤筛筛出。为保证实验条件一致,将采回的红瑞木叶片脱离枝干后马上装入密封袋中,防止水分散失影响光谱曲线。
仪器采用美国Spectra Vista公司2008年生产的SVC HR-1024便携式地物光谱仪测定,光谱的有效范围为350~2 500 nm,波段个数为1 024,光谱分辨率为350~1 000 nm内≤3.5 nm,1 000~1 850 nm内≤8.5 nm,1 850~2 500 nm内≤6.5 nm[14],最小积分时间1 ms,信号采集方式为蓝牙传输。
光谱测定在可控制光照条件的暗室内进行,光源为50 W大小的卤素灯,距样本表面75 cm,光源天顶角为30°,如图1所示,测量前需进行暗电流采集并进行白板标定,每个光谱数据的测定时间设置成5 s,每个样本测定5条光谱曲线,取其平均值作为该样点的光谱反射率的值。
土壤—植物叶片混合在30 cm×30 cm的黑色盛样器皿中将土铺平,并压出一个半径为9 cm的圆,圆心与传感器的探头垂直,在圆内放入经过裁剪的叶片,依次增加叶片的面积,并用照相机进行拍照,逐一进行地物光谱测量;将筛好的土壤、叶片样本分别放置在30 cm×30 cm的黑色盛样器皿中,土壤表面用直尺刮平,尽量模拟地表植被的真实状态;传感器探头垂直于样本表面15 cm处,并采用30°视场角探头,探头接受光谱的区域为半径8.66 cm的圆,远小于盛样器皿的面积,并保证探头接收到的均为样本的光谱反射。
图1 实验设计图
圆内依次放入叶片后用照相机垂直于表面进行拍照,为保证测出的每条光谱曲线与植被覆盖度相对应。经过筛选,测试的7组数据共获得480张有效照片,由于照片中的植被覆盖度形态不一,而CAD的系统较为成熟,易掌握,具有强大的图形编辑功能,可以进行多种图形格式转换的功能,还具有超强的数据交换功能,因此利用CAD软件对植物叶片盖度进行计算。
使用光谱仪附带的软件SVC HR-1024来剔除研究区光谱曲线变异较大的数据,对数据重叠部分进行匹配,利用Merge功能对光谱数据进行融合,最后将所得的数据保存为Excel格式。
由于在测量时波段之间存在相应的能量差异和光谱仪器自身因素等影响,导致光谱曲线会产生一些噪声,因此有必要平滑数据消除信号中包含的少量噪声,并满足后期对光谱建模的需要。光谱数据平滑处理的方法较多,例如三点平滑法、五点平滑法和七点平滑法等;由于三点平滑取的点较少,平滑效果不太理想,而七点平滑法取的点过多,容易导致数据出现误差,因此本文采用的是移动平均法下的五点平滑法[15]。用Matlab 7.1完成,平滑前后的效果图(以土壤光谱曲线为例)如图2所示。
利用ENVI 5.3对光谱数据进行10 nm光谱重采样,将重采样结果作为实际光谱反射率。
图2 光谱曲线平滑前后处理效果图
1.5.1 光谱植被指数参数
对本文所选取的植被指数进行分析,一共选取10种植被指数,计算公式见表1。
表1 植被指数参数
注:R750为750 nm波长的反射率;R705为705 nm波长处的反射率。
1.5.2 一阶微分处理
利用一阶微分处理后的光谱(图3)不仅可以消除系统误差,还可以减弱大气背景产生的噪声,有效的提取出光谱特征参数,见表2。其一阶微分计算公式[16]:
(1)
式中:R(λi)为波长λi+1和λi的一阶微分光谱;R(λi)、R(λi+1)为i和i+1处的原始光谱反射率;Δ(λi)为波长λi+1与λi之间的波长差值。
表2 红边参数
1.5.3包络线去除法(CR)
包络线去除法又称连续统去除法,是指连接波段吸收起点和吸收终点的线[17]。使用该方法可以将原始反射光谱曲线转化为吸收光谱曲线,更有效地突出光谱曲线的吸收和反射特征[18]。根据公式(2)进行计算,再对所得出的曲线进行归一化处理,使最大值为1,如图4所示,根据包络线去除后的曲线,以ENVI 5.3为平台,可以得出吸收峰面积(A)、吸收深度BD(λi)、吸收宽度(W),计算公式见(3)、(4)[19]。
(2)
式中:CR(λi)为波长λi处的包络线去除值;R(λi)为波长λi处的光谱反射率;RH(λi)为波长λi处直线的光谱反射率。
(3)
BD(λi)=1-CR(λi)。
(4)
式中:BD(λi)为λi处的波段深度;λend、λstart为吸收终点和吸收起点的波长。
图3 一阶微分处理后光谱曲线
图4 包络线去除后光谱曲线图
选取可见光波段410~2 300 nm处的原始光谱反射率中任意两个波段组合成的差值指数(式5)、比值指数(式6)、归一化指数(式7)[20],利用MATLAB7.1完成,对植物叶片盖度进行相关分析。
RI(Rλ1,Rλ2)=Rλ1/Rλ2。
(5)
NI(Rλ1,Rλ2)=|Rλ1-Rλ2|/|Rλ1+Rλ2|。
(6)
DI(Rλ1,Rλ2)=Rλ1-Rλ2。
(7)
本文选取3种建模方法,包括一元线性回归法、多元线性逐步回归法、偏最小二乘法,利用这3种方法建立植物叶片盖度预测模型。这3种建模方法各有优势。一元线性回归法输入量小,计算量小,用Excel完成。多元线性逐步回归法广泛应用于光谱分析,构建模型简单,直观且易于理解,运用Spss 13.0完成。偏最小二乘法以MATLAB 7.1为平台使用分解和筛选数据信息的方法,有效地提取综合性最强的变量,并消除无关信息的干扰[21]。为了评估模型的准确性和稳定性,并确保样品之间叶片覆盖面积的比例间隔,将66组样本分为两部分,随机抽取40组样本对其进行建模分析,余下26组样本做为验证样本,分别建立3种模型。
高光谱预测模型的准确性评估主要基于决定系数和总均方根差,R2与模型的稳定性有关,即R2的值很大,则建立模型的稳定性越好;并且RMSE与模型的预测能力有关:RMSE的值越小,建立的模型的准确度越高,预测能力越强[22]。
如图5所示,在自然状态下,土壤表面的光谱反射曲线都比较光滑,没有明显的峰值和谷值;土壤光谱曲线共有3个吸收谷,分别在480、1 400、1 900 nm附近,在500~1 300 nm之间光谱随着波长增加呈上升的趋势,在1 480~1 810 nm呈缓慢上升的趋势;1 840~1 920 nm土壤光谱曲线变化比较平滑;1 873~1 945 nm曲线呈下降趋势,在1 950~2 190 nm,光谱曲线呈上升状态。
图5 光谱曲线图
植物的光谱反射特征主要取决于叶片,该曲线明显的表现出植被光谱“五谷四峰”的特征。植被光谱的主要特征是可见光波段下的“红谷”和“绿峰”;红边出现在680~760 nm之间,是植被具有诊断性的光谱特征[23],而红谷在此波段内形成高反射;在波长480 nm附近存在一个小的反射峰,即“绿峰”。随着叶绿素的不断增加,光谱曲线会出现向右红移的趋势。
图6是400~2 300 nm之间土壤与植物叶片混合光谱在不同面积比例下反射率所表现出来的形式。当植物叶片盖度比例较小时,光谱曲线近似土壤的光谱曲线;植物叶片盖度大于10%时,近似土壤的光谱曲线开始转变,曲线逐渐趋于植物的光谱曲线,与植物的光谱曲线相似;当比例增加到20%时,混合光谱曲线呈现“五谷四峰”的特性,曲线基本保持一致,但由于土壤反射光谱的影响,各波段的峰值均低于绿色植被。
图6 土壤-植物混合光谱曲线
两波段原始光谱反射率组成的差值、比值和归一化植被指数与植被覆盖度的关系中,其中差值的表现形式最好,其次是归一化值和比值。如图7所示,差值指数形式中组合较好的波段是410~710 nm与700~1 400 nm的组合,比值指数形式中组合较好的波段是700~720 nm与690~810 nm的组合,归一化指数形式中组合较好的波段是420~500 nm与720~850 nm的组合和510~720 nm与720~1 300 nm的组合,经过对比分析发现,差值指数与植被覆盖度的关系明显优于比值指数与归一化指数。其中,差值指数中相关系数最好的波段是(690,450)、比值指数(720,710)和归一化指数(720,700)。
2.4.1 一元线性回归模型
(1)高光谱植被指数模型。根据图8可知,各植被指数与植被覆盖度之间存在着显著的相关性,决定系数大部分在0.6以上,在选取的11种植被指数中,ISAV的相关系数最小,只有0.347 9,而IPR与IPSR的相关系数较大,均在0.8以上,因此选择IPR、IPSR这两种植被指数进行建模效果最好。
(2)高光谱红边参数模型。利用一阶微分法,可提取出红边参数(680~760 nm),主要包括红边幅值、红边位置、红边面积,红边位置采用重采样为1 nm后的数据进行建模,红边幅值与红边面积是重采样为10 nm的数据进行建模。图9为不同植物叶片盖度一阶微分处理后的光谱曲线,叶片盖度从20%增加至40%和80%时,导致光谱峰值的波长向右移动了10 nm和13 nm,主要是因为随着叶片的增加,植物叶绿素含量不断增加,长势状况良好,导致红光波段的吸收率变大,因此出现向右“红移”的现象。由表3红边参数数据与植物叶片盖度的一元线性相关可以看出:红边幅值、红边位置、红边面积都与植物叶片盖度有一定的相关性,在植物叶片盖度比例较小时,光谱反射受土壤的影响较大,因此光谱曲线双峰特征不明显,而“红边”随着植物叶片盖度的增加而增大,红边位置的R2只有0.2189,说明红边位置的变化不具有连续性;而红边幅值与红边面积的变化较为明显,R2都达到0.6以上,说明随着植物叶片盖度的增加,“红边”面积与“红边”幅值呈指数增长。
图7 两波段原始光谱指数
图8 植物叶片盖度与植被指数的关系图
表3 红边参数模型
(3)高光谱吸收特征参数模型。利用包络线去除法,可提取出光谱吸收特征参数(吸收深度、吸收面积和吸收宽度)。由高光谱吸收特征参数与植物叶片盖度的一元线性相关分析表4可知:3种吸收特征参数均与植物叶片盖度存在着一定的关系,决定系数均在0.6以上,模型精度也较稳定;在提取的3种吸收参数中,吸收宽度的模型最稳定。
2.4.2 多元线性逐步回归模型
分别以植被指数、红边参数、光谱吸收特征参数作为自变量,不同叶片覆盖面积比例作为因变量,建立不同多元线性逐步回归分析,根据表5可知:构建的多元线性回归模型明显优于一元线性回归模型,前者R2和RMSE优于后者。以植被指数和不同覆盖度作为输入量而建的模型,预测效果和稳定性较好,达到0.911。
图9 一阶微分后不同植被覆盖度的光谱曲线
表4 光谱吸收特征参数模型
表5 多元线性逐步回归模型
2.4.3 偏最小二乘回归模型
用MATLAB 7.1进行编程,分别以植被指数、吸收特征参数、红边特征参数作为输入量,建立不同叶片覆盖面积偏最小二乘回归模型。经过3种建模方法的对比,表6可知偏最小二乘回归模型比一元线性回归模型和多元线性回归模型更稳定,植被指数、吸收特征参数与红边特征参数的相关系数在不断增大,而RMSE逐渐减小,其中以植被指数和不同覆盖度作为输入量所建的偏最小二乘回归模型,拟合系数达到0.971 4,预测效果与精度验证十分准确,效果较好。
表6 偏最小二乘回归模型
本文采用3种方法建立植物叶片盖度的预测模型,效果较为理想。建模结果表明:利用光谱特征参数预测不同植物叶片盖度具有可行性。根据3种模型的建模效果可以看出,用植被指数预测不同植物叶片盖度的效果最好,虽然运用植被指数建立的一元线性回归模型的精度和稳定性与运用多元线性逐步回归、偏最小二乘回归建立的模型相差不大,但多元线性逐步回归模型简单直观并容易理解,可靠性较高。经过一阶微分法提取的红边参数与包络线去除法提取的光谱吸收特征参数所建立的模型效果没有植被指数建立的模型稳定。一阶微分处理后得出的红边参数与植物的叶绿素、水分等因素有关,用一阶微分处理这种方法减少了对叶绿素与水分等因素的敏感性。由包络线去除法得出的吸收特征参数只与光谱吸收谷的形状特征有关,吸收谷的位置是特定的[24],而且混合光谱是土壤水分、有机质、植物水分、叶绿素等综合作用的结果,用包络线去除法提取出的光谱吸收特征参数降低了对上述因素的敏感性[25]。因此,用植被指数作为自变量建立的不同植被覆盖度预测模型具有更强的稳定性和适普性。
混合光谱特性在遥感等方面发挥着极其重要的作用,不同地物反射出的光谱曲线均不同,本文选取了植物叶片覆盖土壤表面为研究对象,实践当中,混合光谱更为复杂,除纯土壤、植物叶片外,植物枝、干等均有一定反射特性,后续研究中将模拟近自然状态下混合光谱进行。
在自然状态下,土壤光谱曲线十分平滑,随着植物叶片盖度的增加,土壤光谱曲线逐渐呈现植物光谱曲线的特性,出现“五谷四峰”的特征;在红边范围内(680~760 nm),明显向右红移,但由于土壤光谱反射的影响,光谱曲线始终都低于植物光谱曲线。
植物叶片盖度与原始高光谱组成的3种形式(差值、比值、归一化值)的指数之间具有相关性,其中两波段差值指数的效果最好,波段组合为410~710 nm与700~1 400 nm之间的组合,差值指数形式的组合与植物叶片盖度的显著性明显高于其他两种形式组合,相关系数最好、最优的波段为(690,450)。
植被指数、红边参数与光谱吸收特征参数均与植物叶片盖度有一定的相关性,植被指数所建立的模型最稳定,验证的精度最高,可行性较好;在3种建模方法中,偏最小二乘法建立的模型最稳定,精度最高,但处理方法较麻烦,输入量较多,不易操作;虽然一元线性模型的计算量小,操作简便,但得出的模型精度低于其他两种方法,因此选用多元线性逐步回归法最适宜。
通过以上研究,探讨了运用不同光谱参数与不同建模方法预测植物叶片盖度的可行性,取得了较好的结果。为植物叶片盖度的估测提供了理论依据与技术支持,也为混合光谱特性研究提供了良好的依据。