温云梦,张冬冬,王家强,多晶,蔡海辉,柳维扬
(塔里木大学 农学院,新疆 阿拉尔 843300)
高等植物叶绿素有两种:叶绿素a和叶绿素b,它们参与光能吸收、传递和转化[1-2],调控着叶片吸收太阳辐射的量从而影响着光合作用的潜力及初级生产力。植物叶绿素含量与其营养状况密切相关,例如在植物受到胁迫以及在衰老进程中其叶绿素含量会降低且其叶绿素a与叶绿素b的比值也会因非生物因素的影响而发生变化,利用叶绿素含量可以间接估计植物营养状态。叶绿素含量作为有关植物-环境相互作用的信息监测因子[3-4],其已成为植物健康的监测指标之一。叶片的光谱反射率是对光合色素含量的响应,叶绿素在植物叶片内的含量可利用测定特征光谱表现出来。因此,叶片的光谱反射率成为监测植物光合作用、病虫害和环境胁迫的有力手段。如何利用高光谱技术快速准确地监测植物叶绿素含量,进而实现植物健康的大面积监测,已成为亟需解决的生态问题。
胡杨(PopuluseuphraticaOlivier)分布在新疆塔里木河、叶尔羌河等流域,是干旱地区的珍稀濒危、防风固沙的主要植物[5]。胡杨种群是整个塔里木河流域植被中重要的组成部分,在遏制荒漠化、保护地区生态平衡、保护绿洲农牧业生产与自然环境的可持续发展等方面都有着重要作用。利用遥感技术快速、准确、宏观地监测胡杨的叶绿素含量,从而进行胡杨长势及健康评价,能为提高荒漠绿洲过渡带的生态稳定性提供技术支撑。
现阶段,高光谱遥感在植物生态学中的研究一直热度不减[6-7],进行叶绿素含量的估测可以利用植物的光谱反射率与叶绿素含量间的相关性来建立估测模型[8-9],与常规的生物化学分析方式比较,这种在一定空间尺寸上无损、可重复、不间断的叶绿素监测技术具有快速、动态、实时的优点,已经广泛地在植物叶绿素的动态监测方面得到应用[10-11]。通过高光谱遥感方法来定量叶绿素浓度的常见方法是提取叶片反射光谱的叶绿素吸收特征[12],并将其与色素浓度进行回归分析,从而建立回归预测模型以及BP神经网络模型[13]。大量的研究表明用于反演叶绿素的遥感数据主要有反射率数据、反射率数据的变形,如数光谱[14-15]、归一化吸收深度[16]、波形特征参数[17],红边位置[16,18]和各种高光谱指数等[19]。通过使用偏最小二乘法(PLSR)[20-21]、支持向量机(SVM)[21]与BP神经网络(BPNN)[2]模型等方法可以预测叶绿素含量。
近50年来,塔里木河流域大规模地抽取地下水灌耕导致地下水位逐渐降低,迫使胡杨种群退化,其林木大面积衰败、死亡,沙质荒漠化持续扩张[22-23]。对荒漠河岸生态系统而言,植物的生长发育高度依赖于地下水。塔里木河流域近几十年地下水水位下降是胡杨种群退化的主要原因[24]。随着地下水水位的降低,胡杨水势呈下降趋势;随着地下水埋深逐渐加深,胡杨逐渐提高了其水分利用效率。但是,干旱胁迫显著抑制了胡杨光合进程和光强耐受范围,降低光合效率,严重干旱胁迫严重影响胡杨苗木的正常生长和光合作用[25]。不同林龄胡杨水分利用效率不同,随林龄的变老其水分利用效率具有降低的趋势[26]。胡杨生境水分状况的差异会引起部分生理学指标的差异,如胡杨叶片中处于较高水平的可溶性糖是为了提高对逆境的适应能力[27],这种差异又会直接或间接地影响胡杨的叶片光谱特征。以往研究主要针对胡杨叶片的含水量、色素进行光谱建模研究,而利用机器学习算法对胡杨叶片叶绿素a、b、a+b的光谱估算建模的研究尚不多见;因此,本研究以塔里木河岸胡杨为试材,利用SVM、PLSR和BPNN算法建立胡杨光谱与叶绿素a、b、a+b的估算模型,以期为荒漠河岸生态系统稳定性监测提供参考。
研究区位于塔里木河流域上游源流区和新疆阿瓦提县胡杨林保护区。塔里木河流域上游源流区(40°17′N、80°21′E)三河交汇,供水资源丰富,地表径流流量较大,丰水期为7—9月,汛期受洪水影响较大。阿瓦提县胡杨林保护区(40°15′53.72″~40°18′23.13″N、80°19′54.71″ ~ 80°24′13.10″E)位于叶尔羌河的下游,叶尔羌河之水主要来源于高山冰雪融水,其河流有明显的枯水期,且在干旱区因不断蒸发、沿岸取水会导致地表径流量减少,下游逐渐转变为地下径流,水位持续降低。胡杨是荒漠河岸林唯一的建群乔木,林下植被组成简单,植物种类主要有铃铛刺(Halimodendronhalodendron)、甘草(Glycyrrhizauralensis)、柽柳(Tamarixchinensis)等。
设置0~2、2~4、4~6、6~8、8~10 m的5个地下水埋深梯度。在塔河源参照土壤剖面选取地下水埋深0~2与2~4 m采样区。在阿瓦提县胡杨林保护区选择垂直叶尔羌河不同距离的区域,参照竖井水深确定相应采样区作为地下水埋深4~6、6~8与8~10 m采样区。
在晴朗无风、天空云量小于20%的条件下,从每个采样区范围内挑选胸径30~40 cm,树龄、长势相近且无病虫危害的胡杨10株,共50株。每株摘取其完整且具有代表性的叶片10片。用高枝剪采集叶片样本,用于测定样本叶片光谱反射率。采用ASD FieldSpec HandHeld2便携式地物光谱仪对胡杨叶片进行测定,分辨率为1 nm,波长范围在325~1 075 nm,以其平均值作为该采样区的光谱反射率。
胡杨叶片剪碎后通过95%乙醇浸提,放入冰箱于4 ℃密封浸提48 h,之后用分光光度计测定。按下列公式计算其浓度。
叶绿素a(chla)= 0.013 73A663-0.000 897A537-0.003 046A647
叶绿素b(chlb)= 0.024 05A647-0.004 305A537-0.005 507A663
式中:A663或A647为在波长 663或647 nm下用1 cm 的比色皿测量的吸光度值。
采集的样品光谱信号往往会受到背景噪声、基线漂移等因素的干扰,从而影响最终的定性定量分析结果,因此需要对原始光谱进行预处理。通过Savitzky-Golay卷积平滑[28-29]对胡杨叶片原始光谱数据进行预处理与分析。光谱在波长i处经Savitzky-Golay平滑值计算公式参见文献[30]。
一阶导数处理的光谱数据能获取不同的光谱参,数学变换可增强光谱特征差异,减弱背景噪声对光谱数据的干扰,放大光谱吸收特性。(如峰谷特征,红边波段等),从而反映植物的特征[31],对胡杨叶片原始光谱数据进行光谱变换,具体计算公式见文献[30]。
对原始的光谱数据进行SG平滑处理后,光谱噪声明显减弱,对平滑后的原始光谱重采样,间隔为5 nm,再进行一阶导数变换。选取350~1 050 nm的数据进行分析,并且连续测量10次并取其平均反射率数据。
本研究的光谱特征波段采集方法采用相关系数法[32]和灰色关联度[33-34]分析。
相关系数是反映相应变量间相关关系密切度的指标,不同地下水埋深条件下胡杨叶片反射光谱与叶绿素a、b、a+b含量之间的线性相关关系可以通过相关系数来确立。样本的相关系数值越大,其相似程度越高,反之,相似程度越低。相关系数计算式见文献[30]。
由于灰色关联度分析能对目标性状进行分析,评价不同性状的影响程度。故选用此方法对胡杨叶片的光谱特征波段进行筛选。不同地下水埋深条件下胡杨叶片反射光谱与叶绿素a、b、a+b含量之间的非线性相关关系可以通过关联度来确立。关联度计算公式见文献[30]。
在应用胡杨叶片光谱数据的估算时,首先应用灰色关联分析法,计算原始光谱(R)、一阶导数(FD)变换后的光谱数据与叶绿素a、b、a+b含量在关联度大于重要因子(0.7)水平上的反射光谱波段。在全波段内选取关联度大于重要因子(0.7)的波段作为高光谱的敏感波段。
使用偏最小二乘法(PLS)、支持向量机(SVM)、BP神经网络(BPNN)建立预测模型。采用交叉检验的方法对模型进行评估,选取决定系数(R2)、均方根误差(RMSE)、相对分析误差(RPD)、校正标准偏差(RMSEC)、预测标准偏差(RMSEP)作为评价指标。R2值越接近1,且 RMSE值越低RPD值越接近2、SEL/SEP值越接近1时,模型越稳定,精度越高,预测能力越强;0.50 叶绿素a含量最大值为1.66 mg/g,最小值为0.32 mg/g,叶绿素b含量最大值为0.64 mg/g,最小值为0.12 mg/g,叶绿素a+b含量最大值为2.30 mg/g,最小值为0.43 mg/g;叶绿素a、b、a+b含量变化趋势基本一致,呈现先上升后下降的趋势,且地下水埋深4~6 m时叶绿素含量均为最高、0~2 m和8~10 m较低(图1)。这说明地下水埋深4~6 m时最适合胡杨生长,0~2 m和8~10 m时分别存在不同程度的生境胁迫,不利于胡杨的叶绿素的合成。 图1 不同地下水埋深区叶绿素含量变化特征 胡杨叶片的结构和生理特征会随着不同地下水埋深呈现出规律性的变化,继而影响叶片叶绿素含量、原始反射率的变化特征。在不同地下水埋深条件下,胡杨叶片反射率的变化规律基本一致:在地下水埋深4~6 m,其叶片光谱反射率在全波段内明显高于其他水埋深区域的叶片光谱反射率(图2)。在可见光区域(400~700 nm)内,反射率曲线变化比较明显,且光谱反射率较小(小于0.22)(图1a);胡杨叶片反射率光谱在可见光范围内出现绿色植物具有的典型“峰谷”特征——在554 nm附近出现明显的一峰(绿峰)、在490和690 nm附近出现明显的两谷(蓝谷和红谷)(图1b)。这主要是胡杨叶片中叶绿素和其他色素吸收红光反射绿光的原因所致[35]。在此波段内,反射率随地下水埋深的变化情况为:地下水埋深4~6 m的反射率最大,6~8 m和4~6 m的反射率次之,且这三曲线的变化幅度较大;0~2 m和2~4 m反射率较低且趋于稳定(图1b)。 图2 胡杨叶片反射光谱特征 在近红外波段(700~1 050 nm),不同地下水埋深的光谱反射率曲线呈现先上升后稳定变化的趋势。在地下水埋深4~6 m光谱反射率最高,且变化明显,其他4个水埋深则次之。光谱反射率随不同水埋深而发生的这种变化可能是因为胡杨叶片细胞的排列方式与植被整体结构影响所致[36]。在700~750 nm,反射率上升急剧,这一波段叫做“红边”(图1 a)。 红边之所以形成可能是因为胡杨叶片结构影响所引起的多次反射和散射而形成了一个高反射台。 不同地下水埋深条件下,叶绿素含量变化导致胡杨叶片导数光谱在不同波段上有明显差异,而且不同地下水埋深胡杨叶片导数光谱曲线变化趋势基本一致(图1c)。一阶导数反映的是光谱曲线的斜率,是光谱曲线的变化程度。在650~800 nm波段,地下水埋深6~8、2~4、8~10、0~2、4~6 m的反射光谱在715、705、715、730、720 nm附近一阶导数值都达到了极值点,其中715 nm处达到了最大极大值(图1d)。说明在此波段内光谱曲线的斜率变化、反射率变化较大。胡杨叶片叶绿素反射和“红边”效应、叶片结构和物质浓度等影响[37]所形成的高反射率平台的原因所致。在可见光波段,叶绿素含量与一阶导数光谱在某些波段(600~750 nm)的相关性超过原始光谱,因而,所选取的光谱变量参数大多来自一阶导数光谱[35]。 2.3.1 建模数据集 光谱变换值、光谱参数分别与叶片绿素a、b、a+b含量呈极显著相关且关联度大于0.7的波段为敏感波段。原始光谱反射率与叶绿素a含量的敏感波段134条,主要分布在405~523、936~937、1 009~1 010、1 018~1 019 nm附近;导数光谱(与叶绿素a含量的敏感波段184条,大多分布在560~674、731~902、921~1 049 nm附近(表1)。原始光谱反射率与叶绿素b含量的敏感波段121条,大多分布在405~516、936~937、1 018~1 048 nm附近;一阶导数光谱与叶绿素b含量的敏感波段178条,大多分布在551~671、711~793、831~932、971~1 049 nm附近(表1)。原始光谱反射率与叶绿素a+b含量的敏感波段129条,大多分布在405~521、936~937、1 010~1 048 nm附近;一阶导数光谱与叶绿素a+b含量的敏感波段179条,大多分布在560~674、731~902、921~1 049 nm附近(表1)。在两峰两谷、红边等光谱变化差异明显的波段,一阶导数变换能较好地反映光谱与叶绿素的相关性,体现叶绿素吸收光谱变化的强弱程度。由此可见,一阶导数光谱更能体现叶绿素含量变化的差异,可较好参与模型建立。 表1 筛选的敏感波段 基于敏感波段,利用The Unscramber软件对自变量做最大归一化处理,并将胡杨叶片样品数按照2︰1的比例分为校正集和预测集,分别建立SVM、PLSR和BP神经网络叶绿素光谱估测模型。建模数据集如表2。样本叶片的平均叶绿素a、b、a+b含量在0.97、0.38、1.35 mg/g左右。叶绿素含量变异系数(变异系数18.2%~23.2%)均较小,属于弱变异强度。所有数据集的变异系数在组内没有显著差异;对比数据统计结果,数据集之间的差异小,数据集的划分达到建模标准。 表2 总数据集、建模集和验证集的描述性统计 2.3.2 基于SVM的胡杨叶绿素的光谱估算模型 不同光谱变换和光谱参数下胡杨叶片叶绿素a、b、a+b含量的SVM光谱预测模型其精度有所差异(表3)。建模集与验证集R2<0.50且RPD<1.40,SEL/SEP距1较远时模型精度差,对样本的估测能力不稳定,不具备估测能力。经过多次交叉验证,通过SVM方法所分别建立的基于敏感波段的胡杨叶片原始光谱(R)、一阶导数(FD)的叶绿素a、b、a+b含量与不同光谱变换和光谱参数的回归预测模型其预测效果不稳定,无法对样本进行预测。 表3 叶绿素SVM估算模型 2.3.3 基于PLSR的胡杨叶绿素的光谱估算模型 不同光谱变换和光谱参数下胡杨叶片叶绿素a、b、a+b含量的PLSR光谱预测模型其精度有所差异(表4)。 表4 叶绿素PLSR估算模型 经过多次交叉验证,一阶导数光谱敏感波段与叶绿素a含量构建的回归模型其精度最好,实测叶绿素a含量与预测值之间拟合决定系数R2达0.75、RMSE为0.16、RPD为1.88、SEL/SEP值(0.97)接近1,预测能力最优;一阶导数光谱敏感波段与叶绿素a+b含量构建的回归模型其精度较高,实测叶绿素a+b含量与预测值之间拟合决定系数R2达0.74、RMSE为0.24、RPD为1.85、SEL/SEP值(0.97)接近1,预测能力良好;一阶导数光谱敏感波段与叶绿素b含量构建的回归模型其精度次之,实测叶绿素b含量与预测值之间拟合决定系数R2达0.70、RMSE为0.07、RPD为1.85、SEL/SEP值(0.98)接近1,能进行粗略估计。因而,可以选用叶绿素a、a+b和b含量与一阶导数光谱敏感波段构建的回归模型对胡杨的叶绿素a、a+b和b含量进行准确估计。其他PLSR模型精度较低,RMSE在0.32~0.43内、相对分析误差RPD在1.10 ~1.34内,预测效果不稳定,无法准确估测样本的叶绿素含量。 2.3.4 基于BP神经网络的胡杨叶绿素的光谱估算模型 通过多次试验证明使用70%的样本建立网络模型,30%的样品进行训练,利用剩余样本进行预测网络目标误差为0.01,隐藏层神经元为10时可以得到较好的估算结果。 不同光谱变换和光谱参数下胡杨叶片叶绿素a、b、 a+b含量的BP神经网络光谱预测模型其预测精度有所差异(表5)。经过多次交叉验证,可用预测模型精度由高到低依次是一阶导数光谱敏感波段与叶绿素a+b、一阶导数光谱敏感波段与叶绿素a、一阶导数光谱敏感波段与叶绿素b、原始光谱敏感波段与叶绿素a构建的BP神经网络模型。一阶导数光谱敏感波段与叶绿素a+b含量构建的BP神经网络模型,模型精度最优,实测叶绿素a+b含量与预测值之间拟合决定系数R2达0.81、RMSE为0.20,RPD为2.14、SEL/SEP值(0.90)接近1,预测能力最优;一阶导数光谱敏感波段与叶绿素a含量构建的回归模型其精度较好,实测叶绿素a含量与预测值之间拟合决定系数R2达0.74、RMSE为0.17、RPD为1.80、SEL/SEP值(0.91)接近1,预测能力良好;一阶导数光谱敏感波段与叶绿素b含量构建的回归模型其精度次之,实测叶绿素b含量与预测值之间拟合决定系数R2达0.62、RMSE为0.08、RPD为1.50、SEL/SEP值(0.90)接近1,预测能力次之;原始光谱敏感波段与叶绿素a含量构建的回归模型其精度较低,实测叶绿素a含量与预测值之间拟合决定系数R2达0.60、RMSE为0.20、RPD为1.55、SEL/SEP值(1.08)接近1,可进行粗略估计。因此,可以选用叶绿素a+b、b含量与一阶导数光谱敏感波段和叶绿素a含量原始光谱敏感波段数据构建的回归模型对胡杨的叶绿素a+b、 b含量进行估计。 表5 叶绿素BP神经网络估算模型 植物叶片光谱的变化是因为叶片中叶绿素、含水量、内部细胞结构和干物质含量的变化引起的[35]。叶绿素含量是能够监测植物生长发育的重要指标,叶绿素在植物叶片内的含量可利用测定特征光谱表现出来。地下水埋深对胡杨叶片叶绿素的影响较为明显,发现5个地下水埋深下,胡杨叶片光谱特征有明显的区别,因为胡杨叶片对吸收红光和蓝光、反射绿光的叶绿素含量增加,在光谱曲线峰谷处的反射率大小依次是4~6 m>0~2 m>6~8 m>8~10 m>2~4 m,说明光谱曲线对地下水埋深梯度变化有响应,但规律并不明显。在其一阶导数光谱中,红边波段是所有波段的最大值。说明2~4、4~6和6~8 m这3个水埋深的吸收率较大,叶片长势较好,所含叶绿素较多,与许丹等[38]、林海军等[39]对塔里木河流域胡杨叶片反射率光谱曲线的研究结果一致。不同地下水埋深区域胡杨光谱曲线的形态基本相似,峰谷明显,对地下水埋深变化有响应,但并不显著,噪声、基线漂移和细胞内部结构等其他因素的干扰,阻碍提取特征参数和分析随地下水埋深变化的响应。因此,要对胡杨的原始光谱曲线进行数学变换。 高光谱特征参数本质是对光谱反射率做一定的数学变换,以增强植被的信息[40],突出光谱曲线峰谷特征,采用灰色关联度法和相关性分析法筛选出胡杨对地下水埋深区域的敏感响应波段,导数光谱敏感波段远比原始光谱敏感波段多。本研究表明,根据敏感波段建立估算的模型中,一阶导数光谱的建模精度明显优于原始光谱。一阶导数光谱建模集与预测集之间拟合决定系数R2在 0.61~0.92之间,RMSE在0.07~0.33之间;原始光谱建模均存在不同程度的过拟合,预测模型精度较低,建模集RMSE在0.90~0.86内,而预测集RMSE在0.32~0.43内,预测效果不稳定,无法准确估测样本的叶绿素含量。 以一阶导数光谱学建立的模型和原始光谱模型比较,预测的准确度、精确度有较大提高,但仍以BP神经网络模式的预测效率为最好。BP神经网络能够更准确地反映出叶绿素含量与多种光谱参量之间的映射关系,得到精度更高的模型[41-42]。目前已有学者将多种模型应用至各种植物叶绿素含量估算[35,43-44],所得结果与本研究一致。BP神经网络模型估算胡杨叶绿素含量时,验证的预测值与实测值密集分布趋势线附近,一致性较好。一阶导数敏感波段的叶绿素a+b含量神经网络预测模型验证R2达0.81,RMSE为0.20,RPD为2.14;叶绿素a含量偏最小二乘预测模型验证R2达0.75,RMSE为0.16,RPD为1.88,建模与预测模型都相对稳定;原始光谱反射率叶绿素a+b含量支持向量机预测模型R2达0.65,RMSE为0.27,RPD为2.13,但建模模型的精度较低,建模过程支持向量机模型相对并不稳定,可能会出现局部异常值。单一指标过高可能会使模型过拟合,误差较大,所以需进行综合评价。对模型进行综合评价得出:BP神经网络模型和偏最小二乘预测模型明显优于支持向量机模型,估算较为准确。 由于估算植被色素含量受多种因素干扰,且传统的统计建模法比较简单,对非线性关系处理技术能力的不足以至于所建立模型准确度不高。本研究根据植物神经网络非线性映射能力和自适应学习显著增强的特性,来建立相关的植物神经网络模型,所建模型反演精度更高。后期宜针对同种植物不同属性、不同季节来进行采样分析,以便找出稳定规律;同时,宜把增加光谱反演模型普适性效果作为研究目标,充分考虑研究中光谱波段范围、光谱数据数学变换方式对其影响。 从原始光谱中筛选的叶绿素敏感特征波段主要在405~521、1 010~1 045 nm附近,而从一阶导数光谱中筛选的叶绿素敏感特征波段主要在560~674、731~902和921~1 049 nm附近。最大相关系数(-0.69)出现在472 nm,构建的3种回归模型都得到了预测结果,其中一阶导数光谱与叶绿素a+b含量构建的BP神经网络估算模型具有较好的稳定性及预测能力(R2、RMSE、RPD分别为0.81、0.20和2.14),表现出对叶绿素a+b很好的预测能力,说明通过叶绿素含量估算地下水埋深是可行的。研究结果可为监测荒漠河岸生态系统的稳定性提供参考,也可为干旱区荒漠绿洲过渡带的生态环境建设及植被恢复提供技术参考。2 结果与分析
2.1 地下水埋深区胡杨叶片叶绿素含量的变化特征
2.2 不同地下水埋深区胡杨叶片反射光谱特征
2.3 胡杨叶片叶绿素含量光谱估测模型的建立及验证
3 讨论与结论
3.1 讨论
3.2 结论