查晶晶,吴永波,周子尧,朱晓成,朱嘉馨,安玉亭
(1. 南京林业大学南方现代林业协同创新中心,江苏 南京 210037;2. 南京林业大学生物与环境学院,江苏 南京 210037;3. 盐城市麋鹿研究所,江苏 盐城 224136)
牧草的质量是影响鹿类保护区发展的重要因素之一,粗蛋白(crude protein,CP)是衡量牧草营养状况和饲用价值的一个重要指标[1]。因此,精确估算牧草粗蛋白含量对评价鹿类保护区草地营养价值具有重要意义。传统的鹿类可食植物资源粗蛋白含量的测定主要通过实验室化学检测等方法[2-3],不仅费时费力,具有破坏性,且难以实现大范围的动态监测。
早在20 世纪六七十年代,美国农业部(United States Department of Agriculture,USDA) 通过测量多种类型植物叶片光谱,发现在 0.24~0.40 nm 波段间的 42 个敏感波段对应一定的生物化学成分的吸收特征,这为用遥感手段来估测叶片乃至植株的生化组分提供依据[4]。20 世纪80 年代,高光谱遥感开始发展起来,人们开始从窄波段中筛选出对植被类型光谱差异较显著的波段,采用成组整合的方式重新组合波段,充分利用植被光谱信息,改善植被识别与分类精度[5]。近年来,高光谱遥感技术的发展,为定量分析地物的微弱光谱差异带来很大便捷[6]。相比传统的田间及实验室分析方法,高光谱遥感技术具有在不同区域尺度估测植物品质参数的独特优势[7]。国外关于牧草的粗蛋白含量高光谱遥感研究开展较多[8-10]。国内主要以小麦(Triticum aestivum)、玉米(Zea mays)和水稻(Oryza satiua)等农作物为主[11-13],关于牧草的研究较少,尤其是鹿类动物牧草[14]。Chaya 等[15]采用Cubist 模型建立了黑麦草(Lolium perenne)干物质、酸性洗涤纤维等含量的预测模型,不同养分的预测模型R2值在0.49~0.82。Pullanagari 等[16]建立了不同牧草粗蛋白、木质素等9 种指标的PLS 预测模型,R2在0.55~0.83,预测效果较好。
狼尾草(Pennisetum alopecuroides)在大丰麋鹿保护区半散养区占43%,是绝对优势种,也是麋鹿的主要采食植物以及麋鹿的喜食植物[17]。随着麋鹿数量的大规模增加,食物匮乏加大了补饲压力,狼尾草适应力强,受麋鹿践踏影响较小,是麋鹿的重要食源[18]。本研究致力于解决大尺度下无损、实时分析狼尾草粗蛋白含量。通过利用野外实测狼尾草高光谱数据,结合室内粗蛋白含量实测数据,分析狼尾草的高光谱反射率与粗蛋白含量的相关性,建立预测模型,实现无损、实时的粗蛋白含量分析,为评价保护区不同季节狼尾草品质变化状况,满足作为麋鹿食物贡献大小提供理论依据。
大丰国家级麋鹿自然保护区位于盐城市(图1)(32°56′ − 33°36′ N,120°42′ − 120°51′ E),处于北亚热带和南暖温带过渡地区,具备明显海洋性和季风性气候特点,是典型黄海湿地生态系统。光、热、水等条件良好。平均海拔2~4 m,地势平坦,土质为粉沙质,土壤pH 7.6~8.8,为滨海盐土类。年平均气温13.7~14.5 ℃,1 月份平均气温0.8 ℃,7 月份平均气温26.8 ℃,年平均降水量980~1 100 mm,6 月−9 月为降水高峰期。
图1 大丰麋鹿国家级自然保护区位置图Figure 1 Map of Dafeng David’s Deer National Nature Reserve
分别于2018 年3 月、5 月、7 月和10 月,选择晴朗天气,在云层稀薄、风速较小或无风时测定狼尾草冠层反射率,测定时间为11:00 − 13:00。为尽量匹配狼尾草生长周期,不同月份尽量采集相同位置的样本。样方中为纯狼尾草群落。狼尾草光谱参数采用美国ASD 公司生产的Field Spec Pro FR 2500 型背挂式野外光谱仪测定。光谱分辨率为10 nm,波段范围为 350~2 500 nm。传感器探头垂直向下,距狼尾草冠层顶部垂直高度约1.3 m,光谱仪视场角25°,地面视场范围直径60 cm。叶片光谱测量选用5° 视场角,测量距离约为5 cm。每个观测点记录10 条采样光谱线,每个处理重复3 次,以平均值作为该采样点的光谱值。测量过程中,每15 min 进行标准白板校正(标准白板的反射率接近1)。用ASD ViewSpec Programs 软件读取反射光谱原始数据。
光谱数据采集后,收割狼尾草地上部分(样方大小0.5 m × 0.5 m),带回实验室65 ℃烘干后,采用凯式法测定粗蛋白的相对含量。不同月份狼尾草粗蛋白含量及生物量如表1 所列。
表1 不同月份狼尾草粗蛋白含量及生物量Table 1 Crude protein and biomass content of Pennisetum alopecuroides in different months
植被冠层反射率光谱受很多噪音源影响,包括大气混浊度、光照条件以及叶片大小、形状等,反射率光谱数据使用前需进行预处理以消除背景噪音[19]。光谱数据使用之前先剔除首尾波段及中间噪声较强的波段(350~399、1 350~1 430、1 800~1 970和2 350~2 500 nm),再进行Savitzky-Golay 七点三次平滑(Savitzky-Golay,SG) 进一步来消除随机噪声[20]。为突出平滑效果,对部分光谱曲线进行放大,SG 在去除噪声的同时保存了光谱曲线的总体特征(图2)。对平滑后的数据再进行一阶变换,以消除基线和背景噪声,分解混合重叠峰,提高光谱分辨率。变换公式为 , 为两倍原始波段宽度[21]。采用K-S (Kennard-Stone)方法[22]计算出每个预处理后样品之间的欧氏距离,将2/3 样品用于建模,1/3 用于模型验证(表2)。将狼尾草粗蛋白含量分别与预处理后的原始反射率及其构建的植被指数进行相关性分析[23],达到显著相关的波段或植被指数作为模型的自变量进行建模。
图2 原始光谱曲线和SG 平滑曲线对比Figure 2 Difference between unprocessed and SG-smoothed spectral curves
表2 狼尾草粗蛋白含量变异特征Table 2 Variation in crude protein content of Pennisetum alopecuroides
采 用 偏 最 小 二 乘 回 归(partial least squares regression, PLSR)和多元逐步回归(stepwise multiple linear regression, SMLR)两种光谱分析常用方法评价高光谱遥感模型对狼尾草粗蛋白含量的反演效果[1,24-25]。选取决定系数R2、均方根误差RMSE和相对预测误差RPD评价模型精度。R2越接近1,模型拟合度越高。RMSE越小模型估算能力越好。RPD≥2 时,模型预测能力较好[1,26]。PLSR 和SMLR 建模在R 3.4.2 中 实 现,采 用SPSS 22.0 和Excel 2010 处理与分析数据。
狼尾草生长期内不同月份的平均原始光谱曲线如图3 所示。不同月份的狼尾草反射率光谱总体趋势一致,具有绿色植被特有的光谱特征,即可见光区域的绿峰和红谷,近红外的高原区以及短波红外1 400 和1 900 nm 附近的两个反射低谷[27]。狼尾草冠层光谱在560 和670 nm 附近有反射峰和反射谷,由叶绿素吸收近、远红光波段造成[28]。在530~570 nm 的绿光波峰区域,以及620~680 nm 的红光区域,5 月和7 月的光谱曲线绿峰、红谷特征与3、10 月差异较大,可能是3 月和10 月狼尾草地上部分绿色叶片较少,反射率受到土壤光谱干扰而偏高,绿峰相对较不明显[29]。近红外区域反射率光谱曲线差异较大,3 月反射率最低,7 月最高。该区域光谱反射率主要受叶片内部结构、生物量以及叶面积的影响,细胞层数越多,反射率越高[30-31]。3 月以后狼尾草叶片干物质含量增多,反射率增高。7 月反射率较高可能是因为植物生物量高。短波红外区域反射率较低,主要受叶片含水量影响[27]。
图3 不同月份狼尾草叶片平均光谱曲线Figure 3 Average reflectance spectrum of crude protein of Pennisetum alopecuroides leaves in different months
相关性分析(图4)显示,狼尾草原始反射率与粗蛋白含量正相关和负相关,相关性波动较大。在可见光区域大部分相关系数为负值,其中在407~409 nm 以及416~420 nm 等波段达到显著水平。在近红外区的940、945 nm 及1 133~1 148 nm 等波段显著正相关。1 980~2 350 nm 短波红外波段相关系数变化起伏较大。总计筛选出296 个波段,其中相关系数绝对值最大出现在770 nm 波段,为−0.731。
图4 狼尾草粗蛋白含量与原始光谱反射率的相关分析Figure 4 Correlation analysis between crude protein content and raw spectral reflectance of Pennisetum alopecuroides
常见的高光谱吸收特征参数有很多[21,32-33],本研究选取与狼尾草粗蛋白含量显著相关的12 个植被指数进行建模,包括黄边位置[21](r= 0.752**)、改进的土壤调节植被指数(improved soil adjusted vegetation index, MSAVI)[32](r= −0.464**)、优 化 土 壤 调 节 植 被指数(optimized soil adjusted vegetation index,OSAVI)[32](r= 0.464**)、 Zarco-Tejada & Miller (ZTM)[32](r=−0.713**)、Carter 指数2 (Carter indices 2,CTR2)[32](r=0.490**)、Lichtenthaler 指 数1 (Lichtenthaler indices1,Lic1)[32](r= −0.585**)、Vogelmann 指 数1 (vogelmann indices1,Vog1)[32](r= 0.702**)、Vogelmann 指 数4(vogelmann indices 4,Vog4)[32](r= −0.540**)、Gitelson和Merzlyak (G_M)[32](r= −0.647**)、MERIS Terrestrial Chlorophyll Index (MTCI)[33](r= −0.592**)、红边叶绿素指数(red-edge Chlorophyll Index,CI red-edge)[33]和归 一 化 红 边 指 数(normalized difference red edge,NDRE)[33](r= −0.569**)。
以显著相关波段和植被指数为自变量,狼尾草粗蛋白含量为因变量,分别建立PLSR 和SMLR模型。基于显著性波段的PLSR 和SMLR 模型分别选用了296 个和3 个变量,基于植被指数的PLSR和SMLR 模型分别选用了12 个和2 个变量。模型方程的反演效果如表3 所列。可以看出,基于显著波段的PLSR 模型建模集和验证集RPD分别达到2.364 和3.110,反演效果最好。基于显著波段的SMLR 模型反演效果最差,建模集和验证集RPD约为1。由显著性植被指数建立的PLSR 和SMLR 模型精度较为接近,两者建模集和验证集RPD约为2。
表3 基于显著性波段和植被指数的模型及其验证Table 3 Model establishment and validation of crude protein content of Pennisetum alopecuroides based on significant bands and spectral indices
狼尾草是麋鹿保护区半散养区的优势植物。研究表明,麋鹿在补饲情况下仍需取食生境中的植被,以满足不同的养分需求[34]。粗蛋白含量是反映牧草质量的重要指标。粗蛋白的缺乏导致矿质营养(特别是磷)的不足,往往是动物生产的主要限制因子[35]。保护区狼尾草粗蛋白含量在生长期内逐渐下降,这影响麋鹿对食物的持续性需求。因此,利用高光谱仪建立狼尾草粗蛋白含量的估算模型,有利于提高麋鹿喜食植物的粗蛋白含量测定的效率和精度,也为改善麋鹿食物营养结构提供科学依据。本研究结果表明,麋鹿保护区狼尾草的反射率光谱与粗蛋白含量相关性较高。高光谱数据选择显著相关波段和植被指数进行建模,去除无效信息,避免模型过度拟合,对构建反演模型有重要意义。PLSR模型在处理样品数量少,自变量数目多,变量间存在多重共线性时具有独特优势,比多元逐步回归更能利用光谱中的重要信息[36]。PLSR 模型能综合狼尾草反射率光谱对反演其粗蛋白含量贡献较大的成分,简化了数据结构,获得较高的精度。虽然一些学者采用非线性回归方法得出的预测效果比线性模型好[37-38],本研究基于显著性波段的PLSR 模型,具有较好的反演能力,建模集和预测集RPD分别达到2.364 和3.110,具有估算粗蛋白含量的潜力。但PLSR 方法只适用于有明显线性关系的数据,因此今后需研究一些非线性的建模方法,如支持向量机、人工神经网络等[39]。高光谱预处理方法也有很多,包括SG 卷积平滑、多元散射矫正、变量标准化等,以及不同方法进行组合[40],今后将研究不同的预处理方法,获得最佳预处理方法,以提高模型精度。
植物叶片中的有机物质,包括木质素、蛋白质、淀粉、纤维素和糖分等有共同的分子键(如O-H 键和C-H 键),与这些键相关的吸收峰位于短波红外区域,吸收峰之间有重叠[4,16]。原始光谱进行一阶导数转换能在一定程度上将不同生化成分的光谱吸收特征区分开,提高模型精度。本研究采用的是传统经验模型法,具有一定的时空局限性,与粗蛋白含量相关的生化组分会影响粗蛋白的光谱特征吸收波段,进而影响其反演精度,今后需进一步研究这些生化组分的影响以提高预测精度。
本研究选定的大多数显著性波段与蛋白质和氮分子的键振动密切相关。在可见光区域一些预测粗蛋白的重要波段与叶绿素有关,可能是因为叶绿素的蛋白质含量较高[15]。研究表明,由于N-H 键的存在,植物叶绿素浓度与氮含量之间存在较强的相关性[4],而蛋白质是植物体内主要的含氮物质[16]。近红外区域粗蛋白预测光谱可能和蛋白质中的N-H 键和N=H 键有关[15]。
综上,基于全波段显著性原始反射率光谱和显著性植被指数建立的4 种狼尾草粗蛋白含量PLSR和SMLR 预测模型,以基于显著性波段的PLSR 模型预测效果最好,可以较好估测麋鹿保护区半散养区狼尾草粗蛋白含量。另外,本研究分析仅是基于某一年份的观测数据,样本数量有限,增加更多年份的观测数据,可获得更为可靠的结论。