陈晓凯,李粉玲,2※,王玉娜,史博太,侯玉昊,常庆瑞,2
(1.西北农林科技大学资源环境学院,杨凌 712100;2.农业部西北植物营养与农业环境重点实验室,杨凌 712100)
叶面积指数(Leaf Area Index,LAI)被定义为作物在单位土地面积上的叶片的面积之和[1]。快速、无损、精准地监测冬小麦关键生育期的叶面积指数是准确掌握作物冠层结构、长势信息、地上生物量、产量以及病虫害监测等的重要途径,对田间生产管理具有重要意义[2]。遥感技术能以较低的成本获得 LAI的时空变化信息,克服了传统田间地面测量只能获取单点数据的不足。相对于卫星遥感技术,无人机遥感技术体积小、机动灵活、成本低、时空分辨率高,逐渐成为小范围内农业遥感作物参数反演的重要手段[3-4],在水稻、小麦、大豆、棉花等作物的叶绿素、花青素、叶面积指数等理化参数的遥感估算中取得了较好的效果[5-8]。
利用无人机高光谱进行作物理化参数遥感估算主要是通过构建光谱指数,包括典型植被指数和任意两波段组合的窄波段光谱指数,利用回归分析方法进行估算模型构建。对于典型植被指数,高林等[9]以比值植被指数、归一化植被指数、土壤调整植被指数、差值植被指数、三角植被指数等 5种传统植被指数,采用经验模型法对大豆叶面积指数进行反演,结果表明归一化植被指数线性回归模型精度最高;田明璐等[10]基于比值植被指数、差值植被指数、归一化植被指数和绿波段归一化植被指数构建极值植被指数,研究显示以多个极值植被指数参与构建的偏最小二乘回归模型对棉花的叶面积指数预测精度最高。而大多研究表明通过任意两波段组合构建窄波段光谱指数更能挖掘出作物理化参数的敏感位置,显著提高模型的预测精度[11-12]。王伟东等[13]通过构建任意两波段组合的比值光谱指数、差值光谱指数、归一化光谱指数分析了冬小麦花青素的空间分布,结果表明以窄波段光谱指数为自变量的花青素估算模型精度显著高于典型植被指数模型;秦占飞等[14]通过任意两波段组合的比值光谱指数、二次修正土壤调节光谱指数、差值光谱指数、归一化光谱指数探寻反演水稻LAI的最优波段组合,结果表明以比值光谱指数为自变量建立的水稻LAI估算模型精度最高,但这些窄光谱指数均基于原始冠层光谱提取。姚霞等[15]对地面冠层高光谱进行数学变换并探索最佳波段组合对冬小麦氮素含量的响应能力,结果表明一阶导数变换下的任意两波段组合比值光谱指数、归一化光谱指数、土壤调节光谱指数所构建的模型较原始光谱模型的决定系数明显提高;李粉玲等[16-17]研究表明对冠层原始光谱进行一阶导数变换、吸光度变换和连续统去除变换均能不同程度的提高氮素的遥感估算效果。而基于变换光谱提取窄波段光谱指数能否提高LAI的预测精度值得探讨。
综上,本研究以关中平原冬小麦为研究对象,以无人机高光谱成像仪影像数据为基础,系统构建基于原始光谱、一阶导数光谱和连续统去除光谱的任意两波段间的差值光谱指数(Difference Spectral Index,DSI)、比值光谱指数(Ratio Spectral Index,RSI)和归一化光谱指数(Normalized Spectral Index,NDSI),探讨基于变换光谱窄波段光谱指数的LAI估算能力,以期为冬小麦的田间管理提供科学的技术指导。
冬小麦田间试验布置在陕西省乾县梁山乡齐南村(108°07′E,34°38′N),地处陕北黄土高原南缘与关中平原的交界地带,属温带大陆性季风气候,以种植冬小麦和夏玉米为主。本试验共设置36个小区试验和 4个大田试验,供试品种均为当地常见的小偃22号。36个小区面积均为9 m×10 m,小区试验进行氮(N)、磷(P)、钾(K)3种肥料的胁迫试验,分别设置 6个水平的施肥处理,分别为N(0、30、60、90、120、150 kg/hm2)、P (0、22.5、45、67.5、90、112.5 kg/hm2)和 K(0、22.5、45、67.5、90、112.5 kg/hm2),每个处理设置重复2次。4个大田面积均为480 m2,设置4个水平的氮(N)施肥处理0、60、120、180 kg/hm2,小区和大田的管理方式均与当地常规冬小麦相同。本研究在拔节期(2018年3月29日)进行冬小麦冠层LAI和无人机高光谱影像获取。
1.2.1 冬小麦叶面积指数(LAI)采集
冠层分析仪SunScan(Delta Co.,英国)能同时获得直射光合有效辐射(Photosynthetically Active Radiation,PAR)、散射PAR、透过PAR和LAI等多种指标。其中LAI是通过传感器测量冠层的辐射值和椭球体叶倾角分布参数,利用冠层投射光学模型的方法获取,具有无损性和可重复性观测的特点[18]。研究表明SunScan冠层分析仪测定的叶面积指数与传统方法测定的叶面积指数有很好的相关性,在多种作物的LAI研究中得到广泛应用[19-20]。本研究基于 SunScan冠层分析仪,在各小区和大田地块分别选取1~2个样点进行冠层LAI测定。测量时,每个样点分别在东、西、南、北 4个方位上测定 4次,取其平均值作为该样点上的LAI值。测量LAI的同时用差分全球定位系统(Global Positioning System,GPS)记录该样点的坐标信息。共获取LAI有效样本数据66个,将LAI值按从小到大的顺序进行排序,按照2∶1的比例抽样获取建模集(44个)和验证集(22个),样本LAI值统计特征如表1所示。
图1 研究区位置及采样点分布Fig.1 Location of study area and distribution of sampling sites
表1 拔节期冬小麦叶面积指数特征统计Table 1 Feature statistics of winter wheat leaf area index at jointing stage
1.2.2 无人机高光谱影像获取
试验采用八旋翼无人机搭载 Cubert UHD185(简称UHD185)高光谱成像仪在地面LAI测定的同时获取冬小麦近地冠层高光谱影像。UHD185成像仪的光谱覆盖范围为450~950 nm,光谱分辨率和采样间隔均为4 nm,共125个探测通道。数据获取之前,首先使用参考板对成像光谱仪进行辐射校正,并规划飞行航线,设定1 ms采样间隔进行数据采集,飞行高度为 100 m,飞行速度为6 m/s,光谱仪镜头垂直向下,视场角 30°,并保证 80%的航向重叠和 60%的旁向重叠,获取的高光谱影像地面分辨率为0.3 m,每幅影像幅宽约16 m。在无人机影像专业处理软件Cube-Pilot1.4.4下对高光谱影像进行拼接,依据Google Earth 影像和地面控制点在地理信息系统系列软件ArcGIS 10.6下对研究区拼接影像进行地理配准;在遥感图像处理软件 ENVI(Environment for Visualizing Images)中采用 3×3均值滤波对配准后的图像进行卷积运算,提取3×3卷积核范围内的平均值作为中心像元值。依据地面上66个LAI观测样点位置,提取样点所对应的高光谱反射率。
1.2.3 冠层高光谱变换
在获取高光谱数据时,由于光子效应等原因,难免会受到噪声的干扰,在遥感图像处理软件ENVI中对无人机高光谱数据进行平滑滤波处理,剔除依附在冠层高光谱影像上的噪声信息,得到 66个样本点的原始光谱(Original Spectrum,OS)。对去噪光谱进行一阶导数变换和连续统去除变换,变换后的冠层光谱分别标记为一阶导数光谱(First Derivative Spectrum,FDS)、连续统去除光谱(Continuum Removal Spectrum,CRS)。
1.2.4冠层高光谱窄波段光谱指数
高光谱提供了丰富的光谱信息,针对高光谱任意波段进行两两组合时,便可构建高光谱窄波段光谱指数。为了便于研究作物冠层高光谱窄波段光谱指数与LAI的相关关系,本研究在450~950 nm的波段范围内,选取了计算最为简单且最常用的归一化植被指数、差值植被指数和比值植被指数,系统构造了原始光谱、一阶导数光谱和连续统去除光谱的任意两波段间的差值光谱指数(Difference Spectral Index,DSI)、比值光谱指数(Ratio Spectral Index,RSI)和归一化光谱指数(Normalized Spectral Index,NDSI),其计算如式(1)~式(3)所示:
式中i、j为高光谱波长,nm;Ri、Rj分别表示i、j波长所对应的高光谱反射率(本研究分别取原始光谱、一阶导数光谱和连续统去除光谱)。
1.3.1 模型构建
本研究基于450~950 nm波段范围内的无人机冠层高光谱原始光谱反射率、一阶导数光谱和连续统去除光谱分别提取3种光谱指数(差值光谱指数、比值光谱指数和归一化光谱指数),分析任意两波段交叉提取的光谱指数与LAI的相关性,筛选最优的光谱指数进行拔节期冬小麦LAI的估算模型研究。采用的建模方法包括一元回归(Simple Regression,SR)、多元线性回归(Multiple Linear Regression,MLR)、BP神经网络(Back Propagation Neural Network,BP)和随机森林回归(Random Forest Regression,RFR)。其中 BP神经网络和随机森林回归作为机器学习算法,在农作物生理生化参数的定量估算中表现突出[4,11,21-24]。
BP神经网络模型由一个输入层、至少一个隐含层和一个输出层构成,是一种基于梯度下降思维、采用反向传播算法不断调节隐含层神经元个数对数据进行反复训练获取最优模型参数的机器学习算法[25]。本研究首先对建模集和验证集数据进行归一化处理,在MATLAB 2017a中调用BP神经网络工具箱训练数据,经过反复调试参数对数据进行训练,最终确定隐含层节点数为4,输出层节点数为1时获取到最佳模型。分别将建模集和验证集输入模型得出各自预测值并输出,再将输出结果反归一化完成BP神经网络模型构建。
Breiman[26]在 2001年提出随机森林回归,这是一种基于分类树的回归算法。其实质是将样本不断放回并进行多次取样形成训练集,通过决策树的组合对预测结果求平均来进行预测,这种算法主要考虑决策树数量以及分割结点的数量这2个参数。本研究在统计软件R中调用RandomForsest程序包进行随机森林回归分析。通常情况下,随着决策树数目的增加,预测模型的误差会逐渐下降并趋于平稳。本研究通过绘制决策树数目与模型预测误差之间的曲线图来确定最优决策树数目。经过不断调参,最终确定决策树数量为500,分割节点数量为1[27-28]。
1.3.2 模型精度的评价指标
本研究选取决定系数(coefficient of determination,R²)、均方根误差(Root Mean Square Error,RMSE)和相对预测偏差(Residual Prediction Deviation,RPD)进行模型精度检验。R²表示模拟值与实测值的拟合程度,R²越高越好,越接近于1,表明模型的估测效果越好;RMSE反映了模拟值与实测值的偏离度,RMSE越低,表明在该模型下的预测值与实测值越接近,模型效果越好,Rc2、RMSEc表示建模集决定系数和均方根误差;Rp2、RMSEp表示验证集决定系数和均方根误差;RPD是通过衡量预测值和实测值的相对偏差程度来评价一个模型预测能力的重要指标。通常认为RPD<1.5 模型不具备预测能力;1.5<RPD<2.0模型可以粗略的估测样本,预测能力尚可;RPD>2.0 表明模型具有极好的预测能力。RPD计算如式(4)所示[29]:
式中SD为验证集标准偏差,RMSEp为验证集均方根误差。
本研究基于无人机冠层高光谱(450~950 nm),根据数学表达式(1)~式(3)在MATLAB中构建3种变换光谱基于任意两波段的窄波段光谱指数与 LAI的相关性等势图(图2)。结果表明窄波段光谱指数与LAI的相关性显著提高,各变换光谱与 LAI相关性较高的波段组合范围比较集中,主要分布在 680~750 nm 与 818~922 nm之间,9种窄波段光谱指数与LAI的相关系数最大值均在 0.65~0.85之间。根据相关系数最大的原则,筛选出估算冬小麦叶面积指数的 9种光谱指数的最佳波段组合如表2所示。通过查阅相关系数显著性表,所选9种窄波段光谱指数均通过了0.01水平的显著性检验。
冬小麦冠层光谱以及变换光谱与LAI值的相关性关系如图3所示。原始冠层光谱与LAI值在450~734 nm波段范围内呈负相关关系,即LAI值随着冠层光谱反射率的增加而减少;在734~950 nm波段范围内,冬小麦LAI与反射率存在正相关关系,LAI值随着冠层光谱反射率的增加而增加,其中在750~950 nm波段范围内达到显著正相关(P<0.01),并在918 nm处,原始光谱反射率与LAI值的相关系数达到最大值0.66。冠层一阶导数光谱与 LAI的相关性较为复杂,波动性较大,在 730~770 nm波段范围与LAI达到0.01水平上的显著正相关,且相关性高于原始冠层光谱,对应最敏感位置在754 nm处,相关系数达到0.70。连续统去除光谱在450~778 nm范围内与LAI值呈负相关关系,在778~950 nm波段范围内呈正相关关系,其中482~762 nm波段范围内,两者呈现显著性负相关关系,并在738 nm处相关系数到达最大值为-0.81。整体上来看,LAI与各变换光谱在可见光部分呈现负相关关系,在近红外部分呈现正相关关系,且变换光谱与LAI的相关性略高于原始冠层光谱。
图2 窄波段光谱指数与冬小麦叶面积指数的相关系数等势图Fig.2 Equipotential diagram of correlation coefficient between narrow band spectral index and winter wheat Leaf Area Index (LAI)
表2 窄波段光谱指数的最佳波段组合Table 2 Best band combination of narrow band spectral index
图3 冬小麦叶面积指数与不同变换光谱反射率的相关性Fig.3 Correlation between winter wheat Leaf Area Index (LAI)and reflectance of different transformed spectra
以冬小麦叶面积指数为因变量,分别以原始光谱、一阶导数光谱、连续统去除光谱下的差值光谱指数、比值光谱指数、归一化光谱指数的最佳波段组合作为自变量,建立冬小麦叶面积指数的线性或非线性回归模型,筛选出每种光谱变换下的最优单变量预测模型如表3所示。结果表明最优窄波段光谱指数与LAI的关系均表现为非线性,更适合用一元二次函数进行拟合。在3种光谱变换下,原始光谱和连续统去除光谱均以归一化光谱指数(NDSI)为自变量构建的LAI预测模型最优,而导数变换光谱以比值光谱指数(RSI)为自变量构建的预测模型最优,3种最优单变量模型均到达了 0.01的显著性检验,其R2均超过了0.55,其中基于原始光谱所构建的预测模型在几种单变量预测模型中表现相对最佳,R2为0.75,RMSE为0.29,与基于连续统去除光谱所建模型精度较为接近。
表3 基于最优光谱指数的冬小麦叶面积指数含量预测模型分析(建模集)Table 3 Analysis results of winter wheat Leaf Area Index(LAI)content prediction model based on the best spectral index(Modeling set)
众多农作物生理生化参数的遥感估算研究表明,通过多光谱指数构建的农学参数估算模型精度显著高于单光谱指数构建的模型,能有效提高提高农学参数的预测精度[30-31]。本研究尝试基于窄波段多光谱指数构建以下模型,1)对各变换光谱分别进行基于最优差值光谱指数、比值光谱指数和归一化光谱指数的多元线性回归模型构建;2)以各变换光谱下的最优差值光谱指数、比值光谱指数和归一化光谱指数合计9个光谱指数为自变量,构建基于BP神经网络的LAI估算模型;3)构建基于以上9个光谱指数的随机森林回归估算模型。各模型的预测方程和精度如表4所示。
在 3种光谱变换下,采用多元线性回归建模对冬小麦LAI进行预测,其中基于原始光谱建模所得决定系数最高(Rc2= 0.75),均方根误差最低(RMSEc= 0.29);相对于多元线性回归建模,2种机器学习算法模型精度均显著提高。其中,对9个窄波段光谱指数进行LAI的随机森林回归建模优于BP神经网络模型,其决定系数最高(Rc2= 0.92),均方根误差最低(RMSEc= 0.17),且预测过程没有出现过拟合和欠拟合现象。
由表3和表4所构建的LAI预测模型可知,多元线性回归模型建模精度相对传统的一元回归模型并无显著提高,而基于多光谱指数的机器学习算法建模效果明显优于传统回归模型。基于以上构建的冬小麦LAI估算模型,计算得到验证集LAI的预测值,并将LAI预测值与实测值进行线性拟合。依据模型精度的评价指标对不同模型的预测精度进行比较分析,结果如表5所示。预测精度较建模精度整体上有所下降,基于连续统去除光谱的最佳窄波段光谱指数LAI估算模型(CRS-NDSI)精度略高于OS-NDSI和FDS-RSI,多元线性回归模型验证精度依然是连续统去除光谱(CRS-LAI-MLR)的预测精度略高于OS-LAI-MLR和FDS-LAI-MLR,但多元线性回归模型验证精度相对一元回归模型并无显著提高。基于FDS-RSI所构建的最优光谱指数验证模型不具备预测样本的能力(RPD < 1.5),其他7种验证模型中除RFR模型外,均具有粗略的估测样本能力(1.5 < RPD < 2),且RPD 由小到大依次为 FDS-LAI-MLR、OS-NDSI、OS-LAI-MLR、CRS-LAI-MLR、CRS-NDSI和LAI-BP,随机森林回归模型(LAI-RFR)RPD>2,验证模型的决定系数为 0.77,均方根误差为 0.27,在所有验证模型中综合表现最好。相对预测偏差RPD>1.5的所有模型的LAI实测值与预测值的空间分布如图4所示,可以看出基于随机森林构建的冬小麦LAI验证模型,实测值与预测值的拟合分布更接近于 1∶1,说明估算模型具有极好的预测能力。
表4 基于多光谱指数的冬小麦叶面积指数含量预测模型(建模集)Table 4 Prediction model of winter wheat Leaf Area Index(LAI)content based on multispectral index (Modeling set)
表5 基于光谱指数的冬小麦叶面积指数含量验证模型分析结果(验证集)Table 5 Analysis results of winter wheat Leaf Area Index(LAI)content verification model based on spectral indices (Validation set)
图4 冬小麦叶面积指数实测值和预测值分布Fig.4 Distribution of measured and predicted values of winter wheat Leaf Area Index(LAI)
叶面积指数是一种描述作物冠层结构的重要参数,快速准确地获取LAI能精确地掌握农作物生长状况[32-33]。冬小麦拔节期氮素积累量几乎占总的氮积累量的一半,拔节期的生长状况是后期产量和品质形成的关键,对拔节期冬小麦的叶面积指数进行精确监测可以为后期冬小麦的田间管理提供科学的理论依据[34-35]。基于高光谱相机(UHD 185)的作物理化参数反演得到了广泛的验证,田明璐等[10]对无人机平台搭载 UHD高光谱相机所测的地物反射光谱曲线与地面对应目标的反射光谱进行比对,认为UHD高光谱影像具有较好的稳定性和光谱一致性。本研究基于无人机平台和UHD高光谱影像进行拔节期LAI的估算研究,结果表明冬小麦UHD原始冠层高光谱、一阶导数光谱和连续统去除光谱与LAI分别在750~950、730~770和 482~762 nm范围内达到极显著相关(P<0.01),通过分析原始冠层光谱、一阶导数光谱和连续统去除光谱所构建的任意两波段差值光谱指数、比值光谱指数和归一化光谱指数与 LAI的相关关系,发现与 LAI相关性较高的波段组合中均包含了 680~750 nm的波段(表2),这与前人研究结果基本一致[14,36-39],本研究中基于连续统去除光谱的最佳波段组合为NDSI(738,822)。刘伟东等[40]研究发现水稻的叶面积光谱敏感波段集中在740~760 nm;苏伟等[41]发现基于哨兵2号遥感影像构建有红边参与的 NDSI(705,783)光谱指数能够较为准确地估算玉米LAI值,这都反映了红边位置对于LAI估算的重要性。因此,可以预见当无人机多光谱或者卫星多光谱在携带红边波段的情况下,将会提升LAI的估算能力。
本研究中基于一阶导数变换光谱和连续统去除变换光谱与LAI的相关性较原始光谱显著提高(图2),与王伟东等[13]、姚霞等[15]、李粉玲等[16]、武旭梅等[42]和张雪红等[43]研究结果基本一致,表明对原始光谱做变换并应用到作物生理参数反演方面是可行的。基于变换光谱构建的最优窄波段光谱指数与LAI的相关性显著高于敏感波段,并且最优窄波段光谱指数与LAI的关系均表现为非线性,更适合用一元二次函数进行拟合,其中基于连续统去除光谱的 3类光谱指数所筛选的最佳波段组合均为 738和822 nm,且 NDSI(738,822)表现最优。基于多光谱指数构建的多元线性回归模型相较于一元回归模型精度并无明显提高。但多元回归模型和一元线性回归模型均表明基于连续统变换光谱的模型精度较原始光谱和一阶导数变换光谱下的模型精度有所提高,这与张雪红等[43]、张金恒[44]的研究结果一致,表明以连续统去除法处理光谱反射率并用来建模是可行的,基于连续统去除光谱的 NDSI(738,822)指数具备较好的LAI的估算能力。以9个最优窄波段光谱指数为自变量所构建的BP神经网络模型和随机森林回归模型相对于传统的回归模型精度明显提高,其中随机森林回归模型精度最高,这是由于随机森林算法建模能较好的容忍一些噪声和异常值,只要调参精确,就不易出现过拟合,更适合解决一些非线性问题。基于该模型,本研究区拔节期冬小麦的LAI空间分布如图5所示,基本与实际情况相符。但该模型对不同小麦品种、不同地理位置和生长环境下的LAI估算的适用性还有待深入研究。
图5 基于LAI-RFR的研究区冬小麦叶面积指数反演图Fig.5 Inversion map of winter wheat Leaf Area Index (LAI) in the study area based on LAI-RFR
无人机被广泛应用在农业遥感方面,可以获得作物各个生育期的信息,实现低空遥感作业与地面数据测量同步进行,为区域尺度高光谱遥感理论提供依据。本研究采用无人机低空遥感平台获取高光谱遥感影像,构建基于窄波段光谱指数的冬小麦叶面积指数(Leaf Area Index,LAI)估算模型,结果表明基于不同变换光谱的多个窄波段光谱指数构建随机森林算法能够获得最优的LAI估算精度,其相对预测偏差为2.01,验证集决定系数和均方根误差分别为0.77和0.27。该模型可以作为关中地区拔节期冬小麦叶面积指数无人机高光谱遥感估算的基本模型,进而实现小区域尺度冬小麦LAI的快速准确获取,为后期作物长势以及估产等提供理论依据。