郭 松,常庆瑞 ,张佑铭,陈 倩,落莉莉
(西北农林科技大学 资源环境学院,陕西杨凌 712100)
叶片氮素含量是衡量作物生长状态的指标之一[1-2],同时还是科学规划田间施氮的重要参考量[3]。传统的氮素测量方法如凯氏定氮法[4-5]、纳氏试剂法[6]等不仅检测速度慢,而且对样本本身有着不可逆的损害,不适宜用于大样本下的氮素含量测定。
近年来,随着遥感技术的不断发展,基于作物光谱的无损、快速、大面积的作物氮素含量监测成为研究热点[7-8],涉及多种作物类型,如小麦[9]、水稻[10]、花生[11]、马铃薯[12]等。Martins等[13]发现甘蔗叶片氮含量变化与其红光波段和绿光波段的反射特性显著相关;Li等[14]从不同角度获取冬小麦冠层的光谱数据,发现不同角度光谱数据的融合可以提高冬小麦氮素反演的精度;杨海波等[15]从品种以及生育期两方面评估了归一化植被指数(NDVI)反演马铃薯植株氮素含量的潜力,结果显示生育期的影响比较大;李金敏等[16]开发了一种深度森林(DF)模型,较好反演了水稻叶片尺度的氮含量;Pullanagari等[17]以牧草冠层高光谱数据为基础,使用一维卷积神经网络较好估测了牧草冠层的氮素含量。
作物叶绿素与类黄酮的比值称为氮平衡指数(Nitrogen Balance Index,NBI),与氮素相比,NBI是重要的荧光胁迫参数,同样能指示作物的长势信息,而且在评估作物氮肥吸收情况时,NBI能有效避免肥料效应的滞后性[18]。当下已有学者对作物的NBI进行了研究,Cartelat等[19]建议在农业生产中使用NBI指示冬小麦的氮素含量和产量;Lejealle等[20]的研究表明,在指导足球场草坪氮肥施用时,NBI比叶绿素的指示性更强;宋森楠等[21]发现小麦的NBI可用于其籽粒的蛋白质含量预测。但目前学者们多是探讨NBI的农学价值,少有从光谱角度进行遥感定量反演。陕西省黄土台塬区作为中国玉米的重要产区,其玉米的稳产、高产以及氮肥的科学施用对于中国农业的可持续发展具有重要意义[22]。故本试验以该地区玉米作为研究对象,构建高精度的玉米NBI高光谱反演估算模型,为陕西省黄土台塬区的玉米长势监测以及氮肥调控提供技术和理论支持。
研究区位于陕西省乾县齐南村(108.113°E,34.642°N),地处黄土高原与关中平原交界地带,地貌类型为黄土台塬,属暖温带大陆性季风气候,四季分明,年均气温10.5℃,年均降水550~610 mm,集中在夏季和秋季,平均海拔990 m。试验地土壤类型为红黑油土,水肥兼顾,适合耕作,作物一年一熟或两年三熟,主要为玉米、小麦以及少部分的油菜。试验开始于2017-05-15,研究作物是‘陕单226’玉米,试验地共划36 个小区(90 m2,9 m×10 m),4个大田(153 m2,9 m×17 m),提供氮、磷、钾3 种肥料,氮肥处理(N0~N5)纯N施用量分别为0、30、60、90、120、150 kg/hm2;磷肥处理(P0~P5)P2O5施用量分别为0、18.75、37.5、56.25、75、93.75 kg/hm2;钾肥处理(K0~K5)K2O施用量分别为0、20、40、60、80、100 kg/hm2,每种肥料均设6 个水平,共18 个处理,N0、N2、N4、N5重复3 次,其余各处理重复2 次,所有肥料在播种前一次性施入,不追肥,田间生产管理方式与当地一致,各小区与大田均设置两个采样点。分别在玉米拔节期(6月16日)、抽雄期(7月19日)、乳熟期(8月2日)、完熟期(9月6日)采集叶片样品,每个采样点附近采集3片生长状态良好的冠层叶片,将叶片装入塑封袋并排尽空气,迅速保存在置有冰袋的保温箱中,于当天在室内测定叶片的NBI与可见光~近红外波段的反射率。
1.2.1 叶片NBI 使用法国Force-A公司生产的Dualex Scientific+测量玉米叶片NBI。将各样点的3 片叶片按顺序排好并擦去其表面灰尘,分别在叶片的尖、中、基3 个部位各测量1 次,测量时避开叶脉,每个样点共获取9个NBI,取平均值作为该样点的最终NBI。
1.2.2 叶片光谱反射率 利用美国Spectrum Vista公司生产的SVC HR-1024i便携式地物光谱仪获取玉米叶片的高光谱反射信息。室内测量时该仪器使用内置钨灯作为光源,光谱测量范围在350~2 500 nm,相应光谱分辨率在 1 850~ 2 500 nm为6.5 nm、1 000~1 850 nm为9.5 nm、350~1 000 nm为3.5 nm,在每片叶片的尖、中、基3 个部位(与NBI测量位置相对应)分别获取2条光谱曲线,单个样点共获取18条光谱曲线,取平均作为该样点的最终反射率信息,为保证数据科学可靠,每30 min进行1 次参考板校正,且校正数据稳定。
NBI是叶绿素与类黄酮的比值,其光谱响应波段集中在可见光~近红外[23],故通过SVC系统提供的软件将光谱反射率重采样至380~1 000 nm,采样间隔1 nm;利用The Unscrambler X 10.4对光谱曲线进行Savitzky-Golay三阶平滑以去除试验过程中的随机噪声;在Excel 2016中按照升序原则将NBI数据进行排序,使用分层抽样法以3∶1的比例划分建模集与验证集,每个生育期得到建模样本60 个,验证样本20 个。
采用一元建模和多元建模构建NBI反演模型,一元建模函数包括线性函数、幂函数、多项式、指数函数以及对数函数;多元建模包括偏最小二乘回归和极限学习机回归,所有模型的建立均在Matlab 2016a中实现。
(1)
(2)
表1 植被指数计算方法Table 1 Calculation method of vegetation index
2.1.1 玉米叶片NBI特征 从不同生育期的NBI统计特征表(表2)可看出,玉米各生育期NBI的中位数与平均值较接近,各生育期的NBI变异系数为0.136~0.182,属于中等变异[30]。随着生育期的推进,NBI平均值呈现先上升后下降的趋势。这是因为从拔节期到抽雄期,玉米植株发育较快,氮素主要向叶片汇集,并在抽雄期NBI达到最大值,而抽雄期以后氮素则主要供给玉米粒,故叶片NBI开始下降并逐渐稳定。
表2 不同生育期玉米叶片NBI统计特征Table 2 Statistics characteristics of maize leaves NBI at different growth stages
2.1.2 不同NBI玉米叶片的高光谱特征 将4个生育期的320个样本按照NBI大小排序,分为3 组,每组NBI平均值分别为29.98、37.70、 44.51,对各组的光谱曲线取平均,分析不同NBI的光谱特征(图1)。总体上,不同NBI的光谱曲线趋势一致,表现为“根号”走势,在可见光波段反射率低,近红外波段反射率高,二者之间由“红边”连接。从不同NBI光谱曲线看,色素吸收带处的反射率与NBI成反比,而近红外高反射平台则与之相反,原因可能是NBI增加反映玉米叶片色素含量上升和细胞结构更加稳定,色素含量的上升会使叶片对光能的利用效率大大增加,在可见光波段的反射率降低,吸收率增加,即蓝光(450 nm)与红光(700 nm)处两个吸收谷更深,绿光(550 nm)处的反射峰更矮,产生“红边红移”现象;同时随着细胞结构更加稳定,叶片叶腔对近红外光的反射能力增强,故近红外高反射平台变高。
图1 不同NBI玉米叶片高光谱特征Fig.1 Hyperspectral characteristics of maize leaves with different NBI
2.2.1 NBI与光谱反射率的相关性 各生育期NBI与光谱反射率相关系数曲线变化趋势基本一致,通过0.01相关性检验的波段集中在可见光波段,即波长380~750 nm,且均为负相关,而近红外(大于750 nm)波段与NBI的相关性则比较低,未通过显著性检验(图2)。从不同生育期看,NBI与反射率相关性在抽雄期最佳,其特征波段位于558 nm处,相关系数为-0.80,其次是乳熟期、完熟期和拔节期,相应的特征波段分别为711 nm、710 nm、560 nm,相关系数为-0.72、 -0.71、-0.61;由拔节期向完熟期过渡时,与NBI相关性为极显著的波段数量依次增加,同时特征波段由绿光向红光方向移动(图2)。
图2 不同生育期NBI与光谱反射率相关性Fig.2 Correlation between NBI and spectral reflectance at different growth stages
2.2.2 NBI与植被指数的相关性 表3中所有生育期的4种植被指数均通过0.01相关性检验。除MCARI外,其余植被指数均表现为正相关;各生育期的4个植被指数中,均为NDVI相关性最低,MTCI相关性最高,故选择MTCI作为一元建模的植被指数参数。
表3 不同生育期光谱植被指数与NBI相关性Table 3 Correlation between spectral vegetation index and NBI at different growth stages
2.3.1 单因素模型构建及精度评价 选取不同生育期特征波段与最佳植被指数构建一元回归模型,所有单因素模型表达式均为曲线方程(表4)。从建模参数看,4个生育期中基于植被指数的回归模型均优于基于特征波段的回归模型,说明植被指数的反演潜力高于特征波段。所有单因素模型中,精度最高的是抽雄期MTCI模型,其建模R2与预测R2分别为0.67、0.73,相应的RPD为1.47和1.89,表明该模型具有粗略的预测能力,当考虑单因素模型反演玉米NBI时,应优先选用此模型(表4)。
表4 不同生育期NBI单因素模型Table 4 Single factor model at different growth stages
2.3.2 基于连续投影算法的偏最小二乘模型构建 连续投影算法是通过对工具响应矩阵进行一系列的正交投影,从而使变量选择问题转化为优化组合问题的前向变量选择方法[31]。本文将不同生育期通过0.01相关性检验的波段反射率作为被选择变量,NBI作为响应变量,通过该算法确定多元建模参数。筛选结果如表5,各时期的波段数为8~20,抽雄期最多,乳熟期最少。同时以筛选出的各波段为自变量,通过偏最小二乘回归(Partial Least Square Regression,PLSR)拟合NBI,PLSR结合了主成分分析与古典回归的特点,算法中的主成分个数由方差贡献率决定,建模结果如表6。与单因素模型相比,偏最小二乘回归模型精度提升较大,各生育期建模R2与验证R2分别为0.75~0.92、0.69~0.91,相应的RPD分别为1.74~3.44、1.42~3.21,总体上抽雄期的建模效果最好,其次是完熟期、乳熟期,最后是拔节期,其中抽雄期的偏最小二乘回归模型建模与验证RPD均大于2,表明该生育期的模型预测能力极好。
表5 不同生育期光谱多元建模参数Table 5 Multivariable modeling parameters of spectrum at different growth stages
表6 不同生育期偏最小二乘回归模型Table 6 Partial least-squares regression model at different growth stages
2.3.3 基于SSA-ELM的多因素模型构建 极限学习机(Extreme Learning Machine,ELM)是一种基于前馈神经网络的改进型机器学习算法,与基于梯度的经典神经网络相比,该方法具有学习速率快、泛化能力强的优点[32],但是在样本数据向高维空间的映射过程中,由于其函数参数是随机生成的,因此容易产生较差的拟合结果,所以,为降低时间成本,获取较好的模型,本文采用麻雀搜索算法(Sparrow Search Algorithm,SSA)对ELM进行优化[33]。选择sigmoid函数作为ELM激活函数,隐含层数目N、麻雀种群数量P、最大迭代次数I、自适应度参数F以及建模效果如表7。各生育期的SSA-ELM模型均优于相应的偏最小二乘回归模型,建模效果较好。就模型RPD而言,拔节期、乳熟期建模RPD大于2,验证RPD小于2,模型精度相对欠佳,而抽雄期与完熟期的建模和验证RPD均大于2,模型精度相对较高。综合来看,在所有SSA-ELM模型中,抽雄期的拟合效果最好,建模R2与验证R2均为0.93,对NBI具有极好的预测效果。
表7 不同生育期极限学习机回归模型Table 7 Regression model of extreme learning machine atdifferent growth stages
2.3.4 不同建模方法精度对比 选择不同建模方法下的最优模型进行拟合精度分析,图3是各类最优模型的NBI预测值与实测值拟合分布图,其中虚线为1∶1线,实线为拟合线,当拟合线越接近虚线,方程斜率越接近1,表示建模精度越好。3 种不同建模方法的模型预测值都较为均匀地分布在虚线两侧,说明模型没有出现“低值高估、高值低估”现象;其中极限学习机算法模型的R2最高,NBI预测点紧紧围绕在拟合线周边,拟合线斜率为0.92,决定系数R2为0.93,达极显著水平,表明抽雄期的SSA-ELM模型是此次研究中的最优模型。
a、b、c分别表示抽雄期下的单因素模型、PLS模型、SSA-ELM模型
在可见光区域,叶片的光谱由其色素含量决定,色素含量越高,对可见光波段的光能利用越多,相应的反射率越低;在近红外区域,叶片光谱由其内部的细胞成熟度决定,细胞成熟度高的叶片栅栏组织更加稳定,对近红外光的反射、折射比较强烈。同一生育期内,NBI较高的叶片发育较好,相应的色素含量和细胞成熟度较高。
随着生育期的推进,玉米叶片NBI及其与光谱的相关性均先上升、后下降,二者在抽雄期达到峰值。拔节期向抽雄期过渡时,玉米根系吸收的养分主要流向叶片,促进玉米叶片色素积累和细胞发育,叶片NBI上升,此时不同NBI的叶片光谱特征差异较大,且差异的规律性较好,所以相关性偏高;抽雄期后玉米植株的养分主要供给对象由叶片变为了玉米粒,叶片NBI有所下降,但是该时期的玉米叶片已经较为成熟,光谱特征趋于稳定,不同NBI的叶片光谱特征差异相对较小,所以相关性偏低。因此,在玉米的乳熟期及完熟期,NBI监测不应只针对于叶片,还应考虑玉米粒NBI对光谱响应的贡献。玉米不同生育期光谱反射率通过0.01相关性检验的区域主要集中在可见光,这在高光谱反演玉米生理生化参数方面与落莉莉等[34]的研究结果不一致,原因可能在于NBI是一个比值,由叶绿素含量与类黄酮含量共同决定,二者变化其一,则NBI必然变化,故叶片叶绿素、类黄酮以及NBI在近红外区域的高光谱特征差异对比是下一步研究的重点。
激活函数的选择及其参数的设置会影响到ELM对NBI的拟合效果,ELM的激活函数包括sigmoid函数、sin函数、hardlim函数等,鉴于单一激活函数的侧重点不同,已有学者开发了其他的激活函数以加强算法实用性[35]。灰狼算法、蚁群算法等参数寻优方法能降低ELM运行成本,缩短运行时间,本文采用麻雀搜索算法优化ELM,通过不断迭代快速获取了较优的NBI拟合结果。
本研究构建了多种不同生育期的玉米叶片高光谱NBI反演模型,总体上,多因素模型优于单因素模型,机器学习优于普通回归,这与其他学者的研究结果一致[36-38]。在实际应用时,仅需获取田间玉米叶片的高光谱数据,针对不同的生育期和模型,从反射光谱中提取相应的模型自变量,即可计算叶片NBI。NBI高的样点,玉米氮肥状况较为良好,不需要追肥;NBI低的样点,玉米氮肥较差,需要适量追加氮肥[23]。但是此次研究的区域局限在了陕西省黄土台塬区,文中所构建的各类模型是否适用于其他地区还有待验证,同时为了增加模型的实用性,在今后高光谱反演玉米NBI工作中,应由叶片尺度逐渐过渡到冠层尺度,并且在波段的组合与选择上要尽量向遥感卫星影像的波段靠拢,以期用影像检验模型精度并实现NBI遥感填图,在大区域尺度下实现玉米长势监测和指导田间施肥。
本研究以陕西省黄土台塬区玉米为研究对象,同步获取玉米叶片不同生育期的NBI与高光谱信息,通过相关性分析及连续投影算法提取一元和多元建模参数,运用普通回归、偏最小二乘回归和麻雀搜索算法优化的极限学习机回归构建NBI高光谱反演模型,得到结论如下:
(1)不同生育期的特征波段及相关系数分别是拔节期(560 nm,-0.61)、抽雄期(558 nm, -0.80)、乳熟期(710 nm,-0.72)、完熟期(711 nm, -0.71);MTCI是各生育期的最优植被指数。
(2)连续投影算法降维效果较好,不同生育期提取了8~20个多元建模参数,该算法未对光谱作任何修改,保证了提取参数的完整性和可解读性。
(3)综合来看,抽雄期下的SSA-ELM模型是此次研究中的最优模型,其建模和验证R2均达到0.93,相应RPD分别是2.57、2.31,该模型对NBI具有极好的预测效果。