黄帅 孙浩翔 王廷超 舒坤良 王青蓝 盖嘉慧
摘要:为快速、精准的诊断辣椒叶绿素含量,采用测量方法简单、干扰因素较少的透过光谱进行定量分析。研究对叶绿素含量极其敏感的红边波段变化规律,利用一阶导数法计算代表红边波段特征的红边位置、红边幅值和红边面积三种红边参数,分析参数变量间的相关性和共线性,并基于特征参数分别建立最小二乘回归模型和岭回归模型。结果表明,最小二乘回归模型的验证结果相对误差为7.94%,岭回归模型的验证结果相对误差为7.75%,岭回归模型不仅解决参数间的共线性问题,并且提高模型验证结果的精确度,该模型可以作为辣椒生长状态快速诊断的技术基础。
关键词:辣椒叶片;叶绿素含量;透过强度光谱;红边参数;岭回归
中图分类号:S641.3文献标识码:A文章编号:20955553 (2023) 11010906
Research on the diagnostic model of chlorophyll content in pepper leaves based on the
red-edge characteristics of transmission intensity spectra
Huang Shuai, Sun Haoxiang, Wang Tingchao, Shu Kunliang, Wang Qinglan, Gai Jianghui
(Jilin Academy of Agricultural Sciences, Changchun, 130033, China)
Abstract:In order to quickly and accurately diagnose the chlorophyll content of peppers, quantitative analysis was carried out through the transmission spectrum with simple measurement method and less interference factors.The variation law of the red-edge band, which was extremely sensitive to chlorophyll content, was studied. Three red-edge parameters (λred), red-edge amplitude (dλred) and red-edge area (Sred) representing the characteristics of the red-edge band were calculated by the first derivative method. The correlation and collinearity among the parametric variables were analyzed. And the least squares regression model and the ridge regression model were established respectively based on the characteristic parameters. The results showed that the relative error of the verification results of the least squares regression model was 7.94%, and the relative error of the verification results of the ridge regression model was 7.75%. The ridge regression model not only solved the problem of collinearity between parameters, but also improved the accuracy of the model verification results. Therefore, the above model can be used as a technical basis for rapid diagnosis of pepper growth status.
Keywords:pepper leaf; chlorophyll content; transmission intensity spectrum; red-edge parameters; ridge regression
0引言
葉绿素是绿色植物光合作用中最重要的有机分子,是大部分植物生命特征指标之一[12],其含量不仅能够直接反映植物营养及生理状态,还为农业生产管理提供可靠依据[34]。如何快速准确地获取叶片叶绿素含量,成为监测作物长势、指导农事生产的重要研究方向。
传统的化学分析法虽然可以准确检测叶片叶绿素含量,但检测过程不仅具有一定的破坏性,而且费时费力、操作繁琐、成本过高。大量研究表明,基于光谱信息的定量监测技术是诊断叶片叶绿素含量的有效方法[58]。
在基于光谱技术诊断植物叶片叶绿素含量方面的研究中,毛智慧等[911]利用低空无人机遥感技术,搭载光学传感器获取作物冠层叶片反射光谱,对玉米、花生、马铃薯等作物进行叶绿素定量分析,建立多种作物生长情况监测模型;Cai等[1213]在高浓度二氧化碳条件环境下利用高光谱影像数据建立多种小麦叶片叶绿素含量估算模型。上述研究均取得了很好的成果,但是在利用无人机遥感技术获取作物反射光谱数据时,不仅存在较远的测量光程,还受制于环境因素,对拍摄时的光照条件要求较为苛刻。Wang等[1415]利用560nm、650nm和940nm处的透过率光谱进行计算作为特征参数,对水稻、黄瓜和番茄等作物叶片进行叶绿素含量检测;丁永军等[16]分别利用去包络线、吸光度、原始光谱和一阶微分数据提取多个番茄叶片叶绿素含量敏感光谱波段,并建立多种预测能力较好的估测模型。上述几位研究人员使用的光谱范围较大,横跨可见光和近红外光谱范围,光谱检测设备开发难度较大、成本较高。本研究改良透过光谱测量方法,搭建构造简单、检测精准的透过光谱数据采集系统,构建利用较窄波段的高精度估测模型,为叶片叶绿素含量检测仪器的精简化开发提供技术支持。
通过对植物叶片光谱特性的研究发现,由于叶片对红光波段的吸收和对近红外光波段的不吸收,在680~760nm的区域出现了光谱曲线陡然上升的情况[17]。许多研究结果表明,红边区域特征参数与叶绿素含量有强烈的相关性[1819],Li等[2022]在处理高光谱遥感数据时,利用反射率光谱红边区域的特征参数,建立马铃薯、冬季油菜和玉米冠层叶片的叶绿素和氮素含量估算模型。然而,大部分红边区域的研究都用在反射率光谱数据的定量分析中。
本文以温室辣椒为研究对象,采用透过光谱对辣椒叶片叶绿素含量进行定量分析,降低外界环境对原始数据潜在的影响,提升数据检测的稳定性和准确性,探究叶片透过光谱红边区域与叶绿素含量间的变化规律,基于红边特征参数建立的两种不同算法的多元线性回归模型,并对模型的估测精度进行对比分析。
1材料与方法
1.1植物样本的培育
试验在吉林省蔬菜花卉科学研究院可控温室(东经125°23′37.1″,北纬43°49′51.9″)进行,辣椒栽培设计了5个不同氮元素营养水平试验区(N1~N5,营养浓度见表1),其中N3为标准营养水平。基质中椰糠和珍珠岩配比为3∶1,5个实验区的栽培槽规格相同(长600cm、宽40cm、高30cm),每个试验区种植16株,共80株辣椒苗。温室内的温度和光照用物联网设备进行实时监控并通过放风和遮阳幕进行自动的适度环境调控,温室内的温度控制在白天(26±2)℃和晚上(16±2)℃,相对湿度50%~70%,光强度不超过1000光量子通量密度,利用定时器和潜水泵自动定时每日早晚各灌溉5min营养液,每天为每株辣椒提供800mL的营养液,并将pH值调整在6.5~7.5之间。经不同施氮处理30天后,选择已发育较好的叶片进行光谱数据采集和叶绿素含量测定,每个试验区采集叶片样本30个,共采集150个样本。
1.2光谱数据采集
使用AvaSpec-ULS2048XL-EVO光谱仪(Avantes,荷兰)进行光谱数据采集,测量波段范围为350~1100nm,测量步长为0.6nm。整个数据采集过程在封闭的暗室内进行,将余弦校正器固定在水平操作台上,将测量光源垂直于操作台,叶片样本避开叶脉平铺在余弦校正器上并用叶片夹固定。测量时保持光源与操作台距离不变,并封闭暗室操作窗口,保证测量不受外界光源影响,将人为出现的误差的几率降到最低。测量样本之前,在扣除机器噪音后测量光源的原始光谱,将光照强度保持为1200μmol/(m2·s)并保存为参考光谱后,进行叶片样本透过光谱数据采集,每个叶片样本进行4次数据采集并保存,测量5个样本后校正一次光源距离和光照强度。
1.3叶绿素含量测定
本文使用紫外分光光度计METTLER TOLEDO UV5(Mettler-Toledo,瑞士)进行叶绿素含量的测定,按丙酮和水体积比4∶1配置萃取液,称取剔除叶脉的辣椒叶片0.2g放到10mL的丙酮溶液中,在4℃冰箱中暗黑条件下浸泡24h,取上清液测定663nm和645nm波段的光密度OD(Optical Density),测定后按Arnon法修正公式计算出溶液的叶绿素含量[23]
1.4光谱预处理和特征参数计算方法
将每个样本测量的4次光谱数据进行平均,得到该样本的最终透过强度光谱曲线数据。利用Savitzky-Golay方法对透过强度光谱曲线进行平滑处理,窗口点数为20,在保证光谱特征的前提下,消除光谱中存在误差的个别数据。对光谱数据进行预处理后,需要提取光谱数据中反映样本叶绿素含量的有效信息来进行诊断模型的建立。在对红边区域的分析中,最大一阶导数法计算的红边位置连续性较高[24],并且可以得到与叶绿素含量相关的红边幅值(红边位置所对应的值)和红边面积(红边区域一阶导数曲线所围成的面积)两种参数,所以本研究选用一阶导数法计算透过强度光谱的红边参数。
1.5模型建立及评价方法
本文拟用最小二乘回归和岭回归两种建模方法建立包含多种自变量的多元线性回归模型。岭回归[25]方法是一种对自变量具有多重共线性数据分析的有偏估计回归方法。Hoerl等[26]在研究中推导出了岭回归分析的具体证明。Mcdonald等[27]对岭回归方法进行了简要概述,证明了岭回归分析的性质是对不适定问题进行回归时最经常使用的正规化方法。岭回归实质上是一种经过改良的普通最小二乘估计,通过放弃最小二乘估计的无偏性,以损失部分信息、降低模型精度为代价,从而使回归方法获得更符合实际、更可靠的回归系数。
本研究利用上述两种方法建立模型后得到的绝对系数,并通过计算模型估测结果与实际测量结果的相对误差来验证模型的准确性。
2结果与分析
2.1葉绿素测量结果
2.2光谱特征
2.3红边参数计算
利用5个试验区30个叶片样本透过强度光谱数据的平均光谱曲线,使用最大一阶导数法对平均光谱曲线的红边区域(680~760nm)范围进行特征提取,得到平均光谱红边区域的一阶导数曲线如图3所示。各试验区红边区域的一阶导数曲线有着明显差异,随着叶绿素含量的增加,波峰右侧曲线的斜率减小,逐渐呈现出双峰现象。随着叶绿素含量的增加,透过强度红边区域一阶导数曲线差异越小,N2~N5试验区的波峰峰值逐渐降低,波峰位置向红外区域移动。N1~N5试验区平均透过强度光谱曲线的红边位置分别为:686.91nm、689.21nm、694.41nm、697.87nm、698.44nm;红边幅值分别为:0.0605、0.0698、0.0567、0.0484、0.0434;红边面积分别为:14.4214、17.8995、29.4888、43.2703、46.7996。
截取150个样本的透过强度红边区域(680~760nm)范围内的光谱曲线。对一阶导数曲线进行分析,得到能代表红边区域特征的红边参数,包括红边位置λred(一阶导数曲线峰值的对应波段)、红边幅值dλred(一阶导数曲线峰值)、红边面积Sred(一阶导数曲线所围成的面积)。表2为全部样本红边参数统计结果。
三种特征参数都表现出了与叶片叶绿素含量较高的相关性,其中λred与叶绿素含量相关性最高,达到0.8991,dλred与叶绿素含量呈负相关,Sred与叶绿素含量的相关性为0.7707;Sred和dλred的极差相对较大且变异系数大于15%,说明两种红边参数受叶绿素含量的影响波动较大。
2.4参数共线性分析
多特征参数建立的多元线性回归模型相较于单一变量模型的估测结果更加稳定。但建立多元线性回归模型时,需分析每个参数之间存在的多重共线性,如果自变量之间共线性较强,则会导致模型系数不稳定。所以在建立模型之前,先对三种参数进行共线性诊断(表3),λred和Sred两种自变量的方差膨胀因子(Variance Inflation Factor,VIF)均大于10,且特征根为0.0590和0.0129均趋近于0,Sred的条件指数大于10且小于30,说明λred和Sred两种自变量存在多重共线性。对3种红边参数进行相关性分析(图3),dλred与λred和Sred的相关系数分别为-0.6924和-0.3801,相关性较低,但λred与Sred之间的相关性高达0.8974。上述结果说明3种参数间存在多重共线性,所以在建立叶绿素含量诊断模型时需要解决自变量间存在共线性的问题。
2.5建模结果分析
为解决上述问题,本文将150个样本随机分为100个训练集样本和50个验证集样本,利用最小二乘回归和岭回归方法,基于100个训练集叶片样本计算出的3种红边参数建立多元线性回归模型。在利用岭回归方法建立模型时,为了有效降低参数之间的多重共线性和过拟合情况,通过对3种红边参数的岭迹进行分析,发现当k值为0.04时,各自变量的回归系数趋近于稳定,且R2值也处于较高的位置。将k带入回归模型中,得到一个有偏的多元线性回归模型。将50个验证集样本带入模型中,得到不同建模方法的验证集样本预测值(图5),并计算预测值与实测值的相对误差,利用计算结果对模型精度进行评价。
从表4可以看出,两种回归模型的R2、均方根误差(Root Mean Square Error,RMSE)和自由度(Degree of Freedom,DF)均相同,岭回归模型的残差平方和(Sum of the Squared Errors,SSE)要高于最小二乘回归模型,但岭回归模型的验证结果与实测值的相对误差RE为7.75%,估测精度优于最小二乘回归模型。由此可见,在建立基于透过强度光谱红边区域特征参数的辣椒叶片叶绿素诊断时,岭回归方法相较于最小二乘回归方法,估测结果精度更高。
3结论
1) 本文利用透过强度光谱进行辣椒叶片叶绿素含量的估測,在固定光源及光路的情况下,尽量减少光谱采集时对原始光谱的计算,降低原始数据产生误差的可能性。仅采用680~760nm范围80nm宽的光谱波段即可实现叶绿素准确检测,该方法不仅减少了检测设备对光源和传感器的要求,降低了检测设备成本;并且测量光程差为0,不易受外界环境干扰,提升了原始数据的准确性,为开发辣椒叶片叶绿素含量估测仪器提供科学依据。
2) 分析了5种施氮条件下辣椒叶片样本的透过强度光谱红边区域变化规律,使用一阶导数法计算了150个样本的红边参数,探讨了红边参数与叶片叶绿素含量的相关性。随着叶绿素含量的增加,λred向近红外方向偏移,透过强度也随之降低,λred与叶绿素含量的相关系数达到0.899 1,dλred和Sred与叶绿素含量的相关系数绝对值均高于0.7,三种红边参数可以作为作物叶绿素含量诊断的参考特征参数。
3) 证明了透过强度光谱红边参数可以用于辣椒叶片的叶绿素含量快速无损检测。建立了两种基于3种透过强度光谱红边参数的多元线性回归模型,综合模型的R2、RMSE、SSE和RE指标,两种模型的决定系数R2均高达0.917,岭回归模型验证结果的相对误差为7.75%,可以有效诊断辣椒叶片叶绿素含量,能够用于开发基于光谱透过率的叶绿素含量检测仪器。
参考文献
[1]Qi Haixia, Wu Zeyu, Zhang Lei, et al. Monitoring of peanut leaves chlorophyll content based on drone-based multispectral image feature extraction [J]. Computers and Electronics in Agriculture, 2021,187: 106292.
[2]Zhou Wei, Shi Runhe, Wu Nan, et al. Spectral response and the retrieval of canopy chlorophyll content under interspecific competition in wetlands-case study of wetlands in the Yangtze River Estuary [J]. Earth Science Informatics, 2021(14): 1467-1486.
[3]Kochubey S M, Kazantsev T A. Changes in the first derivatives of leaf reflectance spectra of various plants induced by variations of chlorophyll content [J]. Journal of Plant Physiology, 2007, 164(12): 1648-1655.
[4]陈鹏, 冯海宽, 李长春, 等. 无人机影像光谱和纹理融合信息估算马铃薯叶片叶绿素含量[J]. 农业工程学报, 2019, 35(11): 63-74.Chen Peng, Feng Haikuan, Li Changchun, et al. Estimation of chlorophyll content in potato using fusion of texture and spectral features derived from UAV multispectral image [J]. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(11): 63-74.
[5]Peng Yi, Gitelson A A. Application of chlorophyll-related vegetation indices for remote estimation of maize productivity [J]. Agricultural and Forest Meteorology, 2011, 151(9): 1267-1276.
[6]Erhard E. Pfündel. Simultaneously measuring pulse-amplitude-modulated (PAM) chlorophyll fluorescence of leaves at wavelengths shorter and longer than 700 nm [J].Photosynthesis Research, 2021(147): 345-358.
[7]Li H, Wei Z, Wang X, et al. Spectral characteristics of reclaimed vegetation in a rare earth mine and analysis of its correlation with the chlorophyll content [J]. Journal of Applied Spectroscopy, 2020, 87(3): 553-562.
[8]Zhu Wenjing, Li Jinyan, Li Lin, et al. Nondestructive diagnostics of soluble sugar, total nitrogen and their ratio of tomato leaves in greenhouse by polarized spectra-hyperspectral data fusion [J]. Agricultural and Biological Engineering, 2020, 13(2): 189-197.
[9]毛智慧, 邓磊, 孙杰, 等. 无人机多光谱遥感在玉米冠层叶绿素预测中的应用研究[J]. 光谱学与光谱分析, 2018, 38(9): 2923-2931.Mao Zhihui, Deng Lei, Sun Jie, et al. Research on the application of UAV multispectral remote sensing in the maize chlorophyll prediction [J]. Spectroscopy and Spectral Analysis, 2018, 38(9): 2923-2931.
[10]Zhu Wanxue, Sun Zhigangm, Yang Ting, et al. Estimating leaf chlorophyll content of crops via optimal unmanned aerial vehicle hyperspectral data at multi-scales [J]. Computers and Electronics in Agriculture, 2020, 178: 105786.
[11]Chen Shaomin, Ma Lihui, Hu Tiantian, et al. Nitrogen content diagnosis of apple trees canopies using hyperspectral reflectance combined with PLS variable extraction and extreme learning machine [J]. Agricultural and Biological Engineering, 2021, 14(3): 181-188.
[12]Cai Yao, Miao Yuxuan, Wu Hao, et al.Hyperspectral estimation models of winter wheat chlorophyll content under elevated CO2[J]. Frontiers in Plant Science, 2021, 12: 642917.
[13]Wu Bin, Huang W, Ye H, et al. Usingmulti-angular hyperspectral data to estimate the vertical distribution of leaf chlorophyll content in wheat [J]. Remote Sensing, 2021, 13(8): 1501.
[14]Wang Jianfeng, He Dongxian, Song Jinxiu, et al. Non-destructive measurement of chlorophyll in tomato leaves based on spectral transmittance international [J]. Agricultural and Biological Engineering, 2015, 8(5): 73-78.
[15]賀冬仙, 胡娟秀. 基于叶片光谱透过特性的植物氮素测定[J]. 农业工程学报, 2011, 27(4): 214-218, 397.He Dongxian, Hu Juanxiu. Plant nutrition indices using leaf spectral transmittance for nitrogen detection [J]. Transactions of the Chinese Society of Agricultural Engineering, 2011, 27(4): 214-218, 397.
[16]丁永軍, 张晶晶, 孙红, 等. 玻璃温室环境下番茄叶绿素含量敏感光谱波段提取及估测模型[J]. 光谱学与光谱分析, 2017, 37(1): 194-199.Ding Yongjun, Zhang Jingjing, Sun Hong, et al. Sensitive bands extraction and prediction model of tomato chlorophyll in glass greenhouse [J]. Spectroscopy and Spectral Analysis, 2017, 37(1): 194-199.
[17]Horler D N H, Dockray M, Barber J. The red edge of plant leaf reflectance [J]. International Journal of Remote Sensing, 1983, 4(2): 273-288.
[18]Jiang Changhui, Chen Yuwei, Wu Haohao, et al. Study of a high spectral resolution hyperspectral lidar in vegetation red edge parameters extraction [J]. Remote Sensing, 2019, 11(17): 2007.
[19]Ren Hongrui, Zhou Guangsheng, Zhang Xinshi. Estimation of green aboveground biomass of desert steppe in Inner Mongolia based on red-edge reflectance curve area method [J]. Biosystems Engineering, 2011, 109(4): 385-395.
[20]Li Lantao, Ren Tao, Ma Yi, et al. Evaluating chlorophyll density in winter oilseed rape (Brassica napus L.) using canopy hyperspectral red-edge parameters [J]. Computers and Electronics in Agriculture, 2016, 126: 21-31.
[21]Wen Pengfei, Shi Zujiao, Ning fang, et al. Estimation of the vertically integrated leaf nitrogen content in maize using canopy hyperspectral red edge parameters [J]. Precision Agriculture, 2021(22): 984-1005.
[22]Tao Zheng, Ning Liu, Li Wu, et al. Estimation of chlorophyll content in potato leaves based on spectral red edge position [J]. IFAC Papers OnLine, 2018, 51(17): 602-606.
[23]Lichtenthaler H K, Wellbuen A R. Determinations of total carotenoids and chlorophyll a and b leaf extracts in different solvents [J]. Biochemical Society Transactions, 1983, 11(5): 591-592.
[24]Dawson T P, Curran P J. Technical note a new technique for interpolating the reflectance red edge position [J]. International Journal of Remote Sensing, 1998, 19(11): 2133-2139.
[25]Zohre E K, Fatemeh R, Mohsen E K, et al. Investigation of the relationship between dust storm index, climatic parameters, and normalized difference vegetation index using the ridge regression method in arid regions of Central Iran [J]. Arid Land Research and Management, 2020, 34(3): 239-263.
[26]Hoerl A E, Kennard R W. Ridge regression: biased estimation for nonorthogonal problems [J]. Technometrics, 1970, 12(1): 55-67.
[27]Mcdonald G C. Ridge regression [J]. Wires Computational Statistics, 2009, 1(1): 93-100.