李庆波,贾召会
(北京航空航天大学仪器科学与光电工程学院,精密光机电一体化技术教育部重点实验室,北京100191)
叶绿素在植物光合作用过程中起着重要作用,其含量是植物营养胁迫、生长状况的重要指示因子[1-2]。当前,通常采用叶绿素计实时、无损测定叶绿素含量,这种方法基于透射式光谱技术,只能单点和接触测量,还会受到叶片厚度的限制,无法满足植物冠层生化参数检测需求,或无人照料的自动检测需求。因此,有必要寻找一种更为简便、快速、非接触式的植物叶绿素含量测定方法。
基于反射式光谱技术的非接触式检测可以获取植物叶片或者冠层的面状光谱信息,测定范围变大,而且不再受叶片厚度的限制;此外,针对植物科学实验培养等特殊应用,非接触式检测可以实现对植物生化参数的无人自动检测,有利于搭建一个闭环的监控系统,以实现养分的自动供给。然而,相比单点接触测量,非接触式检测则更易受到各种因素的干扰:来自植物本身物理特性的影响,如叶片结构、散射效应[3-4];光谱测量过程中外界的干扰,如环境光、土壤背景等;仪器本身带来的基线漂移和热噪声。这些噪声以一定形式和程度叠加在有用信息上,降低了光谱信噪比,增加了定量分析的难度。
有效消除无用信息是建立稳健准确模型的基础,通常采用预处理算法消除无用信息。实际应用时一般需要多种预处理方法的结合[5-6],考虑到不同分析体系最佳组合及运算顺序不尽相同,选取优化过程工作量大[7-8]。本文从另一角度出发,不针对某一种噪声进行处理,而是提取出数据中所蕴含的本真低维结构,精简数据维数,同时消除大量冗余信息,降低建模复杂度的同时提高精度。目前,一种新的降维方法——等距映射(isometric mapping,ISOMAP)[9]被证明能够有效地发现高维数据集的低维结构[10],本文将其应用于叶绿素含量非接触式检测中,先利用ISOMAP算法对原始光谱进行降维,再对降维后数据进行PLS建模(简称为ISOMAPPLS建模方法)。结果表明,与波长参比和单纯PLS建模方法比较,ISOMAP-PLS有更高的预测精度,将ISOMAP算法应用在非接触检测的定量分析中是可行的。
使用美国Ocean Optics公司的USB4000光谱仪,其有效波段为400~1100 nm,分辨率为0.2 nm。叶绿素含量标准值测定采用日本美能达公司的SPAD-502叶绿素仪,测量精度为 ±1.0 SPAD,重复性精度为±0.3 SPAD(0~50 SPAD范围内)。光纤和光源采用与光谱仪配套的Y形光纤、LS-1卤钨灯。叶片光谱采用非接触漫反射式测量方式。
样品准备:选用盆栽绿萝作为待分析植物(品种为青叶葛),并选择植株上无生理病斑、无机械伤、绿色程度不同的叶片作为光谱采集样本。
光谱采集方式:采用自行设计的光纤支架搭建光谱采集系统,光纤支架主要有样品平台、滑杆、光纤探头固定孔三部分组成。检测距离取决于光纤探头视场角和光谱采集面积,光谱采集时确保样本充满光纤探头视场,在一定程度上减少背景反射光谱的影响。本研究中,样本和光纤探头的距离是5 cm。
光谱采集步骤:先采集暗光谱;然后采集标准反射板信号作为参考光谱;最后进行叶片光谱采集,每片叶片测量五次,然后以平均值作为最终测量结果,测量时探头垂直距离叶面5 cm。每一叶片测量其光谱后,即刻在这片叶子不同位置处使用SPAD-502测量SPAD值五次,然后平均作为最终SPAD值。22组样本数据的叶绿素含量标准值范围分布在12.8 ~45.1 SPAD,标准偏差为 9.78 SPAD。
本研究某一样本的原始光谱曲线如图1所示。由于探测器边缘的响应度较差,无法反映植物的光谱特征,故截取500~950 nm可见/近红外谱段信息用于分析,较好地保留了植物叶绿素的大量吸收信息,数据获取2336个波长点。
图1 某一样本原始反射光谱Fig.1 original spectra of one sample
从图1中可以看出,550 nm附近有一个叶绿素的吸收谷,650~700 nm波段是叶绿素的强吸收带,其中叶绿素在670 nm波长处的吸收峰最为明显,均符合叶绿素的吸收特性。从图1还可以看出,同一样本的五次测量光谱存在一定差异,这是由于非接触测量过程会受到散射效应等因素的影响;吸收峰处的吸光度并不高,这是由于一些携带叶绿素吸收信息的光线被散射出去,未被光纤接收。实测光谱的这些特点与本文引言中的分析是一致的。
ISOMAP算法是对多维尺度变换(MDS)[9]进行了非线性扩展,采用微分几何中的测地距离代替欧式距离,并且找到了一种用实际输入数据估计测地距离的算法。ISOMAP算法[9]描述下:
输入:样本X=,邻域参数k,样本本真维数q。
第一步,构建邻域图G。计算所有样本点两两之间的欧氏距离,得到距离矩阵D。找出样本点xi的k个最近邻点,连接它们,并用表示边Eij的权重。
第二步,计算最短路径。当图G有边Eij时,设最短路径,否则设=∞。在图G上,根据迪杰斯特拉(Dijkstra)算法求出所有对点之间的最短路径,得到最短距离矩阵DG。
第三步,构建q维嵌入。将MDS应用于最短距离矩阵DG,步骤如下:
ISOMAP有两个可调参数k和q,其中k为构建邻域图时选择的领域个数,q为样本的本真维数。选取不同的参数将得到不同的降维结果,进而有不同的PLS校正模型。本文采用网格搜索法进行参数优选,即分别让k和q从初始值增加到最大值,在每一对(k,q)下,将原始数据进行ISOMAP降维,然后进行PLS回归,交互验证均方根误差(RMSECV)最小时对应的参数对(k,q)即是最优参数组合。同时,将PLS主成分选取个数限制在10之内,以防止过拟合现象,缩减参数优选周期,从而提高检测的实时性。
本研究还采用波长参比法[11-12]和PLS两种传统建模方法,以验证ISOMAP-PLS的应用效果。
对样本数据采用以下方法建立模型,通过交互验证求出样本的预测值,并计算预测值均方根误差、预测值与标准值的相关系数进行评价。
3.2.1 波长参比建模方法
由叶绿素的吸收特性可知,670 nm是叶绿素的吸收峰,选择为吸收波长;叶绿素在940 nm处几乎没有吸收,选择为参比波长,用于消除背景成分吸收、叶片结构等因素的影响。将670 nm和940 nm波长处的吸光度作为自变量,与叶绿素含量标准值建立线性回归模型[11-13],即:
Ccl=17.74+129A670-548.61A940
预测结果如图2所示。
图2 波长参比模型预测结果Fig.2 predicted results of the wavelength referencemodel
3.2.2 偏最小二乘建模方法
与波长参比法不同,PLS是采用连续谱段建模,光谱信息利用率高。采用留一法交互验证建立校正模型,PLS预测结果如图3所示。
图3 单纯PLS模型预测结果Fig.3 predicted results of the single PLSmodel
3.2.3 ISOMAP -PLS建模方法
原始光谱(22×2336)数据量大,冗余信息多。本研究先利用ISOMAP有效提取出原始高维数据中蕴含的内在低维结构,再对其进行PLS建模。ISOMAP-PLS模型的预测结果如图4所示。
图4 ISOMAP-PLS模型预测结果Fig.4 predicted results of the ISOMAP - PLSmodel
计算以上三种模型的预测均方根误差(RM-SEP),以及预测值和标准值之间的相关系数(R),如表1所示。为了进一步研究ISOMAP算法的有效性,本文对PLS和ISOMAP-PLS模型的预测误差进行了统计分析,结果如表2所示。
表1 三种模型的数据比较Tab.1 comparison of data of three differentmodels
表2 模型相对预测误差的统计分布Tab.2 statistical analysis of the relative prediction error formodels %
由图2~图4以及表1可知,本实验采用波长参比法建立的校正模型效果不理想,之前进行的透射式叶绿素含量检测实验中,此建模方法取得很好的预测精度[12]。出现这种现象与非接触式检测过程干扰因素多有关,建模变量太单一,抵御外界干扰的能力低,模型的鲁棒性相对差些;相比较,基于全谱的PLS和ISOMAP-PLS模型的预测效果好很多,这是因为全谱可利用的模型信息多,因此计算精度高,适应性强。
比较图3和图4可知,ISOMAP-PLS模型的预测效果明显优于单纯PLS模型。由表1的数据计算可得,ISOMAP-PLS模型的预测精度比PLS模型提高了34.4%,相关系数也增加到0.98。这一方面说明,ISOMAP算法在降维同时有效提取出原始光谱数据的有用信息,避免过多冗余信息参与到建模过程中,有利于提高模型精度;另一方面说明,经ISOMAP降维后,光谱数据原有的本质拓扑结构并没有因数据消减而受到破坏。同时,由表2也可以看出,ISOMAP-PLS模型的精密性(即预测标准残差)要优于PLS方法,降低了17.5%,此外,最大预测偏差也分别降低了22.7%。
图5为PLS模型主成分个数与交互验证均方根误差(RMSECV)的关系,原始数据的PLS模型只需要3个主成分,RMSECV就达到了最佳值,而经ISOMAP降维之后,需要7个主成分才能达到最佳值。这是因为,原始光谱数据中的有用信息被散射、叶片结构等非化学信息干扰因素所掩盖,经ISOMAP降维后,其冗余信息被大大消减,有用信息利用率提高,主成分提取更容易。同时还可以看到,经过ISOMAP降维后的光谱,PLS模型中每一个主成分对原始数据的解释能力都增强了,即采用相同主成分个数,ISOMAP-PLS模型的精度均要高于PLS模型,这和上述ISOMAP降维有利于提高预测精度的结论是一致的。
图5 主成分个数与交互验证均方根误差关系Fig.5 RMSECV versus PC number
本文提出一种植物叶绿素含量的非接触式检测方法,并将ISOMAP降维方法应用在实测光谱数据中,结合PLS建立校正模型。与波长参比建模方法和单纯PLS建模方法比较,ISOMAP-PLS模型的预测精度均有很大提高,这说明先对数据进行ISOMAP降维,可以有效提取其中有用信息,避免过多冗余信息参与到建模过程中,有利于提高模型精度。本文研究结果表明,应用ISOMAP算法对植物叶绿素含量非接触式光谱检测是可行的,降低建模复杂度的同时提高了预测精度,可以作为植物多种生化参数非接触式检测的理论依据,也为今后开发相应的仪器奠定了基础。
[1] Zhang Jishu.Plant physiology[M].Beijing:Higher Education Press,2006.(in Chinese)
张继澍.植物生理学[M].北京:高等教育出版社,2006.
[2] Wang Fenghua,Zhang Shujuan.Research progress of the farming information collections key technologies on precision agriculture[J].Transactions of the Chinese Society of Agricultural Machinery,2008,39(5):112 -121.(in Chinese)
王凤花,张淑娟.精细农业田间信息采集关键技术的研究进展[J].农业机械学报,2008,39(5):112 -121.
[3] Lao Cailian,Li Baoguo,Guo yan,etal.Design and evaluation of a new device for measuring scattering light distri-bution of leaf[J].Transactions of the CSAE,2005,21(9):85 -89.(in Chinese)
劳彩莲,李保国,郭焱,等.一种用于叶片散射光分布测定的新型装置及性能评价[J].农业工程学报,2005,21(9):85 -89.
[4] Guo Lei,Lao Cailian.Design ofmeasuring system for scattering light distribution of leaf base on ARM[J].Control& Automation,2008,24(6 -2):140 -141.(in Chinese)
郭雷,劳彩莲.基于ARM的叶片散射光分布测量系统设计[J].微计算机信息,2008,24(6-2):140-141.
[5] Zhang Guangjun,Li Lina,Li Qingbo,et al.Application of denoising and background elimination based on wavelet transform to blood glucose noninvasive measurement of near infrared spectroscopy[J].Journal of Infrared and Millimeter Waves,2009,28(2):107 -110.(in Chinese)
张广军,李丽娜,李庆波,等.基于小波变换的噪声及背景同时去除方法在血糖近红外无创检测中的应用[J].红外与毫米波学报,2009,28(2):107 -110.
[6] Liang Liang,Yang Minhua,Zang Zhuo.Improvement research of wheat leaf area index measurement using visible/near-infrared spectra[J].Laser & Infrared,2010,40(11):1205 -1210.(in Chinese)
梁亮,杨敏华,臧卓.利用可见/近红外光谱测定小麦叶面积指数的改进研究[J].激光与红外,2010,40(11):1205-1210.
[7] Xia Junfang,Li Peiwu,Li Xiaoyu,et al.Effect of different pretreatmentmethod of nondestructivemeasure Vitamin C content of umbilical orange with near-infrared spectroscopy[J].Transactions of the Chinese Society of Agricultural Machinery,2007,38(6):107 -111.(in Chinese)
夏俊芳,李培武,李小昱,等.不同预处理对近红外光谱检测脐橙VC含量的影响[J].农业机械学报,2007,38(6):107-111.
[8] Yin Huimin,Wu Wenfu,Zhang Yaqiu.Application of BP neural network based on wavelength optimization in near infrared spectroscopy[J].Laser& Infrared,2011,41(8):871 -874.(in Chinese)
尹慧敏,吴文福,张亚秋.波长优选BP神经网络用于近红外光谱分析[J].激光与红外,2011,41(8):871-874.
[9] Tenenbaum JB,Silva V D,Langford J C.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(22):2319 -2323.
[10] Du Peijun,Wang Xiaomei,et al.Dimensionality reduction and feature extraction from hyperspectral remote sensing imagery based on manifold learning[J].Geomatics and Information Science of Wuhan University,2011,36(2):148.(in Chinese)
杜培军,王小美,等.利用流形学习进行高光谱遥感影像的降维与特征提取[J].武汉大学学报·信息科学版,2011,36(2):148.
[11] Xue Lihong,Luo Weihong,Cao Weixing,et al.Research progress on thewater and nitrogen detection using spectral reflectance[J].Journal of Remote Sensing,2003,7(1):73.(in Chinese)
薛利红,罗卫红,曹卫星,等.作物水分和氮素光谱诊断研究进展[J].遥感学报,2003,7(1):73.
[12] LiQingbo,Xu Yupo,Zhang Chaohang,et al.Development of chlorophyll concentration nondestructive measurement instrument based on spectral analysis technology[J].Spectroscopy and Spectral Analysis,2009,29(10):2875 -2878.(in Chinese)
李庆波,徐玉波,张超航,等.基于光谱技术的植物叶绿素浓度无损检测仪器的研制[J].光谱学与光谱分析,2009,29(10):2875 -2878.
[13] Lu Wanzhen.Modern near infrared spectroscopy analytical technology[M].Beijing:China Petrochemical Press,2007.(in Chinese)
陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社,2007.